CN101138021B - 使用虚拟源位置信息的多声道音频压缩和解压缩方法 - Google Patents

使用虚拟源位置信息的多声道音频压缩和解压缩方法 Download PDF

Info

Publication number
CN101138021B
CN101138021B CN2006800081055A CN200680008105A CN101138021B CN 101138021 B CN101138021 B CN 101138021B CN 2006800081055 A CN2006800081055 A CN 2006800081055A CN 200680008105 A CN200680008105 A CN 200680008105A CN 101138021 B CN101138021 B CN 101138021B
Authority
CN
China
Prior art keywords
channel
vector
angle
signal
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800081055A
Other languages
English (en)
Other versions
CN101138021A (zh
Inventor
徐廷一
白承权
张仁瑄
姜京玉
洪镇佑
韩敏洙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority claimed from PCT/KR2006/000916 external-priority patent/WO2006098583A1/en
Publication of CN101138021A publication Critical patent/CN101138021A/zh
Application granted granted Critical
Publication of CN101138021B publication Critical patent/CN101138021B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • H04M1/0206Portable telephones comprising a plurality of mechanically joined movable body parts, e.g. hinged housings
    • H04M1/0208Portable telephones comprising a plurality of mechanically joined movable body parts, e.g. hinged housings characterized by the relative motions of the body parts
    • H04M1/0225Rotatable telephones, i.e. the body parts pivoting to an open position around an axis perpendicular to the plane they define in closed position
    • H04M1/0227Rotatable in one plane, i.e. using a one degree of freedom hinge
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Stereophonic System (AREA)

Abstract

提供了一种使用有限半圆平面上的虚拟源位置信息(VSLI)来压缩和解压缩多声道信号的方法。使用VSLI而不是ICLD作为空间提示参数,由此最小化由于空间提示信息的量化引起的损失,并改善解压缩的音频信号的音质,并通过减少解码器频谱上在解压缩原始信号时的失真而再现优质的音频信号。

Description

使用虚拟源位置信息的多声道音频压缩和解压缩方法
技术领域
本发明涉及多声道音频信号的压缩和解压缩,并且,更具体地,涉及用于基于半圆平面上的虚拟源位置信息(VSLI)来压缩和解压缩多声道音频信号的方法。 
背景技术
在传统的双声道提示(cue)编码方法中,声道间电平差(ICLD)通常被用作压缩多声道音频信号的频谱信息时的空间提示信息。然而,ICLD在被发送之前经过量化处理。因为量化处理分配有限数目的比特,所以分辨率是有限的。因此,ICLD的这样的信息损失恶化了解压缩的音频信号。 
发明内容
技术问题 
本发明针对用于表示、压缩和解压缩多声道音频信号的方法,其使用在有限半圆平面上表示的虚拟源位置信息(VSLI)而不是ICLD作为空间提示参数,由此最小化由于空间提示信息的量化引起的损失,并改善解压缩的音频信号的音质。 
本发明还针对用于压缩多声道音频信号的方法,其中,在使用下混频的(down-mixed)音频信号和虚拟源位置信息来表示和压缩N个多声道音频信号并将它们发送到解码器时,根据全局矢量的位置,仅估计和发送N-1片(piece)虚拟源位置信息,由此减少所发送的信息的量。 
技术方案 
本发明的一个方面提供了一种用于估计在压缩多声道音频信号时被用作空间提示信息的虚拟源位置信息(VSLI)的方法,该方法包括以下步骤:(i)在半圆平面上虚拟地分配多声道音频信号的声道;(ii)将多声道音频信号转换为频域信号;(iii)将频域信号划分为多个子带,并计算每个子带中的每个声道的信号大小;(iv)根据所计算的每个子带中的每个声道的信号大小以及 每个虚拟地分配的声道信号的虚拟位置信息,来估计在在所述半圆平面上表示的全局矢量;以及(v)确定每个子带中的全局矢量的角度是否大于0,并且,当所述全局矢量的角度大于0时估计第一组局部矢量,而当所述全局矢量的角度小于0时估计第二组局部矢量。 
本发明的另一方面提供了一种用于基于虚拟源位置信息(VSLI)来压缩多声道音频信号的方法,该方法包括以下步骤:获得表示通过执行上述方法而估计的虚拟源位置信息的全局矢量和多个局部矢量的角度信息;对所述全局矢量和多个局部矢量的角度信息进行量化;对输入的多声道音频信号进行下混频和编码;以及将编码后的下混频的音频信号与量化后的矢量的角度信息进行多路复用,以最终生成压缩的多声道音频信号。 
本发明的再一方面提供了一种用于基于空间提示信息来解压缩由虚拟源位置信息(VSLI)表示的压缩的多声道音频信号和编码后的下混频的音频信号的方法,该方法包括以下步骤:(i)使用恒定功率摇摆(panning)规则,根据所述VSLI预测反向摇摆角信息;(ii)使用所预测的反向摇摆角信息,获得每个子带中的每个声道的估计功率分量;以及(iii)使用每个声道的所述估计功率分量和所述下混频的音频信号,最终对每个子带中的每个声道的信号进行解压缩。 
有益效果 
在根据本发明的使用半圆平面上的虚拟源位置信息来压缩多声道信号的方法中,使用虚拟声音位置信息(VSLI)来表示空间提示信息,由此最小化由于空间提示信息的量化引起的损失,并改善解压缩的音频信号的音质。 
附图说明
图1示意性地图解了可采用本发明的多声道音频编码器的配置; 
图2是图解根据本发明的示例实施例的估计多声道音频信号的虚拟声音位置信息(VSLI)的处理的流程图; 
图3图解了根据本发明示例实施例的在半圆平面结构上虚拟地分配多声道音频信号的各个声道的示例; 
图4图解了在图3中示出的半圆平面结构的各个部分中估计的局部矢量的示例;以及 
图5是图解根据本发明示例实施例的对已基于VSLI压缩和表示的多声道 音频信号进行解码的处理的流程图。 
具体实施方式
下文中,将详细描述本发明的示例实施例。然而,本发明不限于下面公开的示例实施例,而可以用各种形式来实现。因而,提供这些示例实施例,以完整地公开本发明,并且向本领域技术人员完全传达本发明的范围。 
图1示意性地图解了根据本发明的多声道音频编码器的配置。参照图1,多声道音频编码器包括:下混频器110,用于对输入的多声道音频信号进行下混频,以生成下混频的音频信号;高级音频编码(AAC)编码单元120,用于对下混频的音频信号进行编码;虚拟源位置信息(VSLI)估计单元130,用于根据多声道音频信号来估计虚拟源位置信息;量化单元140,用于将VSLI量化;以及多路复用单元150,用于将由AAC编码单元120编码的下混频的音频信号与由量化单元140量化的VSLI进行多路复用,以最终生成压缩的多声道音频信号。 
在本发明中,由半圆平面上的虚拟源位置矢量和中央声道之间的方位角来表示虚拟源位置信息(VSLI),其中根据多声道音频信号中的各个声道的信号幅值来估计该虚拟源位置矢量。因为对于N个多声道音频信号,使用(N-1)片虚拟源位置信息,所以,虚拟源位置信息的量与声道间电平差(ICLD)相同。 
在本发明的示例实施例中,虚拟声音位置矢量包括全局矢量Gvb、左和右半平面矢量LHvb和RHvb、以及左和右后续(subsequent)矢量LSvb和RSvb。各个矢量和中央声道之间的角度分别由Gab、LHab、RHab、LSab和RSab来表示。 
在本发明中,在半圆平面上虚拟地分配多声道音频信号的声道,并且根据各个声道的信号幅值来估计在半圆平面上表示的虚拟源位置矢量。一组估计的虚拟源位置矢量随着全局矢量的位置而变化。关于每个估计的虚拟源位置矢量和中央声道之间的角度的信息作为虚拟源位置信息而与下混频的音频信号一起被发送到解码器。 
图2是图解根据本发明示例实施例的估计多声道音频信号的VSLI的处理的流程图。 
在步骤210中,将输入的多声道音频信号的各个声道虚拟地分配到二维半圆平面。根据本发明的示例实施例,图3示出了以45°间隔在半圆平面上分配的多声道音频信号的5个声道C、L、R、Ls和Rs,以及从这些声道估计 的全局矢量的示例。 
在步骤220中,将多声道音频信号转换为频域信号。在步骤230中,将该频域信号划分为多个子带,并且使用以下等式1来计算每个子带上的每个声道的信号幅值: 
等式1 
M ch , b = Σ n = B b B b + 1 - 1 | S ch , n |
其中,Sch,n指示第ch声道的频率系数。在本发明的实施例中,ch指示中央声道(C)、左声道(L)、右声道(R)、左环绕声道(Ls)和右环绕声道(Rs)中的一个。Bb和Bb+1-1分别指示对应于子带Bb的上边界和下边界的频率索引。 
在步骤240中,根据每个子带中的每个声道的信号幅值来估计在分配了声道的半圆平面上表示的全局矢量。在子带b中,使用以下等式2来估计全局矢量Gvb: 
等式2 
G v b = A 1 × M C , b + A 2 × M L , b + A 3 × M R , b + A 4 × M Ls , b + A 5 × M Rs , b
其中Ai指示在半圆平面上分配的每个声道信号的虚拟位置信息。其可以是在步骤210中被分配到半圆平面上的每个声道的映射信息。在图3所示的实施例中,可按照中央、左、右、左环绕和右环绕声道信号的顺序,将虚拟位置信息定义为A1=cos0°+jsin0°、A2=cos45°-jsin45°、A3=cos45°+jsin45°、A4=cos90°-jsin90°以及A5=cos90°+jsin90°。 
在步骤250中,确定每个子带中的全局矢量的角度Gab是否大于0。在步骤260中,如果全局矢量的角度大于0,则估计第一组局部矢量。在步骤270中,如果全局矢量的角度小于0,则估计第二组局部矢量。在一个实施例中,第一组局部矢量包括LHvb、LSvb和RSvb,而第二组局部矢量包括RHab、RSab和LSab。 
使用以下等式3来估计半圆平面的各部分的局部矢量。图4中示出了其实施例。 
等式3 
LHvb=A1×MC,b+A2×ML,b+A4×MLs,b
RHvb=A1×MC,b+A3×MR,b+A5×MRs,b
LSvb=A2×ML,b+A4×MLs,b
RSvb=A3×MR,b+A5×MRs,b
在步骤280中,将全局矢量的角度和在步骤260或270中估计的局部矢量的角度作为VSLI而发送到解码器。即,如果全局矢量的角度Gab小于0,则发送{Gab,RHab,RSab,LSab},否则,发送{Gab,LHab,LSab,RSab}。 
以此方式,根据本发明,可见,可通过N-1片虚拟源位置信息来表示N各多声道音频信号的空间提示信息。 
图5是图解根据本发明示例实施例的对已基于VSLI压缩和表示的多声道音频信号进行解码的处理的流程图。解码器根据与编码的下混频的音频信号一起接收的虚拟源位置信息来估计原始声音的矢量信息。声音矢量由其幅值和角度来表示。可从所接收的VSLI获得矢量角度,并且可从所接收的下混频的音频信号获得矢量幅值。 
具体地,如图5所示,使用恒定功率摇摆(CPP)规则来从VSLI预测反向摇摆角(inverse panning angle)(S510)。在此情况下,用于预测其他反向摇摆角的方法依赖于全局矢量的角度Gab。使用以下等式4来预测反向摇摆角: 
等式4 
如果Gab≥0,则 
θ 1 = ( G a b - LH a b RS a b - LH a b ) × π 2 , θ 2 = ( LH a b - LS a b 0 - LS a b ) × π 2
θ 3 = ( LS a b + π / 2 - π / 4 + π / 2 ) × π 2 , θ 4 = ( RS a b - π / 2 π / 4 - π / 2 ) × π 2
并且,如果Gab<0,则 
θ 1 = ( G a b - RH a b LS a b - RH a b ) × π 2 , θ 2 = ( RH a b - RS a b 0 - RS a b ) × π 2
θ 3 = ( RS a b - π / 2 π / 4 - π / 2 ) × π 2 , θ 4 = ( LS a b + π / 2 - π / 4 + π / 2 ) × π 2
在步骤520中,从所预测的反向摇摆角获得子带中的每个声道的估计功率分量。使用以下等式5来获得每个声道的估计功率分量: 
等式5 
如果Gab≥0,则 
FC,b=cos(θ1)sin(θ2), 
FL,b=cos(θ1)cos(θ2)sin(θ3), 
FLs,b=cos(θ1)cos(θ2)cos(θ3), 
FR,b=sin(θ1)sin(θ4), 
FRs,b=sin(θ1)cos(θ4);并且, 
如果Gab<0,则 
FC,b=cos(θ1)sin(θ2), 
FL,b=sin(θ1)sin(θ4), 
FLs,b=sin(θ1)cos(θ4), 
FR,b=cos(θ1)cos(θ2)sin(θ3), 
FRs,b=cos(θ1)cos(θ2)cos(θ3
在步骤530中,可根据以下等式,基于每个声道的下混频的音频信号和估计功率分量,来对每个子带中的每个声道信号最终进行解压缩: 
等式6 
Uch,k=Fch,bSk′,Bb≤k≤Bb+1-1 
其中,Sk′指示所接收的下混频的信号的频率分量系数,而Uch,k指示解压缩的音频信号。 
可作为在一个或多个计算机可读介质上实现的一个或多个计算机程序来提供上述本发明。所述介质可以是软盘、硬盘、CD-ROM、闪存卡、可编程只读存储器(PROM)、随机存取存储器(RAM)、只读存储器(ROM)以及磁带。通常,可以用任何编程语言来编写计算机程序,如C、C++和JAVA。 
尽管参照特定示例实施例来示出和描述了本发明,但本领域技术人员应理解,可对其进行形式和细节的各种修改,而不会脱离所附权利要求限定的本发明的精神和范围。 

Claims (15)

1.一种用于估计在压缩多声道音频信号时被用作空间提示信息的虚拟源位置信息VSLI的方法,该方法包括以下步骤:
(i)在半圆平面上虚拟地分配多声道音频信号的每个声道;
(ii)将所述多声道音频信号转换为频域信号;
(iii)将所述频域信号划分为多个子带,并计算每个子带中的每个声道的信号幅值;
(iv)对于每个子带,根据所计算的每个子带中的每个声道的信号幅值、以及每个虚拟地分配的声道信号的虚拟位置信息,来估计在在所述半圆平面上表示的全局矢量;以及
(v)对于每个子带,确定该子带中的全局矢量与中央声道之间的角度是否大于0,并且,当所述全局矢量与中央声道之间的角度大于0时估计第一组局部矢量,而当所述全局矢量与中央声道之间的角度小于0时估计第二组局部矢量,
其中,所述第一组和第二组局部矢量是在半圆平面上表示的虚拟源位置矢量中的局部矢量,
其中,所述第一组局部矢量包括右半平面矢量RHvb、右后续矢量RSvb和左后续矢量LSvb,而所述第二组局部矢量包括左半平面矢量LHvb、左后续矢量LSvb和右后续矢量RSvb,其中所述右半平面矢量RHvb、左半平面矢量LHvb、右后续矢量RSvb和左后续矢量LSvb是半圆平面的各部分的局部矢量,
其中在步骤(v)中,使用在步骤(iii)中计算出的中央、右和右环绕声道的信号幅值来估计所述右半平面矢量RHvb;使用在步骤(iii)中计算出的右和右环绕声道的信号幅值来估计所述右后续矢量RSvb;使用在步骤(iii)中计算出的中央、左和左环绕声道的信号幅值来估计所述左半平面矢量LHvb;以及使用在步骤(iii)中计算出的左和左环绕声道的信号幅值来估计所述左后续矢量LSvb
2.如权利要求1所述的方法,其中步骤(iii)包括使用以下等式来计算每个子带中的每个声道的信号幅值:
M ch , b = Σ n = B b B b + 1 - 1 | S ch , n | ,
其中,Sch,n指示第ch声道的频率系数,ch指示中央声道(C)、左声道(L)、右声道(R)、左环绕声道(Ls)和右环绕声道(Rs)中的一个,并且Bb和Bb+1-1分别指示对应于子带Bb的上边界和下边界的频率索引。
3.如权利要求2所述的方法,其中步骤(iv)包括使用以下等式来估计每个子带的全局矢量:
G v b = A 1 × M C , b + A 2 × M L , b + A 3 × M R , b + A 4 × M Ls , b + A 5 × M Rs , b ,
其中,A1指示中央声道的虚拟位置信息,A2指示左声道的虚拟位置信息,A3指示右声道的虚拟位置信息,A4指示左环绕声道的虚拟位置信息,而A5指示右环绕声道的虚拟位置信息。
4.如权利要求3所述的方法,其中A1=cos0°+jsin0°,A2=cos45°-jsin45°,A3=cos45°+jsin45°,A4=cos90°-jsin90°,且A5=cos90°+jsin90°。
5.如权利要求1所述的方法,其中使用以下等式来估计右半平面矢量RHvb、右后续矢量RSvb、左半平面矢量LHvb和左后续矢量LSvb
LHvb=A1×MC,b+A2×ML,b+A4×MLs,b
RHvb=A1×MC,b+A3×MR,b+A5×MRs,b
LSvb=A2×ML,b+A4×MLs,b
RSvb=A3×MR,b+A5×MRs,b
其中,A1、A2、A3、A4、A5分别指示中央声道、左声道、右声道、左环绕声道、右环绕声道的虚拟位置信息,MC,b、ML,b、MR,b、MLs,b、MRs,b分别是子带b中的中央声道、左声道、右声道、左环绕声道、右环绕声道的信号幅值。
6.如权利要求1所述的方法,其中当所述全局矢量的角度Gab大于0时,将在全局矢量与所述中央声道之间的角度信息和在所述第一组局部矢量的每一个与所述中央声道之间的角度信息发送到解码器,否则,将在全局矢量与所述中央声道之间的角度信息和在所述第二组局部矢量的每一个与所述中央声道之间的角度信息发送到解码器。
7.一种用于基于虚拟源位置信息(VSLI)来压缩多声道音频信号的方法,该方法包括以下步骤:
获得表示通过执行权利要求1至5中任一个的方法而估计的虚拟源位置信息的、在全局矢量与中央声道之间的角度信息和在多个局部矢量的每一个与所述中央声道之间的角度信息;
对所述在全局矢量与中央声道之间的角度信息和在多个局部矢量的每一个与所述中央声道之间的角度信息进行量化;
对输入的多声道音频信号进行下混频和编码;以及
将编码后的下混频的音频信号与量化后的矢量的角度信息进行多路复用,以最终生成压缩的多声道音频信号。
8.一种用于基于空间提示信息来解压缩由虚拟源位置信息VSLI表示的压缩的多声道音频信号和编码后的下混频的音频信号的方法,该方法包括以下步骤:
(i)使用恒定功率摇摆规则,根据所述VSLI预测反向摇摆角信息;
(ii)使用所预测的反向摇摆角信息,获得每个子带中的每个声道的估计功率分量;以及
(iii)使用每个声道的所述估计功率分量和所述下混频的音频信号,最终对每个子带中的每个声道的信号进行解压缩,
所述VSLI是通过执行权利要求1至7中任一项的方法来估计的。
9.如权利要求8所述的方法,其中,在步骤(i)中,所述反向摇摆角的预测方案根据虚拟源位置信息中的全局矢量的角度信息而有所不同。
10.如权利要求8所述的方法,其中步骤(i)包括:当虚拟源位置信息中的全局矢量角度Gab大于0时,根据全局矢量角度Gab、左半平面矢量角度LHab、左后续矢量角度LSab以及右后续矢量角度RSab来预测反向摇摆角θ1、θ2、θ3和θ4,而当虚拟源位置信息中的全局矢量角度Gab小于0时,根据全局矢量角度Gab、右半平面矢量角度RHab、右后续矢量角度RSab以及左后续矢量角度LSab来预测反向摇摆角θ1、θ2、θ3和θ4
11.如权利要求9所述的方法,其中在步骤(i)中,使用以下等式来计算反向摇摆角θ1、θ2、θ3和θ4
如果Gab≥0,则
θ 1 = ( Ga b - LHa b RSa b - LHa b ) × π 2 , θ 2 = ( LHa b - LSa b 0 - LSa b ) × π 2
θ 3 = ( LSa b + π / 2 - π / 4 + π / 2 ) × π 2 , θ 4 = ( RSa b - π / 2 π / 4 - π / 2 ) × π 2
并且,如果Gab<0,则
θ 1 = ( Ga b - RHa b LSa b - RHa b ) × π 2 , θ 2 = ( RHa b - RSa b 0 - RSa b ) × π 2
θ 3 = ( RSa b - π / 2 π / 4 - π / 2 ) × π 2 , θ 4 = ( LSa b + π / 2 - π / 4 + π / 2 ) × π 2 .
12.如权利要求11所述的方法,其中步骤(ii)包括:使用以下等式来获得每个子带中的每个声道的估计功率分量:
如果Gab≥0,则
FC,b=cos(θ1)sin(θ2),
FL,b=cos(θ1)cos(θ2)sin(θ3),
FLs,b=cos(θ1)cos(θ2)cos(θ3),
FR,b=sin(θ1)sin(θ4),
FRs,b=sin(θ1)cos(θ4);并且
如果Gab<0,则
FC,b=cos(θ1)sin(θ2),
FL,b=sin(θ1)sin(θ4),
FLs,b=sin(θ1)cos(θ4),
FR,b=cos(θ1)cos(θ2)sin(θ3),
FRs,b=cos(θ1)cos(θ2)cos(θ3)。
13.如权利要求12所述的方法,其中步骤(iii)包括使用以下等式来对每个子带中的每个声道的信号进行解压缩:
Uch,k=Fch,bS′k,Bb≤k≤Bb+1-1,
其中,S′k指示所接收的下混频的信号的频率分量系数,而Uch,k指示解压缩的音频信号,以及Fch,b指示子带b中的第ch声道的估计功率分量,Bb和Bb+1-1分别指示对应于子带b的上边界和下边界的频率索引。
14.一种用于基于虚拟源位置信息VSLI来压缩多声道音频信号的设备,该设备包括:
获得表示通过执行权利要求1至5中任一个的方法而估计的虚拟源位置信息的、在全局矢量与中央声道之间的角度信息和在多个局部矢量的每一个与中央声道之间的角度信息的部件;
对所述在全局矢量与中央声道之间的角度信息和在多个局部矢量的每一个与中央声道之间的角度信息进行量化的部件;
对输入的多声道音频信号进行下混频和编码的部件;以及
将编码后的下混频的音频信号与量化后的矢量的角度信息进行多路复用以最终生成压缩的多声道音频信号的部件。
15.一种用于基于空间提示信息来解压缩由虚拟源位置信息VSLI表示的压缩的多声道音频信号和编码后的下混频的音频信号的设备,该设备包括:
(i)使用恒定功率摇摆规则、根据所述VSLI预测反向摇摆角信息的第一部件;
(ii)使用所预测的反向摇摆角信息来获得每个子带中的每个声道的估计功率分量的第二部件;以及
(iii)使用每个声道的所述估计功率分量和所述下混频的音频信号来最终对每个子带中的每个声道的信号进行解压缩的第三部件,
其中,所述VSLI是通过执行权利要求1至5中任一项的方法来估计的。
CN2006800081055A 2005-03-14 2006-03-14 使用虚拟源位置信息的多声道音频压缩和解压缩方法 Expired - Fee Related CN101138021B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR20050021104 2005-03-14
KR10-2005-0021104 2005-03-14
KR1020050021104 2005-03-14
KR1020060023545 2006-03-14
KR10-2006-0023545 2006-03-14
PCT/KR2006/000916 WO2006098583A1 (en) 2005-03-14 2006-03-14 Multichannel audio compression and decompression method using virtual source location information
KR1020060023545A KR100714980B1 (ko) 2005-03-14 2006-03-14 가상음원위치정보를 이용한 멀티채널 오디오 신호의 압축및 복원 방법

Publications (2)

Publication Number Publication Date
CN101138021A CN101138021A (zh) 2008-03-05
CN101138021B true CN101138021B (zh) 2012-01-04

Family

ID=37631252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800081055A Expired - Fee Related CN101138021B (zh) 2005-03-14 2006-03-14 使用虚拟源位置信息的多声道音频压缩和解压缩方法

Country Status (3)

Country Link
US (1) US20080187144A1 (zh)
KR (1) KR100714980B1 (zh)
CN (1) CN101138021B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
KR101673232B1 (ko) 2010-03-11 2016-11-07 삼성전자주식회사 수직 방향 가상 채널을 생성하는 장치 및 그 방법
WO2013106322A1 (en) * 2012-01-11 2013-07-18 Dolby Laboratories Licensing Corporation Simultaneous broadcaster -mixed and receiver -mixed supplementary audio services
KR102170398B1 (ko) 2014-03-12 2020-10-27 삼성전자 주식회사 위치정보를 활용한 멀티 스피커의 운용 방법 및 장치
CN105657633A (zh) 2014-09-04 2016-06-08 杜比实验室特许公司 生成针对音频对象的元数据
CN113302692A (zh) * 2018-10-26 2021-08-24 弗劳恩霍夫应用研究促进协会 基于方向响度图的音频处理
CN112037781B (zh) * 2020-08-07 2024-01-19 北京百度网讯科技有限公司 语音数据的获取方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100280844B1 (ko) * 1998-12-02 2001-02-01 정선종 현실감있는 입체음향구현을 위한 가상음장 생성 방법
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Han-gil Moon.Multi-channel audio compression method with virtual source location information for MPEG-4 SAC.《Seoul National University 博士论文》.2005,全文. *
James R.West.Five-Channel Panning Laws:An Analytical and Experimental Comparison.《Music Engineering》.1995, *

Also Published As

Publication number Publication date
KR20060100221A (ko) 2006-09-20
KR100714980B1 (ko) 2007-05-04
CN101138021A (zh) 2008-03-05
US20080187144A1 (en) 2008-08-07

Similar Documents

Publication Publication Date Title
US10257635B2 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US10264382B2 (en) Methods and apparatus for compressing and decompressing a higher order ambisonics representation
CN101138021B (zh) 使用虚拟源位置信息的多声道音频压缩和解压缩方法
US20180247656A1 (en) Method and device for metadata for multi-channel or sound-field audio signals
CN101002261B (zh) 使用虚拟源位置信息编码和解码多声道音频信号的方法和装置
US7573912B2 (en) Near-transparent or transparent multi-channel encoder/decoder scheme
US8817991B2 (en) Advanced encoding of multi-channel digital audio signals
US7719445B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal
EP3707706B1 (en) Determination of spatial audio parameter encoding and associated decoding
CN111542877B (zh) 空间音频参数编码和相关联的解码的确定
JP2022509440A (ja) 空間オーディオパラメータの符号化及び対応する復号の決定
KR20210097775A (ko) 낮은 차수, 중간 차수 및 높은 차수 컴포넌트 생성기를 사용하는 DirAC 기반 공간 오디오 코딩과 관련된 인코딩, 디코딩, 장면 처리 및 기타 절차를 위한 장치, 방법 및 컴퓨터 프로그램
US20110051938A1 (en) Method and apparatus for encoding and decoding stereo audio
JP2019133200A (ja) 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
EP1859439B1 (en) Multichannel audio compression and decompression method using virtual source location information
EP3424048A1 (en) Audio signal encoder, audio signal decoder, method for encoding and method for decoding
US20220392462A1 (en) Multichannel audio encode and decode using directional metadata
CN116982108A (zh) 空间音频参数编码和相关联解码的确定
JP2013167783A (ja) 多チャネル音響システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20080305

Assignee: Neo Lab Convergence Inc.

Assignor: Korea Electronic Communication Institute

Contract record no.: 2016990000259

Denomination of invention: Multichannel audio compression and decompression method using virtual source location information

Granted publication date: 20120104

License type: Exclusive License

Record date: 20160630

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120104

Termination date: 20200314

CF01 Termination of patent right due to non-payment of annual fee