CN1969318B - 音频编码装置、解码装置以及方法 - Google Patents

音频编码装置、解码装置以及方法 Download PDF

Info

Publication number
CN1969318B
CN1969318B CN2005800193874A CN200580019387A CN1969318B CN 1969318 B CN1969318 B CN 1969318B CN 2005800193874 A CN2005800193874 A CN 2005800193874A CN 200580019387 A CN200580019387 A CN 200580019387A CN 1969318 B CN1969318 B CN 1969318B
Authority
CN
China
Prior art keywords
mentioned
sub
division
band
division methods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005800193874A
Other languages
English (en)
Other versions
CN1969318A (zh
Inventor
津岛峰生
高木良明
小野耕司郎
田中直也
宫阪修二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1969318A publication Critical patent/CN1969318A/zh
Application granted granted Critical
Publication of CN1969318B publication Critical patent/CN1969318B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供一种音频编码装置及解码装置,能够灵活调整码率和音质之间的最佳平衡点。可变频率划分编码部(110)包括:相差程度算出部(101、102、103),根据将频带划分为子频带的划分方法(A、B、C),分别算出第一输入信号和第二输入信号间的相差程度;选择部(104),选择一个划分方法;以及相差程度及划分信息编码部(105),对所选择的划分方法和根据其划分方法的每个子频带的相差程度进行编码,可变频率划分解码部(210)包括:划分信息解码部(202),解码划分信息来把握划分方法;切换部(203),将相差程度代码输出到根据划分方法的一个相差程度解码部;以及相差程度解码部(204、205、206),将相差程度代码解码成每子频带的相差程度。

Description

音频编码装置、解码装置以及方法
技术领域
本发明涉及音频信号的编码装置以及解码装置等,尤其涉及使码率和音质之间的最佳平衡点的灵活调整成为可能的技术。 
背景技术
原来,作为音频编码方法及解码方法,广泛普及俗称为MPEG(运动图像专家组:Moving Picture Experts Group)方式等ISO/IEC国际标准方式。现在,作为以具有高应用性、且用低比特率表示高保真音频信号为目的的编码方法,已经出现了ISO/IEC13818-7即俗称为MPEG-2AAC(高级音频编码:Advanced Audio Coding)的编码方法。 
根据此AAC,在对多声道音频信号进行编码时,采用称为MS立体声(中侧立体声:Mid Side Stereo)或强度立体声(Intensity Stereo)的方式来表示声道之间的相关性,从而压缩音频信息,提高编码效率。 
根据MS立体声,以和信号与差信号表示立体声信号,对双方分配不同的代码量。并且,根据强度立体声,将频带划分成子频带,在每个子频带,对各个声道的信号之间的电平差和相位差(相位差有相同相位或相反相位的两个阶段)进行编码。 
正在进行制定此AAC的多个扩展标准的工作。其中将引进利用称为空间音响信息(Spatial Cue Information)或听觉音响信息(Binaural Cue)的信息的编码技术。作为这种编码技术的一个例子,有根据ISO国际标准即MPEG-4 Audio(非专利文献1)所制定的参量立体声(Parametric Stereo)方式,并且,作为另外一个例子,也有专利文献1及2所公开的技术。 
专利文献1:美国专利申请公开说明书第2003/0035553号《Backwards-compatible Perceptual Coding of Spatial Cues》 
专利文献2:美国专利申请公开说明书第2003/0219130号《Coherence-based Audio Coding and Synthesis》 
非专利文献1:ISO/IEC 14496-3:2001 AMD2《Parametric Coding for High Quality Audio》 
然而,根据以往的音频编码方法及解码方法,由于在每个子频带,对各个声道的信号之间的相差进行编码,因此有不能灵活调整码率和音质的最佳平衡点的课题。 
 发明内容
本发明的目的在于,鉴于这种以往的问题,提供一种音频编码装置、解码装置、方法、以及程序,能够灵活调整码率和音质之间的最佳平衡点。 
为了解决上述课题,本发明的音频编码装置是一种音频编码装置,对从一个代表音频信号中将要分离出来的多个音频信号之间的相差程度进行编码,包括:选择单元,从用于将频带划分为一个以上的子频带的多个划分方法中选择一个划分方法;相差程度编码单元,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的;以及划分信息编码单元,对用于识别上述所选择的划分方法的划分信息进行编码;根据上述多个划分方法被设定的子频带的数量均不相同;上述多个划分方法中,第一个划分方法用于将上述频带划分为一个以上的子频带;第二个划分方法用于将上述频带划分为多个子频带;根据上述第一个划分方法所划分的子频带中的一个,与根据上述第二个划分方法所划分的子频带中的一个相同,或与将根据上述第二个划分方法所划分的子频带中相互邻接的多个子频带结合起来的频带相同。 
并且,上述相差程度可以是上述多个音频信号之间的能源差及相关性中的至少一个;并且,上述代表音频信号可以是在对上述多个音 频信号进行缩混之后获得的缩混信号。 
根据此结构,因为可以以按照码率的、适当的划分方法来进行编码,因此,能够灵活调整码率和音质之间的最佳平衡点。 
并且,上述音频编码装置可以进一步包括:相差程度算出单元,针对上述第一个划分方法及第二个划分方法,在每个子频带,分别算出上述多个音频信号之间的相差程度,该子频带是根据其划分方法被设定的;上述选择单元,可以按照根据上述第二个划分方法被划分出的多个子频带的每个算出的相差程度的差异,选择上述第一个划分方法及第二个划分方法中的任一个方法;上述相差程度编码单元,可以对在每个子频带分别算出的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的。 
根据此结构,将相差程度近似的多个子频带结合起来处理,从而不大损坏音质而降低码率,可以提高编码效率。 
为了解决上述课题,本发明的音频解码装置是一种音频解码装置,解码编码音频信号信息,该编码音频信号信息包括:相差程度代码,该相差程度代码是,在每个子频带,分别对从一个代表音频信号将要分离出来的多个音频信号之间的相差程度进行编码后所得的,该子频带是根据将频带划分为子频带的多个划分方法中的一个划分方法被设定的;以及划分信息代码,该划分信息代码是,对用于识别划分方法的划分信息进行编码后所得的,该划分方法是在对上述相差程度代码进行编码时所用的,包括:划分信息解码单元,将上述划分信息代码解码成上述划分信息;以及相差程度信息解码单元,将上述相差程度代码解码成每个子频带的上述多个音频信号之间的相差程度,该子频带是根据由上述划分信息识别的划分方法被设定的;根据上述多个划分方法被设定的子频带的数量均不相同;上述多个划分方法中,第一个划分方法用于将上述频带划分为一个以上的子频带;第二个划分方法用于将上述频带划分为多个子频带;根据上述第一个划分方法所划分的子频带中的一个,与根据上述第二个划分方法所划分的子频带中的一个相同,或与将根据上述第二个划分方法所划分的子频带中相互邻接的多个子频带结合起来的频带相同。 
根据此结构,按照划分信息代码,对所得的编码音频信号信息进行正确的解码,来能够获得音频信号信息,该所得的编码音频信号信息是在由上述音频编码装置适当地调整了码率和音质之间的平衡点后所得的。 
并且,本发明不仅能够作为音频编码装置、解码装置来实现,而且可以作为由上述音频编码装置获得的编码音频信号信息来实现,也可以作为将由上述音频编码装置、解码装置执行的处理设为步骤的音频编码方法、解码方法来实现,并且,也可以作为电脑程序或存储有其电脑程序的记录媒体来实现。另外,也可以考虑作为用于音频编码及解码的集成电路装置来实现。 
根据本发明的音频编码方法及解码方法包括:选择单元,从多个划分方法中选择一个划分方法,该划分方法用于将频带划分为一个以上的子频带;相差程度编码单元,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的,从而以根据码率的适当的划分方法来获得的子频带进行编码,能够使对码率和音质之间的最佳平衡点的灵活调整变得可能。 
尤其是,按照在多个子频带分别获得的音频信号之间的相差程度的差异,将这些子频带结合起来,作为一个子频带来进行处理的结构中,将相差程度近似的多个子频带结合起来处理,从而不大损坏音质而降低码率,能够提高编码效率。 
附图说明
图1是一种方框图,表示本实施方式涉及的音频编码装置及音频解码装置的功能结构。 
图2是一种示意图,表示将频带划分为子频带时的方法的一个例子。 
图3是一种示意图,表示划分信息代码及相差程度代码的一个例子。 
图4(A)、(B)及(C)是一种说明图,说明生成相差程度代码时的思路。 
图5是一种流程图,表示本实施方式涉及的音频编码装置的工作的一个例子。 
图6是一种方框图,表示音频编码装置及音频解码装置的功能结构的另外一个例子。 
符号说明 
100            音频编码装置 
101、102、103  相差程度算出部 
104            选择部 
105            相差程度及划分信息编码部 
106            代表信号生成部 
107            代表信号编码部 
108            多路复用部 
110            可变频率划分编码部 
200            音频解码装置 
201            多路分配部 
202            划分信息解码部 
203            切换部 
204、205、206  相差程度解码部 
207            代表信号解码部 
208            频率转换部 
209            分离部 
210            可变频率划分解码部 
300            音频编码装置 
306            缩混部 
307            AAC编码部 
308            多路复用部 
310            可变频率划分编码部 
400    音频解码装置 
401    多路分配部 
407    AAC解码部 
408    频率转换部 
409    分离部 
410    可变频率划分解码部 
具体实施方式
以下,根据附图说明本发明的实施方式。 
图1是一种方框图,表示本实施方式的音频编码装置100及音频解码装置200的功能结构的一个例子。 
(音频编码装置100) 
音频编码装置100是一种编码装置,对一个代表音频信号及应该从其代表音频信号分离出来的多个音频信号之间的相差程度进行编码,包括:可变频率划分编码部110、代表信号生成部106、代表信号编码部107、以及多路复用部108。可变频率划分编码部110包括:相差程度算出部101、102、103;选择部104;以及相差程度及划分信息编码部105。 
该实施方式中说明,作为多个音频信号的一个例子,提供了两个音频信号即第一输入信号和第二输入信号,对代表上述两个音频信号的代表音频信号和上述两个音频信号之间的相差程度进行编码时的情况。 
本发明不限定第一输入信号、第二输入信号、以及代表音频信号的具体内容,不过,作为一个典型的例子,第一输入信号和第二输入信号可以是分别表示左、右立体声道的音频信号,代表音频信号可以是将上述两个音频信号相加后所得的单声道信号。 
在此情况下,代表信号生成部106将第一输入信号及第二输入信 号缩混(down mix)成单声道信号,代表信号编码部107,例如根据AAC标准所规定的单独声道的音频编解码方法,将该单声道信号编码成代表信号代码。 
相差程度算出部101、102、103,在每个子频带,且在预先规定的每单位时间,分别编码第一输入信号及第二输入信号之间的相差程度,上述子频带是以不同的划分方法分别对含有声频的频带进行划分而定的。 
虽然本发明不限定该相差程度表示的具体物理量,不过,作为一个例子,可以是表示声道间相关性的ICC(Inter-channel Coherency)、表示声道间电平差的ILD(Inter-channel Level Difference)、以及表示声道间相位差的IPD(Inter-channel Phase Difference)等。另外,该相差程度也可以是通过对第一输入信号及第二输入信号分别进行时间频率转换后所得的频域的信号之间的相差程度。 
本发明的特征在于,在每个子频带表示这种相差程度,该子频带是从频带的多个划分方法中选择采用一个划分方法来设定的。 
图2是一种示意图,表示划分方法A、划分方法B、划分方法C,这些划分方法分别用于相差程度算出部101、102、103。如图所示,频带是按划分方法A、划分方法B、划分方法C的顺序依次成为粗糙的,其分别被划分成5个、3个、1个子频带。实际上,要处理更多的子频带,但是,为了简单的说明,仅列举了上述数量为例。 
划分方法B中设定有子频带B_degree(0)、B_degree(1)、以及B_degree(2),这些子频带是从划分方法A中所设定的五个子频带A_degree(0)、...、A_degree(4)中,按频率低的顺序分别结合了两个子频带、两个子频带、一个子频带的。 
划分方法C中设定有子频带C_degree(0),该子频带是结合了在划分方法B中所设定的三个子频带B_degree(0)、B_degree(1)、B_degree(2)的。 
在这里,如A_degree(4)和B_degree(2)那样,两个划分方法可以 设定相同的子频带。并且,被结合的子频带的数量不限于在这里所示的例子中的数量,而当然可以将四个以上的子频带结合起来。 
相差程度算出部101,在每单位时间,对于划分方法A所设定的五个子频带,分别算出第一输入信号及第二输入信号之间的频域的相差程度。 
为此,相差程度算出部101首先对第一输入信号及第二输入信号各自的单位时间的时间波形进行时间频率转换,转换成频域的信号。该转换采用FFT(快速傅立叶变换:Fast Fourier Transformation)等已知技术来进行。 
在假设所求的相差程度是ICC的情况下,相差程度算出部101,其次以第一输入信号及第二输入信号各自的频域的信号的采样值x(i)、y(i)(i是频率轴上的采样点),按照下述计算公式(1)算出五个子频带各自的频域的ICC即A_degree(0)、...、A_degree(4)。 
计算公式(1) 
A _ degree ( n ) = ICC ( n ) = Σ i ∈ A ( n ) ( x ( i ) * y ( i ) ) Σ i ∈ A ( n ) ( x ( i ) * x ( i ) ) Σ i ∈ A ( n ) ( y ( i ) * y ( i ) ) · · · ( 1 )
n(n=0,...,4)是子频带的号码 
A(n)是以划分方法A所定的第n个子频带 
与此相同,相差程度算出部102,在每单位时间,按照下述计算公式(2)算出三个子频带各自的频域的ICC即B_degree(0)、B_degree(1)、B_degree(2)。 
计算公式(2) 
B _ degree ( n ) = ICC ( n ) = Σ i ∈ B ( n ) ( x ( i ) * y ( i ) ) Σ i ∈ B ( n ) ( x ( i ) * x ( i ) ) Σ i ∈ B ( n ) ( y ( i ) * y ( i ) ) · · · ( 2 )
n(n=0,1,2)是子频带的号码 
B(n)是以划分方法B所定的第n个子频带 
与此相同,相差程度算出部103,在每单位时间,按照下述计算公式(3)算出整个频带中的ICC即C_degree(0)。 
计算公式(3) 
C _ degree ( 0 ) = ICC ( 0 ) = Σ i ∈ C ( x ( i ) * y ( i ) ) Σ i ∈ C ( x ( i ) * x ( i ) ) Σ i ∈ C ( y ( i ) * y ( i ) ) · · · ( 3 )
C是整个频带 
相差程度算出部101、102、103将通过上述方式所得的各相差程度输出到选择部104。 
在假设用于表示每子频带的相差程度的代码量为相同的情况下,由子频带的数量不同可见,相差程度是按划分方法A、划分方法B、划分方法C的顺序依次降低的码率来被编码的。 
在这里,在上述例子中说明作为相差程度求出ICC的情况,不过,在求出ILD的情况下,例如按照下述计算公式(4)算出即可。 
计算公式(4) 
A _ degree ( n ) = ILD ( n ) = Σ i ∈ A ( n ) ( x ( i ) * x ( i ) ) / Σ i ∈ A ( n ) ( y ( i ) * y ( i ) ) · · · ( 4 )
n(n=0,...,4)是子频带的号码 
A(n)是以划分方法A所定的第n个子频带 
选择部104从划分方法A、划分方法B、划分方法C中选择一个用于编码的划分方法。 
例如在不能够确保可以使用的足够的代码量的情况下,即在码率低的情况下,选择部104选择以较低的码率来进行编码的划分方法C。并且,将从相差程度算出部103所得的相差程度输出到相差程度及划分信息编码部105。 
另一方面,在能够确保足够的代码量的情况下,即在码率高的情况下,以较高的码率来进行编码,因此选择可以精细地表示相差程度的划分方法A。并且,将从相差程度算出部101所得的相差程度输出到相差程度及划分信息编码部105。 
另一方面,作为其他选择方法,可以采用以下方法:选择部104首先选择划分方法A,而在从相差程度算出部101所得的多个相差程度实际相同的情况下,重新选择划分方法B,并且,在从相差程度算出部102所得的多个相差程度实际相同的情况下,重新选择划分方法C。并且,向相差程度及划分信息编码部105输出从与最终所选择的划分方法相对应的相差程度算出部所得的相差程度。 
在这里,相差程度实际相同的定义例如是,对于根据比上一个划分方法更粗糙的划分方法所结合的每个子频带算出的相差程度之间的差异(最大值和最小值的差)小、将这些差异当做相同也没有问题,并且,其判断可以通过与预先具体决定的阈值比较来进行。 
通过此选择方法,例如在被选择了划分方法C的情况下,如计算公式(5)所示,所有的相差程度都成为实际相同,因此从编码效率的观点来看,进行了好的选择是很明显的。 
计算公式(5) 
A _ degree ( 0 ) ≅ A _ degree ( 1 ) ≅ A _ degree ( 2 ) ≅ A _ degree ( 3 ) ≅ A _ degree ( 4 )
≅ B _ degree ( 0 ) ≅ B _ degree ( 1 ) ≅ B _ degree ( 2 )
≅ C _ degree ( 0 )
相差程度及划分信息编码部105,将用于识别由选择部104所选择的划分方法的划分信息编码成划分信息代码,并且,将根据所选择的划分方法所设定的每个子频带的相差程度编码成相差程度代码。 
图3是一种示意图,表示由相差程度及划分信息编码部105所生成的划分信息代码及相差程度代码的一个例子。 
根据该图所示的例子,划分信息代码X是对应于划分方法A、划分方法B、划分方法C各自的2比特值“00”、“01”、“10”。并且,相差程度代码是对从相差程度算出部101、102、103所得的、对应于划分方法的每个子频带的相差程度X_degree(i)(i=0、...,n-1、n是与划分方法相对应的子频带的数量,X是按划分方法,A、B、C中的任一个)进行量化并编码后所得的值。 
图4(A)、图4(B)及图4(C)是一种说明图,说明生成相差程度代码时的思路。 
图4(A)表示,在将相差程度设为ICC时的ICC出现频度分布的一个典型例子。该例子表示,ICC在从+1至-1的值之间大体均匀分布。 
图4(B),表示用于ICC的量化的量化网格的一个例子。在ICC为+1的情况下,则表示各信号的相位相同,在ICC为-1的情况下,则表示各信号的相位相反。通常,人的听觉对ICC的辨别灵敏度,在相同相位(ICC=+1)和相反相位(ICC=-1)的附近高,即能听出来ICC值的微小的差别,而在无相关(ICC=0)附近低,即难以听出来ICC值的差别。如图4(B)所示例的量化网格是考虑这种人的听觉特性来设定的。 
图4(C)是霍夫曼代码的一个例子,是按照图4(A)所示的ICC的出现频度分布和图4(B)所示的量化网格来建立的,表示每个量化网格的代表值和与此对应的霍夫曼代码长度。 
在这里,要关注的是,由出现频度分布曲线被切剪的量化网格的面积与代表值的出现频度相对应。例如,对出现频度小的代表值±1分配9比特,对出现频度大的代表值±0.5分配2比特。 
通过这种比特数的分配,众所周知,能够得到平均代码长度成为最小的霍夫曼代码。 
但是,在输入了不断成为相同相位或相反相位的音频信号的情况下,即,作为典型的一个例子,在单纯地对左、右声道输入了单声道信号的情况下,使用上述霍夫曼代码时,在每个编码的单位时间,ICC会不断地以9比特被表示,与将平均代码长度最小化的期待相反,产生很长的代码。尤其是,在对于n个子频带,分别编码ICC的情况下,在编码的每个单位时间,会产生9n比特的代码,因此,n为越大,越对代码长度的影响大。 
于是,考虑到,以用于表示所有的代表值是否都相同的1比特代码和在所有的代码都相同的情况下用于表示其相同的代表值(例如+1)的9比特代码来表示各子频带的代表值。根据该表示方法,能够对于不断获得相同代表值的信号,在每个单位时间,以少于9n比特的、最大10比特的信息量来传递ICC。 
多路复用部108,将从相差程度及划分信息编码部105获得的划分信息代码及相差程度代码、以及从代表信号编码部107获得的代表信号代码多路复用成编码音频信号信息,生成表示此编码音频信号信息的比特流。 
下面,说明音频编码装置100中的可变频率划分编码部110的工作。 
图5是一种流程图,表示可变频率划分编码部110的工作的最佳的一个例子。 
在相差程度算出部101、102、103之中,与可以获得不超过预先所定阈值的码率的划分方法相对应的相差程度算出部进行工作,算出相差程度(S01)。选择部104,将可以获得不超过上述阈值的码率的划 分方法设为选择候选,首先从其中选择子频带的数量最多的划分方法(S02)。 
在有未选择的划分方法的情况下(S03的“是”),选择根据比上一个划分方法更粗糙的划分方法所结合的子频带的一个组(S04)。在对于所选择的组的各个子频带分别算出的相差程度的差小于规定阈值的情况下(S05的“是”),进一步选择其他组来进行同样的比较。并且,在所有的组的相差程度的差小于规定阈值的情况下(S06的“是”),选择比上一个划分方法更粗糙的划分方法(S07),反复进行S03以后的工作。 
当没有了未选择的划分方法、成为选择了最粗糙的划分方法的状态时(S03的“否”),或当相差程度的差是规定阈值以上时(S05的“否”),相差程度及划分信息编码部105对用于识别所选择的划分方法的划分信息以及与所选择的划分方法相对应的相差程度算出部所算出的相差程度进行编码(S08)。 
(音频解码装置200) 
再次根据图1,音频解码装置200是一种解码装置,将由多个音频编码装置100所生成的比特流表示的编码音频信息信号解码成多个音频信号,包括:多路分配部201、可变频率划分解码部210、代表信号解码部207、频率转换部208以及分离部209。可变频率划分解码部210包括:划分信息解码部202、切换部203、以及相差程度解码部204、205、206。 
多路分配部201从由音频编码装置100所生成的比特流多路分离成划分信息代码、相差程度代码以及代表信号代码,将划分信息代码和相差程度代码输出到可变频率划分解码部210,将代表信号代码输出到代表信号解码部207。 
代表信号解码部207将代表信号代码解码成代表音频信号。频率转换部208将代表音频信号的每个单位时间的时间波形转换为频域的信号,输出到分离部209。 
划分信息编码部202将划分信息代码解码成用于识别编码所用的划分方法的划分信息。 
切换部203将相差程度代码输出到与相差程度解码部204、205、206中的、由划分信息所识别的划分方法相对应的任一个。 
相差程度解码部204通过进行与由相差程度及划分信息编码部105所进行的量化及编码相反的处理,将相差程度代码解码成划分方法A的五个子频带各自的相差程度A_degree(n)n(n=0,...,4),输出到分离部209。 
相差程度解码部205通过相同处理,将相差程度代码解码成划分方法B的三个子频带各自的相差程度B_degree(n)n在(n=0,1,2),输出到分离部209。 
相差程度解码部206通过相同处理,将相差程度代码解码成划分方法C的整个频带的相差程度C_degree(0),输出到分离部209。 
如上所述,该相差程度,具体为ICC、ILD等。 
分离部209按照由相差程度解码部204、205或206所得的各个子频带的相差程度,补正由频率转换部208所得的频域的代表音频信号,使得各个子频带分别将其相差程度分离成所提供的两个频率信号。并且,将所得的两个频率信号分别转换成在时域的第一再生信号及第二再生信号。 
该补正例如可以采用以下已知方法来进行,该已知方法是指,将以ILD所示的电平相差的一半分别对逆方向赋予来获得两个频率信号,并对该两个频率信号混合按照ICC的量的原代表音频信号来调整相关的方法。 
根据如上所述的结构,能够获得通过选择使用多个频率划分方法中的任一个,从而可以灵活调整码率和音质之间的最佳平衡点的效果、以及通过将多个子频带结合起来,从而提高编码效率的效果。 
在上述说明中,作为一个例子,将由代表信号解码部207从比特流读取的代表信号代码设为时域的代表音频信号输出,频率转换部208 将该代表音频信号转换成频域的信号,输出到分离部209。除此之外,例如可以采用具备代替代表信号解码部207及频率转换部208的解码部的结构,该解码部在代表信号代码表示频域的代表音频信号的情况下,将从比特流读取的代表信号代码解码成频域的代表音频信号,输出到分离部209。 
(对5.1声道音频的应用) 
可以考虑将如上所述的可变频率划分编码及解码技术对5.1声道音频应用。 
图6是在这种情况下的方框图,表示音频编码装置300和音频解码装置400的功能性结构。 
音频编码装置300是一种编码装置,将由左声道信号L、右声道信号R、后置左声道信号LS、后置右声道信号RS、中心声道信号C以及低频率声道信号LFE而成的5.1声道音频信号解码成表示左合并声道信号LO、右合并声道信号RO以及各个信号之间的相差程度的编码音频信号信息,包括:缩混部306、AAC编码部307、可变频率划分编码部310以及多路复用部308。 
缩混部306将左声道信号L、后置左声道信号LS、中心声道信号C以及低频率数声道信号LFE缩混成左合并声道信号LO,并且将右声道信号R、后置右声道信号LS、中心声道信号C以及低频率声道信号LFE缩混成右合并声道信号RO。 
AAC编码部307按照在AAC规格中规定的单独声道的音频编解码方法,将左合并声道信号LO、右合并声道信号RO分别编码成代表信号代码。 
可变频率划分编码部310选择多个频率划分方法中的任一个,在所选择的划分方法的每个子频带,算出5.1声道音频信号的各个信号之间的相差程度,进行量化及编码。此划分方法的选择、量化及编码中,利用与音频编码装置100中说明的技术相同的技术。 
多路复用部308将由AAC编码部307所得的、分别表示左合并声道信号LO和右合并声道信号RO的代表信号代码以及由可变频率划分编码部310所得的、表示所选择的划分方法和信号之间的相差程度的代码多路复用成编码音频信号信息,生成表示该编码音频信号信息的比特流。 
音频解码装置400是一种解码装置,将由音频编码装置300所生成的比特流表示的编码音频信号信息解码成多个音频信号,包括多路分配部401、可变频率划分解码部410、AAC解码部407、频率转换部408以及分离部409。 
多路分配部401从由音频编码装置300所生成的比特流多路分离出划分信息代码、相差程度代码以及代表信号代码,将划分信息代码和相差程度代码输出到可变频率划分解码部210,将代表信号代码输出到AAC解码部407。 
AAC解码部407将代表信号代码解码成左合并声道信号LO’、右合并声道信号RO’。频率转换部408将左合并声道信号LO’、右合并声道信号RO’的各自的在每个单位时间的时间波形转换成频域的信号,输出到分离部409。 
可变频率划分解码部410,首先,将划分信息代码解码成划分信息,从而知道在可变频率划分编码部310中针对编码所使用的频率划分方法。 
其次,进行与由可变频率划分编码部310所进行的量化及编码相反的处理,从而将相差程度代码解码成其频率划分方法的每个子频带的相差程度。 
并且,按照相差程度,补正左合并声道信号LO’、右合并声道信号RO’的各自的频域的信号,从而将5.1声道的各自的音频信号L’、R’、L’S、R’S、C’、LFE’分离并再生。 
根据这种结构,在对5.1声道音频应用时,也如上所述,能够获得通过选择使用多个频率划分方法中的任一个,从而可以灵活调整码 率和音质之间的最佳平衡点的效果、以及通过将多个子频带结合起来,从而提高编码效率的效果。 
另外,如图所示,将左合并声道信号LO’和右合并声道信号RO’输出到外部,就能以立体声耳机、立体声扬声器系统等比较简便的机器来进行收听,因此在实用方面能够获得高便利性。 
(其他应用例子) 
在上述说明中,以明确应用本发明的具体例子为目的,举了双声道音频、5.1声道音频的例子,不过,本发明的应用范围不限于这种多声道的原音频信号的编码和解码。 
例如,可以考虑应用到对单声道的原音频信号赋予人工的声像扩大或声像定位的音响效果。对于在这种情况下的代表信号,不使用缩混信号,而可以使用单声道的原音频信号本身,并且,不通过多个信号之间的比较,而通过根据故意的声像扩大或声像定位的计算来求出相差程度。 
在这种情况下,也应用本发明的可变频率划分编码及解码,能够获得灵活调整码率和音质之间的最佳平衡点的效果,以及提高编码效率的效果。 
本发明的音频编码装置及音频解码装置可以用于对多声道的音频信号进行编码及解码的所有装置。 
本发明的编码音频信号信息可以用于音频内容及视频音频内容的传输和存储,具体而言,可以用于这种内容的数字广播、通过互联网的向个人电脑或移动信息终端装置的传输、以及在DVD(DigitalVersatile Disk)或SD(Secure Digital)卡等媒体的记录、再生。 

Claims (8)

1.一种音频编码装置,对从一个代表音频信号中将要分离出来的多个音频信号之间的相差程度进行编码,其特征在于,包括:
选择单元,从用于将频带划分为一个以上的子频带的多个划分方法中选择一个划分方法;
相差程度编码单元,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的;以及
划分信息编码单元,对用于识别上述所选择的划分方法的划分信息进行编码;
根据上述多个划分方法被设定的子频带的数量均不相同;
上述多个划分方法中,第一个划分方法用于将上述频带划分为一个以上的子频带;第二个划分方法用于将上述频带划分为多个子频带;根据上述第一个划分方法所划分的子频带中的一个,与根据上述第二个划分方法所划分的子频带中的一个相同,或与将根据上述第二个划分方法所划分的子频带中相互邻接的多个子频带结合起来的频带相同。
2.如权利要求1所述的音频编码装置,其特征在于,
上述音频编码装置进一步包括:相差程度算出单元,针对上述第一个划分方法及第二个划分方法,在每个子频带,分别算出上述多个音频信号之间的相差程度,该子频带是根据各个划分方法被设定的;
上述选择单元,按照根据上述第二个划分方法被划分出的多个子频带的每个算出的相差程度的差异,选择上述第一个划分方法及第二个划分方法中的任一个方法;
上述相差程度编码单元,对在每个子频带分别算出的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的。
3.如权利要求1所述的音频编码装置,其特征在于,
上述相差程度是上述多个音频信号之间的能量差。
4.如权利要求1所述的音频编码装置,其特征在于,
上述相差程度是上述多个音频信号之间的相关性。
5.如权利要求1所述的音频编码装置,其特征在于,
上述代表音频信号是,在对上述多个音频信号进行缩混之后获得的缩混信号。
6.一种音频解码装置,解码编码音频信号信息,该编码音频信号信息包括:相差程度代码,该相差程度代码是,在每个子频带,分别对从一个代表音频信号将要分离出来的多个音频信号之间的相差程度进行编码后所得的,该子频带是根据将频带划分为子频带的多个划分方法中的一个划分方法被设定的;以及划分信息代码,该划分信息代码是,对用于识别划分方法的划分信息进行编码后所得的,该划分方法是在对上述相差程度代码进行编码时所用的,其特征在于,包括:
划分信息解码单元,将上述划分信息代码解码成上述划分信息;以及
相差程度信息解码单元,将上述相差程度代码解码成每个子频带的上述多个音频信号之间的相差程度,该子频带是根据由上述划分信息识别的划分方法被设定的;
根据上述多个划分方法被设定的子频带的数量均不相同;
上述多个划分方法中,第一个划分方法用于将上述频带划分为一个以上的子频带;第二个划分方法用于将上述频带划分为多个子频带;根据上述第一个划分方法所划分的子频带中的一个,与根据上述第二个划分方法所划分的子频带中的一个相同,或与将根据上述第二个划分方法所划分的子频带中相互邻接的多个子频带结合起来的频带相同。
7.一种音频编码方法,对从一个代表音频信号中将要分离出来的多个音频信号之间的相差程度进行编码,其特征在于,包括:
选择步骤,从用于将频带划分为一个以上的子频带的多个划分方法中选择一个划分方法;
相差程度编码步骤,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的;以及
划分信息编码步骤,对用于识别上述所选择的划分方法的划分信息进行编码;
根据上述多个划分方法被设定的子频带的数量均不相同;
上述多个划分方法中,第一个划分方法用于将上述频带划分为一个以上的子频带;第二个划分方法用于将上述频带划分为多个子频带;根据上述第一个划分方法所划分的子频带中的一个,与根据上述第二个划分方法所划分的子频带中的一个相同,或与将根据上述第二个划分方法所划分的子频带中相互邻接的多个子频带结合起来的频带相同。
8.一种音频解码方法,解码编码音频信号信息,该编码音频信号信息包括:相差程度代码,该相差程度代码是,在每个子频带,分别对从一个代表音频信号将要分离出来的多个音频信号之间的相差程度进行编码后所得的,该子频带是根据将频带划分为子频带的多个划分方法中的一个划分方法被设定的;以及划分信息代码,该划分信息代码是,对用于识别划分方法的划分信息进行编码后所得的,该划分方法是在对上述相差程度代码进行编码时所用的,其特征在于,包括:
划分信息解码步骤,将上述划分信息代码解码成上述划分信息;以及
相差程度信息解码步骤,将上述相差程度代码解码成每个子频带的上述多个音频信号之间的相差程度,该子频带是根据由上述划分信息识别的划分方法被设定的;
根据上述多个划分方法被设定的子频带的数量均不相同;
上述多个划分方法中,第一个划分方法用于将上述频带划分为一个以上的子频带;第二个划分方法用于将上述频带划分为多个子频带;根据上述第一个划分方法所划分的子频带中的一个,与根据上述第二个划分方法所划分的子频带中的一个相同,或与将根据上述第二个划分方法所划分的子频带中相互邻接的多个子频带结合起来的频带相同。
CN2005800193874A 2004-09-17 2005-09-13 音频编码装置、解码装置以及方法 Expired - Fee Related CN1969318B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP272444/2004 2004-09-17
JP2004272444 2004-09-17
PCT/JP2005/016794 WO2006030754A1 (ja) 2004-09-17 2005-09-13 オーディオ符号化装置、復号化装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
CN1969318A CN1969318A (zh) 2007-05-23
CN1969318B true CN1969318B (zh) 2011-11-02

Family

ID=36060006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800193874A Expired - Fee Related CN1969318B (zh) 2004-09-17 2005-09-13 音频编码装置、解码装置以及方法

Country Status (4)

Country Link
US (1) US7860721B2 (zh)
JP (1) JP4809234B2 (zh)
CN (1) CN1969318B (zh)
WO (1) WO2006030754A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2927206B1 (fr) * 2008-02-04 2014-02-14 Groupe Des Ecoles De Telecommunications Get Ecole Nationale Superieure Des Telecommunications Enst Procede de decodage d'un signal transmis dans un systeme multi-antennes, produit programme d'ordinateur et dispositif de decodage correspondants.
KR101756838B1 (ko) * 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
CN105632505B (zh) * 2014-11-28 2019-12-20 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置
CN107864448B (zh) * 2017-11-21 2020-05-05 深圳市希顿科技有限公司 一种基于蓝牙2.0或3.0实现双通道通讯的设备及其通讯方法
CN112862106B (zh) * 2021-01-19 2024-01-30 中国人民大学 一种基于自适应编解码迭代学习控制信息传输系统和方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5736943A (en) * 1993-09-15 1998-04-07 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method for determining the type of coding to be selected for coding at least two signals
CN1451154A (zh) * 1999-07-19 2003-10-22 高通股份有限公司 话音编码设备中计算帧原型间线性相移的频带识别方法和装置
CN1498396A (zh) * 2002-01-30 2004-05-19 ���µ�����ҵ��ʽ���� 音频编码与解码设备及其方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
AU5663296A (en) * 1995-04-10 1996-10-30 Corporate Computer Systems, Inc. System for compression and decompression of audio signals fo r digital transmission
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US7395209B1 (en) * 2000-05-12 2008-07-01 Cirrus Logic, Inc. Fixed point audio decoding system and method
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
EP1393298B1 (en) 2001-05-25 2010-06-09 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
JP3823804B2 (ja) 2001-10-22 2006-09-20 ソニー株式会社 信号処理方法及び装置、信号処理プログラム、並びに記録媒体
JP2003271168A (ja) 2002-03-15 2003-09-25 Nippon Telegr & Teleph Corp <Ntt> 信号抽出方法および信号抽出装置、信号抽出プログラムとそのプログラムを記録した記録媒体
JP4714416B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
EP1500083B1 (en) * 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
KR20050021484A (ko) * 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
EP1554716A1 (en) 2002-10-14 2005-07-20 Koninklijke Philips Electronics N.V. Signal filtering

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5736943A (en) * 1993-09-15 1998-04-07 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method for determining the type of coding to be selected for coding at least two signals
CN1451154A (zh) * 1999-07-19 2003-10-22 高通股份有限公司 话音编码设备中计算帧原型间线性相移的频带识别方法和装置
CN1498396A (zh) * 2002-01-30 2004-05-19 ���µ�����ҵ��ʽ���� 音频编码与解码设备及其方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特开2003-271168A 2003.09.25

Also Published As

Publication number Publication date
JPWO2006030754A1 (ja) 2008-05-15
CN1969318A (zh) 2007-05-23
JP4809234B2 (ja) 2011-11-09
US7860721B2 (en) 2010-12-28
WO2006030754A1 (ja) 2006-03-23
US20080059203A1 (en) 2008-03-06

Similar Documents

Publication Publication Date Title
US11343631B2 (en) Compatible multi-channel coding/decoding
JP4794448B2 (ja) オーディオエンコーダ
KR100955361B1 (ko) 적응 잔류 오디오 코딩
KR100717598B1 (ko) 파라미트릭 멀티채널 코딩 시스템에서의 주파수 기반오디오 채널 코딩
KR101117336B1 (ko) 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
US7916873B2 (en) Stereo compatible multi-channel audio coding
CN102171754B (zh) 编码装置以及解码装置
CN1758337B (zh) 用于低比特率音频编码应用的高效可标度参数立体声编码
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
MX2007002854A (es) Metodo y dispositivo para generar senal de multicanal o conjunto de datos de parametros.
KR20090095009A (ko) 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
CN1969318B (zh) 音频编码装置、解码装置以及方法
JP2008536411A (ja) 最大ビットレートを保証する情報の無損失符号化
EP2360684B1 (en) Audio reproducing device and audio reproducing method
US8271291B2 (en) Method and an apparatus for identifying frame type
CN106463131B (zh) 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置
AU2004306509B2 (en) Compatible multi-channel coding/decoding
WO2020201619A1 (en) Spatial audio representation and associated rendering
GB2598773A (en) Quantizing spatial audio parameters
KR20070108314A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111102

Termination date: 20200913