CN1969318A - 音频编码装置、解码装置、方法、以及程序 - Google Patents

音频编码装置、解码装置、方法、以及程序 Download PDF

Info

Publication number
CN1969318A
CN1969318A CNA2005800193874A CN200580019387A CN1969318A CN 1969318 A CN1969318 A CN 1969318A CN A2005800193874 A CNA2005800193874 A CN A2005800193874A CN 200580019387 A CN200580019387 A CN 200580019387A CN 1969318 A CN1969318 A CN 1969318A
Authority
CN
China
Prior art keywords
division
difference degree
mentioned
sub
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800193874A
Other languages
English (en)
Other versions
CN1969318B (zh
Inventor
津岛峰生
高木良明
小野耕司郎
田中直也
宫阪修二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1969318A publication Critical patent/CN1969318A/zh
Application granted granted Critical
Publication of CN1969318B publication Critical patent/CN1969318B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供一种音频编码装置及解码装置,能够灵活调整码率和音质之间的最佳平衡点。可变频率划分编码部(110)包括:相差程度算出部(101、102、103),根据将频带划分为子频带的划分方法(A、B、C),分别算出第一输入信号和第二输入信号间的相差程度;选择部(104),选择一个划分方法;以及相差程度及划分信息编码部(105),对所选择的划分方法和根据其划分方法的每个子频带的相差程度进行编码,可变频率划分解码部(210)包括:划分信息解码部(202),解码划分信息来把握划分方法;切换部(203),将相差程度代码输出到根据划分方法的一个相差程度解码部;以及相差程度解码部(204、205、206),将相差程度代码解码成每子频带的相差程度。

Description

音频编码装置、解码装置、方法、以及程序
技术领域
本发明涉及音频信号的编码装置以及解码装置等,尤其涉及使码率和音质之间的最佳平衡点的灵活调整成为可能的技术。
背景技术
原来,作为音频编码方法及解码方法,广泛普及俗称为MPEG(运动图像专家组:Moving Picture Experts Group)方式等ISO/IEC国际标准方式。现在,作为以具有高应用性、且用低比特率表示高保真音频信号为目的的编码方法,已经出现了ISO/IEC13818-7即俗称为MPEG-2AAC(高级音频编码:Advanced Audio Coding)的编码方法。
根据此AAC,在对多声道音频信号进行编码时,采用称为MS立体声(中侧立体声:Mid Side Stereo)或强度立体声(Intensity Stereo)的方式来表示声道之间的相关性,从而压缩音频信息,提高编码效率。
根据MS立体声,以和信号与差信号表示立体声信号,对双方分配不同的代码量。并且,根据强度立体声,将频带划分成子频带,在每个子频带,对各个声道的信号之间的电平差和相位差(相位差有相同相位或相反相位的两个阶段)进行编码。
正在进行制定此AAC的多个扩展标准的工作。其中将引进利用称为空间音响信息(Spatial Cue Information)或听觉音响信息(Binaural Cue)的信息的编码技术。作为这种编码技术的一个例子,有根据ISO国际标准即MPEG-4Audio(非专利文献1)所制定的参量立体声(Parametric Stereo)方式,并且,作为另外一个例子,也有专利文献1及2所公开的技术。
专利文献1:美国专利申请公开说明书第2003/0035553号《Backwards-compatible Perceptual Coding of Spatial Cues》
专利文献2:美国专利申请公开说明书第2003/0219130号《Coherence-based Audio Coding and Synthesis》
非专利文献1:ISO/IEC 14496-3:2001 AMD2《Parametric Codingfor High Quality Audio》
然而,根据以往的音频编码方法及解码方法,由于在每个子频带,对各个声道的信号之间的相差进行编码,因此有不能灵活调整码率和音质的最佳平衡点的课题。
发明内容
本发明的目的在于,鉴于这种以往的问题,提供一种音频编码装置、解码装置、方法、以及程序,能够灵活调整码率和音质之间的最佳平衡点。
为了解决上述课题,本发明的音频编码装置是一种音频编码装置,对从一个代表音频信号中应该分离出来的多个音频信号之间的相差程度进行编码,包括:选择单元,从多个划分方法中选择一个划分方法,该划分方法用于将频带划分为一个以上的子频带;相差程度编码单元,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的;以及划分信息编码单元,对用于识别上述所选择的划分方法的划分信息进行编码。
并且,优选的是,根据上述多个划分方法被设定的子频带的数量可以均不相同;另外,上述多个划分方法中,第一个划分方法可以用于将上述频带划分为一个以上的子频带;第二个划分方法可以用于将上述频带划分为多个子频带;根据上述第一个划分方法所划分的子频带中的一个,可以与根据上述第二个划分方法所划分的子频带中的一个相同,或可以与将根据上述第二个划分方法所划分的子频带中相互邻接的多个子频带结合起来的频带相同。
并且,上述相差程度可以是上述多个音频信号之间的能源差及相关性中的至少一个;并且,上述代表音频信号可以是在对上述多个音频信号进行缩混之后获得的缩混信号。
根据此结构,因为可以以按照码率的、适当的划分方法来进行编码,因此,能够灵活调整码率和音质之间的最佳平衡点。
并且,上述音频编码装置可以进一步包括:相差程度算出单元,针对上述第一个划分方法及第二个划分方法,在每个子频带,分别算出上述多个音频信号之间的相差程度,该子频带是根据其划分方法被设定的;上述选择单元,可以按照在多个子频带分别算出的相差程度的差异,选择上述第一个划分方法及第二个划分方法中的任一个方法,上述多个子频带是根据上述第二个划分方法被划分的;上述相差程度信息编码单元,可以对在每个子频带分别算出的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的。
根据此结构,将相差程度近似的多个子频带结合起来处理,从而不大损坏音质而降低码率,可以提高编码效率。
为了解决上述课题,本发明的音频解码装置是一种音频解码装置,解码编码音频信号信息,该编码音频信号信息包括:相差程度代码,该相差程度代码是,在每个子频带,分别对从一个代表音频信号应该分离出来的多个音频信号之间的相差程度进行编码后所得的,该子频带是根据将频带划分为子频带的多个划分方法中的一个划分方法被设定的;以及划分信息代码,该划分信息代码是,对用于识别划分方法的划分信息进行编码后所得的,该划分方法是在对上述相差程度代码进行编码时所用的,包括:划分信息解码单元,将上述划分信息代码解码成上述划分信息;以及相差程度信息解码单元,将上述相差程度代码解码成每个子频带的上述多个音频信号之间的相差程度,该子频带是根据由上述划分信息识别的划分方法被设定的。
根据此结构,按照划分信息代码,对所得的编码音频信号信息进行正确的解码,来能够获得音频信号信息,该所得的编码音频信号信息是在由上述音频编码装置适当地调整了码率和音质之间的平衡点后所得的。
并且,本发明不仅能够作为音频编码装置、解码装置来实现,而且可以作为由上述音频编码装置获得的编码音频信号信息来实现,也可以作为将由上述音频编码装置、解码装置执行的处理设为步骤的音频编码方法、解码方法来实现,并且,也可以作为电脑程序或存储有其电脑程序的记录媒体来实现。另外,也可以考虑作为用于音频编码及解码的集成电路装置来实现。
根据本发明的音频编码方法及解码方法包括:选择单元,从多个划分方法中选择一个划分方法,该划分方法用于将频带划分为一个以上的子频带;相差程度编码单元,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的,从而以根据码率的适当的划分方法来获得的子频带进行编码,能够使对码率和音质之间的最佳平衡点的灵活调整变得可能。
尤其是,按照在多个子频带分别获得的音频信号之间的相差程度的差异,将这些子频带结合起来,作为一个子频带来进行处理的结构中,将相差程度近似的多个子频带结合起来处理,从而不大损坏音质而降低码率,能够提高编码效率。
附图说明
图1是一种方框图,表示本实施方式涉及的音频编码装置及音频解码装置的功能结构。
图2是一种示意图,表示将频带划分为子频带时的方法的一个例子。
图3是一种示意图,表示划分信息代码及相差程度代码的一个例子。
图4(A)、(B)及(C)是一种说明图,说明生成相差程度代码时的思路。
图5是一种流程图,表示本实施方式涉及的音频编码装置的工作的一个例子。
图6是一种方框图,表示音频编码装置及音频解码装置的功能结构的另外一个例子。
符号说明
100      音频编码装置
101、102、103    相差程度算出部
104    选择部
105    相差程度及划分信息编码部
106    代表信号生成部
107    代表信号编码部
108    多路复用部
110    可变频率划分编码部
200    音频解码装置
201    多路分配部
202    划分信息解码部
203    切换部
204、205、206    相差程度解码部
207    代表信号解码部
208    频率转换部
209    分离部
210    可变频率划分解码部
300    音频编码装置
306    缩混部
307    AAC编码部
308    多路复用部
310    可变频率划分编码部
400    音频解码装置
401    多路分配部
407    AAC解码部
408    频率转换部
409    分离部
410    可变频率划分解码部
具体实施方式
以下,根据附图说明本发明的实施方式。
图1是一种方框图,表示本实施方式的音频编码装置100及音频解码装置200的功能结构的一个例子。
(音频编码装置100)
音频编码装置100是一种编码装置,对一个代表音频信号及应该从其代表音频信号分离出来的多个音频信号之间的相差程度进行编码,包括:可变频率划分编码部110、代表信号生成部106、代表信号编码部107、以及多路复用部108。可变频率划分编码部110包括:相差程度算出部101、102、103;选择部104;以及相差程度及划分信息编码部105。
该实施方式中说明,作为多个音频信号的一个例子,提供了两个音频信号即第一输入信号和第二输入信号,对代表上述两个音频信号的代表音频信号和上述两个音频信号之间的相差程度进行编码时的情况。
本发明不限定第一输入信号、第二输入信号、以及代表音频信号的具体内容,不过,作为一个典型的例子,第一输入信号和第二输入信号可以是分别表示左、右立体声道的音频信号,代表音频信号可以是将上述两个音频信号相加后所得的单声道信号。
在此情况下,代表信号生成部106将第一输入信号及第二输入信号缩混(down mix)成单声道信号,代表信号编码部107,例如根据AAC标准所规定的单独声道的音频编解码方法,将该单声道信号编码成代表信号代码。
相差程度算出部101、102、103,在每个子频带,且在预先规定的每单位时间,分别编码第一输入信号及第二输入信号之间的相差程度,上述子频带是以不同的划分方法分别对含有声频的频带进行划分而定的。
虽然本发明不限定该相差程度表示的具体物理量,不过,作为一个例子,可以是表示声道间相关性的ICC(Inter-channel Coherency)、表示声道间电平差的ILD(Inter-channel Level Difference)、以及表示声道间相位差的IPD(Inter-channel Phase Difference)等。另外,该相差程度也可以是通过对第一输入信号及第二输入信号分别进行时间频率转换后所得的频域的信号之间的相差程度。
本发明的特征在于,在每个子频带表示这种相差程度,该子频带是从频带的多个划分方法中选择采用一个划分方法来设定的。
图2是一种示意图,表示划分方法A、划分方法B、划分方法C,这些划分方法分别用于相差程度算出部101、102、103。如图所示,频带是按划分方法A、划分方法B、划分方法C的顺序依次成为粗糙的,其分别被划分成5个、3个、1个子频带。实际上,要处理更多的子频带,但是,为了简单的说明,仅列举了上述数量为例。
划分方法B中设定有子频带B_degree(0)、B_degree(1)、以及B_degree(2),这些子频带是从划分方法A中所设定的五个子频带A_degree(0)、…、A_degree(4)中,按频率低的顺序分别结合了两个子频带、两个子频带、一个子频带的。
划分方法C中设定有子频带C_degree(0),该子频带是结合了在划分方法B中所设定的三个子频带B_degree(0)、B_degree(1)、B_degree(2)的。
在这里,如A_degree(4)和B_degree(2)那样,两个划分方法可以设定相同的子频带。并且,被结合的子频带的数量不限于在这里所示的例子中的数量,而当然可以将四个以上的子频带结合起来。
相差程度算出部101,在每单位时间,对于划分方法A所设定的五个子频带,分别算出第一输入信号及第二输入信号之间的频域的相差程度。
为此,相差程度算出部101首先对第一输入信号及第二输入信号各自的单位时间的时间波形进行时间频率转换,转换成频域的信号。该转换采用FFT(快速傅立叶变换:Fast Fourier Transformation)等已知技术来进行。
在假设所求的相差程度是ICC的情况下,相差程度算出部101,其次以第一输入信号及第二输入信号各自的频域的信号的采样值x(i)、y(i)(i是频率轴上的采样点),按照下述计算公式(1)算出五个子频带各自的频域的ICC即A_degree(0)、…、A_degree(4)。
计算公式(1)
A _ degree ( n ) = ICC ( n ) = Σ i ∈ A ( n ) ( x ( i ) * y ( i ) ) Σ i ∈ A ( n ) ( x ( i ) * x ( i ) ) Σ i ∈ A ( n ) ( y ( i ) * y ( i ) ) · · · ( 1 )
n(n=0,…,4)是子频带的号码
A(n)是以划分方法A所定的第n个子频带
与此相同,相差程度算出部102,在每单位时间,按照下述计算公式(2)算出三个子频带各自的频域的ICC即B_degree(0)、B_degree(1)、B_degree(2)。
计算公式(2)
B _ degree ( n ) = ICC ( n ) = Σ i ∈ B ( n ) ( x ( i ) * y ( i ) ) Σ i ∈ B ( n ) ( x ( i ) * x ( i ) ) Σ i ∈ B ( n ) ( y ( i ) * y ( i ) ) · · · ( 2 )
n(n=0,1,2)是子频带的号码
B(n)是以划分方法B所定的第n个子频带
与此相同,相差程度算出部103,在每单位时间,按照下述计算公式(3)算出整个频带中的ICC即C_degree(0)。
计算公式(3)
C _ degree ( 0 ) = ICC ( 0 ) = Σ i ∈ C ( x ( i ) * y ( i ) ) Σ i ∈ C ( x ( i ) * x ( i ) ) Σ i ∈ C ( y ( i ) * y ( i ) ) · · · ( 3 )
C是整个频带
相差程度算出部101、102、103将通过上述方式所得的各相差程度输出到选择部104。
在假设用于表示每子频带的相差程度的代码量为相同的情况下,由子频带的数量不同可见,相差程度是按划分方法A、划分方法B、划分方法C的顺序依次降低的码率来被编码的。
在这里,在上述例子中说明作为相差程度求出ICC的情况,不过,在求出ILD的情况下,例如按照下述计算公式(4)算出即可。
计算公式(4)
A _ degree ( n ) = ILD ( n ) = Σ i ∈ A ( n ) ( x ( i ) * x ( i ) ) / Σ i ∈ A ( n ) ( y ( i ) * y ( i ) ) · · · ( 4 )
n(n=0,…,4)是子频带的号码
A(n)是以划分方法A所定的第n个子频带
选择部104从划分方法A、划分方法B、划分方法C中选择一个用于编码的划分方法。
例如在不能够确保可以使用的足够的代码量的情况下,即在码率低的情况下,选择部104选择以较低的码率来进行编码的划分方法C。并且,将从相差程度算出部103所得的相差程度输出到相差程度及划分信息编码部105。
另一方面,在能够确保足够的代码量的情况下,即在码率高的情况下,以较高的码率来进行编码,因此选择可以精细地表示相差程度的划分方法A。并且,将从相差程度算出部101所得的相差程度输出到相差程度及划分信息编码部105。
另一方面,作为其他选择方法,可以采用以下方法:选择部104首先选择划分方法A,而在从相差程度算出部101所得的多个相差程度实际相同的情况下,重新选择划分方法B,并且,在从相差程度算出部102所得的多个相差程度实际相同的情况下,重新选择划分方法C。并且,向相差程度及划分信息编码部105输出从与最终所选择的划分方法相对应的相差程度算出部所得的相差程度。
在这里,相差程度实际相同的定义例如是,对于根据比上一个划分方法更粗糙的划分方法所结合的每个子频带算出的相差程度之间的差异(最大值和最小值的差)小、将这些差异当做相同也没有问题,并且,其判断可以通过与预先具体决定的阈值比较来进行。
通过此选择方法,例如在被选择了划分方法C的情况下,如计算公式(5)所示,所有的相差程度都成为实际相同,因此从编码效率的观点来看,进行了好的选择是很明显的。
计算公式(5)
A _ degree ( 0 ) ≅ A _ degree ( 1 ) ≅ A _ degree ( 2 ) ≅ A _ degree ( 3 ) ≅ A _ degree ( 4 )
≅ B _ degree ( 0 ) ≅ B _ degree ( 1 ) ≅ B _ degree ( 2 )
≅ C _ degree ( 0 ) · · · ( 5 )
相差程度及划分信息编码部105,将用于识别由选择部104所选择的划分方法的划分信息编码成划分信息代码,并且,将根据所选择的划分方法所设定的每个子频带的相差程度编码成相差程度代码。
图3是一种示意图,表示由相差程度及划分信息编码部105所生成的划分信息代码及相差程度代码的一个例子。
根据该图所示的例子,划分信息代码X是对应于划分方法A、划分方法B、划分方法C各自的2比特值“00”、“01”、“10”。并且,相差程度代码是对从相差程度算出部101、102、103所得的、对应于划分方法的每个子频带的相差程度X_degree(i)(i=0、…,n-1、n是与划分方法相对应的子频带的数量,X是按划分方法,A、B、C中的任一个)进行量化并编码后所得的值。
图4(A)、图4(B)及图4(C)是一种说明图,说明生成相差程度代码时的思路。
图4(A)表示,在将相差程度设为ICC时的ICC出现频度分布的一个典型例子。该例子表示,ICC在从+1至-1的值之间大体均匀分布。
图4(B),表示用于ICC的量化的量化网格的一个例子。在ICC为+1的情况下,则表示各信号的相位相同,在ICC为-1的情况下,则表示各信号的相位相反。通常,人的听觉对ICC的辨别灵敏度,在相同相位(ICC=+1)和相反相位(ICC=-1)的附近高,即能听出来ICC值的微小的差别,而在无相关(ICC=0)附近低,即难以听出来ICC值的差别。如图4(B)所示例的量化网格是考虑这种人的听觉特性来设定的。
图4(C)是霍夫曼代码的一个例子,是按照图4(A)所示的ICC的出现频度分布和图4(B)所示的量化网格来建立的,表示每个量化网格的代表值和与此对应的霍夫曼代码长度。
在这里,要关注的是,由出现频度分布曲线被切剪的量化网格的面积与代表值的出现频度相对应。例如,对出现频度小的代表值±1分配9比特,对出现频度大的代表值±0.5分配2比特。
通过这种比特数的分配,众所周知,能够得到平均代码长度成为最小的霍夫曼代码。
但是,在输入了不断成为相同相位或相反相位的音频信号的情况下,即,作为典型的一个例子,在单纯地对左、右声道输入了单声道信号的情况下,使用上述霍夫曼代码时,在每个编码的单位时间,ICC会不断地以9比特被表示,与将平均代码长度最小化的期待相反,产生很长的代码。尤其是,在对于n个子频带,分别编码ICC的情况下,在编码的每个单位时间,会产生9n比特的代码,因此,n为越大,越对代码长度的影响大。
于是,考虑到,以用于表示所有的代表值是否都相同的1比特代码和在所有的代码都相同的情况下用于表示其相同的代表值(例如+1)的9比特代码来表示各子频带的代表值。根据该表示方法,能够对于不断获得相同代表值的信号,在每个单位时间,以少于9n比特的、最大10比特的信息量来传递ICC。
多路复用部108,将从相差程度及划分信息编码部105获得的划分信息代码及相差程度代码、以及从代表信号编码部107获得的代表信号代码多路复用成编码音频信号信息,生成表示此编码音频信号信息的比特流。
下面,说明音频编码装置100中的可变频率划分编码部110的工作。
图5是一种流程图,表示可变频率划分编码部110的工作的最佳的一个例子。
在相差程度算出部101、102、103之中,与可以获得不超过预先所定阈值的码率的划分方法相对应的相差程度算出部进行工作,算出相差程度(S01)。选择部104,将可以获得不超过上述阈值的码率的划分方法设为选择候选,首先从其中选择子频带的数量最多的划分方法(S02)。
在有未选择的划分方法的情况下(S03的“是”),选择根据比上一个划分方法更粗糙的划分方法所结合的子频带的一个组(S04)。在对于所选择的组的各个子频带分别算出的相差程度的差小于规定阈值的情况下(S05的“是”),进一步选择其他组来进行同样的比较。并且,在所有的组的相差程度的差小于规定阈值的情况下(S06的“是”),选择比上一个划分方法更粗糙的划分方法(S07),反复进行S03以后的工作。
当没有了未选择的划分方法、成为选择了最粗糙的划分方法的状态时(S03的“否”),或当相差程度的差是规定阈值以上时(S05的“否”),相差程度及划分信息编码部105对用于识别所选择的划分方法的划分信息以及与所选择的划分方法相对应的相差程度算出部所算出的相差程度进行编码(S08)。
(音频解码装置200)
再次根据图1,音频解码装置200是一种解码装置,将由多个音频编码装置100所生成的比特流表示的编码音频信息信号解码成多个音频信号,包括:多路分配部201、可变频率划分解码部210、代表信号解码部207、频率转换部208以及分离部209。可变频率划分解码部210包括:划分信息解码部202、切换部203、以及相差程度解码部204、205、206。
多路分配部201从由音频编码装置100所生成的比特流多路分离成划分信息代码、相差程度代码以及代表信号代码,将划分信息代码和相差程度代码输出到可变频率划分解码部210,将代表信号代码输出到代表信号解码部207。
代表信号解码部207将代表信号代码解码成代表音频信号。频率转换部208将代表音频信号的每个单位时间的时间波形转换为频域的信号,输出到分离部209。
划分信息编码部202将划分信息代码解码成用于识别编码所用的划分方法的划分信息。
切换部203将相差程度代码输出到与相差程度解码部204、205、206中的、由划分信息所识别的划分方法相对应的任一个。
相差程度解码部204通过进行与由相差程度及划分信息编码部105所进行的量化及编码相反的处理,将相差程度代码解码成划分方法A的五个子频带各自的相差程度A_degree(n)n(n=0,…,4),输出到分离部209。
相差程度解码部205通过相同处理,将相差程度代码解码成划分方法B的三个子频带各自的相差程度B_degree(n)n在(n=0,1,2),输出到分离部209。
相差程度解码部206通过相同处理,将相差程度代码解码成划分方法C的整个频带的相差程度C_degree(0),输出到分离部209。
如上所述,该相差程度,具体为ICC、ILD等。
分离部209按照由相差程度解码部204、205或206所得的各个子频带的相差程度,补正由频率转换部208所得的频域的代表音频信号,使得各个子频带分别将其相差程度分离成所提供的两个频率信号。并且,将所得的两个频率信号分别转换成在时域的第一再生信号及第二再生信号。
该补正例如可以采用以下已知方法来进行,该已知方法是指,将以ILD所示的电平相差的一半分别对逆方向赋予来获得两个频率信号,并对该两个频率信号混合按照ICC的量的原代表音频信号来调整相关的方法。
根据如上所述的结构,能够获得通过选择使用多个频率划分方法中的任一个,从而可以灵活调整码率和音质之间的最佳平衡点的效果、以及通过将多个子频带结合起来,从而提高编码效率的效果。
在上述说明中,作为一个例子,将由代表信号解码部207从比特流读取的代表信号代码设为时域的代表音频信号输出,频率转换部208将该代表音频信号转换成频域的信号,输出到分离部209。除此之外,例如可以采用具备代替代表信号解码部207及频率转换部208的解码部的结构,该解码部在代表信号代码表示频域的代表音频信号的情况下,将从比特流读取的代表信号代码解码成频域的代表音频信号,输出到分离部209。
(对5.1声道音频的应用)
可以考虑将如上所述的可变频率划分编码及解码技术对5.1声道音频应用。
图6是在这种情况下的方框图,表示音频编码装置300和音频解码装置400的功能性结构。
音频编码装置300是一种编码装置,将由左声道信号L、右声道信号R、后置左声道信号LS、后置右声道信号RS、中心声道信号C以及低频率声道信号LFE而成的5.1声道音频信号解码成表示左合并声道信号LO、右合并声道信号RO以及各个信号之间的相差程度的编码音频信号信息,包括:缩混部306、AAC编码部307、可变频率划分编码部310以及多路复用部308。
缩混部306将左声道信号L、后置左声道信号LS、中心声道信号C以及低频率数声道信号LFE缩混成左合并声道信号LO,并且将右声道信号R、后置右声道信号LS、中心声道信号C以及低频率声道信号LFE缩混成右合并声道信号RO。
AAC编码部307按照在AAC规格中规定的单独声道的音频编解码方法,将左合并声道信号LO、右合并声道信号RO分别编码成代表信号代码。
可变频率划分编码部310选择多个频率划分方法中的任一个,在所选择的划分方法的每个子频带,算出5.1声道音频信号的各个信号之间的相差程度,进行量化及编码。此划分方法的选择、量化及编码中,利用与音频编码装置100中说明的技术相同的技术。
多路复用部308将由AAC编码部307所得的、分别表示左合并声道信号LO和右合并声道信号RO的代表信号代码以及由可变频率划分编码部310所得的、表示所选择的划分方法和信号之间的相差程度的代码多路复用成编码音频信号信息,生成表示该编码音频信号信息的比特流。
音频解码装置400是一种解码装置,将由音频编码装置300所生成的比特流表示的编码音频信号信息解码成多个音频信号,包括多路分配部401、可变频率划分解码部410、AAC解码部407、频率转换部408以及分离部409。
多路分配部401从由音频编码装置300所生成的比特流多路分离出划分信息代码、相差程度代码以及代表信号代码,将划分信息代码和相差程度代码输出到可变频率划分解码部210,将代表信号代码输出到AAC解码部407。
AAC解码部407将代表信号代码解码成左合并声道信号LO’、右合并声道信号RO’。频率转换部408将左合并声道信号LO’、右合并声道信号RO’的各自的在每个单位时间的时间波形转换成频域的信号,输出到分离部409。
可变频率划分解码部410,首先,将划分信息代码解码成划分信息,从而知道在可变频率划分编码部310中针对编码所使用的频率划分方法。
其次,进行与由可变频率划分编码部310所进行的量化及编码相反的处理,从而将相差程度代码解码成其频率划分方法的每个子频带的相差程度。
并且,按照相差程度,补正左合并声道信号LO’、右合并声道信号RO’的各自的频域的信号,从而将5.1声道的各自的音频信号L’、R’、L’S、R’S、C’、LFE’分离并再生。
根据这种结构,在对5.1声道音频应用时,也如上所述,能够获得通过选择使用多个频率划分方法中的任一个,从而可以灵活调整码率和音质之间的最佳平衡点的效果、以及通过将多个子频带结合起来,从而提高编码效率的效果。
另外,如图所示,将左合并声道信号LO’和右合并声道信号RO’输出到外部,就能以立体声耳机、立体声扬声器系统等比较简便的机器来进行收听,因此在实用方面能够获得高便利性。
(其他应用例子)
在上述说明中,以明确应用本发明的具体例子为目的,举了双声道音频、5.1声道音频的例子,不过,本发明的应用范围不限于这种多声道的原音频信号的编码和解码。
例如,可以考虑应用到对单声道的原音频信号赋予人工的声像扩大或声像定位的音响效果。对于在这种情况下的代表信号,不使用缩混信号,而可以使用单声道的原音频信号本身,并且,不通过多个信号之间的比较,而通过根据故意的声像扩大或声像定位的计算来求出相差程度。
在这种情况下,也应用本发明的可变频率划分编码及解码,能够获得灵活调整码率和音质之间的最佳平衡点的效果,以及提高编码效率的效果。
本发明的音频编码装置及音频解码装置可以用于对多声道的音频信号进行编码及解码的所有装置。
本发明的编码音频信号信息可以用于音频内容及视频音频内容的传输和存储,具体而言,可以用于这种内容的数字广播、通过互联网的向个人电脑或移动信息终端装置的传输、以及在DVD(DigitalVersatile Disk)或SD(Secure Digital)卡等媒体的记录、再生。

Claims (14)

1、一种音频编码装置,对从一个代表音频信号中应该分离出来的多个音频信号之间的相差程度进行编码,其特征在于,包括:
选择单元,从多个划分方法中选择一个划分方法,该划分方法用于将频带划分为一个以上的子频带;
相差程度编码单元,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的;以及
划分信息编码单元,对用于识别上述所选择的划分方法的划分信息进行编码。
2、如权利要求1所述的音频编码装置,其特征在于,
根据上述多个划分方法被设定的子频带的数量均不相同。
3、如权利要求2所述的音频编码装置,其特征在于,
上述多个划分方法中,第一个划分方法用于将上述频带划分为一个以上的子频带;第二个划分方法用于将上述频带划分为多个子频带;根据上述第一个划分方法所划分的子频带中的一个,与根据上述第二个划分方法所划分的子频带中的一个相同,或与将根据上述第二个划分方法所划分的子频带中相互邻接的多个子频带结合起来的频带相同。
4、如权利要求3所述的音频编码装置,其特征在于,
上述音频编码装置进一步包括:相差程度算出单元,针对上述第一个划分方法及第二个划分方法,在每个子频带,分别算出上述多个音频信号之间的相差程度,该子频带是根据各个划分方法被设定的;
上述选择单元,按照在多个子频带分别算出的相差程度的差异,选择上述第一个划分方法及第二个划分方法中的任一个方法,上述多个子频带是根据上述第二个划分方法被划分的;
上述相差程度信息编码单元,对在每个子频带分别算出的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的。
5、如权利要求1所述的音频编码装置,其特征在于,
上述相差程度是上述多个音频信号之间的能量差。
6、如权利要求1所述的音频编码装置,其特征在于,
上述相差程度是上述多个音频信号之间的相关性。
7、如权利要求1所述的音频编码装置,其特征在于,
上述代表音频信号是,在对上述多个音频信号进行缩混之后获得的缩混信号。
8、一种编码音频信号信息,表示从一个代表音频信号中应该分离出来的多个音频信号之间的相差程度,其特征在于,包括:
相差程度代码,该相差程度代码是,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码后所得的,该子频带是根据将频带划分为子频带的多个划分方法中的一个划分方法被设定的;以及
划分信息代码,该划分信息代码是,对用于识别划分方法的划分信息进行编码后所得的,该划分方法是在对上述相差程度代码进行编码时所用的。
9、一种音频解码装置,解码编码音频信号信息,该编码音频信号信息包括:相差程度代码,该相差程度代码是,在每个子频带,分别对从一个代表音频信号应该分离出来的多个音频信号之间的相差程度进行编码后所得的,该子频带是根据将频带划分为子频带的多个划分方法中的一个划分方法被设定的;以及划分信息代码,该划分信息代码是,对用于识别划分方法的划分信息进行编码后所得的,该划分方法是在对上述相差程度代码进行编码时所用的,其特征在于,包括:
划分信息解码单元,将上述划分信息代码解码成上述划分信息;以及
相差程度信息解码单元,将上述相差程度代码解码成每个子频带的上述多个音频信号之间的相差程度,该子频带是根据由上述划分信息识别的划分方法被设定的。
10、一种音频编码方法,对从一个代表音频信号中应该分离出来的多个音频信号之间的相差程度进行编码,其特征在于,包括:
选择步骤,从多个划分方法中选择一个划分方法,该划分方法用于将频带划分为一个以上的子频带;
相差程度编码步骤,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的;以及
划分信息编码步骤,对用于识别上述所选择的划分方法的划分信息进行编码。
11、一种音频解码方法,解码编码音频信号信息,该编码音频信号信息包括:相差程度代码,该相差程度代码是,在每个子频带,分别对从一个代表音频信号应该分离出来的多个音频信号之间的相差程度进行编码后所得的,该子频带是根据将频带划分为子频带的多个划分方法中的一个划分方法被设定的;以及划分信息代码,该划分信息代码是,对用于识别划分方法的划分信息进行编码后所得的,该划分方法是在对上述相差程度代码进行编码时所用的,其特征在于,包括:
划分信息解码步骤,将上述划分信息代码解码成上述划分信息;以及
相差程度信息解码步骤,将上述相差程度代码解码成每个子频带的上述多个音频信号之间的相差程度,该子频带是根据由上述划分信息识别的划分方法被设定的。
12、一种计算机可以执行的程序,用于对从一个代表音频信号中应该分离出来的多个音频信号之间的相差程度进行编码,其特征在于,使计算机执行以下步骤:
选择步骤,从多个划分方法中选择一个划分方法,该划分方法用于将频带划分为一个以上的子频带;
相差程度编码步骤,在每个子频带,分别对上述多个音频信号之间的相差程度进行编码,该子频带是根据上述所选择的划分方法被设定的;以及
划分信息编码步骤,对用于识别上述所选择的划分方法的划分信息进行编码。
13、一种计算机可以执行的程序,用于解码编码音频信号信息,该编码音频信号信息包括:相差程度代码,该相差程度代码是,在每个子频带,分别对从一个代表音频信号应该分离出来的多个音频信号之间的相差程度进行编码后所得的,该子频带是根据将频带划分为子频带的多个划分方法中的一个划分方法被设定的;以及划分信息代码,该划分信息代码是,对用于识别划分方法的划分信息进行编码后所得的,该划分方法是在对上述相差程度代码进行编码时所用的,
其特征在于,使计算机执行以下步骤:
划分信息解码步骤,将上述划分信息代码解码成上述划分信息;以及
相差程度信息解码步骤,将上述相差程度代码解码成每个子频带的上述多个音频信号之间的相差程度,该子频带是根据由上述划分信息识别的划分方法被设定的。
14、一种计算机可以读取的记录媒体,记录权利要求12及权利要求13的至少一项所述的程序。
CN2005800193874A 2004-09-17 2005-09-13 音频编码装置、解码装置以及方法 Expired - Fee Related CN1969318B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP272444/2004 2004-09-17
JP2004272444 2004-09-17
PCT/JP2005/016794 WO2006030754A1 (ja) 2004-09-17 2005-09-13 オーディオ符号化装置、復号化装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
CN1969318A true CN1969318A (zh) 2007-05-23
CN1969318B CN1969318B (zh) 2011-11-02

Family

ID=36060006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800193874A Expired - Fee Related CN1969318B (zh) 2004-09-17 2005-09-13 音频编码装置、解码装置以及方法

Country Status (4)

Country Link
US (1) US7860721B2 (zh)
JP (1) JP4809234B2 (zh)
CN (1) CN1969318B (zh)
WO (1) WO2006030754A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101971543A (zh) * 2008-02-04 2011-02-09 法国电信教育集团/巴黎电信学院 用于解码在多天线系统中的信号的方法,对应的计算机软件产品和解码装置
CN105632505A (zh) * 2014-11-28 2016-06-01 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置
CN107864448A (zh) * 2017-11-21 2018-03-30 深圳市希顿科技有限公司 一种基于蓝牙2.0或3.0实现双通道通讯的设备及其通讯方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101756838B1 (ko) * 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
CN103368682B (zh) 2012-03-29 2016-12-07 华为技术有限公司 信号编码和解码的方法和设备
CN112862106B (zh) * 2021-01-19 2024-01-30 中国人民大学 一种基于自适应编解码迭代学习控制信息传输系统和方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
AU5663296A (en) * 1995-04-10 1996-10-30 Corporate Computer Systems, Inc. System for compression and decompression of audio signals fo r digital transmission
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6434519B1 (en) * 1999-07-19 2002-08-13 Qualcomm Incorporated Method and apparatus for identifying frequency bands to compute linear phase shifts between frame prototypes in a speech coder
US7395209B1 (en) * 2000-05-12 2008-07-01 Cirrus Logic, Inc. Fixed point audio decoding system and method
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
JP4272050B2 (ja) 2001-05-25 2009-06-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディトリーイベントに基づく特徴付けを使ったオーディオの比較
JP3823804B2 (ja) 2001-10-22 2006-09-20 ソニー株式会社 信号処理方法及び装置、信号処理プログラム、並びに記録媒体
WO2003065353A1 (en) * 2002-01-30 2003-08-07 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
JP2003271168A (ja) * 2002-03-15 2003-09-25 Nippon Telegr & Teleph Corp <Ntt> 信号抽出方法および信号抽出装置、信号抽出プログラムとそのプログラムを記録した記録媒体
CN1307612C (zh) * 2002-04-22 2007-03-28 皇家飞利浦电子股份有限公司 声频信号的编码解码方法、编码器、解码器及相关设备
ATE332003T1 (de) * 2002-04-22 2006-07-15 Koninkl Philips Electronics Nv Parametrische beschreibung von mehrkanal-audio
AU2003281128A1 (en) * 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
EP1554716A1 (en) 2002-10-14 2005-07-20 Koninklijke Philips Electronics N.V. Signal filtering

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101971543A (zh) * 2008-02-04 2011-02-09 法国电信教育集团/巴黎电信学院 用于解码在多天线系统中的信号的方法,对应的计算机软件产品和解码装置
CN105632505A (zh) * 2014-11-28 2016-06-01 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置
CN105632505B (zh) * 2014-11-28 2019-12-20 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置
CN107864448A (zh) * 2017-11-21 2018-03-30 深圳市希顿科技有限公司 一种基于蓝牙2.0或3.0实现双通道通讯的设备及其通讯方法
CN107864448B (zh) * 2017-11-21 2020-05-05 深圳市希顿科技有限公司 一种基于蓝牙2.0或3.0实现双通道通讯的设备及其通讯方法

Also Published As

Publication number Publication date
US7860721B2 (en) 2010-12-28
CN1969318B (zh) 2011-11-02
WO2006030754A1 (ja) 2006-03-23
US20080059203A1 (en) 2008-03-06
JP4809234B2 (ja) 2011-11-09
JPWO2006030754A1 (ja) 2008-05-15

Similar Documents

Publication Publication Date Title
CN1101087C (zh) 信号编码方法及装置、信号解码方法及装置和信号传送方法
CN1288625C (zh) 音频编码与解码设备及其方法
KR101117336B1 (ko) 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
RU2689438C2 (ru) Устройство кодирования и способ кодирования, устройство декодирования и способ декодирования и программа
CN1993733A (zh) 用于空间音频参数的有效编码的能量相关量化
CN1647155A (zh) 空间声频的参数表示
CN1910655A (zh) 构造多通道输出信号或生成下混信号的设备和方法
CN101036183A (zh) 立体声兼容的多声道音频编码
CN1144179C (zh) 声音信号解码方法和装置、声音信号编码方法和装置
CN1233163C (zh) 多声道数字音频信号的压缩编码和解码设备及其方法
RU2006131451A (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
CN101044550A (zh) 产生编码多通道信号的设备和方法、对编码多通道信号进行解码的设备和方法
CN1816847A (zh) 保真度优化的可变帧长编码
CN1765072A (zh) 多声道音频扩展支持
CN1139842A (zh) 数字信号处理方法及装置,数字信号解码方法及装置,数字信号传输方法及记录介质
CN1647156A (zh) 参数多声道音频表示
AU2005226536A1 (en) Frequency-based coding of audio channels in parametric multi-channel coding systems
CN1677490A (zh) 一种增强音频编解码装置及方法
CN1969318A (zh) 音频编码装置、解码装置、方法、以及程序
WO2007011157A1 (en) Virtual source location information based channel level difference quantization and dequantization method
CN1822508A (zh) 对数字信号进行编码和解码的方法和设备
CN1677491A (zh) 一种增强音频编解码装置及方法
WO2004044891A1 (ja) 音楽情報符号化装置及び方法、並びに音楽情報復号装置及び方法
CN1677492A (zh) 一种增强音频编解码装置及方法
CN1732530A (zh) 运动图像专家组音频编码方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111102

Termination date: 20200913

CF01 Termination of patent right due to non-payment of annual fee