CN1954362B - 音频信号编码装置及音频信号解码装置 - Google Patents

音频信号编码装置及音频信号解码装置 Download PDF

Info

Publication number
CN1954362B
CN1954362B CN2005800157948A CN200580015794A CN1954362B CN 1954362 B CN1954362 B CN 1954362B CN 2005800157948 A CN2005800157948 A CN 2005800157948A CN 200580015794 A CN200580015794 A CN 200580015794A CN 1954362 B CN1954362 B CN 1954362B
Authority
CN
China
Prior art keywords
signal
mentioned
sneaking
sound
supplementary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005800157948A
Other languages
English (en)
Other versions
CN1954362A (zh
Inventor
津岛峰生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1954362A publication Critical patent/CN1954362A/zh
Application granted granted Critical
Publication of CN1954362B publication Critical patent/CN1954362B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

移动播放器(710)或者多声道家庭播放器(730)包括:混入信号解码部(711)、信号分离处理部(731)、耳机或扬声器(720)或者扬声器(740),该混入信号解码部(711)从所输入的代码串提取被混入了多声道音频信号且表示缩混信号的代码串和用于将缩混信号恢复到缩混之前的多声道音频信号的辅助信息并且解码表示缩混信号的代码串;该信号分离处理部(731)根据提取的辅助信息,分离由解码所得的缩混信号,生成在听觉上与被缩混之前的多声道音频信号相近的音频信号;该耳机或扬声器(720)播放已被解码的缩混信号;该扬声器(740)播放从缩混信号所分离的多声道音频信号。

Description

音频信号编码装置及音频信号解码装置 
技术领域
本发明涉及编码音频信号的编码装置、以及解码已被编码的音频信号的解码装置。 
背景技术
以往的音频信号解码方法以及编码方法,作为公认的方式可举出ISO/IEC国际标准方式,通常称为MPEG的方式等。现在作为得到广泛应用的方式,在低位速率时也保持高音质的编码方式可举出ISO/IEC13818-7,通常称为MPEG2高级音频编码(AAC:Advanced Audio Coding)的方式等。现在该方式的扩展标准也进行着多标准化(参照非专利文献1。)。 
非专利文献1:ISO/IEC 13818-7(MPEG2 AAC) 
然而,以往的音频信号编码方法以及解码方法,例如记述在背景技术的AAC等,当编码多声道信号时,因为没有充分地利用声道之间的相互关系,所以难以达到低位速率化。图1是示出以往的解码已被编码的多声道信号时的方法的图。如图1所示,例如以往的多声道AAC编码装置600,对5.1声道的音频信号进行编码,并进行多路复用后,由广播等发送给以往的播放器610。以往的播放器610接收上述的编码数据,该播放器610在2声道的扬声器或耳机输出的情况下,具备多声道AAC解码部611和缩混(Down Mix)部612,该播放器610将从接收的编码信号所生成的缩混信号输出到2声道的扬声器或者耳机613。 
然而,以往的播放器610对编码原声多声道信号所得的信号进行解码时,即使只在二个扬声器或耳机等播放的情况下,也先对全部的 声道进行解码。之后,缩混部612使用缩混等方法,从已经解码的所有声道中生成缩混信号(右)DR、(左)DL,该缩混信号是应该由上述二个扬声器或耳机播放的信号。例如,5.1声道的多声道信号包括5声道的音频信号和表示音频信号的超低音的0.1声道的信号LFE,该5声道的音频信号来自配置在视听者前方正面Center、前方右FR、前方左FL、后方右BR、后方左BL的音源。缩混部612,对已经解码的多个声道信号即各个声道信号进行加权,并进行加法运算,从而生成缩混信号DR、DL。这样即使在二个扬声器或耳机播放的情况下,也需要大的计算量和计算用的缓冲,进而,使计算单元的消耗功率和成本增加,该计算单元例如是安装计算处理部的数字信号处理器(DSP:Digital SignalProcessor)等。 
发明内容
为了解决上述课题,本发明的音频信号解码装置,解码代码串并输出音频信号,包括:提取单元,从所输入的代码串提取下述代码串和辅助信息,该被提取的代码串表示被混入了多个音频信号且数量比多个音频信号少的混入信号,该被提取的辅助信息用于将上述混入信号恢复到被混入之前的音频信号; 
解码单元,解码上述代码串,该代码串表示上述混入信号; 
信号分离单元,根据所提取的上述辅助信息,分离由上述解码所得的上述混入信号,生成听觉上与被混入之前的上述音频信号相近的多个音频信号;以及 
播放单元,播放已被解码的上述混入信号,或者播放从上述混入信号所分离的多个音频信号, 
上述辅助信息包括线性预测系数,该线性预测系数用于以上述混入信号的函数来表示被混入之前的一个以上的音频信号; 
上述信号分离单元,根据上述辅助信息内的上述线性预测系数,算出以上述混入信号的函数来表示的无相关信号,从上述混入信号排 除所算出的上述无相关信号,从而生成被混入之前的上述音频信号。 
所述的音频信号解码装置,上述辅助信息包括标志,该标志示出被混入之前的多个音频信号之间的相关程度; 
上述信号分离单元,在上述标志示出上述音频信号之间的相关程度低的情况下,从上述混入信号排除上述无相关信号,从而生成被混入之前的上述音频信号。 
一种音频信号编码装置,编码混入信号,该混入信号是被混入了多个音频信号的信号,该音频信号编码装置包括: 
混入信号生成单元,混入所输入的多个音频信号,生成混入信号,该混入信号表示数量比原来的音频信号的数量少的音频信号; 
辅助信息生成单元,生成辅助信息,该辅助信息包括线性预测系数和标志,该线性预测系数用于根据被混入之前的一个以上的音频信号,算出以上述混入信号的函数来表示的无相关信号,该标志示出被混入之前的多个音频信号之间的相关程度,且该辅助信息用于在上述标志示出上述音频信号之间的相关程度低的情况下,从上述混入信号分离下述音频信号,该音频信号是听觉上与被混入之前的上述音频信号相近的音频信号; 
编码单元,编码上述混入信号;以及 
代码串生成单元,生成代码串,该代码串包括已被编码的上述混入信号和已被生成的上述辅助信息。 
所述的音频信号编码装置,上述线性预测系数是一种被导出的系数,该线性预测系数使线性预测滤波输出的信号表示被混入上述混入信号之前的至少一个上述音频信号,并且用函数定义以混入信号作为输入信号的上述线性预测滤波。 
再者,本发明不仅作为这样的音频信号编码装置以及音频信号解码装置来实现,也作为音频信号编码方法以及音频信号解码方法来实现,或者可以将上述的步骤作为使计算机执行的程序来实现。进而,也可以作为将这些的步骤编入到集成电路等的音频信号编码装置以及 音频信号解码装置来实现。并且,上述的程序也可以通过CD-ROM等记录介质或互联网等传送介质来分发。 
如上述说明,本发明的音频信号编码装置,在根据被混入的二个或更多信号列生成代码串而且将所生成的代码串分离成多个信号列时,着眼于信号之间的类似性,使代码串中含有非常小的补助信息,从而,分离信号后能够达到听觉上与分离前没有差别的程度。还有,预先将被混入的信号设成多声道信号的缩混信号,这样在解码时不需要读取补助信息来进行信号处理,而是仅解码缩混信号部,就能够在具有2声道信号播放系统的扬声器或耳机中,也以少的运算量进行高音质的播放。 
附图说明
图1是示出以往的多声道信号的编码方法以及解码方法的一个例子的图。 
图2是概略示出本发明的音频信号编码装置的主要部的图。 
图3是概略示出本发明的音频信号解码装置的主要部的图。 
图4是示出在本实施方式的音频信号解码装置,将被混入了二个信号的混入信号mX分离成听觉上与原信号相近的信号X1和X2的模样的图。 
图5是示出本实施方式的音频信号解码装置的更为具体的结构的一个例子的图。 
图6(a)是示出图5所示的混入信号解码部输出的子频带(subband)信号的图。图6(b)是示出将图7所示的时间频率空间的分割方法适用在图6(a)所示的子频带信号的例子的图。 
图7是示出表示输出信号的空间的分割方法的一个例子的图,该输出信号是来自混入信号解码部的信号。 
图8是示出用2声道移动播放器来播放来自编码装置的代码串的情况下,音频信号系统的结构例的图。 
图9是示出用家庭播放器来播放来自编码装置的代码串的情况下,音频信号系统的结构例的图,该家庭播放器是可以播放多声道音频的播放器。 
图10是示出在本实施方式的音频信号解码装置进一步进行相位控制的情况下的结构的一个例子的图。 
图11是示出在本实施方式的音频信号解码装置,各个输入信号之间的相关程度低时,使用线性预测滤波的情况下的结构的一个例子的图。 
编号说明 
101混入信号信息 
102混入信号解码部 
103信号分离处理部 
104辅助信息 
105输出信号(1) 
106输出信号(2) 
201输入信号(1) 
202输入信号(2) 
203混入信号编码部 
204辅助信息生成部 
205辅助信息 
206混入信号信息 
211增益算出部 
212相位算出部 
213系数算出部 
301混入信号信息 
302混入信号解码部 
303信号分离部 
304增益控制部 
305输出信号(1) 
306输出信号(2) 
307辅助信息 
308时间频率矩阵生成部 
401混入信号信息 
402混入信号解码部 
403信号分离部 
404增益控制部 
405输出信号(1) 
406输出信号(2) 
407辅助信息 
408时间频率矩阵生成部 
409相位控制部 
501混入信号信息 
502混入信号解码部 
503信号分离部 
504增益控制部 
505输出信号(1) 
506输出信号(2) 
507辅助信息 
508时间频率矩阵生成部 
509相位控制部 
510线性预测滤波自适应部 
600以往的多声道AAC编码装置 
610以往的播放器 
611多声道AAC解码部 
612缩混部 
613扬声器或者耳机 
700编码装置 
701缩混部 
702辅助信息生成部 
703编码部 
710移动播放器 
711混入信号解码部 
720耳机或者扬声器 
730多声道家庭播放器 
740扬声器 
具体实施方式
以下,参照附图对本发明的实施方式加以说明。 
(实施方式1) 
图2是示出本发明的音频信号解码装置中生成可以解码的代码串的音频信号编码装置200的结构的块图。该音频信号编码装置200是至少输入二个信号并从所输入的信号生成数量更少的混入信号,而且生成下述代码串的音频信号编码装置,该代码串包括表示混入信号的一个编码数据和位数比该编码数据少的位数来表示的辅助信息,该音频信号编码装置200包括混入信号编码部203以及辅助信息生成部204。辅助信息生成部204内部包括:增益算出部211、相位算出部212、系数算出部213。以下,为了说明的方便,就输入信号为二个的情况加以说明。混入信号编码部203以及辅助信息生成部204,都以输入信号(1)201和输入信号(2)202作为输入,混入信号编码部203生成混入信号以及混入信号信息206。在这里,混入信号是用规定的方法重叠输入信号(1)201和输入信号(2)202所得的信号。辅助信息生成部204根据所输入的输入信号(1)201、输入信号(2)202以及混入信号编码部203输出的混入信号,生成辅助信息205。 
更具体而言,在混入信号编码部203,根据预先所定的一定的方法将输入信号(1)201和输入信号(2)202加在一起生成混入信号,并编码该混入信号,输出混入信号信息206。在这里,作为混入信号编码部203的编码方法,可以使用AAC等方法,不过不局限于该方法。 
在辅助信息生成部204,用输入信号(1)201、输入信号(2)202、混入信号、混入信号信息206生成辅助信息205,该混入信号和混入信号信息206是在混入信号编码部203所作成的。在这里辅助信息205用于从混入信号中分离,听觉上与被混入之前的输入信号(1)201和输入信号(2)202尽量相同的信号。因而,混入信号分离后的程度可以是与被混入之前的输入信息(1)201和输入信号(2)202完全相同的程度,也可以是听觉上没有差异的程度。即使在听觉上有差异,该辅助信息属于本发明的范畴,重要的是该辅助信息含有用于上述分离的信息。在辅助信息生成部,对所输入的信号进行编码,例如,可以用正交镜像对称滤波器(QMF:Quadrature Mirror Filter)滤波器组的编码方法进行编码,也可以用快速傅立叶变换(FFT:Fast Fourier Transform)等的编码方法进行编码。 
增益算出部211,对输入信号(1)201及输入信号(2)202,和混入信号进行比较,从而生成增益,该增益用于从混入信号生成非常相似于输入信号(1)201及输入信号(2)202的信号。更具体而言,增益算出部211,首先对输入信号(1)201及输入信号(2)202和混入信号的每个帧分别实施QMF滤波处理,从而将输入信号(1)201、输入信号(2)202及混入信号变换为时间频率空间上的子频带信号。其次,将时间频率空间按时间方向和频率方向分割之后,在被分割的各区域内进行下述比较,比较从输入信号(1)201及输入信号(2)202所变换的各个子频带信号,和从混入信号所变换的子频带信号。然后,使用从混入信号所变换的子频带信号,算出被分割的每个区域的增益,该增益用来表示从输入信号(1)201及输入信号(2)202所变换的各个子频带信号。进而,生成时间频率矩阵,并且将该时间频率矩阵与示出时间频率空间的分 割方法的信息一同作为辅助信息205输出,该时间频率矩阵示出对被分割的各区域所算出的增益的分布。再者,在这里可以只对输入信号(1)201及输入信号(2)202所变换的子频带信号中的一个算出增益的分布。其理由如下,从混入信号生成输入信号(1)201及输入信号(2)202中的一个,再从混入信号减去输入信号(1)201或者输入信号(2)202,就可以得到另一个输入信号(1)201或者输入信号(2)202。 
还有,可以预想,例如用邻接的话筒等所收集的语音等,各频谱之间的相关程度高。这种情况下,相位算出部212与增益算出部211相同,对输入信号(1)201及输入信号(2)202和混入信号的每个帧分别进行QMF滤波处理。进而相位算出部212,以每个子频带为单位,算出从输入信号(1)201所得的子频带信号和从输入信号(2)202所得的子频带信号的相位差(延迟量),并将算出的相位差与该情况的增益作为辅助信息输出。再者,输入信号(1)201和输入信号(2)202的相位差,有这样的性质,在低频率中听觉上容易被感知,而在高频率中难以被感知。因此,子频带信号为高频率的情况下,可以省略算出该相位差。还有,相位算出部212在输入信号(1)201和输入信号(2)202的相关程度低的情况下,即使算出相位差,也不在辅助信息中包括其算出值。 
进而,输入信号(1)201和输入信号(2)202的相关程度低的情况下,可以将输入信号(1)201和输入信号(2)202之中的一个信号当做是与另一个信号没有关系的信号(噪音信号)。从而,系数算出部213,在输入信号(1)201和输入信号(2)202的相关程度低的情况下,首先生成示出输入信号(1)201和输入信号(2)202的相关程度低的标志。定义以混入信号作为输入信号的线性预测滤波(函数),导出线性预测系数,该线性预测系数使上述滤波输出的信号与被混入之前的一个信号尽可能相同。如果混入信号由二个信号所构成,可以导出二组的线性预测系数,将该二者作为辅助信息输出,也可以只输出其中一个。即使混入信号由多个输入信号构成,也导出下述线性预测系数,根据该线性预测系数输出至少与某一个输入信号尽可能相同的信号。因这样的结构,系 数算出部213在算出上述函数的线性预测系数之后,将所算出的线性预测系数和示出输入信号(1)201和输入信号(2)202的相关程度低的标志作为辅助信息输出。再者,在这里用标志来示出输入信号(1)201和输入信号(2)202的相关程度低,不过,不局限于比较信号全体,也可以对每个用QMF滤波处理等所得到的子频带信号生成该标志。 
其次用图3说明解码方法。图3是将本发明的音频信号解码装置100的主要部的结构以模式的方法示出的图。音频信号解码装置100是一种解码装置,该音频信号解码装置100预先从所输入的代码串提取混入信号信息和辅助信息,从所解码的混入信号信息分离出输出信号(1)105和输出信号(2)106,该音频信号解码装置100包括混入信号解码部102及信号分离处理部103。 
在音频信号解码装置100的前段,从代码串所提取的混入信号信息101,在混入信号解码部102从编码数据的形式解码为音频信号的形式。上述音频信号的形式,不局限于时间轴上的信号形式,可以是频率轴上的信号形式,也可以是以时间和频率两轴所表现的形式等。辅助信息104和来自混入信号解码部102的输出信号,被输入到信号分离处理部103,进行信号的分离合成后,输出输出信号(1)105和输出信号(2)106。图4是示出在本实施方式的音频信号解码装置,将被混入了二个信号的混入信号mX分离成听觉上与原信号相近的二个信号X1和X2的模样的图。本发明的音频信号解码装置100,根据从代码串所提取的辅助信息,从混入信号mX分离信号X1和信号X2,该分离信号X1和信号X2听觉上与原信号信号x1和信号x2相近。 
以下,用图5来说明本发明的具体的解码方法。图5是示出在本实施方式的音频信号解码装置100进行增益控制时结构的一个例子的图。本实施方式的音频信号解码装置100包括:混入信号解码部302、信号分离部303、增益控制部304、时间频率矩阵生成部308。 
在图5示出的音频信号解码装置100的前段,预先从代码串所提取的混入信号信息301被输入到混入信号解码部302。在混入信号解码 部302,混入信号信息301从编码数据的形式解码为音频信号的形式。上述音频信号的形式,不局限于时间轴上的信号形式,可以是频率轴上的信号形式,也可以是以时间和频率两轴所表现的形式等。上述的混入信号解码部302的输出信号,以及辅助信息307,被输入到信号分离部303。在信号分离部303,以辅助信息307为基础将所解码的混入音频信号分离成多个信号。具体而言,按照包括在辅助信息307的示出时间频率空间(或者频率空间)的分割方法的信息,来分割混入音频信号所属的空间。为了说明的方便,在这里记载了分离成二个的情况,不过,不一定限制为二个。另一方面,在时间频率矩阵生成部308,根据辅助信息307生成对应于从混入信号解码部302所输出的信号或者来自信号分离部303的多个输出信号相同的音频信号的形式的增益。例如,音频形式单纯是时域信号的情况下,时间频率矩阵生成部308输出有关时域的一个以上时间的增益信息,或者,音频形式是如同QMF滤波由多个子频带所组成的时间轴和频率轴所表现的形式的情况下,时间频率矩阵生成部308输出时间和频率的二维的增益信息。增益控制部304,对上述的增益信息和来自信号分离部303的多个音频信号适用与数据形式相对应的增益控制,而且输出输出信号(1)305和输出信号(2)306。 
这样所构成的音频信号解码装置,可以从被混入的音频信号中得到已被适当地进行了增益控制的多个音频信号。 
关于该增益控制,用以下的图6及图7进行详细说明。图6(a)及图6(b),示出从图5所示的混入信号解码部302所输出的是QMF滤波的情况下,对各个子频带信号的增益控制的一个例子的图。图7是示出表示来自混入信号解码部302的输出信号的空间的分割方法的一个例子的图。图6(a)是示出图5所示的混入信号解码部302输出的子频带信号的图。如上所述,QMF滤波所输出的子频带信号以时间轴和频率轴所组成的二维空间上的信号来表示。 
从而,当音频形式由QMF滤波所构成的情况下,以帧为单位处理 音频信号时,用时间频率矩阵的增益控制可容易进行。 
例如,音频信号由32子频带的QMF滤波所构成,且该音频信号是1帧1024采样的音频信号,处理该音频信号的结果,可以获得时间方向32采样,频率方向(子频带)32频带的作为音频形式的时间频率矩阵。对那些1024采样的信号进行增益控制的情况下,如图7,以频率方向和时间方向分割区域,对所分割的各个区域定义增益控制的系数(R11,R12,R21,R22),则容易进行增益控制。在这里为了说明的方便,使用了由R11至R22的四个要素所组成的矩阵,不过,时间方向、频率方向的系数个数不受这些限制。在图6示出增益控制的适用例子。即图6(b)是示出将图7所示的时间频率空间的分割方法适用在图6(a)所示的子频带信号的例子的图。如图6(b)所示,QMF滤波为6子频带的情况下,将6子频带分为低域4频带和高域2频带,时间方向上平均地分为2个,这样的情况下,在上述4区域存在的QMF滤波所得的信号列乘以增益R11,R12,R21,R22,输出乘上之后的信号等。 
对于所混入的信号列没有特别限制,不过,处理多声道的音频信号列的情况下,可以考虑出现,后部声道信号混入到前方声道信号的情况、进而中央声道也混入其中的情况等。从而,混入后的信号在通常被称为缩混信号等的情况也有效。 
图8是示出用2声道移动播放器来播放来自编码装置700的代码串的情况下,音频信号系统的结构例子的图。如该图所示,该音频信号系统包括编码装置700、移动播放器710、耳机或扬声器720。编码装置700是一种编码装置,该编码装置700输入例如5.1声道的多声道音频信号列,输出从5.1声道缩混为2声道的音频代码串以及辅助信号,该编码装置700包括缩混部701、辅助信息生成部702以及编码部703。缩混部701,从5.1声道的多声道音频信号列生成2声道的缩混信号,又将生成的缩混信号DL及DR输出到编码部703。辅助信息生成部702生成用于从所生成的缩混信号DL及DR复原到5.1声道的多声道信号的信息,又将该信息作为辅助信息输出到编码部703。编码部 703,编码所生成的缩混信号DL及DR和辅助信息,又多路复用该缩混信号DL及DR和辅助信息,将这些作为代码串输出。在该音频信号系统中的移动播放器710,连接在2声道的耳机或者扬声器720,只能播放2声道的立体声播放。而移动播放器710包括混入信号解码部711,由混入信号解码部711仅对从编码装置700获得的代码串进行解码,就能够以2声道的耳机或扬声器720进行播放。 
图9是示出用家庭播放器播放来自编码装置700的代码串的情况下,音频信号系统的结构例子的图,该家庭播放器是可以播放多声道音频的播放器。如该图所示,该音频信号系统包括,编码装置700、多声道家庭播放器730以及扬声器740。编码装置700的内部结构与图8示出的编码装置700相同,因此省略说明。多声道家庭播放器730包括混入信号解码部711和信号分离处理部731,该多声道家庭播放器连接在可以播放5.1声道的多声道信号的扬声器740。在该多声道家庭播放器730中,混入信号解码部711,解码从编码装置700获得的代码串,提取辅助信息和缩混信号DL及DR。在信号分离处理部731,根据所提取的辅助信息,从所提取的缩混信号DL和DR生成5.1声道的多声道信号。 
如同图8及图9所示的例子,即使输入同样的代码串,只播放2声道信号的移动播放器等,仅解码代码串中的混入信号就可以播放所希望的缩混音频信号,从而可以得到降低电的消费,使电池的使用时间长久的效果。还有,设置在家庭中的可播放多声道音频信号的家庭播放器因为不是由电池所驱动,所以可不介意电的消耗,可以追求播放更高音质的音频信号。 
(实施方式2) 
以下,用图10来说明本实施方式的具体的解码装置。 
图10是示出在本实施方式的音频信号解码装置进一步进行相位控制的情况下的结构的一个例子的图。实施方式2的音频信号解码装置是一种音频信号解码装置,该音频信号解码装置是输入作为代码串的 混入信号信息401及辅助信息407,根据所输入的混入信号信息401及辅助信息407,输出输出信号(1)405及输出信号(2)406的装置,该音频信号解码装置包括,混入信号解码部402、信号分离部403、增益控制部404、时间频率矩阵生成部408、相位控制部409。 
实施方式2的结构与上述的实施方式1的结构上的差异只在于,实施方式2加上了相位控制部409,其他的结构与实施方式1相同。因而本实施方式2中,只对相位控制部409的结构进行详细说明。 
当编码时所混入的信号,相互间存在关联性的情况下,特别是对某一个信号另一个信号延迟,作为增益不同的信号来处理时,混入信号被记载成(公式1)。 
(公式1) 
mx=x1+x2 
  =x1+A*x1*phaseFactor 
在这里,mx为被混入之后的信号,x1、x2为输入信号(被混入之前的信号),A为增益补正,phaseFactor是按照相位差所乘的系数。所以,因为混入信号mx是作为信号x1的函数来表示,所以在相位控制部409可以从混入信号mx简单地算出信号x1,并进行分离。而且,可以根据从混入信号mx分离信号x1来获得信号x2。进而,增益控制部404根据从辅助信息407所得的时间频率矩阵,对上述所分离的信号x1及x2,进行增益控制,从而可以输出更接近原音的输出信号(1)405及输出信号(2)406。 
A以及phaseFactor,不是从被混入之后的信号导出的,而是从编码的时候(即被混入之前的多个信号)就可以导出,所以预先在编码装置,将这些编码到辅助信息407中,就能够在相位控制部409控制分 离的各个信号的相位。 
相位差,可以以不被限定为整数的采样数来编码,也可以以协方差矩阵赋予。协方差矩阵是同行业者普遍知道的技术,因此省略说明。 
频带中存在相位信息在听觉上重要的频带,也存在相位信息不对音质产生大的影响的信号或频带,因此相位信息没有必要发给所有的频带以及所有的时间。即,相位信息在听觉上不重要的频带,或者相位信息不对音质产生大的影响的信号或频带中,可以省略子频带信号的相位控制。从而,对每个子频带信号分别生成相位信息,就可以不用发送多余的信息,能够减少辅助信息的数据量。 
(实施方式3) 
用图11对本发明的具体的解码装置进行说明。图11是示出在本实施方式的音频信号解码装置,当各个输入信号间相关程度低时,使用线性预测滤波的情况下的结构的一个例子的图。 
实施方式3的音频信号解码装置是当被输入混入信号信息501和辅助信息507,并原来的输入信号之间没有大的相互关系的情况下,将其中一个信号当做由混入信号的函数来表示的无相关信号(噪音信号),生成并输出输出信号(1)505和输出信号(2)506的音频信号解码装置,该音频信号解码装置包括:混入信号解码部502、信号分离部503、增益控制部504、时间频率矩阵生成部508、相位控制部509、线性预测滤波自适应部510。 
首先,该实施方式3的解码装置是详细说明实施方式1中的解码装置的装置。 
实施方式3的结构和上述的实施方式2的结构上的不同之处仅在于加上了线性预测滤波自适应部510,其他的结构与实施方式2相同。因而在本实施方式3,只对线性预测滤波自适应部510的结构进行详细说明。 
当编码时被混入的信号之间相互关系小的情况下,对某一个信号的表现不能单纯通过延迟另一个信号等来表现。这个情况下,可以考 虑线性预测滤波自适应部510将一个信号当做与另一个信号无相关的信号(噪音信号),对该一个信号进行编码。在这样的情况下,预先在代码串中编码标志等,该标志示出相关程度低,就可以在解码时实行相关程度低的情况的分离处理。该信息可以以每个频带或者以每个时间间隔进行编码。还有,这个标志在代码串中可以以每个子频带信号进行编码。 
(公式2) 
mx=x1+x2 
  =x1+Func(x1+x2) 
在这里,mx为被混入之后的信号,x1m、x2为输入信号(被混入之前的信号),Func()是由线性预测系数等组成的多项式。 
信号mx,x1,x2不是从被混入之后的信号导出的,而是从编码的时候(即被混入之前的多个信号)就可以利用,所以从信号mx,x1,x2导出以Func()来表示的多项式的系数,并将这些系数预先编码到辅助信息507里,就能够在线性预测滤波自适应部510导出x1、x2。 
(公式3) 
x2=Func(x1+x2) 
从而,导出使(公式3)成立的Func()的系数,并进行编码即可。 
如上所述,使代码串中包括表示输入信号之间是否存在相互关系的标志,从而在输入信号之间没有很多相互关系的情况下,或者当输入信号有二个或二个以上时,将其中某一个作为标准信号,且其他的输入信号与标准信号没有很多相关的情况下,可以将其他的信号以无 相关信号(噪音信号)来表示,该无相关信号是以混入信号的函数来表示的信号。还有,输入信号之间的相互关系大的情况下,可将其他的信号以标准信号的延迟信号来表示。还有,如上所述从混入信号所分离的各信号乘上以时间频率矩阵来表示的增益,从而具有能够获得更加忠实于所输入的原音的输出信号的效果。 
本发明的音频信号解码装置以及编码装置,可适用于已适用音频编码及解码方法的所有应用程序。 
进行了音频编码的位流(bit stream)代码串,应用于现在的广播内容的传送,以及在DVD或SD卡等存储介质中记录并播放的情况,还应用于将AV内容传送到以移动电话为代表的通信机器的情况等。还有,该编码流也有用于作为互联网上交换的电子数据,传送音频信号的情况。 
本发明的音频信号解码装置,作为根据电池等所驱动的移动电话等移动型音频信号播放装置而有用。还有,本发明的音频信号解码装置,作为可以转换多声道播放和2声道播放来进行播放的多声道家庭播放器而有用。还有,本发明的音频信号编码装置,作为分发音频内容的广播局或内容分发服务器包括的音频信号编码装置而有用,该广播局或内容分发服务器通过窄频带传输线,向移动电话等的移动型音频信号播放装置分发音频内容。 

Claims (4)

1.一种音频信号解码装置,解码代码串并输出音频信号,包括:
提取单元,从所输入的代码串提取下述代码串和辅助信息,该被提取的代码串表示被混入了多个音频信号且数量比多个音频信号少的混入信号,该被提取的辅助信息用于将上述混入信号恢复到被混入之前的音频信号;
解码单元,解码上述代码串,该代码串表示上述混入信号;
信号分离单元,根据所提取的上述辅助信息,分离由上述解码所得的上述混入信号,生成听觉上与被混入之前的上述音频信号相近的多个音频信号;以及
播放单元,播放已被解码的上述混入信号,或者播放从上述混入信号所分离的多个音频信号,
上述辅助信息包括线性预测系数,该线性预测系数用于以上述混入信号的函数来表示被混入之前的一个以上的音频信号;
上述信号分离单元,根据上述辅助信息内的上述线性预测系数,算出以上述混入信号的函数来表示的无相关信号,从上述混入信号排除所算出的上述无相关信号,从而生成被混入之前的上述音频信号。
2.根据权利要求1所述的音频信号解码装置,
上述辅助信息包括标志,该标志示出被混入之前的多个音频信号之间的相关程度;
上述信号分离单元,在上述标志示出上述音频信号之间的相关程度低的情况下,从上述混入信号排除上述无相关信号,从而生成被混入之前的上述音频信号。
3.一种音频信号编码装置,编码混入信号,该混入信号是被混入了多个音频信号的信号,该音频信号编码装置包括:
混入信号生成单元,混入所输入的多个音频信号,生成混入信号,该混入信号表示数量比原来的音频信号的数量少的音频信号;
辅助信息生成单元,生成辅助信息,该辅助信息包括线性预测系数和标志,该线性预测系数用于根据被混入之前的一个以上的音频信号,算出以上述混入信号的函数来表示的无相关信号,该标志示出被混入之前的多个音频信号之间的相关程度,且该辅助信息用于在上述标志示出上述音频信号之间的相关程度低的情况下,从上述混入信号分离下述音频信号,该音频信号是听觉上与被混入之前的上述音频信号相近的音频信号;
编码单元,编码上述混入信号;以及
代码串生成单元,生成代码串,该代码串包括已被编码的上述混入信号和已被生成的上述辅助信息。
4.根据权利要求3所述的音频信号编码装置,
上述线性预测系数是一种被导出的系数,该线性预测系数使线性预测滤波输出的信号表示被混入上述混入信号之前的至少一个上述音频信号,并且用函数定义以混入信号作为输入信号的上述线性预测滤波。
CN2005800157948A 2004-05-19 2005-05-17 音频信号编码装置及音频信号解码装置 Expired - Fee Related CN1954362B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004148661 2004-05-19
JP148661/2004 2004-05-19
PCT/JP2005/008997 WO2005112002A1 (ja) 2004-05-19 2005-05-17 オーディオ信号符号化装置及びオーディオ信号復号化装置

Publications (2)

Publication Number Publication Date
CN1954362A CN1954362A (zh) 2007-04-25
CN1954362B true CN1954362B (zh) 2011-02-02

Family

ID=35394382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800157948A Expired - Fee Related CN1954362B (zh) 2004-05-19 2005-05-17 音频信号编码装置及音频信号解码装置

Country Status (8)

Country Link
US (1) US8078475B2 (zh)
EP (2) EP1914723B1 (zh)
JP (1) JP4939933B2 (zh)
KR (1) KR101117336B1 (zh)
CN (1) CN1954362B (zh)
CA (1) CA2566366C (zh)
DE (2) DE602005022235D1 (zh)
WO (1) WO2005112002A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
WO2006118179A1 (ja) * 2005-04-28 2006-11-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
JP4850827B2 (ja) * 2005-04-28 2012-01-11 パナソニック株式会社 音声符号化装置および音声符号化方法
JP2009532712A (ja) * 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
JP2007310087A (ja) * 2006-05-17 2007-11-29 Mitsubishi Electric Corp 音声符号化装置及び音声復号装置
WO2009050896A1 (ja) * 2007-10-16 2009-04-23 Panasonic Corporation ストリーム合成装置、復号装置、方法
WO2009075511A1 (en) * 2007-12-09 2009-06-18 Lg Electronics Inc. A method and an apparatus for processing a signal
WO2010005050A1 (ja) * 2008-07-11 2010-01-14 日本電気株式会社 信号分析装置、信号制御装置及びその方法と、プログラム
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2144229A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
BRPI0905069A2 (pt) * 2008-07-29 2015-06-30 Panasonic Corp Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
KR101108060B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
CN102257567B (zh) * 2009-10-21 2014-05-07 松下电器产业株式会社 音响信号处理装置、音响编码装置及音响解码装置
US8793126B2 (en) * 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
JP5895050B2 (ja) 2011-06-24 2016-03-30 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 符号化された多チャンネルオーディオ信号を処理するオーディオ信号プロセッサ及びその方法
JP5057535B1 (ja) 2011-08-31 2012-10-24 国立大学法人電気通信大学 ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法
EP3528249A1 (en) 2013-04-05 2019-08-21 Dolby International AB Stereo audio encoder and decoder
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
CN104982042B (zh) 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
US9658818B2 (en) 2014-08-11 2017-05-23 Princeton Audio, LLC Adaptable audio systems
CN105812986A (zh) * 2016-05-09 2016-07-27 中山奥凯华泰电子有限公司 将多声道缩混成无线两声道的音箱和处理方法
CN115188394A (zh) * 2022-06-20 2022-10-14 安徽听见科技有限公司 混音方法、装置、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0688113A2 (en) * 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0691052B1 (en) * 1993-12-23 2002-10-30 Koninklijke Philips Electronics N.V. Method and apparatus for encoding multibit coded digital sound through subtracting adaptive dither, inserting buried channel bits and filtering, and encoding apparatus for use with this method
TW295747B (zh) 1994-06-13 1997-01-11 Sony Co Ltd
JP3397001B2 (ja) 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
JPH09102742A (ja) * 1995-10-05 1997-04-15 Sony Corp 符号化方法および装置、復号化方法および装置、並びに記録媒体
JPH1132399A (ja) 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US6356211B1 (en) * 1997-05-13 2002-03-12 Sony Corporation Encoding method and apparatus and recording medium
WO1999023657A1 (fr) 1997-10-31 1999-05-14 Sony Corporation Dispositif et procede de codage d'informations, dispositif et procede de decodage d'informations, et support d'enregistrement correspondant
JP2000123481A (ja) * 1997-10-31 2000-04-28 Sony Corp 情報符号化装置および方法、情報復号装置および方法、記録媒体、並びに提供媒体
SE519552C2 (sv) 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
JP3341992B2 (ja) * 1998-11-16 2002-11-05 日本ビクター株式会社 光記録媒体、音声復号装置
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US20050004791A1 (en) * 2001-11-23 2005-01-06 Van De Kerkhof Leon Maria Perceptual noise substitution
JP2003195894A (ja) * 2001-12-27 2003-07-09 Mitsubishi Electric Corp 符号化装置、復号化装置、符号化方法、及び復号化方法
JP4296753B2 (ja) 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
AU2003244932A1 (en) 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
EP1523863A1 (en) * 2002-07-16 2005-04-20 Koninklijke Philips Electronics N.V. Audio coding
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
EP1818911B1 (en) * 2004-12-27 2012-02-08 Panasonic Corporation Sound coding device and sound coding method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0688113A2 (en) * 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Christof Faller,Frank Baumgarte.Binaural Cue Coding Applied to Audio Compression withFlexible Rendering.AES converntion paper presented at the 113th Convention.2002,1-7.
Christof Faller,Frank Baumgarte.Binaural Cue Coding Applied to Audio Compression withFlexible Rendering.AES converntion paper presented at the 113th Convention.2002,1-7. *
说明书第14栏第54行至第15栏第55行,第16栏第15行至第17栏第20行,第18栏第13行至第19栏第2行,附图4,附图6,附图9-12.

Also Published As

Publication number Publication date
US20070244706A1 (en) 2007-10-18
CA2566366C (en) 2013-08-06
EP1758100A4 (en) 2007-07-04
WO2005112002A1 (ja) 2005-11-24
EP1914723A2 (en) 2008-04-23
EP1914723A3 (en) 2008-05-14
CA2566366A1 (en) 2005-11-24
CN1954362A (zh) 2007-04-25
JPWO2005112002A1 (ja) 2008-03-27
JP4939933B2 (ja) 2012-05-30
EP1758100A1 (en) 2007-02-28
DE602005024548D1 (de) 2010-12-16
KR101117336B1 (ko) 2012-03-08
EP1914723B1 (en) 2010-07-07
KR20070019718A (ko) 2007-02-15
US8078475B2 (en) 2011-12-13
DE602005022235D1 (de) 2010-08-19
EP1758100B1 (en) 2010-11-03

Similar Documents

Publication Publication Date Title
CN1954362B (zh) 音频信号编码装置及音频信号解码装置
US20190379990A1 (en) Compatible multi-channel coding/decoding
CN101479787B (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN103649706B (zh) 三维音频音轨的编码及再现
CN101689368B (zh) 对具有多声道的多对象音频信号进行编码和解码的设备和方法
CN101553866B (zh) 用于处理音频信号的方法和装置
CN101542595B (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN102089807A (zh) 音频编码和解码中相位信息的有效利用
CN104641414A (zh) 立体声音频信号编码器
CN101410889A (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
CN102523551A (zh) 用于确定空间输出多声道音频信号的装置
WO2005122639A1 (ja) 音響信号符号化装置および音響信号復号装置
CN103915098A (zh) 音频信号编码器
CN101903943A (zh) 用于处理信号的方法和装置
CN101490745B (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN104509130A (zh) 立体声音频信号编码器
KR100917845B1 (ko) 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
CN102138341A (zh) 声信号处理设备、其处理方法以及程序
CN102855879A (zh) 信号处理装置、信号处理方法及程序
Marchand et al. DReaM: a novel system for joint source separation and multi-track coding
AU2004306509B2 (en) Compatible multi-channel coding/decoding
Pathrose Design of a karaoke system for commercial stereophonic audio tracks aiming a musical learning aid for amateur singers

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140928

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140928

Address after: Seaman Avenue Torrance in the United States of California No. 2000 room 200

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110202

Termination date: 20200517