CN1954642A - 多信道合成器及产生多信道输出信号方法 - Google Patents

多信道合成器及产生多信道输出信号方法 Download PDF

Info

Publication number
CN1954642A
CN1954642A CNA2005800152836A CN200580015283A CN1954642A CN 1954642 A CN1954642 A CN 1954642A CN A2005800152836 A CNA2005800152836 A CN A2005800152836A CN 200580015283 A CN200580015283 A CN 200580015283A CN 1954642 A CN1954642 A CN 1954642A
Authority
CN
China
Prior art keywords
channel
reconstruction parameter
reprocessing
parameter
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800152836A
Other languages
English (en)
Other versions
CN1954642B (zh
Inventor
约尔根·赫瑞
沙夏·帝许
约翰内斯·希勒佩特
克里斯蒂安·埃特尔
安德鲁·霍尔茨尔
克劳斯-克里斯蒂安·史宾格尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN1954642A publication Critical patent/CN1954642A/zh
Application granted granted Critical
Publication of CN1954642B publication Critical patent/CN1954642B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Radio Relay Systems (AREA)
  • Stereophonic System (AREA)
  • Channel Selection Circuits, Automatic Tuning Circuits (AREA)

Abstract

一种多信道合成器,包含一后处理器(10),用于决定欲处理的输入信号的实际时间部分的一后处理重建参数或从所述重建参数所得的量,使得所述后处理重建参数或所述后处理量与对应的量化及反向量化重建参数不同,其不同在于所述后处理重建参数的数值或所得的量并不受量化步骤大小所限制。一多信道重建器(12)使用所述后处理重建参数来重建所述多信道输出信号。利用与多信道编码/译码有关的后处理重建参数,可以一方面具有低数据传输率,而另一方面具有高质量,这是由于重建参数量化步骤大小较大,较佳的是因为低位传输率要求,而减少了在所述重建多信道输出信号中产生强烈改变。

Description

多信道合成器及产生多信道输出信号方法
技术领域
本发明与多信道音频处理有关,更特别的,本发明与利用基频及参数侧信息的多信道音频重建有关,其用于重建具有多个信道输出信号的输出信号。
背景技术
目前,多信道音频重制技术变的愈来愈重要。这是由于像是已知MP3技术等的音频压缩/编码技术,可能借助具有一受限频宽的因特网或是其它的传输信道而干扰音频声音记录。由于MP3技术可以利用立体声形式,换言之,利用一种包含一第一或左立体声信道与一第二或右立体声信道的音频声音记录数字表现,散布所有的声音记录,因此已经变的相当出名。
然而,传统的两信道音响系统具有基本的缺点。因此,已经建立环绕技术。除了所述两立体声信道L与R以外,一种受欢迎的多信道环绕表现还包含一额外的中央信道C以及两环绕信道Ls、Rs。这种参考音响形式也称做为三/二立体声(three/two-stereo),其意谓三个前方信道以及两个环绕信道。一般来说,需要五个传输信道。在一种录放环境中,需要分别位于五个不同位置处的五个扬声器,以获得相距所述五个良好放置扬声器特定距离中的最佳甜蜜点。
在此领域中,有许多已知用来减少传输多信道音频信号所需数据传输量的技术。这种技术也称为联合立体声技术。为这目的,参考图10图10,其显示一种联合立体声装置60。此装置可以是一种像是执行强烈立体声(IS)或是双耳线索编码(BCC)的装置。一般来说这种装置接收至少两信道(CH1、CH2、…、CHn)做为输入,并输出一单一运送信道与参数数据。因为定义所述参数数据,因此在译码器中便可以计算原始信道(CH1、CH2、…、CHn)的近似估计。
正常来说,所述运送信道将包含次波段样本、频谱系数、时间域样本等等,其提供所述基本信号一种较为细致的表现,然而,所述参数数据并不包含这种频谱系数的样本,而是包含用于控制一特定重建算法的控制参数,所述算法则如同利用乘法所进行的权重、时间转移、频率转移、相位转移…等等。因此所述参数数据只包含所述信号或所述相关信道较为粗糙的表现。以量化方式说明,利用一运送信道所需要的数据传输量介于每秒60-70千位的范围之间,而使用代表一信道参数侧信息所需要的数据传输量则介于1.5-2.5千位的范围之间。如同以下将描述的,一种已知的参数数据范例则像是缩放因子、强烈立体声信息或双耳线索参数。
在AES preprint 3799,“Intensity Stereo Coding”,J.Herre,K.H.Brandenburg,D.Lederer,February 1994,Amsterdam中描述强烈立体声编码。一般来说,强烈立体声的概念是根据一种对于两三维效果音频信道所进行的主轴转换。如果大多数的数据点集中在所述第一主轴附近,便可以在旋转之前利用一特定角度旋转所述两信号,以达成编码增益。然而,这对于真实三维效果产生技术而言并非总是成立。因此,此技术可以在所述位串流中包含来自于转换所获得的第二正交成分而进行修正。因此,用于所述左右信道的重建信号便由不同的权重或是相同传输信号的缩放形式所组成。不过,所述重建信号具有不同振幅,但其相位信息完全相同。然而,可利用一般在频率选择方式中操作的选择缩放操作,维持两原始音频信号的能量-时间包络。此符合高频位置的人类音响感知,而其支配空间线索则利用所述能量包络所决定。
另外在实际执行中,利用所述左信道与右信道的加总,而不是利用旋转所述两成分的方式产生所述传输信号,换言之所述运送信道。此外,这种处理,换言之产生强烈立体声参数以执行所述缩放操作的处理,则以选择频率的方式进行执行,换言之,与每个缩放因子波段,也就是编码器频率划分无关。较佳的是,将两信道结合以形成一种结合或”运送”信道,而在所述结合信道以外,便根据所述第一信道的能量、所述第二信道的能量或是所述结合信道的能量,决定所述强烈立体声信息。
在AES convention paper 5574,“Binaural cue coding applied to stereoand multichannel audio compression”,C.Faller,F.Baumgrate,May 2002,Munich中描述双耳线索编码(BCC)技术。在双耳线索编码(BCC)中,利用离散傅立叶转换(DFT)做为基础,以重迭窗的方式将数个音频输入信道转换为一种频谱表现。所述形成的均匀频谱被区分为非重迭划分,每一划分都具有一索引。每一划分具有正比于其等价矩形频宽(ERB)的频宽。估计用于每一划分每一帧k的所述信道之间程度差异(ICLD)与所述信道之间时间差异(ICTD)。将所述信道之间程度差异(ICLD)与信道之间时间差异(ICTD)量化并编码,形成一双耳线索编码(BCC)位串流。给定用于每一信道,相对于一参考信道的所述信道之间程度差异(ICLD)与信道之间时间差异(ICTD)。接着,利用规定的方程式计算参数,所述方程式与被处理信号的特定划分有关。
在译码器侧,所述译码器接收一单音信号以及所述双耳线索编码(BCC)位串流。将所述单音信号转换至频率域,并输入至一空间合成功能区块,其同时接收解码后的信道之间程度差异(ICLD)与信道之间时间差异(ICTD)数值。在所述空间合成功能区块中,使用所述双耳线索编码(BCC)参数(信道之间程度差异(ICLD)与信道之间时间差异(ICTD))数值执行所述单音信号的加权操作,以合成所述多信道信号,在频率/时间转换之后,所述合成多信道信号代表所述原始多信道音频信号的重建结果。
在双耳线索编码(BCC)的情况中,操作所述联合立体声模块60以输出所述信道侧信息,因此所述参数信道数据可以被量化,并将所述信道之间程度差异(ICLD)与信道之间时间差异(ICTD)参数加以编码,其中,所述原始信道之一则做为将所述信道侧信息进行编码的一参考信道。
正常来说,所述运送信道是由所述参与原始信道的总和所形成。
自然地,所述上述技术仅为了译码器提供单音表现,其只能够处理所述运送信道,但无法处理所述参数数据,以产生多于一个输入信道的一个或多个近似估计。
在United States patent application publications US 2003,0219130 A1,2003/0026441 A1与2003/0035553 A1中也同样描述了用于双耳线索编码(BCC)的音频编码技术。另外也可以参考在Audio and Speech Proc.,Vol.11,No.6,Nov.1993上的文章”Binaural Cue Coding.Part II:Scheme andApplications”,C.Faller and F.Baumgrate,IEEE Trans.。由Faller与Baumgrate发表对于双耳线索编码(BCC)技术的United States patent applicationpublications,在此则完全整合为本发明的参考文献。
在之后,参考图11至图13,结合这些附图详细说明一种用于多信道音频编码的典型一般双耳线索编码(BCC)结构。图11显示这种用于一多信道音频信号编码/转换的一般双耳线索编码(BCC)结构。在一双耳线索编码(BCC)编码器112输入110处的多信道音频输入信号,将在一下混功能区块114中进行下混。在目前的范例中,在所述输入110处的原始多信道信号是一种5信道环绕信号,其具有一左前信道、一右前信道、一左环绕信道、一右环绕信道与一中央信道。在本发明的较佳实施例中,所述下混功能区块114利用将这五个信道加总成为一单音信号的简单方式,产生一加总信号。在此领域中,也可以利用多信道输入信号的其它已知下混结构,获得具有一单一信道的下混信号。此单一信道便在一加总信号线115处输出。在一侧信息线117处,输出利用一双耳线索编码(BCC)分析功能区块116所获得的侧信息。如同已经在之前所描述,在所述双耳线索编码(BCC)分析功能区块116中,计算信道之间程度差异(ICLD)与信道之间时间差异(ICTD)。目前,所述双耳线索编码(BCC)分析功能区块116已经被强化为能够计算信道之间相关性(ICC)数值。较佳的是传输量化与编码形式的所述加总信号与所述侧信息至一双耳线索编码(BCC)译码器120。所述双耳线索编码(BCC)译码器120将所述传输加总信号分解成为多个次波段,并进行缩放、延迟与其它的处理,以产生所述输出多信道音频信号的次波段。借助此处理执行,在一输出121处重建多信道信号的信道之间程度差异(ICLD)、信道之间时间差异(ICTD)与信道之间相关性(ICC)参数(线索),便与在所述双耳线索编码(BCC)编码器112输入110处的原始多信道信号各别线索相似。为这目的,所述双耳线索编码(BCC)译码器120包含一双耳线索编码(BCC)合成功能区块122与一侧信息处理功能区块123。
在之后,参考图12说明所述双耳线索编码(BCC)合成功能区块122的内部结构。将加总信号线115上的加总信号输入至一时间/频率转换单元或是滤波器组(FB)125。在所述滤波器组125的输出处,存在总数为N的次波段信号,或是在极端情况中,当所述音频滤波器组125进行一种1∶1转换,也就是一种利用N个时间域样本产生N个频谱系数的转换时,存在一组频谱系数。
所述双耳线索编码(BCC)合成功能区块122另外包括一延迟阶层126、一程度修正阶层127、一相关性处理阶层128与一反向滤波器组阶层(IFB)129。在所述反向滤波器组阶层129的输出处,可以将具有例如在5信道环绕系统中五个信道的重建多信道音频信号,输出至如同在图11中所描述的一组喇叭124。
如在图12中所显示的,利用所述滤波器组125将所述输入信号s(n)转换至频率域或滤波器组域。如利用乘法节点130所描述,进行所述滤波器组125输出信号的乘法操作,以获得所述相同信号的多种形式。所述原始信号的形式总数等于在所述被重建输出信号中的输出信道总数。一般来说,当在节点130处进行所述原始信号每一形式的特定延迟d1、d2、…、di、…、dN时,可以利用在图11中的侧信息处理功能区块123计算,并从所述双耳线索编码(BCC)分析功能区块116所决定的信道之间时间差异(ICTD)推导所述延迟参数。
对于乘法参数a1、a2、…、ai、…、aN而言也同样成立,根据所述双耳线索编码(BCC)分析功能区块116所计算信道之间程度差异(ICLD),由所述侧信息处理功能区块123计算所述乘法参数。
利用所述侧信息处理功能区块123所计算的信道之间相关性(ICC)参数则用于控制所述功能区块128的功能,因此可以在所述功能区块128输出处,获得介于所述延迟与程度操作信号之间的特定相关性。在此应该注意的是,所述阶层126、127、128的顺序可以与图12中所显示的情况不同。
在此应该注意的是,在一音频信号帧相关的处理中,利用帧相关的方式,换言之以时间变化的方式执行所述双耳线索编码(BCC)分析,其也可以利用频率相关的方式执行。此意谓可以获得用于每一频谱波段的双耳线索编码(BCC)参数。此意谓在所述音频滤波器组125将所述输入信号分解成为例如32个波段通过信号的情况中,所述双耳线索编码(BCC)分析功能区块能够获得用于所述32个波段每一个的双耳线索编码(BCC)参数。自然地,如同在图11中所显示,并在图12中详细描述的双耳线索编码(BCC)合成功能区块122,便根据所述范例中的32个波段进行重建。
在之后,参考图13,其显示一种决定特定双耳线索编码(BCC)参数的设定。正常来说,可以定义介于信道对之间的信道之间程度差异(ICLD)、信道之间时间差异(ICTD)与信道之间相关性(ICC)参数。然而,较佳的是在一参考信道与每一另外信道之间,决定信道之间程度差异(ICLD)、信道之间时间差异(ICTD)参数。这在图13A中描述。
可以利用多种方式定义信道之间相关性(ICC)参数。最一般的方式是如在图13B中所显示,在所述编码器中的所有可能信道对之间估计信道之间相关性(ICC)参数。在此情况中,一译码器进行信道之间相关性(ICC)参数的合成,因此其几乎与所述原始多信道信号中所有可能信道对之间的相同。然而,建议每次只估计介于最强两信道之间的信道之间相关性(ICC)参数。此结构则在图13C中描述,其中显示的范例为在某一时刻下,估计介于信道1与2之间的信道之间相关性(ICC)参数,而在另一时刻时,计算介于信道1与5之间的信道之间相关性(ICC)参数。所述译码器接着将介于所述译码器中最强两信道之间的信道之间相关性(ICC)加以合成,并应用某些启发式规则计算并合成剩余信道对的信道之间相关性(ICC)参数。
关于例如根据传输信道之间程度差异(ICLD)参数的乘法参数a1、aN计算,可以参考之前列出的AES convention paper 5574。所述信道之间程度差异(ICLD)表现一种原始多信道信号中的能量分布。在不失去一般性下,图13A中显示在所有其它信道与所述左前信道之间,具有描述其能量差异的四个信道之间程度差异(ICLD)。在所述侧信息处理功能区块123中,从所述信道之间程度差异(ICLD)参数推导所述乘法参数a1、…、aN,因此所有重建输出信道的总能量与所述传输加总信号的能量相同(或正比于所述传输加总信号的能量)。一种决定这些参数的简单方式是一种2-阶段处理,其中在第一阶段中,将用于所述左前信道的乘法因子设定为1,而用于图13A中其它信道的乘法因子则设定为所述传输信道之间程度差异(ICLD)数值。接着,在第二阶段中,计算所有五个信道的能量,并与所述传输加总信号能量比较。接着,利用对于所有信道为相同的一选择缩减因子将所有信道加以缩减,因此所有重建输出信道的总能量在缩减之后,等于所述传输加总信号的总能量。
自然地,存在其它计算所述乘法因子的方法,其并非依赖所述2-阶段处理,而是仅需一种1-阶段处理的方式。
关于所述延迟参数,应该注意的是当用于所述左前信道的延迟参数d1被设定为0时,所述延迟参数可以直接使用从一双耳线索编码(BCC)编码器所传输的信道之间时间差异(ICTD)。在此便不需进行再次缩放的动作,因为延迟并不改变所述信号的能量。
至于从所述双耳线索编码(BCC)编码器传输至所述双耳线索编码(BCC)译码器的信道之间相关性(ICC)参数,应该注意的是可以利用修正所述乘法因子a1、…、an的方式完成调和运用,像是利用介于20log10(-6)与20log10(6)之间的随机数值与所有次波段加权因子相乘。较佳的是将所述拟似随机序列选择为对于所有临界波段而言,其变异数接近为定值,且在每一临界波段之中的平均为零。将所述相同序列应用至用于每一不同帧的频谱系数。因此,便利用修正所述拟似随机序列的方式控制所述听觉映象宽度。较大的变异数产生较大的映象宽度。所述变异数修正可以在具有临界波段宽的各自波段中进行。这可以达成一种在听觉感受中具有多个对象的仿真存在,每一个对象都具有不同的映象宽度。如同在US patentapplication 2003/0219130 A1中所描绘,所述拟似随机序列的适当振幅分布为一种在对数尺度上的均匀分布。不过,所有的双耳线索编码(BCC)合成处理都与如同在图11中所显示的一传输单一输入信道有关,其做为从所述双耳线索编码(BCC)编码器至所述双耳线索编码(BCC)译码器的加总信号。
在J.Breebaatt,S.van de Par,A.Kohlrausch,E.Schuijers,“High-QualityParametric Spatial Audio Coding at Low Bitrates”,AES 116th Convention,Berlin,Preprint 6072,May 2004以及E.Schuijers,J.Breebaatt,H.Pumhagen,J.Engdegard,“Low Complexity Parametric Stereo Coding”,AES 116thConvention,Berlin,Preprint 6073,May 2004中则叙述了一种参数立体声的已知相关技术。
如同以上已经对于图13所描述,所述参数侧信息,换言之所述信道之间程度差异(ICLD)、所述信道之间时间差异(ICTD)或所述信道之间相关性(ICC)参数可以对于所述五个信道的每一个加以计算并传输。此意谓正常来说,可以传输用于五信道信号的五组信道之间程度差异(ICLD)。其对于所述信道之间时间差异(ICTD)参数也同样成立。对于所述信道之间相关性(ICC)参数而言,例如只传输两组这些参数也可能是足够的。
如同以上已经对于图12所描述,并没有用于一信号帧或时间部分的单一程度差异参数、时间差异参数或是调和参数。取而代之的是,针对许多不同频带决定这些参数,因此便可获得与频率相关的参数。由于较佳的是使用例如一种32频率信道,换言之,使用具有32个频带的滤波器组,进行双耳线索编码(BCC)分析与双耳线索编码(BCC)合成,因此所述参数可能占用大量的数据。虽然-在与其它的多信道传输相比之下,-所述参数表现造成一种十分低的数据传输率,其仍需要继续进一步减少多信道信号的数据传输率,所述多信道信号则用于表现像是具有两信道(立体声信号)的信号,或是具有多于两信道的多信道环绕信号。
为此目的,便需要根据一特定量化规则量化所述编码器侧的计算重建参数。此意谓将未量化重建参数映射至本领域所已知的量化程度或量化指针受限集合之中,如同在C.Faller and F.Baumgrate,“Binaural cue codingapplied to audio compression with flexible rendering,”AES 113th convention,Los Angeles,Preprint 5686,October 2002中所详细描述。
量化所获得的效果为,将所有小于所述量化步骤尺寸的所有参数数值量化为零。此外,借助将一未量化数值大集合映像至一量化数值小集合的方式,就其本身而言便可以节省数据传输率。这些省下的数据传输率可以进一步利用将在所述编码器侧上量化重建参数进行熵编码(entropy-encoding)的方式所强化。较佳的熵编码方式则像是以预先定义编码表为基础,或是信号统计实际测定及编码书信号调适建构为基础的霍夫曼(Huffman)方法。替代的,也可以使用像是算数编码的其它熵编码工具。
一般来说,存在随着增加量化器步骤尺寸而减少所述重建参数所需要数据传输率的规则。换句话说,较粗糙的量化造成一种较低的数据传输率,而较细致的量化则造成一种较高的数据传输率。
因为一般来说参数信号表现只需要低数据传输率环境,因此便应该尝试将所述重建参数尽可能地粗糙量化,以获得具有在所述基频中特定数据量的信号表现,并同时具有包含所述侧信息量化及熵编码重建参数的合理小量数据。
因此,先前技术方法直接从被编码多信道信号推导所述被传输重建参数。如以上讨论的粗糙量化将造成重建参数扭曲,当所述量化重建参数在一译码器中反向量化,并用于多信道合成时,便造成大量的舍去误差(rounding error)。自然地,所述舍去误差随着所述量化器步骤尺寸增加,换言之,随着所述选择的”量化器粗糙度”增加。这种舍去误差可能造成量化程度的改变,也就是从先前时刻的第一量化程度,改变为在之后时刻的第二量化程度,其中较佳的是为了一粗糙量化动作,以所述非常大的量化器步骤尺寸定义一量化器程度与另一量化器程度之间的差异。不幸的是,当所述未量化参数是介于两量化程度的中间时,一小参数改变便可能触发所述大量化器步骤尺寸的量化器程度改变。明显的是,这种在所述侧信息中的量化器指标改变情况,将造成在信号合成阶段中的同样强烈改变。当考虑所述信道之间程度差异(ICLD)-做为范例-时,这种强烈改变将明显地形成一种特定喇叭信号响度的明显减少,以及伴随另一喇叭信号响度的明显增加。这种只由一量化程度改变以及一粗糙量化触发的情况,可能感知为来自一第一(虚拟)位置至一第二(虚拟)位置音响来源的中间位置改变。由于实际上音调信号的音响来源并不会非常快速地改变位置,这种从一时刻至另一时刻之间,被感知为一种调变效果的中间位置改变听起来便相当不自然。
一般来说,在量化器指标的快速改变中也可能造成传输错误,其在所述多信道输出信号明显改变时立即发生,其对于为了数据传输率理由而采用粗糙量化器的情况而言也同样存在。
发明内容
本发明的目标是提供一种改善的信号合成概念,其一方面可以具有低数据传输率,而另一方面则具有良好的主观质量。
根据本发明第一观点,所述目标是利用一种多信道合成器达成,其用于从一输入信号产生一输出信号,所述输入信号具有至少一输入信道以及一量化重建参数序列,所述量化重建参数则根据一量化规则所量化,并与所述输入信道的随后时间部分有关,所述输出信号具有一些合成输出信道,而所述合成输出信道的数量是大于1或大于所述输入信道的数量,所述多信道合成器包括一后处理器,用于为了所述被处理输入信号的时间部分,决定一后处理重建参数或从所述重建参数推导的后处理量,其中所述后处理器是操作以决定所述后处理重建参数或所述后处理量,因此所述后处理重建参数或所述后处理量的数值是与利用根据所述量化规则在量化所获得的数值不同;以及一多信道重建器,用于利用所述输入信道的时间部分以及所述后处理重建参数或所述后处理量,重建所述一些合成输出信道的时间部分。
根据本发明第二观点,此目标是利用一种从一输入信号产生一输出信号的方法达成,所述输入信号具有至少一输入信道以及一量化重建参数序列,所述量化重建参数则根据一量化规则所量化,并与所述输入信道的随后时间部分有关,所述输出信号具有一些合成输出信道,而所述合成输出信道的数量是大于1或大于所述输入信道的数量,所述方法包括:为了所述被处理输入信号的时间部分,决定一后处理重建参数或从所述重建参数推导的后处理量,因此所述后处理重建参数或所述后处理量的数值是与利用根据所述量化规则在量化所获得的数值不同;以及利用所述输入信道的时间部分以及所述后处理重建参数或所述后处理量,重建所述一些合成输出信道的时间部分。
根据本发明第三观点,此目标是利用一种计算机程序达成,其具有当在一计算机上执行时,执行上述方法的程序代码。
本发明是根据对于操作在一多信道合成器中所使用量化重建参数的后处理,可以减少或甚至消除一方面以粗糙量化方式,而另一方面量化程度改变时所相关的问题。然而,在先前技术系统中,因为在所述合成器中的再量化只允许所述受限的量化数值集合,在一编码器中的小参数改变将在所述译码器处造成强烈的参数改变,本发明装置执行重建参数的后处理,因此用于所述输入信号被处理时间部分的所述后处理重建参数并非由所述采用编码器量化栅所决定,而是造成与利用根据所述量化规则量化方式获得数值不同的重建参数数值。
然而,在一种线性量化情况中,所述先前技术方法只允许反向量化数值是一种所述量化器步骤尺寸的整数乘积,本发明后处理方式可以允许反向量化数值是一种所述量化器步骤尺寸的非整数乘积。此意谓本发明后处理方式可以消除所述量化器步骤尺寸限制,因此也可以利用所述后处理方式,以及使用利用所述后处理重建参数的本发明多信道重建器,获得位在两邻近量化器程度之间的后处理重建参数。
此后处理可以在一多信道合成器中,于再量化之前或之后执行。当利用所述量化参数,换言之利用所述量化器指标执行所述后处理时,便需要一反向量化器,其不但可以进行量化器步骤倍数的反向量化,也可以反向量化成为所述量化器步骤尺寸倍数之间的反向量化数值。
在利用反向量化重建参数执行后处理的情况中,可以使用一种直向前反向量化器,并利用所述反向量化数值进行内插/滤波/平滑处理。
在像是一种对数量化规则的非线性量化规则情况中,执行在再量化之前的量化重建参数后处理,因为所述对数量化与人耳音响感知类似,对于低程度音响而言具有较高精确性,而对于高程度音响而言具有较低精确性,换言之,产生一种对数压缩。
在此应该注意的是,本发明的价值并不仅是利用修正包含在所述位串流中做为所述量化参数的所述重建参数本身而获得。其优点也可以利用从所述重建参数推导一后处理量的方式获得。当所述重建参数是一种差异参数,以及针对从所述差异参数所推导的绝对参数执行像是平滑化的运用时,这是特别有用的。
在本发明的一较佳实施例中,利用一种信号分析器的装置控制用于所述重建参数的后处理,其分析与一重建参数有关的信号部分,以找出存在的信号特性。在一较佳实施例中,本发明后处理仅为了所述信号(有关频率及/或时间)的音调部分所启动,而对于非音调部分,换言之所述输入信号的瞬变部分便关闭所述后处理。此确保传输代表所述音频信号的瞬变部分,而不是代表所述信号音调部分的所述重建参数完整动态改变。
较佳的,所述后处理执行一种所述重建参数平滑形式的修正,这对于心理听觉的观点而言是有意义的,而不影响重要的空间侦测线索,这对于非音调,换言之瞬变信号部分而言是特别重要的。
因为重建参数的编码器侧量化可以是一种粗糙的量化方式,本发明便形成一种低数据传输率,因此系统设计者并不需要担心由于来自于从一反向量化程度至另一反向量化程度所造成的重建参数改变,而在所述译码器中的剧烈改变,此改变则利用本发明将其映射至介于两再量化程度之间的数值处理方式所减少。
因为本发明借助将一数值映像至两容许再量化程度之间数值的后处理方式,可以减少由于从一反向再量化程度改变至次一容许反向再量化程度所造成的可听见人为干扰,因此本发明的另一优点便可以改善所述系统的质量。
自然地,本发明量化重建参数的后处理方式,除了在所述编码器中由参数化以及所述重建参数的后续量化所获得的信息损失之外,也表现另一种信息损失。然而,因为本发明后处理较佳的是利用所述实际或在前量化重建参数,以决定用于重建所述输入信号,换言之所述基本信道实际时间部分的后处理重建参数,因此其并不像所听到的那么糟。已经说明因为可以将编码器所引起的错误补偿至一定程度,便可以造成一种改善的主观质量。即使在编码器所引起的错误并不由所述重建参数的后处理所补偿时,也可以减少在所述重建多信道音频信号中空间感知的强烈改变,较佳的是只针对音频信号部分,因此不管其是否进一步造成信息损失,仍可以改善主观的听觉质量。
附图说明
之后参考附图描述本发明的较佳实施例,其中:
图1为本发明多信道合成器一较佳实施例的方框示意图;
图2为一编码器/译码器系统较佳实施例的方框示意图,其中包含图1的多信道合成器;
图3为一后处理器/信号分析器的方框示意图,其与图1的本发明多信道合成器结合使用;
图4为所述输入信号与用于过去信号部分、被处理实际信号部分与未来信号部分相关量化重建参数的时间部分结构表现;
图5为来自图1的后处理器实施例;
图6a为在图1中所显示后处理器的另一实施例;
图6b为所述后处理器的另一较佳实施例;
图7a为在图1中所显示后处理器的另一实施例;
图7b为根据本发明被后处理的参数结构指示,其显示本发明也可以将从所述重建参数所推导的量加以平滑化;
图8为执行一直向前映射或一强化映像的量化器/反向量化器结构表现;
图9a为结合后续输入信号部分的量化重建参数示范时间过程;
图9b为后处理重建参数的时间过程,其已经利用所述后处理器以执行平滑(低通过)函数的方式进行后处理;
图10图10描述一先前技术联合立体声编码器;
图11为一先前技术双耳线索编码(BCC)编码器/译码器链的方框示意图表现;
图12为图11双耳线索编码(BCC)合成功能区块的先前执行方框示意图;以及
图13为一种用于决定信道之间程度差异(ICLD)、信道之间时间差异(ICTD)与信道之间相关性(ICC)参数的已知结构表示。
具体实施方式
图1显示本发明多信道合成器的方框示意图示,用于从一输入信号产生一输出信号。如同稍后参考第4所显示的,所述输入信号具有至少一输入信道以及一量化重建参数序列,所述量化重建参数则根据一量化规则所量化。每一重建参数都与所述输入信道的时间部分有关,因此一时间部分序列便与一量化重建参数序列有关。此外,应该注意的是,所述利用图1多信道合成器所产生的输出信号具有一些合成输出信道,在任何时候其数量都大于在所述中的输入信道数量。当所述输入信道数量为1时,换言之,当只有一单一输入信道时,所述输出信道数量为2或更多。然而,当所述输入信道数量为2或3时,所述输出信道数量则至少为3或至少为4。
在以上叙述的双耳线索编码(BCC)情况中,所述输入信道数量为1,或一般来说不大于2,然而所述输出信道数量为5(左环绕、左方、中央、右方、右环绕)或6(5个环绕信道家上1个次低音扩声器信道),或甚至可以是一种7.1或9.1多信道形式。
如同在图1中所显示的,本发明多信道合成器基本特色为包含一重建参数后处理器10与一多信道重建器12。操作所述重建参数后处理器10以接收量化及较佳编码重建参数,用于所述输入信道的后续时间部分。操作所述重建参数后处理器10以在一输出处决定所述输入信号被处理时间部分的后处理重建参数。所述重建参数后处理器是根据一后处规则所操作,其在某些较佳实施例中是一种低通过滤波规则、一种平滑规则或是类似的一些规则。实际上,操作所述后处理器10以决定所述后处理重建参数,因此所述后处理重建参数的数值,是与根据所述量化规则以任何量化重建参数再量化所获得的数值不同。
使用所述多信道重建器12,以利用所述输入信道被处理时间部分与所述后处理重建参数,重建每一合成输出信道的时间部分。
在本发明的较佳实施例中,所述量化重建规则是一种量化双耳线索编码(BCC)参数,像是信道之间程度差异、信道之间时间差异或是信道之间调和参数。自然地,根据本发明也可以处理像是用于强烈立体声或是参数立体声等立体声参数的其它重建参数。
总结来说,本发明具有用于与所述输入信号后续时间部分有关,所述量化与较佳编码重建参数的第一输入14a。将所述输入信号的后续时间部分输入至连接至所述多信道重建器12的第二输入14b,并较佳的连接至之后描述的一输入信号分析器16。在所述输出侧上,图1的本发明多信道合成器具有一多信道输出信号输出18,包含许多输出信道,其数量大于输入信道的数量,其中所述输入信道的数量可以是一单一输入信道,或是两个或更多的输入信道。在任何情况中,输出信道的数量都大于输入信道的数量,因此所述合成输出信道一方面利用所述输入信号,而另一方面利用所述重建参数形式中的侧信息所形成。
在之后,参考图4,其显示用于一位串流的范例。所述位串流包含许多帧20a、20b、20c、…。每一帧都包含在图4中利用帧上方矩形所表现的所述输入信号时间部分。此外,每一帧都包含一组量化重建参数,其与所述时间部分有关,并在图4中以每一帧20a、20b、20c的下方矩形所描述。做为示范,将帧20b视作为所述被处理输入信号,其中此帧具有在前输入信号部分,换言之其形成所述被处理输入信号部分的”过去”。此外,也具有后续输入信号部分,其形成所述被处理输入信号部分的”未来”(所述被处理输入部分也称作为”实际”输入信号部分),而”过去”中的输入信号部分也称为在前输入信号部分,同时”未来”中的信号部分也称为在后输入信号部分。
在之后,参考图2对于一完整编码器/译码器的设定,其中可以包含发明的多信道合成器。
图2显示一编码器侧21与一译码器侧22。在所述编码器中,将N个原始输入信道输入至一下混器阶层23之中。操作所述下混器阶层23以将所述多个信道减少成为例如单一单音信道,或可能减少成为两立体声信道。接着将在所述下混器23输出处的下混信号表现输入至一来源编码器24,所述来源编码器则执行为例如一种mp3译码器或是一种高等音频码(AAC)编码器,以产生一输出位串流。所述编码器侧21另外包括一参数取得器25,其根据本发明执行所述双耳线索编码(BCC)分析(图11中的功能区块116),并输出所述量化及较佳霍夫曼(Huffman)编码的信道之间程度差异(ICLD)。在所述来源编码器24输出处的位串流以及由该参数取得器25所输出的量化重建参数可以被传输至一译码器22,或是进行储存而在之后传输至一译码器等等。
所述译码器22包含一来源译码器26,其被操作以从所述接收位串流(来自于所述来源编码器24)重建一信号。为此目的,所述来源译码器26供应所述输入信号的后续时间部分作为输出,并输入至一上混器12,其进行与图1中多信道重建器12的相同功能。较佳的,此功能是一种如同在图11中由功能区块122所执行的双耳线索编码(BCC)合成。
与图11相比之下,本发明多信道合成器另外包括所述后处理器10,也称为”信道之间程度差异(ICLD)平滑器”,其利用所述输入信号分析器16所控制,所述信号分析器16较佳的执行所述输入信号的音频分析。
从图2可见,将像是信道之间程度差异(ICLD)的重建参数输入至所述信道之间程度差异(ICLD)平滑器之中,而在所述参数取得器25与所述上混器12存在另一连接。透过此增设连接,其它用于重建而不需要进行后处理的参数也可以从所述参数取得器25供应至所述上混器12。
图3显示利用所述信号分析器16与所述信道之间程度差异(ICLD)平滑器10所形成信号调适重建参数处理的一较佳实施例。
所述信号分析器16是由一音调决定单元16a与一随后阈值装置16b所形成。此外,来自图2的所述重建参数后处理器10包含一平滑滤波器10a与一后处理器开关10b。所述后处理器开关10b是利用所述阈值装置16b所控制操作,因此当所述阈值装置16b决定像是所述音调特性的输入信号特定信号特性位于一特定指明阈值预定关系中时,便启动所述开关。在此情况中,当所述输入信号的信号部分音调以及特别是所述信号特定时间部分的一特定频带具有在一音调阈值以上的音调时,便在所述上方位置中(如在图3中所显示)启动所述开关。在此情况中,启动所述开关10b以连接所述平滑滤波器10a的输出至所述多信道重建器12的输入,因此便将经过后处理但尚未进行反向量化的信道之间差异,供应至所述译码器/多信道重建器/上混器12。
然而,当所述音调决定装置决定所述输入信号实际时间部分的一特定频带,换言之一被处理输入信号部分的特定频带,具有低于所述特定指明阈值以下的音调时,换言之其为瞬变部分,所述开关便启动,因此绕过所述平滑滤波器10a。
在所述后者情况中,利用所述平滑滤波器10a所进行的信号调适后处理,确保用于瞬变信号的重建参数改变可以通过未修正的后处理阶层,并造成在所述重建输出信号中对于所述空间映象的快速改变,这与用于瞬变信号具有高度可能性的实际情况有关。
在此应该注意的是,图3的实施例,换言之一方面启动后处理而另一方面完全地关闭后处理,也就是进行或不进行后处理的二元决策方式,因为其简单及有效率的结构而仅是一较佳实施例。然而,特别是对于音调而言,应该注意的是此信号特性并不只是一种定性参数,也是一种量化参数,一般来说可以介于0至1之间。根据所述量化决定参数,可以设定所述平滑滤波器的平滑程度,或是举例而言设定一低通过滤波器的切除(cut-off)频率,因此对于重度音调信号而言,可以启动重度平滑处理,而对于并非如此重度音调的信号而言,可以启动具有较低平滑程度的平滑处理。
自然地,也可以侦测瞬变部分并扩大在所述参数中的改变,成为介于预先定义量化数值或量化指标之间的数值,因此,对于重度瞬变信号而言,为了所述重建参数的后处理,便形成一多信道信号空间映象的更夸张改变。在此情况中,可以将对于后续时间部分利用后续重建参数指示数值为1的量化步骤尺寸,强化成为例如1.5、1.4、1.3等等,其形成一种更加引人注目的重建多信道信号空间映象改变。
在此应该注意的是,一音调信号特性、一瞬变信号特性或是其它的信号特性只是作为信号特性的范例,根据此特性可以执行信号分析以控制一重建参数后处理器。为了响应此控制,所述重建参数后处理器决定一后处理重建参数,其具有与利用一预定量化规则所决定,一方面用于量化指标或另一方面用于再量化数值的任何数值都不同的数值。
在此应该注意的是,重建参数的后处理与一信号特性有关,换言之,一信号调适参数后处理只是选择性的。对于许多信号而言,与信号无关的后处理也具有优点。举例而言,使用者可以选择一特定后处理函数,因此所述使用者可得到强化的改变(在夸大函数的情况中)或是减幅的改变(在平滑函数的情况中)。替代的,对于错误复原而言,与任何使用者选择无关以及与信号特性无关的后处理也具有特定的优点。特别是在大量化器步骤尺寸的情况中,明显的是在一量化器指标中的传输错误可能造成严重的可听见人为干扰。为此目的,当所述信号必须透过具有错误倾向的信道进行传输时,可执行一种前向错误改正或是其它类似的改正方式。根据本发明,所述后处理可以排除对于位无效错误改正码的需要,因此根据过去重建参数所进行的重建参数后处理将造成一种对于错误传输量化重建参数的侦测,并造成一种对于这种测量的适当反向测量。此外,如同稍后所描绘的,当所述后处理函数为一种平滑化函数时,将自动地运用与在前或在后重建参数所非常不同的量化重建参数。
图5显示来自图1重建参数后处理器10的一较佳实施例。实际上,其考虑将所述量化重建参数进行编码的情况。在此,所述编码量化重建参数进入一熵译码器10c,其输出所述解码量化重建参数序列。在所述熵译码器输出处的重建参数被量化,其意谓他们并不具有一特定“有用的”数值,但其意谓他们指示特定的量化器指标或是由一随后反向量化器所执行特定量化规则的量化器程度。举例而言,所述运用器10d可以是一种数字滤波器,像是具有利用所述要求后处理函数所决定任何滤波器特性的(较佳的)一种无限脉冲响应(IIR)或是有限脉冲响应(FIR)滤波器。一平滑或低通过滤波后处理函数是较佳的。在所述运用器10d的输出处,可以获得运用量化重建参数序列,其不但可以是任何正整数,也可以是利用所述量化规则所决定范围之中的任何实数。与之前的阶层10d所具有的数值1、0、1相比之下,这种运用重建参数可以具有像是1.1、0.1、0.5、…等的数值。接着将在所述功能区块10d输出处的数值序列输入至一强化反向量化器10e之中,以获得后处理重建参数,其可以在图1的功能区块12中为了多频动重建(例如,双耳线索编码(BCC)合成)所使用。
应该注意的是,所述强化量化器10e与一种正常反向量化器不同,因为正常反向量化器只将来自于一受限量化指标数量的每一量化输入,映射至一特定指明的反向量化输出数值。所述正常反向量化器无法映射非正整数的量化器指标。因此执行所述强化量化器10e,以较佳的使用像是线性或对数量化守则的相同量化规则,但是其可以接受非正整数的输入,以提供并只利用正整数输入所获得数值不同的输出数值。
有关本发明,基本上对于是否于再量化之前(见图5)或于再量化之后(见图6a、图6b)执行运用并没有差别。在所述后者情况中,本发明量化器只必须是一种正常直向前反向量化器,其与已经在之前描绘图5的所述强化反向量化器10e不同。自然地,图5与图6a之间的选择是一种与特定执行有关的问题。对于目前的双耳线索编码(BCC)执行而言,所述图5实施例是较佳的,因为其更适合于目前的双耳线索编码(BCC)算法。然而,这也可能因为其它的应用而有所不同。
图6b所显示的实施例,是在图6a中利用一直向前反向量化器与根据一种线性或较佳为非线性曲线进行映像的映像器10g,取代所述强化反向量化器10a。此映像器可以在硬件中或软件中执行,像是一种用于执行数学操作的电路,或是一种查询表格。利用例如所述平滑器10g的数据运用,可以在该映像器10g之前或在该映射器10g之后,或是结合在两位置处执行。当在所述反向量化器域中执行所述后处理时,此实施例是较佳的,因为所有的构件10f、10h、10g可以利用像是软件例行程序电路的直向前组件执行。
一般来说,所述后处理器10是执行为如在图7a中所指示的一种后处理器,其接收所有的实际量化重建参数、未来重建参数或过去量化重建参数,或是其中的一部份选择。在所述后处理器只接收至少一过去重建参数与所述实际重建参数的情况中,所述后处理器将作用为一种低通过滤波器。然而,当所述后处理器10接收一未来量化重建参数时,其不能在实时应用中发生,但可以发生在所有其它的应用之中,所述后处理器可以执行一种在所述未来及目前或一过去量化重建参数之间的内插处理,以例如将一重建参数的时间过程平滑化,举例而言,一特定频带。
如同已经在以上所描绘的,在一粗糙量化环境中因为量化步骤尺寸以数据运用克服人为干扰的方式,也可以针对从附加在所述参数编码多信道信号中,所述基频的重建参数所推导的量执行。举例而言,当所述量化重建参数是一种差异参数(信道之间程度差异(ICLD))时,此参数可以不利用任何修正便进行反向量化。接着,可以推导用于一输出信道的绝对程度数值,并对于所述绝对数值进行本发明数据运用。只要在所述量化重建参数与所述实际重建之间的处理路径中执行数据运用,此步骤也造成本发明的人为干扰减少,因此,所述后处理重建参数的数值或是所述后处理量,便与利用根据所述量化规则的再量化,换言之不进行任何克服“步骤尺寸限制”的运用所获得的数值不同。
在本领域中可以设计并使用许多用于从所述量化重建参数推导所述最终运用量的映像函数,其中这些映像函数包含用于根据一映像规则将一输入数值唯一映射至一输出数值的函数,以获得在所述多信道重建(合成)算法之中所使用的后处理量。
在之后,参考图8描述图5强化反向量化器10e与图6a直向前反向量化器10f之间的差异。为此目的,图8中的描述于水平轴中显示一种代表未量化数值的输入数值轴。垂直轴描述所述量化器程度或是量化器指标,其较佳的是具有0、1、2、3等数值的正整数。在此应该注意的是,图8中的所述量化器将不形成任何介于0与1或1与2之间的数值。利用所述阶梯型函数控制这些量化程度的映像,因此例如介于-10至10之间的数值便被映射为0,而介于10与20之间的数值则被映射为1等等。
一种可能的反向量化器函数,是将具有0的量化器程度映射至具有0的反向量化数值。具有1的量化器程度将被映射至具有10的反向量化数值。模拟的,例如具有2的量化器程度将被映像至具有20的反向量化数值。因此,再量化便受到利用参考数字31所指示的反向量化函数所控制。应该注意的是,对于直向前反向量化器而言,只有线段30与线段31的交叉点是可能的。此意谓对于具有图8反向量化器规则的直向前反向量化器而言,仅能借助再量化获得0、10、20、30的数值。
这与所述强化反向量化器10e不同,因为所述强化反向量化器接收介于0与1或是1与2之间,像是0.5的数值作为输入。利用所述运用器10f所获得数值0.5的在前再量化,将造成一种数值为5的反向量化输出,换言之在一后处理重建参数中的数值,其与利用根据所述量化规则进行再量化所获得的数值不同。虽然所述正常量化规则仅准许0或10的数值,根据所述反向量化器函数31所工作的本发明反向量化器,造成一种不同的数值,换言之,如在图8中所指明的数值5。
然而,所述直向前反向量化器仅将正整数量化器程度映射至量化程度,而所述强化反向量化器接收非正整数量化器”程度”,以将这些数值映射至利用所述反向量化器规则所决定数值之间的“反向量化数值”。
第9图显示本发明后处理对于图5实施例的影响。图9a显示介于0至3之间变化的量化重建参数序列。图9b显示后处理重建参数序列,当将所述图9a中的波形输入至一低通过(平滑化)滤波器时,其也称做为”修正量化器指标”。在此应该注意的是,在图9b实施例中,于时刻1、4、6、8、9与10处的增加/减少降低。应该注意强调的是,介于时刻8与时刻9之间的峰值,其可能是一种由完整量化步骤所降低的人为干扰。然而,这种极端值的降低可以利用根据以上描绘量化音调数值进行某些程度的后处理所控制。
在本发明后处理中,本发明的优点为将扰动平滑化或将短极端数值平滑化。此状况特别在来自数个具有相似能量输入信道的信号部分,于一信号频带,换言之基频或输入信号信道中迭加的情况时产生。接着此频带根据该情况于每一时间部分以高度扰动的方式混合至所述特别输出信道之中。然而,从心理听觉的观点而言,较佳的是将这些扰动平滑化,因为这些扰动大体上并不贡献一来源的位置侦测,但对于主观听觉感受具有负面影响。
根据本发明一较佳实施例,可以降低或甚至消除这种可听见的人为干扰,而不在所述系统中其它位置处造成任何质量损失,也不需要所述传输重建参数的较高分辨率/量化(而因此,较高的数据传输率)。本发明借助执行一种参数信号调适修正(平滑化)达成此目的,而大体上并不影响重要的空间局部侦测线索。
在所述重建输出信号特性中突然产生的改变,将造成一种可听见的人为干扰,特别是对于具有高固定定常性特性的音频信号而言。这是一种具有音调信号的情况。因此,重要的是提供一种介于用于这种信号量化重建参数之间的”较平滑”转换。这可以利用例如平滑、内插等等方式所获得。
此外,对于其它的音频信号形式而言,这种参数数值修正也可能引入一种可听见的扭曲。这发生在信号包含快速扰动特性的情况之中。这种特性可以在瞬变部分或打击敲击乐器中发现。在此情况中,本发明也可以为了参数平滑化失效做准备。
这是利用于信号调适方式进行传输量化重建参数后处理而获得。
所述调适可以是线性或非线性。当所述调适为非线性时,可以执行如在图3中描述的阈值步骤。
用于控制所述调适的另一种条件为决定一信号特性的定常性。一信号特性定常性的特定形式决定,是估计所述信号包络或特别是估计所述信号的音调。在此应该注意的是,所述音调可以对于完整频率范围所决定,或较佳的是对于一音频信号不同频带分别决定。
本发明可减少或甚至完全消除到目前为止为不可避免的人为干扰,而对于传输所述参数数值而言不造成任何要求数据传输率的增加。
如同以上对于第2与图3所描绘,当所述考虑信号部分具有一音调特性时,本发明较佳实施例进行一种信道之间程度差异的平滑化。在一编码器中所计算并在一编码器中所量化的信道之间程度差异,则被传送至一译码器以进行信号调适平滑操作。所述调适成分是一种与阈值决定所连接的音调决定,其为了音调频谱成分的信道之间程度差异滤波处理所启动,而为了类似噪音与瞬变频谱成分的处理而关闭。在此实施例中,执行调适平滑算法并不需要一编码器的额外侧信息。
在此应该注意的是,本发明后处理也可以为了其它多信道信号的参数编码概念所使用,像是参数立体声MP3/高等音频码(AAC)、MP3环绕及其它类似的方法。

Claims (26)

1.一种多信道合成器,用于从一输入信号产生一输出信号,所述输入信号具有至少一输入信道以及一量化重建参数序列,所述量化重建参数是根据一量化规则而加以量化,并与所述输入信道的随后时间部分有关,所述输出信号具有多个合成输出信道,而所述合成输出信道的数量大于1或大于所述输入信道的数量,所述多信道合成器包括:
一后处理器(10),用于针对欲处理的输入信号的时间部分,决定一后处理重建参数或得自所述重建参数的一后处理量,其中所述后处理器(10)是操作以决定所述后处理重建参数或所述后处理量,由此,所述后处理重建参数或所述后处理量的数值与使用根据所述量化规则的量化所获得的数值不同;以及
一多信道重建器(12),用于利用所述输入信道的时间部分以及所述后处理重建参数或所述后处理量而重建所述多个合成输出信道的时间部分。
2.如权利要求1所述的多信道合成器,其特征在于还包括:
一输入信号分析器(16),用于分析所述输入信号,以决定欲处理的输入信号的时间部分的信号特性;以及
其中所述后处理器(10)是操作以决定与所述信号特性有关的后处理重建参数。
3.如权利要求2所述的多信道合成器,其特征在于当为了所述输入信号时间部分而利用所述输入信号分析器(16)决定一预定信号特性时,所述后处理器(10)是操作以决定所述后处理重建参数,而当所述输入信号分析器(16)并不决定所述预定信号特性时,便绕过所述后处理器(10)。
4.如权利要求3所述的多信道合成器,其特征在于当一信号特性数值落于一阈值的特定关系中时,所述输入信号分析器(16)是操作以决定所述信号特性为所述预定信号特性。
5.如权利要求2,3或4所述的多信道合成器,其特征在于所述信号特性是欲处理的输入信号的部分的一音调特性或一瞬变特性。
6.如权利要求1至5中任一项所述的多信道合成器,其特征在于所述后处理器(10)是操作以执行一种平滑功能,使得一后处理重建参数序列相较于一未后处理反向量化重建参数序列,在时间中较平滑。
7.如权利要求1至6中任一项所述的多信道合成器,其特征在于所述后处理器(10)是操作以执行一种平滑功能,且其中所述后处理器(10)包含一种具有低通过特性的数字滤波器,所述滤波器接收与所述输入信号的在前时间部分有关的至少一重建参数作为输入。
8.如权利要求1至7中任一项所述的多信道合成器,其特征在于所述后处理器(10)是操作以使用与至少一在前时间部分有关的重建参数,或是使用与至少一随后时间部分有关的重建参数,来执行一种内插功能。
9.如权利要求1至8中任一项所述的多信道合成器,其特征在于所述后处理器(10)是操作以决定一运用重建参数,其不与所述量化规则定义的任何量化程度相符;以及使用一反向量化器来反向量化所述运用重建参数,所述反向量化器是操作以将运用重建参数映射为一反向量化运用重建参数,所述运用重建参数不与由所述反向量化器所映射的任何量化规则所定义的反向量化数值相符。
10.如权利要求9所述的多信道合成器,其特征在于所述量化规则是一种对数量化规则。
11.如权利要求1至10中任一项所述的多信道合成器,其特征在于所述后处理器(10)是操作以根据所述量化规则来反向量化所述量化重建规则,运用所获得的反向量化重建参数;以及根据一非线性或线性函数来映像所运用的参数。
12.如权利要求1至11中任一项所述的多信道合成器,其特征在于所述后处理器(10)是操作以根据所述量化规则来反向量化所述量化重建规则,根据一非线性或线性函数来映像所获得的反向量化参数;以及运用所获得的映射重建参数。
13.如权利要求1至12中任一项所述的多信道合成器,其特征在于所述后处理器(10)是根据所述量化规则而对与所述输入信号随后时间部分相关的一反向量化重建规则进行操作;以及其中所述后处理器(10)还操作以根据所述输入信号的至少一在前时间部分的至少一反向量化重建参数而决定一后处理重建参数。
14.如权利要求1至13中任一项所述的多信道合成器,其特征在于所述输入信号的时间部分与所述输入信号的不同频带的多个量化重建参数有关;以及其中所述后处理器(10)是操作以决定所述输入信号的不同频带的后处理重建参数。
15.如权利要求1至14中任一项所述的多信道合成器,其特征在于所述输入信号是一种经由组合一多信道音频信号的至少两个原始信道所获得的加总频谱;以及其中所述量化重建参数是一信道间程度差异参数、一信道间时间差异参数、一信道间相位差异参数或是一信道间相关性参数。
16.如权利要求2至15中任一项所述的多信道合成器,其特征在于所述输入信道分析器(16)是操作以量化决定一度数,其指示所述输入信号具有多少信号特性;以及其中所述后处理器(10)是操作以与所述度数有关的强度来执行后处理。
17.如权利要求1至16中任一项所述的多信道合成器,其特征在于当决定欲处理的时间部分的后处理重建参数时,所述后处理器(10)是操作以使用与欲处理的时间部分有关的量化重建参数。
18.如权利要求1至17中任一项所述的多信道合成器,其特征在于所述量化规则为在两个邻近的量化程度之间的差异大于进行数值计算的处理器所精确决定的两个数值之间的差异。
19.如权利要求1至18中任一项所述的多信道合成器,其特征在于所述量化重建参数被熵编码,并与具有一熵编码形式的时间部分有关;以及其中所述后处理器(10)是操作以对用于决定所述后处理重建参数的经熵编码的量化重建参数进行熵译码。
20.如权利要求7所述的多信道合成器,其特征在于所述数字滤波器(10a)是一无限脉冲响应滤波器。
21.如权利要求1至20中任一项所述的多信道合成器,其特征在于所述后处理器(10)是操作以执行一后处理规则,使得在随后时间部分的后处理重建参数之间的差异小于未后处理重建参数之间的差异,所述未后处理重建参数是得自再量化与随后时间部分相关的量化重建参数。
22.如权利要求1至21中任一项所述的多信道合成器,其特征在于后处理量是得自只使用一映像函数的量化重建参数,所述映像函数是根据一映像规则而将一输入数值独一映射为一输出数值,以获得一未后处理量,且其中所述后处理器是操作以对未后处理量进行后处理,以获得所述后处理量。
23.如权利要求1至22中任一项所述的多信道合成器,其特征在于所述量化重建参数是一差异参数,其指示在与两输入信道相关的绝对量之间的参数差异,且其中所述后处理量是一种绝对数值,其用于重建与所述输入信道之一对应的输出信道。
24.如权利要求1至23中任一项所述的多信道合成器,其特征在于所述量化重建参数是一信道间程度差异,且其中所述后处理量指示一输出信道的绝对程度;或是
其中所述量化重建参数是一种信道之间时间差异,且其中所述后处理量指示一输出信道的绝对时间参考;或是
其中所述量化重建参数是一信道间调和测量,且其中所述后处理量指示一输出信道的绝对调和程度;或是
其中所述量化重建参数是一信道间相位差异,且其中所述后处理量指示一输出信道的绝对相位数值。
25.一种从一输入信号产生一输出信号的方法,所述输入信号具有至少一输入信道以及一量化重建参数序列,所述量化重建参数是根据一量化规则而加以量化,并与所述输入信道的随后时间部分有关,所述输出信号具有多个合成输出信道,而所述合成输出信道的数量大于1或大于所述输入信道的数量,所述方法包括:
决定一后处理重建参数或一后处理量,所述后处理量得自欲处理的输入信号的时间部分的后处理重建参数,由此,所述后处理重建参数的数值或所述后处理量与使用根据所述量化规则而量化所获得的数值不同;以及
利用所述输入信道的时间部分以及所述后处理重建参数或所述后处理量,重建所述多个合成输出信道的时间部分。
26.一种计算机程序,其具有当在一计算机上执行时,执行如权利要求25项所述的方法的程序代码。
CN2005800152836A 2004-06-30 2005-06-13 多信道合成器及产生多信道输出信号方法 Active CN1954642B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/883,538 2004-06-30
US10/883,538 US8843378B2 (en) 2004-06-30 2004-06-30 Multi-channel synthesizer and method for generating a multi-channel output signal
PCT/EP2005/006315 WO2006002748A1 (en) 2004-06-30 2005-06-13 Multi-channel synthesizer and method for generating a multi-channel output signal

Publications (2)

Publication Number Publication Date
CN1954642A true CN1954642A (zh) 2007-04-25
CN1954642B CN1954642B (zh) 2010-05-12

Family

ID=34971777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800152836A Active CN1954642B (zh) 2004-06-30 2005-06-13 多信道合成器及产生多信道输出信号方法

Country Status (18)

Country Link
US (1) US8843378B2 (zh)
EP (1) EP1649723B1 (zh)
JP (1) JP4712799B2 (zh)
KR (1) KR100913987B1 (zh)
CN (1) CN1954642B (zh)
AT (1) ATE394901T1 (zh)
AU (1) AU2005259618B2 (zh)
BR (1) BRPI0511362B1 (zh)
CA (1) CA2569666C (zh)
DE (1) DE602005006495D1 (zh)
ES (1) ES2307188T3 (zh)
HK (1) HK1090504A1 (zh)
IL (1) IL178670A (zh)
MX (1) MXPA06014968A (zh)
NO (1) NO338980B1 (zh)
PT (1) PT1649723E (zh)
RU (1) RU2345506C2 (zh)
WO (1) WO2006002748A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102138342A (zh) * 2008-08-13 2011-07-27 弗朗霍夫应用科学研究促进协会 用于合并空间音频流的设备
CN103460283A (zh) * 2012-04-05 2013-12-18 华为技术有限公司 确定多信道音频信号的编码参数的方法及多信道音频编码器
WO2018028170A1 (zh) * 2016-08-10 2018-02-15 华为技术有限公司 多声道信号的编码方法和编码器
CN109247069A (zh) * 2016-03-18 2019-01-18 弗劳恩霍夫应用研究促进协会 通过使用音频频谱图上的结构张量来重构相位信息的编码

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4612787B2 (ja) * 2003-03-07 2011-01-12 キヤノン株式会社 画像データの暗号化装置の制御方法及び画像データ変換装置の制御方法、及び、それらの装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US8150042B2 (en) * 2004-07-14 2012-04-03 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
ES2623551T3 (es) * 2005-03-25 2017-07-11 Iii Holdings 12, Llc Dispositivo de codificación de sonido y procedimiento de codificación de sonido
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
JP2009518659A (ja) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
US8208641B2 (en) * 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
WO2007089129A1 (en) * 2006-02-03 2007-08-09 Electronics And Telecommunications Research Institute Apparatus and method for visualization of multichannel audio signals
US8285556B2 (en) * 2006-02-07 2012-10-09 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP1870880B1 (en) * 2006-06-19 2010-04-07 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
DE102006030276A1 (de) 2006-06-30 2008-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines gefilterten Aktivitätsmusters, Quellentrenner, Verfahren zum Erzeugen eines bereinigten Audiosignals und Computerprogramm
KR100763919B1 (ko) * 2006-08-03 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
JP4769673B2 (ja) * 2006-09-20 2011-09-07 富士通株式会社 オーディオ信号補間方法及びオーディオ信号補間装置
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
EP2092516A4 (en) 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
CN101632117A (zh) 2006-12-07 2010-01-20 Lg电子株式会社 用于解码音频信号的方法和装置
EP2122613B1 (en) 2006-12-07 2019-01-30 LG Electronics Inc. A method and an apparatus for processing an audio signal
JP2010518460A (ja) * 2007-02-13 2010-05-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
JP5336522B2 (ja) 2008-03-10 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法
WO2010016270A1 (ja) * 2008-08-08 2010-02-11 パナソニック株式会社 量子化装置、符号化装置、量子化方法及び符号化方法
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
BR112012007138B1 (pt) 2009-09-29 2021-11-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
CN102648495B (zh) 2009-10-21 2014-05-28 杜比Ab国际公司 用于利用适应性过取样产生高频音频信号的装置及方法
CA2781310C (en) * 2009-11-20 2015-12-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
CN102884570B (zh) 2010-04-09 2015-06-17 杜比国际公司 基于mdct的复数预测立体声编码
EP2464146A1 (en) * 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a pre-calculated reference curve
US9424852B2 (en) * 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
CN103718466B (zh) 2011-08-04 2016-08-17 杜比国际公司 通过使用参量立体声改善fm立体声无线电接收器
JP5977434B2 (ja) * 2012-04-05 2016-08-24 ホアウェイ・テクノロジーズ・カンパニー・リミテッド パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器
EP2862166B1 (en) * 2012-06-14 2018-03-07 Dolby International AB Error concealment strategy in a decoding system
US9319790B2 (en) * 2012-12-26 2016-04-19 Dts Llc Systems and methods of frequency response correction for consumer electronic devices
CN103533123B (zh) * 2013-09-23 2018-04-06 陕西烽火电子股份有限公司 一种飞机用多接收通道通话静噪方法
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
EP3424048A1 (en) * 2016-03-03 2019-01-09 Nokia Technologies OY Audio signal encoder, audio signal decoder, method for encoding and method for decoding
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5675701A (en) 1995-04-28 1997-10-07 Lucent Technologies Inc. Speech coding parameter smoothing method
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
JP3266178B2 (ja) * 1996-12-18 2002-03-18 日本電気株式会社 音声符号化装置
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP4008607B2 (ja) * 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
JP3558031B2 (ja) * 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030220801A1 (en) * 2002-05-22 2003-11-27 Spurrier Thomas E. Audio compression method and apparatus
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4431568B2 (ja) * 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
KR20050116828A (ko) * 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102138342A (zh) * 2008-08-13 2011-07-27 弗朗霍夫应用科学研究促进协会 用于合并空间音频流的设备
CN102138342B (zh) * 2008-08-13 2014-03-12 弗朗霍夫应用科学研究促进协会 用于合并空间音频流的设备
US8712059B2 (en) 2008-08-13 2014-04-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for merging spatial audio streams
CN103460283A (zh) * 2012-04-05 2013-12-18 华为技术有限公司 确定多信道音频信号的编码参数的方法及多信道音频编码器
CN103460283B (zh) * 2012-04-05 2015-04-29 华为技术有限公司 确定多信道音频信号的编码参数的方法及多信道音频编码器
US9449604B2 (en) 2012-04-05 2016-09-20 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
CN109247069A (zh) * 2016-03-18 2019-01-18 弗劳恩霍夫应用研究促进协会 通过使用音频频谱图上的结构张量来重构相位信息的编码
CN109247069B (zh) * 2016-03-18 2021-12-21 弗劳恩霍夫应用研究促进协会 通过使用音频频谱图上的结构张量来重构相位信息的编码
WO2018028170A1 (zh) * 2016-08-10 2018-02-15 华为技术有限公司 多声道信号的编码方法和编码器
US11133014B2 (en) 2016-08-10 2021-09-28 Huawei Technologies Co., Ltd. Multi-channel signal encoding method and encoder
US11935548B2 (en) 2016-08-10 2024-03-19 Huawei Technologies Co., Ltd. Multi-channel signal encoding method and encoder

Also Published As

Publication number Publication date
MXPA06014968A (es) 2007-02-08
RU2345506C2 (ru) 2009-01-27
EP1649723A1 (en) 2006-04-26
AU2005259618B2 (en) 2008-05-22
CA2569666A1 (en) 2006-01-12
IL178670A (en) 2011-10-31
RU2007103341A (ru) 2008-08-10
KR20070028481A (ko) 2007-03-12
KR100913987B1 (ko) 2009-08-25
JP4712799B2 (ja) 2011-06-29
AU2005259618A1 (en) 2006-01-12
WO2006002748A1 (en) 2006-01-12
CA2569666C (en) 2013-07-16
NO20070560L (no) 2007-03-30
ATE394901T1 (de) 2008-05-15
BRPI0511362A (pt) 2007-12-04
BRPI0511362B1 (pt) 2018-12-26
EP1649723B1 (en) 2008-05-07
JP2008504578A (ja) 2008-02-14
US8843378B2 (en) 2014-09-23
DE602005006495D1 (de) 2008-06-19
HK1090504A1 (en) 2006-12-22
ES2307188T3 (es) 2008-11-16
IL178670A0 (en) 2007-02-11
US20060004583A1 (en) 2006-01-05
PT1649723E (pt) 2008-07-28
NO338980B1 (no) 2016-11-07
CN1954642B (zh) 2010-05-12

Similar Documents

Publication Publication Date Title
CN1954642B (zh) 多信道合成器及产生多信道输出信号方法
CN101816040B (zh) 生成多声道合成器控制信号的设备和方法及多声道合成的设备和方法
RU2711513C1 (ru) Устройство и способ оценивания межканальной разницы во времени
CN1910655B (zh) 构造多通道输出信号或生成下混信号的设备和方法
CN106105269B (zh) 音频信号处理方法和设备
AU2010249173B2 (en) Complex-transform channel coding with extended-band frequency coding
KR101707125B1 (ko) 효율적인 다운믹싱을 이용하는 오디오 디코더 및 디코딩 방법
US7953604B2 (en) Shape and scale parameters for extended-band frequency coding
CN105247613A (zh) 音频处理系统
US20090240505A1 (en) Audio decoding
US6466912B1 (en) Perceptual coding of audio signals employing envelope uncertainty
CN1918629B (zh) 音频编码中的短窗分组方法
KR20230135665A (ko) 공간 오디오 파라미터 인코딩 및 관련 디코딩 결정
MX2008009186A (en) Complex-transform channel coding with extended-band frequency coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant