CN102089807A - 音频编码和解码中相位信息的有效利用 - Google Patents

音频编码和解码中相位信息的有效利用 Download PDF

Info

Publication number
CN102089807A
CN102089807A CN2009801270927A CN200980127092A CN102089807A CN 102089807 A CN102089807 A CN 102089807A CN 2009801270927 A CN2009801270927 A CN 2009801270927A CN 200980127092 A CN200980127092 A CN 200980127092A CN 102089807 A CN102089807 A CN 102089807A
Authority
CN
China
Prior art keywords
signal
phase
information
parameter
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801270927A
Other languages
English (en)
Other versions
CN102089807B (zh
Inventor
约翰内斯·希勒佩特
伯恩哈特·格里尔
马蒂亚斯·诺伊辛格
朱利恩·罗比利亚德
玛利亚·路易斯-瓦莱罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN102089807A publication Critical patent/CN102089807A/zh
Application granted granted Critical
Publication of CN102089807B publication Critical patent/CN102089807B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

当附加地考虑指示输入音频信号的至少第一或第二不同特征的信号特征信息时,可以使用指示第一和第二输入音频信号间的相关性的相关性信息,来导出第一和第二输入音频信号的有效编码表示。当输入音频信号具有第一特征时,导出指示第一和第二输入音频信号间的相位关系的相位信息。当输入音频信号具有第一特征时,将相位信息和相关性度量包括到该编码表示中;而当输入音频信号具有第二特征时,仅将相关性信息包括在该编码表示中。

Description

音频编码和解码中相位信息的有效利用
技术领域
本发明涉及音频编码和音频解码,更具体地说,涉及一种当相位信息的重建是感知相关时选择性地提取和/或传输相位信息的编码和解码方案。
背景技术
例如双耳线索编码(BCC)、参数立体声(PS)或MPEG环绕(MPS)的最近的参数多信道编码方案使用人类听觉系统的针对空间感知的线索的紧凑参数表示。这允许了具有两个或多个音频信道的音频信号的速率有效表示。为此,编码器进行从M个输入信道至N个输出信道的降混,且将所提取的线索连同该降混信号一起传输。此外,根据人类感知的原理对这些线索进行量化,即,人类听觉系统无法听到或无法区别的信息可被删除或粗略量化。
当降混信号为“一般性”音频信号时,这种原始音频信号的编码表示所消耗的带宽可以通过使用单信道音频压缩器对降混信号或降混信号的信道进行压缩而进一步减少。在下文中,将各种类型的这些单信道音频压缩器概括为核心编码器。
用于描述两个或多个音频信道间的空间相互关系的典型线索是将输入信道间的电平关系进行参数化的信道间电平差(ILD)、将输入信道间的统计相依性进行参数化的信道间互相关性/相干性(ICC),以及将输入信道的类似信号段间的时间或相位差进行参数化的信道间时间/相位差(ITD或IPD)。
为了维持由降混与先前描述的线索所表示的信号的高感知质量,通常是针对不同频带计算个别线索。也就是,针对该信号的给定时段,传输将相同属性进行参数化的多个线索,每个线索-参数表示信号的预定频带。
可以在时间和频率上依赖于接近于人类的频率分辨率的标尺来计算这些线索。无论何时当表示多信道音频信号时,相应的解码器基于传输的空间线索和降混传输的信号(因此所传输的降混常被称为载波信号)进行从M信道至N信道的升混。
通常,得到的升混信道可描述为传输的降混的电平和相位加权版本。如传输的相关性参数(ICC)所指示的,通过对传输的降混信号(“干”信号)和从该降混信号导出的去相关信号(“湿”信号)进行混合与加权,可以合成在编码信号的同时导出的去相关性。这样,升混信道与原始信道相比具有彼此类似的相关性。通过将该降混馈送至滤波器链例如全通滤波器和延迟线,可产生去相关信号(即,当与传输的信号互相关时具有接近于零的互相关性系数的信号)。然而,可以使用其它导出去相关信号的方式。
显然,在前述编码/解码方案的特定实现中,必须进行编码信号的传输比特率(理想的是尽可能地低)与可实现的质量(理想的是尽可能地高)间的折衷。
因此,可以决定不传输空间线索的完整集合,而忽略一个特定参数的传输。附加地,此决定可能受到选择适当的升混的影响。例如,适当的升混可平均地再现未传输的空间线索。也就是,至少针对完整带宽信号的长期分段,保留平均空间属性。
特别地,并非所有参数多信道方案都使用信道间时间差或信道间相位差,从而避免相应的计算或合成。例如MPEG环绕等方案仅依赖于ILD和ICC的合成。通过去相关性合成隐性地对信道间相位差进行近似,该去相关性合成将两种去相关信号的表示与所传输的降混信号进行混合,其中两种表示具有180度的相对相移。忽略IPD的传输,从而减少参数信息的需要量,同时接受再现质量的恶化。
因此,需要提供更佳的信号重建质量而不明显增加所需的比特率。
发明内容
本发明的一个实施例通过使用相位估计器来实现上述目的,当输入音频信号之间的相移超过预定阈值时,该相位估计器导出指示第一和第二输入音频信号间的相位关系的相位信息。当从感知观点来看,需要传输相位信息时,用于将空间参数和降混信号包括到输入音频信号的编码表示中的关联输出接口将仅包括导出的相位信息。
为此,可连续进行相位信息的确定,且可以基于阈值仅进行是否要包括该相位信息的判定。例如,该阈值可描述针对其不需要附加相位信息处理来实现重建后的信号的可接受质量的最大容许相移。
可选地,输入音频信号间的相移可以与相位信息的实际产生无关地导出,这样,仅当超过相位阈值时才进行导出相位信息的正式相位分析。
可选地,可以实现空间输出模式判决器,其接收连续产生的相位信息,并且仅当满足相位信息条件时,即,例如,当输入信号间的相位差超过预定阈值时,该判决器才操控输出接口以包括相位信息。
也就是说,输出接口主要将ICC参数和ILD参数以及降混信号仅包括到输入音频信号的编码表示中。当出现具有特定信号特征的信号时,附加地包括所确定的相位信息,从而可以较高质量地重建使用编码表示重建的信号。但是,这可以仅以最小量附加传输信息来实现,因为确实仅针对关键的那些信号部分传输相位信息。
这一方面允许高质量重建,而另一方面允许低比特率实现。
本发明的另一实施例对该信号进行分析来导出信号特征信息,该信号特征信息用于在具有不同信号类型或特征的输入音频信号之间进行区分。例如,这可以是不同特征的语音信号和音乐信号。当输入音频信号具有第一特征时,仅需要相位估计器;而当输入音频信号具有第二特征时,相位估计可以作废。因此,当编码其中需要相位合成的信号以提供重建后信号的可接受质量时,输出接口仅包括该相位信息。
其它空间线索例如相关性信息(例如ICC参数)被持久地包括在编码表示中,因为其存在对信号类型或信号特征这两者可能均较为重要。对于信道间电平差也一样如此,该信道间电平差主要是描述两个重建的信道间的能量关系。
在另一实施例中,可基于其它空间线索,诸如基于第一和第二输入音频信号间的相关性ICC,来进行相位估计。当存在包括信号特征上的一些附加限制的特征信息时,这是可行的。于是,除了统计信息之外,也可使用ICC参数来提取相位信息。
根据另一个实施例,可极其比特有效地包括相位信息,因为仅实现一个相位切换,对具有预定大小的相移的应用信号通知。虽然如此,如下文中所详细描述的,在再现中粗略重建相位关系可能对某些信号类型就足够了。在另外的实施例中,能够以高得多的分辨率(例如10个或20个的不同相移)来对相位信息进行信号通知,或者甚至作为用于给定-180度至+180度的可能的相对相位角的连续参数来进行信号通知。
当信号特征已知时,可仅对少数频带传输相位信息,该频带数目可能远小于用于导出ICC参数和/或ILD参数的频带数目。例如,当已知音频输入信号具有语音特征时,对于整个带宽仅需要一个单个相位信息。在另一附加实施例中,可以针对例如100Hz至5kHz间的频率范围导出单个相位信息,因为假设扬声器的信号能量主要分布于此频率范围内。例如,当相移超过90度或超过60度时,针对全部带宽的公共相位信息参数是可行的。
此外,当信号特征已知时,通过将阈值标准应用到所述参数,可以从已存在的ICC参数或相关性参数直接导出相位信息。例如当ICC参数小于-0.1时,可以断定此相关性参数与固定的相移相对应,因为输入音频信号的语音特征限制了其它参数,在下文中将详细描述的。
在本发明的另一实施例中,当将该相位信息包括到比特流中时,还对从信号导出的ICC参数(相关性参数)进行修改或后处理。这利用了下述事实:ICC(相关性)参数实际上可以包括与两个特征有关的信息,即,与输入音频信号间的统计相依性有关的信息、以及与这些信号间的相移有关的信息。因此,当传输附加相位信息时,对相关性参数进行修改,使得在重建信号时,尽可能最佳地分离地考虑相位和相关性。
在完全后向兼容的情境下,也可以通过本发明解码器的实施例来进行这样的相关性修改。当解码器接收附加相位信息时可激活相关性修改。
为了实现这种感知上优异的重建,本发明的音频编码器的实施例可包括附加信号处理器,该附加信号处理器对由音频解码器的内部升混器所产生的中间信号进行操作。例如,升混器会接收降混信号和除了相位信息(ICC和ILD)以外的全部空间线索。升混器导出具有如空间线索所描述的信号属性的第一和第二中间音频信号。为此,可以预见附加混响(去相关)信号的产生,以便对去相关信号部分(湿信号)和传输的降混信道(干信号)进行混合。
然而,当音频解码器接收到相位信息时,中间信号后处理器会将附加相移应用到中间信号的至少一个。即,仅当传输附加相位信息时,该中间信号后处理器才可操作。也就是,本发明的音频解码器的实施例与传统的音频解码器完全兼容。
在解码器的一些实施例中的处理以及在编码器侧的处理可以按照时间和频率选择性方式来进行。也就是,可以处理具有多个频带的一连串相邻时间片。因此音频编码器的一些实施例包括了信号组合器,以对所产生的中间音频信号和后处理的中间音频信号进行组合,使得该编码器输出时间连续的音频信号。
换句话说,针对第一帧(时段),信号组合器可以使用由升混器所导出的中间音频信号;而针对第二帧,信号组合器可以使用后处理的中间信号,因为该信号由中间信号后处理器导出。除了引入相移之外,当然也可以在该中间信号后处理器中实现更先进的信号处理。
可选地或附加地,音频解码器的实施例可以包括相关性信息处理器,诸如当附加地接收到相位信息时对所接收的相关性信息ICC进行后处理。然后,由传统升混器使用后处理的相关性信息来产生中间音频信号,使得结合由信号后处理器所引入的相移,可以实现音频信号的自然声音再现。
附图说明
在下文中将参考附图描述本发明的多个实施例,其中,
图1示出了用于从降混信号产生两个输出信号的升混器;
图2示出了由图1的升混器使用ICC参数的实例;
图3示出了要被编码的音频输入信号的信号特征的实例;
图4示出了音频编码器的实施例;
图5示出了音频编码器的另一实施例;
图6示出了由图4和图5的编码器中的一个所产生的音频信号的编码表示的实例;
图7示出了编码器的另一实施例;
图8示出了用于语音/音乐编码的编码器的另一实施例;
图9示出了解码器的实施例;
图10示出了解码器的另一实施例;
图11示出了解码器的另一实施例;
图12示出了语音/音乐解码器的实施例;
图13示出了一种编码方法的实施例;以及
图14示出了一种解码方法的实施例。
具体实施方式
图1示出了一种可以用于解码器的实施例中的升混器,使用降混信号6来产生第一中间音频信号2和第二中间音频信号4。此外,使用附加信道间相关性信息和信道间电平差信息作为控制升混的放大器的操控参数。
升混器包括去相关器10、三个具有相关性的关联的放大器12a至12c、第一混合节点14a、第二混合节点14b、以及第一和第二电平关联的放大器16a和16b。降混音频信号6是分配到去相关器10和分配到去相关的关联的放大器12a和12b的输入的单声信号(mono signal)。去相关器10使用该降混音频信号6,根据去相关性算法创建该信号的去相关版本。将去相关音频信道(去相关信号)输入到第三相关性关联的放大器12c中。可以注意到,仅包括降混音频信号的样本的升混器的信号分量经常也称作为“干”信号;而仅包括去相关信号的样本的信号分量常称作“湿”信号。
ICC关联放大器12a至12c根据取决于传输的ICC参数的缩放规则来缩放湿信号分量和干信号分量。基本上,在通过求和节点14a和14b对干和湿信号分量求和之前,调整这些信号的能量。为此,将相关性关联的放大器12a的输出提供至第一求和节点14a的第一输2;而将相关性关联的放大器12b的输出信号提供至求和节点14b的第一输入。将与湿信号关联的相关性关联的放大器12c的输出提供至第一求和节点14a的第二输入以及第二求和节点14b的第二输入。然而,如图1所示,求和节点处的湿信号的符号的不同在于:以负号的方式将其输入到第一求和节点14a,而将具有原始符号的湿信号输入到第二求和节点14b中。即,将去相关信号与具有其原始相位的第一干信号分量混合,而将其与具有反向相位(即,有180度相移)的第二干信号分量混合。
如已经解释的,依据相关性参数对能量比进行在先调整,使得从求和节点14a和14b输出的信号具有与原始编码信号的相关性(其由传输的ICC参数进行参数化)类似的相关性。最后,使用能量关联放大器16a和16b对第一信道2与第二信道4间的能量关系进行调整。能量关系由ILD参数进行参数化,使得两个放大器均由取决于ILD参数的函数来操控。
也就是,所产生的左信道2和右信道4具有与原始编码信号的统计相依性类似的统计相依性。
然而,对直接源自于传输的降混音频信号6的所产生的第一(左)和第二(右)输出信号2和4的贡献在于具有相同相位。
虽然图1假定了升混的宽带实现,但另一实现可对多个并行频带分别进行升混,使得图4的升混器可以对原始信号的带宽受限表示进行操作。于是,可通过在最终合成混合中添加所有带宽受限输出信号,来获得具有全频带的已重建信号。
图2示出了用于操控具有相关性的关联的放大器12a至12c的ICC参数相依函数的实例。使用该函数并从要被编码的原始信道适当导出ICC参数,可粗略(平均地)再现原始编码信号间的相移。针对此讨论,了解所传输的ICC参数的产生是必要的。本讨论的基础可以是从要被编码的两个输入音频信号的两个相应信号段之间所导出的复数信道间相干性参数,定义如下:
Figure BPA00001293634200061
上式中,指标l是所处理的信号段内部的样本数目,而可选指标k表示多个子带中的一个,根据一些特定实施例,可以由一个单一ICC参数表示。换句话说,X1和X2是两个信道的复数值子带样本,k是子带指标,而l是时间指标。
通过将原始取样的输入信号馈送到QMF滤波器组,可以导出复数值子带样本,例如导出64个子带,其中每个子带内部的样本以复数值的数来表示。通过使用前面的公式来计算复数互相关性,以一个复数值参数(即,参数ICC复数)使两个相应信号段特征化,该参数ICC复数具有下列性质:
其长度|ICC复数|表示两个信号的相干性。矢量越长,则两个信号间的统计相依性越高。
也就是说,无论何时当ICC复数的长度或绝对值等于1时,除了一个全局缩放因子之外,两个信号完全相同。但是可以具有相对相位差,相对相位差则由ICC复数的相位角产生。在此情况下,ICC复数相对于实轴的角度表示两个信号间的相位角。但是,当使用多于一个子带(即,k≥2)进行ICC复数的导出时,相位角因而是所有已处理的参数频带的平均角度。
换句话说,当两个信号是统计上强相依的(|ICC复数|≈1)时,实数部分Re{ICC复数}近似为相位角的余弦,并因而为信号间相位差的余弦。
当ICC复数的绝对值显著低于1时,不再将矢量ICC复数与实轴间的角度Θ解译为相同信号间的相位角。相反,其是统计上相当独立的信号间的最佳匹配相位。
图3给出了可能的矢量ICC复数的三个实例20a、20b和20c。矢量20a的绝对值(长度)接近于单位1,意味着矢量20a所表示的两个信号几乎相同,但彼此相移。换句话说,两个信号是高度相干的。在此情况下,相位角30(Θ)直接与几乎相同的信号之间的相移相对应。
然而,如果ICC复数的评估得到矢量20b,则相位角Θ的含义不再是明确确定的。因为复数矢量20b具有显著低于1的绝对值,两个已分析信号部分或信号在统计上是相当独立的。即,所观察的时段内的信号不具有共同形状。另外,相位角30有一些表示与两个信号的最佳匹配相对应的相移。但是,当这些信号是非相干的时,两个信号间的共同相移几乎不重要。
此外,矢量20c也有接近于单位1的绝对值,因而可以将其相位角32(Φ)再次无疑义地识别为两个类似信号间的相位差。此外,显而易见的是,大于90度的相移与矢量ICC 的实数部分相对应,该实数部分小于0。
在关注两个或更多已编码信号的统计相依性的正确构建的音频编码方案中,图1示出了从传输的降混信道创建第一和第二输出信道的可能升混进程。
作为控制具有相关性的关联的放大器20a-20c的ICC相依函数,经常使用图2所示的函数,以允许从完全相关信号到完全去相关信号的平滑过渡,而不会引入任何不连续。图2示出了如何在干信号分量(通过操控放大器12a和12b)与湿信号分量(通过操控放大器12c)之间分配信号能量。为了实现此目的,传输ICC复数的实数部分,作为针对ICC复数的长度的度量,并因而作为针对信号之间的相似性的度量。
在图2中,x轴给出了传输的ICC参数的值,y轴给出了由升混器的求和节点14a和14b混合在一起的干信号(实线30a)和湿信号(虚线30b)的能量的量。即,当信号极好地相关(相同的信号形状,相同的相位)时,传输的ICC参数将为单位1。因此,升混器将所接收的降混音频信号6分配至输出,而不添加任何湿信号部分。由于降混音频信号基本上是编码的原始信道的求和,因此,就相位和相关性而言该再现是正确的。
然而,如果信号反相关(相位=180度,相同的信号形状),则传输的ICC参数为-1。因此,重建后的信号将不包括干信号的信号部分,而仅包括湿信号的信号分量。由于将湿信号部分添加到第一音频信道,并从产生的第二音频信道扣除,信号之间的相移被正确重建为180度。但是,该信号根本不包括任何干信号部分。这是不利的,因为干信号实际上包括传输至解码器的整个直接信息。
因此,可以降低已重建信号的信号质量。然而,该降低取决于所编码的信号类型,即,取决于底层信号的信号特征。一般来说,由去相关器10所提供的相关信号具有类似混响的声音特征。也就是说,例如,与语音信号相比,仅使用去相关信号所导致的听觉失真对于音乐信号而言是相当低的,其中根据混响的音频信号的重建会导致不自然的声音。
概括地说,前述解码方案仅粗略对相位特性进行近似,因为至多对其进行平均地恢复。这是极为粗糙的近似,由于其仅通过改变添加的信号来实现,其中,所添加的信号部分具有180度的相对相位差。对于明确去相关的信号或者甚至是反相关的信号(ICC≤0),需要相当的量的去相关信号来恢复此去相关,即信号间的统计独立性。通常,由于作为全通滤波器输出的去相关信号具有”混响状”声音,极大降低了可达到的总体质量。
如已经提到的,针对一些信号类型,相位关系的恢复较不重要,但对其它信号类型,正确恢复可能是感知上相关的。尤其是,当从这些信号导出的相位信息满足某种感知上激励的相位重建标准时,可能需要原始相位关系的重建。
因此,当满足某种相位特性时,本发明的一些实施例确实将相位信息包括到音频信号的编码表示中。即当优势(在速率失真估计中)明显时,仅有时传输相位信息。此外,可以对传输的相位信息进行粗略量化,从而仅需要少量的附加比特率。
给定传输的相位信息,可以利用干信号分量之间、即从原始信号直接导出的信号分量(因而感知上高度相关)之间的正确相位关系来重建该信号。
例如,如果以ICC复数矢量20c来对信号进行编码,则传输的ICC参数(ICC复数的实数部分)近似为-0.4。也就是,在升混中,大于50%能量将从去相关信号导出。但是,因为可听见的能量的量仍源自于降混音频信道,因此由于可听见,源自于降混音频信道的信号分量间的相位关系仍然较为重要。即,更接近地对重建信号的干信号部分间的相位关系进行近似是可期望的。
因此,一旦确定原始音频信道间的相移大于预定阈值,则传输附加相位信息。根据特定实现,这样的阈值实例可以是60度、90度或120度。根据该阈值,可以以高分辨率来传输该相位关系,即,信号通知多个预定相移中的一个,或传输连续改变的相位角。
在本发明的一些实施例中,仅传输单一相移指示器或相位信息,用于指示重建信号的相位将以预定相位角偏移。根据一个实施例,仅当ICC参数在预定负值范围内时才应用此相移。根据相位阈值标准,此范围例如可为-1至-0.3或-0.8至-0.3。也就是说,可能需要一个单个比特的相位信息。
当ICC复数的实数部分为正时,由于干信号分量的相位相同处理,由图1的升混器正确地对已重建信号间的相位关系进行平均地近似。
然而,如果所传输的ICC参数低于0,则原始信号的相移平均大于90度。同时,由升混器使用干信号的仍然可听的信号部分。因此,在始于ICC=0至例如ICC近似为-0.6的区域中,固定相移(例如,对应于与前面引入的区间的中间相对应的相移)能够仅以一个单个传输比特的代价,来提供具有显著增加的感知质量的重建信号。例如,当ICC参数行进至更小数值例如低于-0.6时,仅第一和第二输出信道2和4中的少量信号能源自于干信号分量。因此可以再次跳过对这些感知上较不相关的信号部分间的正确相位特性的恢复,因为干信号部分几乎根本不可听。
图4示出了用于产生第一输入音频信号40a和第二输入音频信号40b的编码表示的本发明的编码器的一个实施例。音频编码器42包括空间参数估计器44、相位估计器46、输出操作模式判决器48和输出接口50。
将第一和第二输入音频信号40a和40b分配至空间参数估计器44和相位估计器46。空间参数估计器适于导出空间参数,指示两个信号相对于彼此的信号特征,诸如ICC参数和ILD参数。将估计的参数提供给输出接口50。
相位估计器46适于导出两个输入音频信号40a和40b的相位信息。这样的相位信息例如可以是两个信号间的相移。例如,可以通过直接进行两个输入音频信号40a和40b的相位分析来直接估计该相移。在另一可选实施例中,可以通过可选信号线52将由空间参数估计器44导出的ICC参数提供给相位估计器。相位估计器46然后可以使用任何方式导出的ICC参数进行相位差的确定。与利用两个音频输入信号的完整相位分析的实施例相比较,这可以得到较低复杂度的实现。
将导出的相位信息提供给输出操作模式判决器48,该判决器能够在第一输出模式与第二输出模式之间对输出接口50进行切换。将导出的相位信息提供给输出接口50,该输出接口50通过将产生的ICC、ILD或PI(相位信息)参数的特定子集包括在编码表示中,创建第一和第二输入音频信号40a和40b的编码表示。在第一操作模式中,输出接口50将ICC、ILD和相位信息PI包括在编码表示54中。在第二操作模式中,输出接口50仅将ICC和ILD参数包括在编码表示54中。
当相位信息指示大于预定阈值的第一和第二音频信号40a和40b间的相位差时,输出操作模式判决器48判定为第一输出模式。相位差例如可通过执行信号的完整相位分析来确定。例如,这可以通过相对于彼此偏移输入音频信号并通过计算针对各个信号偏移的互相关性来执行。具有最高值的互相关性与该相移相对应。
在可选实施例中,从ICC参数来估计相位信息。当ICC参数(ICC复数的实数部分)低于预定阈值时,认为有明显相位差。针对检测的可能相移可以例如为大于60度、90度或120度的相移。相反地,ICC参数的标准可以为0.3、0或-0.3的阈值。
引入到该表示中的相位信息可以是例如指示预定相移的单个比特。可选地,通过以更精细的量化来传输相移,直到相移的连续表示,传输的相位信息可以更为精准。
此外,音频编码器可对输入音频信号的带宽受限拷贝进行操作,使得图4的多个音频编码器43并联实现,各个音频编码器对原始宽带信号的带宽滤波版本进行操作。
图5示出了本发明的音频编码器的另一实施例,包括相关性估计器62、相位估计器46、信号特征估计器66和输出接口68。相位估计器46与图4中引入的相位估计器相对应。因此,省略对相位估计器的特性的进一步讨论以免不必要的重复。通常,具有相同或类似的功能的组件被赋予了相同的参考符号。将第一输入音频信号40a和第二输入音频信号40b分配至信号特征估计器66、相关性估计器62和相位估计器46。
信号特征估计器适于导出信号特征信息,其指示输入音频信号的第一或第二不同特征。例如,语音信号可被检测为第一特征,而音乐信号可被检测作为第二信号特征。附加信号特征信息可用来确定相位信息传输的需要,或者附加地,用来根据相位关系来解译相关性参数。
在一个实施例中,信号特征估计器66为信号分类器,用来导出信息,指示该音频信号即第一和第二输入音频信道40a和40b的当前提取为语音类的还是非语音的。依据导出的信号特征,可通过可选控制链路70来接通和断开相位估计器46的相位估计。可选地,可一直进行相位估计,同时通过可选第二控制链路72来操控输出接口,例如,当检测到输入音频信号的第一特征例如语音特征时,仅包括相位信息74。
相反,一直进行ICC确定,从而提供编码信号的升混所需的相关性参数。
可选地,音频编码器的另一实施例可以包括降混器76,其适于来导出降混音频信号78,可选地,可将该降混音频信号78包括到由音频编码器60所提供的编码表示54中。在可选实施例中,如对图4的实施例已经讨论的,相位信息可以基于相关性信息ICC的分析。为此,相关性估计器62的输出可以通过可选信号线52提供给相位估计器46。
当在语音信号和音乐信号间对信号进行区分时,根据以下考虑,这样的确定可以诸如基于ICC复数
当从信号特征信息66得知该信号为语音信号时,可根据以下考虑评估ICC复数
Figure BPA00001293634200111
当确定为语音信号时,可以作出以下结论:人类听觉信号所接收的信号是强相关的,这是由于语音信号的源为点状的。因此,ICC复数的绝对值接近于1。因此,根据下述公式,可以仅使用ICC复数的实数部分的信息来估计出图3的相位角Θ(IPD),而甚至无需评估复数矢量ICC复数
Re{ICC复数}=cos(IPD)
可以基于ICC复数的实数部分来获得相位信息,可以无需计算ICC复数的虚数部分就可以进行确定该ICC复数的实数部分。
简而言之,可以作出以下结论:
|ICC复数|≈1->Re{ICC复数}=cos(IPD)
在上式中,要注意的是,cos(IPD)与图3的cos(Θ)相对应。
更为一般地,在解码器端进行相位合成的必要性也可以根据下述考虑得出:
相干性(abs(ICC复数))显著大于0,相关性(Real(ICC复数))显著小于1,或相位角(arg(ICC复数))显著不同于0。
要注意的是,这些是一般标准,其中在存在语音的情况下,隐性地假定了abs(ICC复数)明显大于0。
图6给出了图5的编码器60导出的编码表示的实例。与时段80a和第一时段80b相对应,该编码表示仅包括相关性信息,其中对于第二时段80c,由输出接口68所产生的该编码表示包括相关性信息和相位信息PI。简而言之,由音频编码器所产生的编码表示的特征在于:其包括降混信号(为求简明并未示出),该降混信号是使用第一和第二原始输出信道产生的。该编码表示还包括第一相关性信息82a,用于指示第一时段80b内的第一和第二原始音频信道间的相关性。另外,所述表示还包括第二相关性信息82b,用于指示第二时段80c内的第一和第二音频信道间的去相关性;以及第一相位信息84,用于指示针对第二时段的第一和第二原始音频信道间的相位关系,其中对第一时段80b并未包括相位信息。要注意的是,为易于说明,图6仅示出了辅助信息而未示出也被传输的降混信道。
图7示意性地示出了本发明的另一实施例,其中音频编码器90还包括相关性信息修改器92。图7的图示假定已经进行了例如参数ICC和ILD的空间参数提取,从而将空间参数94连同音频信号96一起提供。音频编码器90还包括信号特征估计器66和相位估计器46,其操作如上所示。根据信号分类和/或相位分析的结果,根据由上部信号路径指示的第一操作模式来提取和递交相位参数。可选地,由信号分类和/或相位分析操控的开关98可以激活第二操作模式,其中对提供的空间参数94无需修改即进行传输。
然而,当选择需要传输相位信息的第一操作模式时,相关性信息修改器92从接收的ICC参数导出相关性度量,传输该度量来替代ICC参数。选择相关性度量,使得当确定第一和第二输入音频信号间的相对相移时,以及当音频信号被归类为语音信号时,相关性度量大于相关性信息。另外,由相位参数提取器100来提取并传输相位参数。
可选ICC调整或替代最初导出的ICC参数而被递交的相关性度量的确定可以具有更佳的感知质量的效果,原因在于其考虑下述事实:对于小于0的ICC,重建信号将仅包括少于50%的干信号,其实际上仅为从原始音频信号直接导出的信号。也就是说,虽然已经知道音频信号仅由于相移而有明显差异,但是重建提供了由去相关的信号(湿信号)支配的信号。当由相关性信息修改器增加ICC参数(ICC复数的实数部分)时,该升混将自动使用来自于干信号的更多信号能量,即,使用更多”真正”音频信息,从而使得当得出相位再现的必要性时,再现的信号更接近于原始信号。
换句话说,以解码器升混添加较少的去相关性信号的方式,对传输的ICC参数进行修改。ICC参数的一个可能修改在于:使用信道间相干性(ICC复数的绝对值),来替代通常用作ICC参数的信道间互相关性。信道间互相关性定义为:
ICC=Re{ICC复数},
并且,该信道间互相关性取决于这些信道的相位关系。然而,信道间相干性系与相位关系独立,定义如下:
ICC=|ICC复数|。
计算信道间相位差,并将其连同其余空间辅助信息一起传输至解码器。从图8的实施例中将显而易见的是,该表示在实际相位值的量化上是非常粗糙的,并且还可以具有粗糙的频率分辨率,其中甚至宽带相位信息可以是有用的。
从复数信道间关系可以导出相位差,如下:
IPD=arg(ICC复数)。
如果相位信息被包括在比特流中,即被包括到编码表示54中,解码器的去相关性合成可以使用已修改的ICC参数(相关性度量)来产生具有降低的混响的升混信号。
例如,如果信号分类器在语音信号与音乐信号间进行区分,一旦确定该信号的主要语音特征,则可根据下述规则来进行是否需要相位合成的判定。
首先,针对多个用来产生ICC和ILD参数的参数频带,可以导出宽带指示值或相移指示器。也就是说,例如,可以对语音信号主要存在的频率范围(例如100Hz至2KHz)进行评估。一个可能的评估将是基于已经导出的频带的ICC参数来计算此频率范围内的平均相关性。如果结果是此平均相关性小于预定阈值,则可认为该信号是异相的并触发相移。此外,依据相位重建的期望粒度,可以使用多个阈值来信号通知不同的相移。可能的阈值可以例如为0、-0.3或-0.5。
图8示出了本发明的另一个实施例,其中编码器150可操作用于编码语音信号和音乐信号。将第一和第二输入音频信号40a和40b提供给编码器150,该编码器150包括信号特征估计器66、相位估计器46、降混器152、音乐核心编码器154、语音核心编码器156和相关性信息修改器158。信号特征估计器66适于在作为第一信号特征的语音特征与作为第二信号特征的音乐特征之间进行区分。通过控制链路160,信号特征估计器66可操作用于依据导出的信号特征来操控输出接口68。
相位估计器或者直接根据输入音频信道40a和40b、或者根据由降混器152导出的ICC参数来估计相位信息。该降混器创建降混音频信道M(162)和相关性信息ICC(164)。根据前述实施例,可选地,相位估计器46可直接从提供的ICC参数164导出相位信息。可以将降混音频信道162提供给音乐核心编码器154、以及语音核心编码器156,这两者均连接到输出接口68以提供音频降混信道的编码表示。一方面,将相关性信息164直接提供给输出接口68。另一方面,将其提供给相关性信息修改器158的输入,该修改器158适于修改提供的相关性信息且将这样导出的相关性度量提供给输出接口68。
根据信号特征估计器66估计的信号特征,该输出接口将不同参数子集包括到该解码表示中。在第一(语音)操作模式中,输出接口68包括由语音核心编码器156编码的降混音频信道162的编码表示、以及从相位估计器46导出的相位信息PI和相关性度量。该相关性度量可以是由降混器152所导出的相关性参数ICC,或者可选地,是相关性信息修改器158修改的相关性度量。为此,相关性信息修改器158可由相位估计器46操控和/或激活。
在音乐操作模式中,输出接口包括如由音乐核心编码器154编码的降混音频信道162和由降混器152导出的相关性信息ICC。
不言而喻,如同上述的特定实施例,包括不同参数子集能够以不同方式来实现。例如,可以使音乐编码器和/或语音编码器去激活,直到激活信号根据由信号特征估计器66导出的信号特征将其切换到信号路径。
图9示出了根据本发明的解码器的实施例。音频解码器200适于从编码表示204中导出第一音频信道202a和第二音频信道202b,编码表示204包括降混音频信号206a、针对降混信号的第一时段的第一相关性信息208、以及针对降混信号的第二时段的第二相关性信息210,其中仅针对第一时段或第二时段包括相位信息212。
解复用器(未显示)对该编码表示204的各个分量进行解复用,并将第一和第二相关性信息连同降混音频信号206a一起提供给升混器220。升混器220可以是例如图1所述的升混器。然而,也可以使用有不同的内部升混算法的不同升混器。通常,升混器适于使用第一相关性信息208和降混音频信号206a导出针对第一时段的第一中间音频信号222a;以及使用第二相关性信息210和降混音频信号206a导出与第二时段相对应的第二中间音频信号222b。
换句话说,使用去相关性信息ICC1重建第一时段,而使用ICC2重建第二时段。将第一和第二中间信号222a和222b提供给中间信号后处理器224,该中间信号后处理器224适于使用相应的相位信息212来导出针对第一时段的后处理中间信号226。为此,中间信号后处理器224接收相位信息212、以及由升混器220产生的中间信号。当存在与特定音频信号相对应的相位信息时,该中间信号后处理器224适于将相移添加到中间音频信号的音频信道中的至少一个。
也就是说,中间信号后处理器224将相移添加到第一中间音频信号222a,其中中间信号后处理器224并未将任何相移添加到第二中间音频信号222b。中间信号后处理器224输出后处理中间信号226来替代第一中间音频信号,以及未变更的第二中间音频信号222b。
音频解码器200还包括信号组合器230,用于组合从中间信号后处理器224输出的信号,并因而导出由音频解码器200所产生的第一和第二音频信道202a和202b。
在一个特定实施例中,该信号组合器对从该中间信号后处理器输出的这些信号进行级联,以最终导出针对第一和第二时段的音频信号。在另一实施例中,信号组合器可以实现某种交叉衰落,例如,通过在从中间信号后处理器提供的信号间进行衰落来导出第一和第二音频信号202a和202b。当然,信号组合器230的其它实现也是可行的。
利用如图9所示的本发明解码器的实施例提供了添加附加相移的灵活性,因为附加相移可以由编码器信号进行信号通知或以反向兼容方式解码该信号。
图10示出了本发明的另一实施例,其中音频解码器包括去相关电路243,取决于传输的相位信息,该去相关电路243能够依据第一去相关规则和第二去相关规则进行操作。根据图10的实施例,可以对根据其从传输的降混音频信道240导出去相关信号242的去相关规则进行切换,其中该切换取决于现有相位信息。
在其中传输相位信息的第一模式中,使用第一去相关规则来导出去相关信号242。在其中未接收到相位信息的第二模式中,使用第二去相关规则,创建去相关信号,该信号比使用第一去相关规则创建的信号更为去相关。
换句话说,当需要相位合成时,可以导出去相关信号,该信号不如当不需要相位合成时所使用的信号那样高度去相关。即,解码器然后可以使用更类似于干信号的去相关信号,从而在升混中自动创建具有更多干信号分量的信号。这通过使去相关信号更类似于干信号来实现。
在另一实施例中,可以将可选相移器246应用到针对具有相位合成的重建而产生的去相关信号。通过提供已经具有相对于干信号的正确相位关系的去相关信号,这提供了重建信号的相位特性的更接近重建。
图11示出了本发明的音频解码器的另一实施例,包括分析滤波器组260和合成滤波器组262。解码器接收降混音频信号206、以及相关的ICC参数(ICC0...ICCn)。然而,在图11中,不同ICC参数不仅与不同时段相关联,同时也与音频信号的不同频带相关联。即,每个时段处理具有完整的关联ICC参数集合(ICC0...ICCn)。
由于该处理以频率选择方式执行,分析滤波器组260导出传输的降混音频信号206的64个子带表示。即,导出64个带宽受限信号(在滤波器组表示中),每个信号与一个ICC参数相关联。可选地,多个带宽受限信号可以共享公共ICC参数。各个子带表示由升混器264a、264b、...处理。各个升混器可以是例如根据图1的实施例的升混器。
因此,针对每个带宽受限表示,创建第一和第二音频信道(两者均带宽受限)。将每个子带这样创建的音频信道中的至少一个输入到中间音频信号后处理器266a、266b、...,例如,如图9所述的中间音频信号后处理器。根据图11的实施例,中间音频信号后处理器266a、266b、...由相同的公共相位信息212操控。即,在子带信号由合成滤波器组262合成以成为由解码器所输出的第一和第二音频信道202a和202b之前,将相同相移应用到每个子带信号。
可以这样进行相位合成,仅需要传输一个附加公共相位信息。在图11的实施例中,可以进行原始信号的相位特性的正确恢复,而无需比特率的适当增加。
根据另一实施例,针对其使用公共相位信息212的子带数目是信号相关的。因此,当应用相应的相移时,可以仅针对能够对其实现感观质量提高的子带来评估相位信息。这可进一步提高已解码信号的感知质量。
图12示出了音频解码器的另一实施例,该音频解码器适于解码原始音频信号的编码表示,所述信号可以是语音信号或音乐信号。即,或者在编码表示内传输信号特征信息,指示传输了哪种信号特征;或者可以根据比特流中的相位信息的存在,隐性地导出信号特征。为此,相位信息的存在可以指示音频信号的语音特征。根据信号特征,传输的降混音频信号206或者由语音解码器266解码或者由音乐解码器268解码。如图11所示出和阐明的,执行进一步处理。因此,对于进一步的实现细节,参考图11的解释。
图13示出了用于产生第一和第二输入音频信号的编码表示的本发明方法的实施例。在空间参数提取步骤300,从第一和第二输入音频信号导出ICC参数和ILD参数。在相位估计步骤302中,导出指示第一和第二输入音频信号间的相位关系的相位信息。在模式判定304中,当相位关系指示大于预定阈值的第一和第二输入音频信号间的相位差时,选择第一输出模式;而当该相位差小于该阈值时,选择第二输出模式。在表示产生步骤306,在第一输出模式中将ICC参数、ILD参数和相位信息包括在编码表示中;而在第二输出模式中仅将ICC参数和ILD参数包括在编码表示中而不包括相位关系。
图14示出了使用音频信号的编码表示产生第一和第二音频信道的方法的实施例,所述编码表示包括降混音频信号;用于指示用来产生降混信号的第一和第二原始音频信道间的相关性的第一和第二相关性信息,所述第一相关性信息具有针对降混信号的第一时段的信息,而所述第二相关性信息具有针对第二不同时段的信息;以及相位信息,所述相位信息用于指示针对第一时段的第一和第二原始音频信道间的相位关系。
在升混步骤400,使用降混信号和第一相关性信息导出第一中间音频信号,该第一中间音频信号与第一时段相对应且包括第一和第二音频信道。在升混步骤400,还使用降混音频信号和第二相关性信息导出第二中间音频信号,该第二中间音频信号与第二时段相对应且包括第一和第二音频信道。
在后处理步骤402,使用第一中间音频信号,针对第一时段导出后处理中间信号,其中将由相位关系指示的附加相移添加到第一中间音频信号的第一或第二音频信道中的至少一个。
在信号组合步骤404,使用后处理中间信号和第二中间音频信号,产生第一和第二音频信道。
根据本发明方法的特定实现要求,本发明方法能够以硬件或软件的方式来实现。可利用数字存储介质来进行实现(尤其是其上存储了电子可读控制信号的盘、DVD或CD),该数字存储介质与可编程计算机系统协作从而执行本发明方法。总的来说,本发明因而是具有存储在机器可读载体上的程序代码的计算机程序产品,所述程序代码可操作用于当计算机程序产品在计算机上运行时执行本发明方法。因此,换句话说,本发明方法是具有当计算机程序在计算机上运行时执行本发明方法中的至少一个的程序代码的计算机程序。
尽管在前面已经参考特定实施例具体示出并描述了本发明,但是本领域的技术人员将会理解,在不脱离本发明的精神和范围的情况下,可以在形式和细节上作出各种其它改变。要理解的是,在不脱离这里所述以及由所附权利要求包括的更广泛概念的情况下,可以在适配到不同实施例时作出各种改变。

Claims (25)

1.一种用于产生第一和第二输入音频信号的编码表示的音频编码器,包括:
相关性估计器,所述相关性估计器适于导出指示第一和第二输入音频信号之间的相关性的相关性信息;
信号特征估计器,所述信号特征估计器适于导出信号特征信息,所述信号特征信息指示所述输入音频信号的不同的第一或第二特征;
相位估计器,所述相位估计器适于当所述输入音频信号具有第一特征时导出相位信息,所述相位信息指示所述第一和第二输入音频信号之间的相位关系;以及
输出接口,所述输出接口适于:
当所述输入音频信号具有第一特征时将所述相位信息和相关性度量包括到所述编码表示中;或者
当所述输入音频信号具有第二特征时将所述相关性信息包括到所述编码表示中,其中当所述输入音频信号具有第二特征时不包括所述相位信息。
2.根据权利要求1所述的音频编码器,其中由所述信号估计器指示的所述第一信号特征是语音特征;以及
由所述信号估计器指示的所述第二信号特征是音乐特征。
3.根据权利要求1所述的音频编码器,其中所述相位估计器适于使用所述相关性信息来导出所述相位信息。
4.根据权利要求1所述的音频编码器,其中所述相位信息指示所述第一和第二输入音频信号之间的相移。
5.根据权利要求3所述的音频编码器,其中所述相关性估计器适于产生ICC参数作为去相关性信息,所述ICC参数由所述第一和第二输入音频信号的取样信号段的复数互相关性ICC复数的实数部分表示,每个信号段由1个样本值X(1)表示,其中ICC参数可以由下式描述:
ICC = Re { Σ e X 1 ( l ) X 2 * ( l ) Σ e | X 1 ( l ) | 2 Σ e | X 2 ( l ) | 2 } ,
以及,其中所述输出接口适于当所述相关性参数小于预定阈值时将所述相位信息包括到所述编码表示中。
6.根据权利要求5所述的音频编码器,其中所述预定阈值等于或小于0.3。
7.根据权利要求5所述的音频编码器,其中针对相关性信息的所述预定阈值与大于90度的相移相对应。
8.根据权利要求1所述的音频编码器,其中所述相关性估计器适于导出多个相关性参数,作为相关性信息,每个相关性参数与所述第一和第二输入音频信号的相应子带有关;以及其中所述相位估计器适于导出用于指示针对与所述相关性参数相对应的子带中的至少两个子带的所述第一和第二输入音频信号之间的相位关系的相位信息。
9.根据权利要求1所述的音频编码器,还包括相关性信息修改器,所述相关性信息修改器适于导出所述相关性度量,以便所述相关性度量指示比所述相关性信息更高的相关性;以及
其中所述输出接口适于包括所述相关性度量而非所述相关性信息。
10.根据权利要求9所述的音频编码器,其中所述相关性信息修改器适于使用所述第一和第二输入音频信号的两个取样的信号段的复数互相关性ICC复数的绝对值,作为所述相关性度量ICC,每个信号段由1个复数值样本值X(1)表示,所述相关性度量ICC由下式描述:
ICC = | Σ e X 1 ( l ) X 2 * ( l ) Σ e | X 1 ( l ) | 2 Σ e | X 2 ( l ) | 2 | .
11.一种用于产生第一和第二输入音频信号的编码表示的音频编码器,包括:
空间参数估计器,所述空间参数估计器适于导出ICC参数或ILD参数,所述ICC参数指示所述第一和第二输入音频信号之间的相关性,所述ILD参数指示所述第一和第二输入音频信号之间的电平关系;
相位估计器,所述相位估计器适于导出相位信息,所述相位信息指示所述第一和第二输入音频信号之间的相位关系;
输出操作模式判决器,所述输出操作模式判决器适于:
当所述相位关系指示大于预定阈值的所述第一和第二输入音频信号之间的相位差
时,指示第一输出模式,或者
当所述相位差小于所述预定阈值时,指示第二输出模式;以及
输出接口,所述输出接口适于:
在第一输出模式中,将所述ICC参数或ILD参数以及所述相位信息包括到所述编码表示中;以及
在第二输出模式中,将所述ICC参数和ILD参数包括到所述编码表示中而不将所述相位信息包括到所述编码表示中。
12.根据权利要求11所述的音频编码器,其中所述预定阈值与60度的相移相对应。
13.根据权利要求11所述的音频编码器,其中所述空间参数估计器适于导出多个ICC参数或ILD参数,每个ICC参数或ILD参数与所述第一和第二输入音频信号的子带表示的相应子带有关;以及其中所述相位估计器适于导出用于指示针对子带表示的子带中的至少两个子带的所述第一和第二输入音频信号之间的所述相位关系的相位信息。
14.根据权利要求13所述的音频编码器,其中所述输出接口适于将单个相位信息参数包括到所述表示中,作为所述相位信息,所述单个相位信息参数指示针对子带表示的子带中的预定子组的所述相位关系。
15.根据权利要求11所述的音频编码器,其中所述相位关系由指示预定相移的单个比特表示。
16.一种使用音频信号的编码表示来产生第一和第二音频信道的音频解码器,所述编码表示包括降混音频信号、以及指示用来产生降混音频信号的第一和第二原始音频信道之间的相关性的第一和第二相关性信息,所述第一相关性信息具有针对所述降混信号的第一时段的信息,以及第二相关性信息具有针对不同的第二时段的信息;所述编码表示还包括针对第一时段和第二时段的相位信息,所述相位信息指示所述第一和第二原始音频信道之间的相位关系,所述音频解码器包括:
升混器,所述升混器适于:
使用所述降混音频信号和所述第一相关性信息导出第一中间音频信号,所述第一中间音频信号与所述第一时段相对应且包括第一和第二音频信道;和
使用所述降混音频信号和所述第二相关性信息导出第二中间音频信号,所述第二中间音频信号与所述第二时段相对应且包括第一和第二音频信道;
中间信号后处理器,所述中间信号后处理器适于使用所述第一中间音频信号和所述相位信息来导出针对所述第一时段的后处理中间音频信号,其中所述中间信号后处理器适于将由所述相位关系指示的附加相移添加到所述第一中间音频信号的第一或第二音频信道中的至少一个上;以及
音频组合器,所述音频组合器适于通过对所述后处理中间音频信号与所述第二中间音频信号进行组合来产生所述第一和第二音频信道。
17.根据权利要求16所述的音频解码器,其中所述升混器适于使用多个相关性参数,作为所述相关性信息,每个相关性参数与所述第一和第二原始音频信号的多个子带中的一个子带相对应;以及
其中所述中间信号后处理器适于将由所述相位关系指示的附加相移添加到所述第一中间音频信号的相应子带中的至少两个子带上。
18.根据权利要求16所述的音频解码器,还包括相关性信息处理器,所述相关性信息处理器适于导出相关性度量,所述相关性度量指示比第一相关性更高的相关性;以及
其中,当相位信息指示高于预定阈值的所述第一和第二原始音频信道之间的相移时,所述升混器使用所述相关性度量而非所述相关性信息。
19.根据权利要求16所述的音频解码器,还包括去相关器,所述去相关器适于根据针对所述第一时段的第一去相关规则和根据针对所述第二时段的第二去相关规则,从所述降混音频信号导出去相关音频信道,其中所述第一去相关规则与所述第二去相关规则相比创建了更少的去相关的音频信道。
20.根据权利要求19所述的音频解码器,其中所述去相关器还包括相移器,所述相移器适于将附加相移施加到使用所述第一去相关规则所产生的去相关音频信道,所述附加相移取决于所述相位信息。
21.一种用于产生第一和第二输入音频信号的编码表示的方法,包括:
导出指示所述第一和第二输入音频信号之间的相关性的相关性信息;
导出信号特征信息,所述信号特征信息指示所述输入音频信号的不同的第一或第二特征;
当所述输入音频信号具有第一特征时导出相位信息,所述相位信息指示所述第一和第二输入音频信号之间的相位关系;以及
当所述输入音频信号具有所述第一特征时将所述相位信息和相关性度量包括到所述编码表示中;或者
当所述输入音频信号具有所述第二特征时将所述相关性信息包括到所述编码表示中,其中当所述输入音频信号具有所述第二特征时不包括所述相位信息。
22.一种用于产生第一和第二输入音频信号的编码表示的方法,包括:
导出ICC参数或ILD参数,所述ICC参数指示所述第一和第二输入音频信号之间的相关性,所述ILD参数指示所述第一和第二输入音频信号间的电平关系;
导出相位信息,所述相位信息指示所述第一和第二输入音频信号之间的相位关系;
当所述相位关系指示大于预定阈值的所述第一和第二输入音频信号之间的相位差时,指示第一输出模式,或者当所述相位差小于预定阈值时,指示第二输出模式;以及
在第一输出模式中,将所述ICC参数或ILD参数以及所述相位关系包括到所述编码表示中;或者
在第二输出模式中,将所述ICC参数或ILD参数包括到所述编码表示中而不将所述相位关系包括到所述编码表示中。
23.一种使用音频信号的编码表示来导出第一和第二音频信道的方法,所述编码表示包括降混音频信号、以及指示用来产生所述降混音频信号的第一和第二原始音频信道之间的相关性的第一和第二相关性信息,所述第一相关性信息具有针对所述降混信号的第一时段的信息,以及所述第二相关性信息具有针对不同的第二时段的信息;所述编码表示还包括针对所述第一时段和第二时段的相位信息,所述相位信息指示所述第一和第二原始音频信道之间的相位关系,所述方法包括:
使用所述降混音频信号和所述第一相关性信息导出第一中间音频信号,所述第一中间音频信号与所述第一时段相对应且包括第一和第二音频信道;
使用所述降混音频信号和所述第二相关性信息导出第二中间音频信号,所述第二中间音频信号与所述第二时段相对应且包括第一和第二音频信道;
使用所述第一中间音频信号和所述相位信息,导出针对所述第一时段的后处理中间信号,其中,通过将由所述相位关系指示的附加相移添加到所述第一中间信号的第一或第二音频信道中的至少一个上来导出后处理中间信号;以及
对所述后处理中间信号和所述第二中间音频信号进行组合以导出所述第一和第二音频信道。
24.一种音频信号的编码表示,包括:
降混信号,所述降混信号是利用第一和第二原始音频信道产生的;
第一相关性信息,所述第一相关性信息用于指示在第一时段内的所述第一和第二原始音频信道间的相关性;
第二相关性信息,所述第二相关性信息用于指示在第二时段内的所述第一和第二原始音频信道间的相关性;以及
相位信息,所述相位信息用于指示针对所述第一时段的所述第一和第二原始音频信道之间的相位关系,其中所述相位信息是针对所述第一时段和第二时段的包括在所述表示中的仅有的相位信息。
25.一种具有程序代码的计算机程序,所述程序代码用于当在计算机上运行时执行根据权利要求21至23中任一项所述的方法。
CN2009801270927A 2008-07-11 2009-06-30 音频编码器、音频解码器、编码及解码方法 Active CN102089807B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7983808P 2008-07-11 2008-07-11
US61/079,838 2008-07-11
EP08014468.6 2008-08-13
EP08014468A EP2144229A1 (en) 2008-07-11 2008-08-13 Efficient use of phase information in audio encoding and decoding
PCT/EP2009/004719 WO2010003575A1 (en) 2008-07-11 2009-06-30 Efficient use of phase information in audio encoding and decoding

Publications (2)

Publication Number Publication Date
CN102089807A true CN102089807A (zh) 2011-06-08
CN102089807B CN102089807B (zh) 2013-04-10

Family

ID=39811665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801270927A Active CN102089807B (zh) 2008-07-11 2009-06-30 音频编码器、音频解码器、编码及解码方法

Country Status (15)

Country Link
US (1) US8255228B2 (zh)
EP (2) EP2144229A1 (zh)
JP (1) JP5587878B2 (zh)
KR (1) KR101249320B1 (zh)
CN (1) CN102089807B (zh)
AR (1) AR072420A1 (zh)
AU (1) AU2009267478B2 (zh)
BR (1) BRPI0910507B1 (zh)
CA (1) CA2730234C (zh)
ES (1) ES2734509T3 (zh)
MX (1) MX2011000371A (zh)
RU (1) RU2491657C2 (zh)
TR (1) TR201908029T4 (zh)
TW (1) TWI449031B (zh)
WO (1) WO2010003575A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104040624A (zh) * 2011-11-03 2014-09-10 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
CN104981867A (zh) * 2013-02-14 2015-10-14 杜比实验室特许公司 用于控制上混音频信号的通道间相干性的方法
CN104995676A (zh) * 2013-02-14 2015-10-21 杜比实验室特许公司 音频处理系统中的信号去相关
CN106663439A (zh) * 2014-07-01 2017-05-10 弗劳恩霍夫应用研究促进协会 用于解码音频信号的解码器及方法,用于编码音频信号的编码器及方法

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8346379B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
KR20100035121A (ko) * 2008-09-25 2010-04-02 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
WO2010087627A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
JP5340378B2 (ja) * 2009-02-26 2013-11-13 パナソニック株式会社 チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
CA2777657C (en) 2009-10-21 2015-09-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reverberator and method for reverberating an audio signal
CN102157152B (zh) 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
BR112013004362B1 (pt) * 2010-08-25 2020-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
WO2012045203A1 (en) * 2010-10-05 2012-04-12 Huawei Technologies Co., Ltd. Method and apparatus for encoding/decoding multichannel audio signal
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
US9219972B2 (en) * 2010-11-19 2015-12-22 Nokia Technologies Oy Efficient audio coding having reduced bit rate for ambient signals and decoding using same
JP5582027B2 (ja) * 2010-12-28 2014-09-03 富士通株式会社 符号器、符号化方法および符号化プログラム
JP5977434B2 (ja) 2012-04-05 2016-08-24 ホアウェイ・テクノロジーズ・カンパニー・リミテッド パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
EP2717262A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US9659569B2 (en) 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
US9818412B2 (en) 2013-05-24 2017-11-14 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
CN105474308A (zh) * 2013-05-28 2016-04-06 诺基亚技术有限公司 音频信号编码器
JP5853995B2 (ja) * 2013-06-10 2016-02-09 トヨタ自動車株式会社 協調スペクトラムセンシング方法および車載無線通信装置
KR102192361B1 (ko) * 2013-07-01 2020-12-17 삼성전자주식회사 머리 움직임을 이용한 사용자 인터페이스 방법 및 장치
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
ES2653975T3 (es) 2013-07-22 2018-02-09 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de audio multicanal, codificador de audio multicanal, procedimientos, programa informático y representación de audio codificada mediante el uso de una decorrelación de señales de audio renderizadas
KR102484214B1 (ko) * 2013-07-31 2023-01-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱
KR102244379B1 (ko) * 2013-10-21 2021-04-26 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
CN105637581B (zh) * 2013-10-21 2019-09-20 杜比国际公司 用于音频信号的参数重建的去相关器结构
CN105765655A (zh) 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
KR101841380B1 (ko) * 2014-01-13 2018-03-22 노키아 테크놀로지스 오와이 다중-채널 오디오 신호 분류기
CN107710323B (zh) 2016-01-22 2022-07-19 弗劳恩霍夫应用研究促进协会 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
JP6790251B2 (ja) * 2016-09-28 2020-11-25 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネルオーディオ信号処理方法、装置、およびシステム
PT3539127T (pt) 2016-11-08 2020-12-04 Fraunhofer Ges Forschung Dispositivo de downmix e método para executar o downmix de pelo menos dois canais e codificador multicanal e descodificador multicanal
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
GB2568274A (en) * 2017-11-10 2019-05-15 Nokia Technologies Oy Audio stream dependency information
US11533576B2 (en) * 2021-03-29 2022-12-20 Cae Inc. Method and system for limiting spatial interference fluctuations between audio signals
EP4383254A1 (en) 2022-12-07 2024-06-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
EP1523863A1 (en) * 2002-07-16 2005-04-20 Koninklijke Philips Electronics N.V. Audio coding
US7720231B2 (en) 2003-09-29 2010-05-18 Koninklijke Philips Electronics N.V. Encoding audio signals
CA2992097C (en) * 2004-03-01 2018-09-11 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
CN1930914B (zh) * 2004-03-04 2012-06-27 艾格瑞系统有限公司 对多声道音频信号进行编码和合成的方法和装置
EP1914723B1 (en) * 2004-05-19 2010-07-07 Panasonic Corporation Audio signal encoder and audio signal decoder
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US20070174047A1 (en) * 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
TWI297488B (en) * 2006-02-20 2008-06-01 Ite Tech Inc Method for middle/side stereo coding and audio encoder using the same
KR101040160B1 (ko) * 2006-08-15 2011-06-09 브로드콤 코포레이션 패킷 손실 후의 제한되고 제어된 디코딩
EP2149877B1 (en) * 2008-07-29 2020-12-09 LG Electronics Inc. A method and an apparatus for processing an audio signal
US9112591B2 (en) * 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104040624A (zh) * 2011-11-03 2014-09-10 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
CN104040624B (zh) * 2011-11-03 2017-03-01 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
CN106910509A (zh) * 2011-11-03 2017-06-30 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
CN104981867A (zh) * 2013-02-14 2015-10-14 杜比实验室特许公司 用于控制上混音频信号的通道间相干性的方法
CN104995676A (zh) * 2013-02-14 2015-10-21 杜比实验室特许公司 音频处理系统中的信号去相关
CN104995676B (zh) * 2013-02-14 2018-03-30 杜比实验室特许公司 音频处理系统中的信号去相关
CN104981867B (zh) * 2013-02-14 2018-03-30 杜比实验室特许公司 用于控制上混音频信号的通道间相干性的方法
CN106663439A (zh) * 2014-07-01 2017-05-10 弗劳恩霍夫应用研究促进协会 用于解码音频信号的解码器及方法,用于编码音频信号的编码器及方法
US10770083B2 (en) 2014-07-01 2020-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using vertical phase correction
US10930292B2 (en) 2014-07-01 2021-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using horizontal phase correction
CN106663439B (zh) * 2014-07-01 2021-03-02 弗劳恩霍夫应用研究促进协会 用于解码音频信号的解码器及方法,用于编码音频信号的编码器及方法

Also Published As

Publication number Publication date
EP2301016A1 (en) 2011-03-30
MX2011000371A (es) 2011-03-15
JP5587878B2 (ja) 2014-09-10
AU2009267478B2 (en) 2013-01-10
ES2734509T3 (es) 2019-12-10
RU2011100135A (ru) 2012-07-20
AR072420A1 (es) 2010-08-25
TWI449031B (zh) 2014-08-11
JP2011527456A (ja) 2011-10-27
BRPI0910507A2 (pt) 2016-07-26
AU2009267478A1 (en) 2010-01-14
KR101249320B1 (ko) 2013-04-01
KR20110040793A (ko) 2011-04-20
BRPI0910507B1 (pt) 2021-02-23
EP2144229A1 (en) 2010-01-13
EP2301016B1 (en) 2019-05-08
TW201007695A (en) 2010-02-16
CA2730234A1 (en) 2010-01-14
CA2730234C (en) 2014-09-23
US8255228B2 (en) 2012-08-28
US20110173005A1 (en) 2011-07-14
RU2491657C2 (ru) 2013-08-27
TR201908029T4 (tr) 2019-06-21
CN102089807B (zh) 2013-04-10
WO2010003575A1 (en) 2010-01-14

Similar Documents

Publication Publication Date Title
CN102089807B (zh) 音频编码器、音频解码器、编码及解码方法
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
JP5166292B2 (ja) 主成分分析によりマルチチャネルオーディオ信号を符号化するための装置および方法
CN101036183B (zh) 用于立体声兼容的多声道音频编码/解码的方法和设备
KR101629862B1 (ko) 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
US7573912B2 (en) Near-transparent or transparent multi-channel encoder/decoder scheme
CN102171754B (zh) 编码装置以及解码装置
JP5302977B2 (ja) オーディオ信号のフィンガープリントを計算するための装置及び方法、同期のための装置及び方法、並びに試験オーディオ信号の特徴付けのための装置及び方法
US20050177360A1 (en) Audio coding
CN105378832B (zh) 解码器、编码器、解码方法、编码方法和存储介质
US20070168183A1 (en) Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
CN101010725A (zh) 多信道信号编码装置以及多信道信号解码装置
KR20070019718A (ko) 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
JPWO2006030754A1 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
Lindblom et al. Flexible sum-difference stereo coding based on time-aligned signal components
JP2006003580A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
US20110051935A1 (en) Method and apparatus for encoding and decoding stereo audio
Dubey et al. A Novel Very Low Bit Rate Multi-Channel Audio Coding Scheme Using Accurate Temporal Envelope Coding and Signal Synthesis Tools

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant