CN1926610A - 基于编码的多声道音频信号合成单声道音频信号 - Google Patents

基于编码的多声道音频信号合成单声道音频信号 Download PDF

Info

Publication number
CN1926610A
CN1926610A CN200480042422.XA CN200480042422A CN1926610A CN 1926610 A CN1926610 A CN 1926610A CN 200480042422 A CN200480042422 A CN 200480042422A CN 1926610 A CN1926610 A CN 1926610A
Authority
CN
China
Prior art keywords
channel
audio signal
multichannel
parameter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200480042422.XA
Other languages
English (en)
Other versions
CN1926610B (zh
Inventor
阿里·拉卡尼厄米
帕西·奥雅拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN1926610A publication Critical patent/CN1926610A/zh
Application granted granted Critical
Publication of CN1926610B publication Critical patent/CN1926610B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明涉及一种基于可用的编码的多声道音频信号合成单声道音频信号的方法。假定该编码的多声道音频信号为至少一部分音频频带包括该多声道音频信号的每个声道的单独的参数值。为了降低合成单声道音频信号的处理负载,提出了在参数域中至少为一部分音频频带将多声道的参数值组合在一起。组合后的参数值随后被用于合成单声道音频信号。本发明同样涉及对应的音频解码器,对应的编码系统以及对应的软件程序产品。

Description

基于编码的多声道音频信号合成单声道音频信号
技术领域
本发明涉及基于可用的编码的多声道音频信号合成单声道音频信号的方法,该编码的多声道音频信号至少为一部分音频频带包括该多声道音频信号的每个声道的单独的参数值。本发明同样涉及相应的音频解码器、相应的编码系统以及相应的软件程序产品。
背景技术
音频编码系统在目前技术中是众所周知的。它们特别被用于传输或存储音频信号。
用于音频信号传输的音频编码系统包括发送端的编码器和接收端的解码器。发送端和接收端可以是例如移动终端。要传输的音频信号被提供给编码器。编码器负责将进入的音频速率调整为不违反传输信道中的带宽条件的位速率级别。理想地,编码器在这个编码过程中只丢弃与音频信号无关的信息。编码的音频信号随后由音频编码系统的发送端发送并由音频编码系统的接收端接收。接收端的解码器将编码过程反转以获得只有很小或没有听觉下降的解码后的音频信号。
如果为了存档音频数据而采用了音频编码系统,由编码器提供的编码的音频数据被存储在某种存储单元中,并且解码器解码从这个存储单元获取的音频数据,例如由一些媒体播放器播放。在这种情况下,目的是编码器实现尽可能低的位速率以便节省存储空间。
取决于允许的位速率,可以对音频信号应用不同的编码方案。
大多数情况下,音频信号的低频带和高频带彼此相互关联。因此,音频编解码器带宽扩展算法通常先将待编码的音频信号的带宽分成两个频带。然后,低频带由所谓核心编解码器独立处理,而高频带则用关于来自低频带的编码参数和信号的知识进行处理。在高频带编码中使用来自低频带编码的参数大大降低了在高频带编码中得出的位速率。
图1示出了一个典型的分离频带编码和解码系统。该系统包括音频编码器10和音频解码器20。音频解码器10包括一个双频带分析滤波器组11、低频带编码器12和高频带编码器13。音频解码器20包括低频带解码器21、高频带解码器22和一个双频带合成滤波器组23。低频带编码器12和解码器21可以是例如自适应的多-速率宽带(AMR-WB)标准编码器和解码器,而高频带编码器13解码器22可以包括独立的编码算法、带宽扩展算法或二者的组合。作为示例,假定所示系统使用扩展的AMR-WB(AMR-WB+)编解码器作为分离频带编码算法。
输入音频信号1首先由双频带分析滤波器组11进行处理,在其中音频频带被分成了低频带和高频带。为说明起见,图2示出了AMR-WB+情况下的双频带滤波器组的频率响应。12KHz音频频带被分成了0KHz到6.4KHz的频带L和6.4KHz到12KHz的频带H。此外在双频带分析滤波器组11中,产生的频带被临界下取样。也就是说,低频带被下取样到12.8KHz,高频带被重新取样到11.2KHz。
低频带和高频带随后分别由低频带编码器12和高频带编码器13相互独立地进行编码。
低频带编码器12为此包括了完整的源信号编码算法。该算法包括算术代码激励线性预测(ACELP)类型的算法以及基于变换的算法。实际采用的算法是基于各个输入音频信号的信号特征选择的。通常为编码语音信号和瞬态选择ACELP算法,而通常为编码类似音乐和音调的信号选择基于变换的算法,以更好地处理频率解析。
在AMR-WB+编解码器中,高频带编码器13利用线性预测编码(LPC)为高频带信号的频谱包络建模。随后可以借助于定义了合成信号频谱特征的LPC合成滤波系数和控制合成的高频带音频信号的振幅的激励信号的增益因子来描述高频带。高频带激励信号是从低频带编码器12复制的。只有LPC系数和增益因子是为传输提供的。
低频带编码器12和高频带编码器13的输出被多路复用到单个比特流2。
多路复用的比特流2例如通过通信信道被传输到音频解码器20,在其中分开对低频带和高频带进行解码。
在低频带解码器21中,低频带编码器12中的处理被反转以合成低频带音频信号。
在高频带解码器22中,通过对由低频带解码器21为高频带中所用的采样速率所提供的低频带激励信号重新取样而生成一个激励信号。也就是说,通过将低频带信号置换为高频带,将低频带激励信号重新用于高频带的解码。作为选择,可以为高频带信号的重新构建生成随机激励信号。随后通过经由LPC系数所定义的高频带LPC模型滤波成比例缩放的激励信号而重新构造出高频带信号。
在双频带合成滤波器组23中,解码的低频带信号和高频带信号被上取样为原始的采样频率并被组合成合成输出音频信号3。
要编码的输入音频信号1可以是单声道音频信号或者至少包含第一和第二声道信号的多声道音频信号。多声道音频信号的一个示例是立体声音频信号,其由左声道信号和右声道信号组成。
对于AMR-WB+编解码器的立体声操作,输入音频信号在双频带分析滤波器组11中同样被分成低频带信号和高频带信号。低频带编码器12通过将左声道信号和右声道信号进行组合在低频段中生成单声道信号。如上所述地对单声道组合进行编码。另外,低频带编码器12将参数编码用于把左声道信号和右声道信号的差异编码成单声道信号。高频带编码器13通过确定每个声道的单独的LPC参数和增益因子而分别编码左声道和右声道。
在输入音频信号1是多声道音频信号,但用来表现合成的音频信号3的设备不支持多声道音频输出的情况下,输入的多声道比特流2必须被音频解码器20转换成单声道音频信号。在低频带处,多声道信号到单声道信号的转换是直接进行的,因为低频带解码器21能够简单地忽略接收到的比特流中的立体声参数并只解码单声道部分。但对于高频带来说,需要更多的处理,因为在比特流中没有可用的高频带的单独的单声道信号部分。
常规地,分别为左和右声道信号解码高频带的立体声比特流,随后通过在下混合过程中组合左和右声道信号而创建单声道信号。图3中示出了这个方法。
图3示意性地针对单声道音频信号输出示出了图1的高频带解码器22的细节。为此目的高频带解码器包括了左声道处理部分30和右声道处理部分33。左声道处理部分30包括混频器31,它与LPC合成滤波器32相连。右声道处理部分33同样包括了混频器34,它与LPC合成滤波器35相连。两个LPC合成滤波器32、35的输出与另一混频器36相连。
由低频带解码器21提供的低频带激励信号被馈送到混频器31或34。混频器31将左声道的增益因子应用到低频带激励信号。随后由LPC合成滤波器32,通过由左声道的LPC系数定义的高频带LPC模型滤波成比例缩放的激励信号,重新构建出左声道高频带信号。混频器34将右声道的增益因子应用到低频带激励信号。随后由LPC合成滤波器35,通过由右声道的LPC系数定义的高频带LPC模型滤波成比例缩放的激励信号,重新构建出右声道高频带信号。
随后由混频器36通过计算重新构建出的左声道高频带信号和重新构建出的右声道高频带信号在时域中的平均值,而将它们转换成单声道高频带信号。
原则上,这是简单有效的方法。但是,它需要多声道的单独的合成,即使在最后只需要单个声道信号。
此外,如果多声道音频输入信号1不平衡使得该多声道音频信号的大多数能量位于其中一个声道上,则通过计算它们的平均值对多声道的直接混合将导致合成信号中的衰减。在极端情况下,声道之一完全无声,这导致合成信号的能级是初始的活动输入声道的能级的一半。
发明内容
本发明的一个目的是降低基于编码的多声道音频信号合成单声道音频信号所需的处理负载。
提出了一种基于可用的编码的多声道音频信号合成单声道音频信号的方法,该编码的多声道音频信号为至少一部分音频频带包括该多声道音频信号的每个声道的单独的参数值。所提出的方法包括至少为一部分音频频带在参数域中组合该多声道的参数值。所提出的方法还包括对这部分音频频带使用组合后的参数值以合成单声道音频信号。
此外,提出了一种基于可用的编码的多声道音频信号合成单声道音频信号的音频解码器。该编码的多声道音频信号为初始多声道音频信号的至少一部分音频频带包括该多声道音频信号的每个声道的单独的参数值。所提出的音频解码器包括至少一个参数选择部分,适合于至少为该多声道音频信号的一部分频带在参数域中组合多声道的参数值。所提出的音频解码器还包括音频信号合成部分,适合于基于由参数选择部分提供的组合的参数值,至少为该多声道音频信号的一部分频带合成单声道音频信号。
此外,提供了一种编码系统,它除了包括所提出的解码器之外还包括提供编码的多声道音频信号的编码器。
最后,提出了一种软件程序产品,在该产品中存储了用于基于可用的编码的多声道音频信号合成单声道音频信号的软件代码。该编码的多声道音频信号为初始多声道音频信号的至少一部分频带包括了该多声道音频信号的每个声道的单独的参数值。当在音频解码器中运行时,所提出的软件代码实现所提出的方法的步骤。
编码的多声道音频信号可以特别地为(但不仅是)编码的立体声音频信号。
本发明从获得单声道音频信号的考虑出发,如果多声道可用的这些参数值在解码之前已经在参数域中被组合起来就可以避免对可用的多声道进行单独解码。组合后的参数值随后可以用于单个声道解码。
本发明的一个优势是它在解码器上节省了处理负载并且降低了解码器的复杂度。例如,如果多声道是在分离频带系统中处理的立体声声道,则与单独为两个声道完成高频带合成滤波并混合得到的左和右声道信号相比,可以节省高频带合成滤波所需处理负载的大约一半。
在本发明的一个实施例中,参数包括多声道的每一个的增益因子和多声道的每一个的线性预测系数。
可以用静态方式实现对参数值的组合,例如通常通过计算所有声道上可用参数值的平均。但是,有利地,基于关于多声道中各自的活动信息为至少一个参数控制对参数值的组合。这允许能够获得具有尽可能接近相应活动声道的频谱特征和能级的单声道音频信号,并因而获得了音频质量改进了的合成的单声道音频信号。
如果第一声道中的活动显著高于第二声道中的活动,则可以假定第一声道为活动声道,而假定基本上不向初始音频信号提供听觉贡献的第二声道为无声声道。在存在无声声道的情况下,在组合参数值时可以有利地完全丢弃至少一个参数的参数值。作为结果,合成出的单声道信号将与活动声道相似。在所有其它情况下,可以例如通过形成所有声道上的平均或加权平均而组合参数值。对于加权平均来说,为声道所赋的权重随着它相对于其它一个或多个声道的活动的上升而上升。也可以用其它方法实现组合。同样,通过平均或一些其它方法也可将不打算丢弃的无声声道的参数值与活动声道的参数值组合在一起。
各种类型的信息可以形成关于多声道中相应活动的信息。例如,它可以由多声道的每一个的增益因子给出,或由在一段短时间内多声道的每一个的增益因子的组合给出,或由多声道的每一个的线性预测系数给出。同样,活动信息可以由多声道的每一个的至少一部分频带的能级给出,或由关于从提供编码的多声道音频信号的编码器接收到的活动的单独的辅助信息给出。
为了获得编码的多声道音频信号,可以将初始多声道音频信号分成例如低频带信号和高频带信号。然后低频带信号可以用传统方式编码。还可以用传统方式单独地为多声道对高频带信号编码,这产生了多声道的每一个的参数值。随后可以根据本发明处理整个编码的多声道音频信号的至少编码的高频带部分。
必须理解,但为了避免低频带和高频带之间的不平衡,例如信号电平中的不平衡,同样可以根据本发明处理整个信号的低频带部分的多声道参数值。作为选择,原则上不能丢弃影响信号电平的高频带中的无声声道的参数值,只有影响信号频谱特征的无声声道的参数值可以丢弃。
可以(但不限于)在基于AMR-WB+的编码系统中实现本发明。
从下面结合附图的详细说明中可以使本发明的其它目的和特性变得明显。
附图说明
图1是分离频带编码系统的示意性框图;
图2是双频带滤波器组的频率响应图;
图3是用于立体声到单声道转换的常规高频带解码器的示意性框图;
图4是根据本发明的第一实施例用于立体声到单声道转换的高频带解码器的示意性框图;
图5是示出了由图4的高频带解码器得到的立体声信号和单声道信号的频率响应的视图;
图6是根据本发明的第二实施例用于立体声到单声道转换的高频带解码器的示意性框图;
图7是说明使用图6的高频带解码器的系统中的操作的流程图;
图8是示出图7的流程图中用于参数组合的第一选择的流程图;
图9是示出图7的流程图中用于参数组合的第二选择的流程图。
具体实施方式
假定在图1的系统中实现本发明,因此在下文中也会参考图1。立体声输入音频信号1被提供给音频编码器10进行编码,而解码的单声道音频信号3必须由音频解码器20提供用于表现。
为了能够用低处理负载提供这种单声道音频信号3,可以根据本发明的第一简单实施例实现该系统的高频带解码器22。
图4是这个高频带解码器22的示意性框图。高频带解码器22的低频带激励输入通过混频器40和LPC合成滤波器41与高频带解码器22的输出相连。高频带解码器22另外包括连接到混频器的增益平均计算模块42,以及连接到LPC合成滤波器41的LPC平均计算模块43。
该系统运行如下。
到音频编码器10的立体声信号输入由双频带分析滤波器组11分成低频带和高频带。低频带编码器11如前所述对低频带音频信号编码。AMR-WB+高频带编码器12分别针对左和右声道对高频带立体声信号编码。更具体地,它如前所述地为每个声道确定增益因子和线性预测系数。
编码的单声道低频带信号、立体声低频带参数值和立体声高频带参数值在比特流2中被传输到音频解码器20。
低频带解码器21接收该比特流的低频带部分进行解码。在该解码中,它忽略立体声参数并且只解码单声道部分。结果是单声道低频带音频信号。
高频带解码器22一方面从传输来的比特流接收高频带参数值,另一方面通过低频带解码器21接收低频带激励信号输出。
高频带参数分别包括左声道增益因子、右声道增益因子、左声道LPC系数和右声道LPC系数。在增益平均计算模块42中,对左声道和右声道各自的增益因子取平均,并且平均增益因子由混频器40用于按比例缩放低频带激励信号。得到的信号被提供给LPC合成滤波器41用于滤波。
在平均LPC计算模块43中,将左声道和右声道各自的线性预测系数组合在一起。在AMR-WB+中,可以例如通过在导抗频谱对(Immittance Spectral Pair)(ISP)域中计算接收到的系数的平均值而将来自两个声道的LPC系数组合在一起。平均系数随后被用于配置LPC合成滤波器41,以使低频带激励信号得以成比例缩放。
成比例缩放的并且滤波后的低频带激励信号形成了想要的单声道高频带音频信号。
单声道低频带音频信号和单声道高频带音频信号在双频带合成滤波器组23中被组合在一起,并且得到的合成信号3被输出用于表现。
与使用图3的高频带编码器的系统相比,使用图4的高频带编码器的系统的优势是它只需要用于生成合成信号的约一半的处理能力,因为它只生成一次。
必须注意到,在立体声音频信号只在一个声道中有活动信号的情况下,前面提到的组合的信号中可能的衰减问题依然存在。
此外,对于只有一个活动声道的立体声音频输入信号,对线性预测系数的平均会带来“拉平”所得到的组合信号的频谱的副作用。由于活动声道的“实际”频谱和无声声道实际上平的或随机的频谱的组合,组合信号具有稍微失真的频谱特征,而不是活动声道的频谱特征。
图5中示出了这种作用。图5是示出了对于在80ms的一帧上计算出的三种不同的LPC合成滤波器频率响应的振幅随频率的变化的视图。实线表示活动声道的LPC合成滤波器频率响应。点线表示无声声道的LPC合成滤波器频率响应。短划线表示当在ISP域中平均来自两个声道的LPC模块时得到的LPC合成滤波器频率响应。可以看到,平均的LPC滤波器创建了不像任一实际频谱的频谱。实际上这个现象可以看作是高频带上的音频质量下降。
为了能够不仅用低处理负载提供单声道音频信号3,而且还能避免图4的高频带解码器不能解决的限制,可以根据本发明的第二实施例实现图1的系统的高频带解码器22。
图6是这种高频带解码器22的示意性框图。高频带解码器22的低频带激励输入通过混频器60和LPC合成滤波器61与高频带解码器22的输出相连。高频带解码器22另外包括与混频器60相连的增益选择逻辑62,以及与LPC合成滤波器61相连的LPC选择逻辑63。
现在将参考图7说明在使用图6的高频带编码器22的系统中的处理。图7是一个流程图,在它的上部示出了该系统的音频编码器10中的处理,在它的下部示出了该系统的音频解码器20中的处理。上部和下部由水平虚线分隔。
到编码器的立体声音频输入1由双频带分析滤波器组11分成低频带和高频带。低频带编码器12对低频带进行编码。AMR-WB+高频带编码器13分别针对左和右声道对高频带进行编码。更具体地,它确定两个声道的专用增益因子和线性预测系数作为高频带参数。
编码的单声道低频带信号、立体声低频带参数值和立体声高频带参数值在比特流2中被传输到音频解码器20。
低频带解码器21接收到比特流2的低频带相关部分并对其进行解码。在该解码中,低频带解码器21忽略接收到的立体声参数并只解码单声道部分。结果是单声道低频带音频信号。
高频带解码器22一方面接收左声道增益因子、右声道增益因子、左声道的线性预测系数和右声道的线性预测系数,并且另一方面通过低频带解码器21接收低频带激励信号输出。左声道增益和右声道增益同时被用作声道活动信息。另外必须注意到,可以由高频带编码器13提供表示高频带中对左声道和右声道的活动分布的一些其它声道活动信息,作为附加参数。
估计声道活动信息,由增益选择逻辑62根据该估计将左声道和右声道的增益因子组合成单个增益因子。所选择的增益随后借助于混频器60被应用到由低频带解码器21提供的低频带激励信号。
此外,由LPC模型选择逻辑63根据该估计,将左声道和右声道的LPC系数组合成单组LPC系数。组合的LPC模型被提供给LPC合成滤波器61。LPC合成滤波器61将所选择的LPC模型应用于由混频器60提供的成比例缩放的低频带激励信号。
得到的高频带音频信号随后在双频带合成滤波器组23与单声道低频带音频信号一起被组合成单声道全频带音频信号,它可以被输出用于由不能处理立体声音频信号的设备或应用进行表现。
可以用不同的方式实现所提出的对声道活动信息的估计以及对参数值的后续组合,这由图7的流程图示为带有双线的方框。参考图8和图9的流程图将给出两种选项。
在图8所示的第一种选项中,首先在一帧的持续时间内对左声道的增益因子进行平均,并且同样地,在一帧的持续时间内对右声道的增益因子进行平均。
随后从平均后的左声道增益因子中减去平均后的右声道增益因子,得到每帧的某个增益差。
在增益差小于第一阈值的情况下,就将这个帧的组合增益因子设为等于为右声道提供的增益因子。此外,将这个帧的组合LPC模型设为等于为右声道提供的LPC模型。
在增益差大于第二阈值的情况下,就将这个帧的组合增益因子设为等于为左声道提供的增益因子。此外,将这个帧的组合LPC模型设为等于为左声道提供的LPC模型。
在所有其它情况下,将这个帧的组合增益因子设为左声道各自的增益因子和右声道各自的增益因子的平均。将这个帧的组合LPC模式设为左声道各自的LPC模型和右声道各自的LPC模型的平均。
第一阈值和第二阈值是根据需要的敏感度和需要的立体声到单声道转换的应用的类型而选择的。例如,第一阈值的合适的值为-20dB,第二阈值的合适的值是20dB。
因而,如果在相应的帧内,声道之一可以看作是无声声道,而另一声道可以看作是活动声道,那么由于平均增益因子大的差值,对于该帧的持续时间无声声道的增益因子和LPC模型被丢弃。这是可行的,因为无声声道对混合音频输出没有任何听觉贡献。参数值的这种组合确保了频谱特征和信号电平尽可能地接近各自的活动声道。
必须注意到,除了忽略立体声参数外,低频带解码器还可以形成组合参数值并将它们应用到信号的单声道部分,正如为高频带处理所说明的那样。
在图9所示的参数值组合的第二种选项中,左声道的增益因子和右声道的增益因子同样在一帧的持续时间上被分别进行平均。
随后从平均后的左声道增益中减去平均后的右声道增益,得到每个帧的某个增益差。
在增益差小于第一、低阈值的情况下,将这个帧的组合LPC模型设为等于为右声道所提供的LPC模型。
在增益差大于第二、高阈值的情况下,将这个帧的组合LPC模型设为等于为左声道所提供的LPC模型。
在所有其它情况下,将这个帧的组合LPC模型设为等于左声道各自的LPC模型和右声道各自的LPC模型的平均。
任何情况下,该帧的组合增益因子都被设为左声道各自的增益因子和右声道各自的增益因子的平均。
LPC系数仅在合成的信号的频谱特征上有直接效果。因而只组合LPC系数就会导致期望的频谱特征,但不能解决信号衰减的问题。但是,在没有依照本发明混合低频带的情况下,这样做的优势是保持了低频带和高频带之间的平衡。保留高频带处的信号电平会通过在高频带中引入相对太噪杂的信号而改变低频带和高频带之间的平衡,这会导致主观的音频质量下降。
必须注意到,所说明的实施例只是可以进一步用多种方式进行改进的各种实施例中的一些。

Claims (20)

1.一种基于可用的编码的多声道音频信号(2)合成单声道音频信号(3)的方法,该编码的多声道音频信号(2)为至少一部分音频频带包括所述多声道音频信号的每个声道的单独的参数值,所述方法为至少一部分音频频带包括:
-在参数域中组合所述多声道的参数值;以及
-使用所述组合的参数值以合成单声道音频信号。
2.根据权利要求1所述的方法,其中所述参数包括所述多声道的每一个的增益因子以及所述多声道的每一个的线性预测系数。
3.根据权利要求1或2所述的方法,其中基于关于所述多声道各自的活动信息为至少一个参数控制组合所述参数值。
4.根据权利要求3所述的方法,其中所述关于所述多声道各自的活动信息包括下列至少之一:
-所述多声道的每一个的增益因子;
-所述多声道的每一个的增益因子在一段短时间内的组合;
-所述多声道的每一个的线性预测系数;
-所述多声道的每一个的所述多声道音频信号的至少部分频带中的能级;以及
-从提供所述编码的多声道音频信号的编码端接收到的关于所述活动的单独的辅助信息。
5.根据权利要求3或4所述的方法,其中在关于所述多声道中的活动的所述信息指示所述多声道的第一声道中的活动显著低于所述多声道中的至少一个其它声道的情况下,就丢弃对所述第一声道可用的至少一个参数的值。
6.根据权利要求5所述的方法,其中在关于所述多声道中的活动的所述信息指示所述多声道中的第一声道中的活动显著低于所述多声道中的至少一个其它声道的情况下,就将对所述多声道可用的至少一个其它参数的值进行平均。
7.根据权利要求3至6之一所述的方法,其中在关于所述多声道中的活动的所述信息不指示所述多声道之一中的活动显著小于所述多声道中的至少一个其它声道的情况下,就将对所述多声道可用的所述参数的值进行平均。
8.根据前述权利要求之一所述的方法,其中所述多声道信号是立体声信号。
9.根据前述权利要求之一所述的方法,包括前述步骤:将初始多声道音频信号(1)分成低频带信号和高频带信号,编码所述低频带信号并单独地针对所述多声道编码所述高频带信号,为所述多声道的每一个单独所述参数值,其中至少组合为所述高频带信号得到的参数值,用于合成所述单声道音频信号。
10.一种用于基于可用的编码的多声道音频信号(2)合成单声道音频信号(3)的音频解码器(20),该编码的多声道音频信号(2)为初始多声道音频信号(1)的至少一部分频带包括所述多声道音频信号的每个声道的单独的参数值,所述音频解码器包括:
-适合于至少为所述多声道音频信号的一部分频带在参数域中组合所述多声道的参数值的至少一个参数选择部分(42、43;62、63);以及
-适合于基于由所述至少一个参数选择部分(42、43;62、63)提供的组合后的参数值至少为所述多声道音频信号的一部分频带合成单声道音频信号的音频信号合成部分(40、41;60、61)。
11.根据权利要求10所述的音频解码器(20),其中所述参数包括所述多声道的每一个的增益因子以及所述多声道的每一个的线性预测系数。
12.根据权利要求10或11所述的音频解码器(20),其中所述参数选择部分(62、63)适合基于关于所述多声道各自的活动信息为至少一个参数将所述参数值组合在一起。
13.根据权利要求12所述的音频解码器(20),其中所述关于所述多声道的活动信息包括至少下列之一:
-所述多声道的每一个的增益因子;
-所述多声道的每一个的增益因子在一段短时间内的组合;
-所述多声道的每一个的线性预测系数;
-所述多声道的每一个的所述多声道音频信号的至少部分频带中的能级;以及
-从提供所述编码的多声道音频信号的编码端接收到的关于所述活动的单独的辅助信息。
14.根据权利要求12或13所述的音频解码器(20),其中所述参数选择部分(62、63)适合在关于所述多声道中的活动信息指示所述第一声道的活动显著低于所述多声道中的至少一个其它声道的情况下,在所述组合中丢弃对所述多声道的第一声道可用的至少一个参数的值。
15.根据权利要求14所述的音频解码器(20),其中所述参数选择部分(62、63)适合在关于所述多声道中的活动信息指示所述多声道的第一个声道中的活动显著低于所述多声道中的至少一个其它声道的情况下,在所述组合中就对所述多声道可用的至少一个其它参数的值进行平均。
16.根据权利要求12至15之一所述的音频解码器(20),其中所述参数选择部分(62、63)适合在关于所述多声道中的活动信息不指示所述多声道的一个中的活动显著低于所述多声道中至少一个其它声道中的情况下,就对所述多声道可用的所述参数的值进行平均。
17.根据权利要求10至16之一所述的音频解码器(20),其中所述多声道信号是立体声信号。
18.一种包括音频编码器(10)和音频解码器(20)的编码系统,其中音频编码器(10)提供编码的多声道音频信号(2),该编码的多声道音频信号(2)为至少为初始多声道音频信号(1)的一部分频带包括所述多声道音频信号的每个声道的单独的参数值,其中音频解码器(20)根据权利要求10至17之一所述。
19.根据权利要求18的编码系统,其中所述音频编码器(10)包括评估部件(13),适合确定关于所述多声道的活动信息并且适合提供所述信息由所述音频解码器(20)使用。
20.一种软件程序产品,在其中存储了用于基于可用的编码的多声道音频信号(2)合成单声道音频信号(3)的软件代码,该编码的多声道音频信号(2)为初始多声道音频信号(1)的至少一部分频带包括了所述多声道音频信号的每个声道的单独的参数值,当在音频解码器(20)中运行时,所述软件代码实现根据权利要求1至9之一的方法的步骤。
CN200480042422.XA 2004-03-12 2004-03-12 合成单声道音频信号的方法、音频解码器和编码系统 Expired - Lifetime CN1926610B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/IB2004/000715 WO2005093717A1 (en) 2004-03-12 2004-03-12 Synthesizing a mono audio signal based on an encoded miltichannel audio signal

Publications (2)

Publication Number Publication Date
CN1926610A true CN1926610A (zh) 2007-03-07
CN1926610B CN1926610B (zh) 2010-10-06

Family

ID=34957094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200480042422.XA Expired - Lifetime CN1926610B (zh) 2004-03-12 2004-03-12 合成单声道音频信号的方法、音频解码器和编码系统

Country Status (12)

Country Link
US (1) US7899191B2 (zh)
EP (1) EP1723639B1 (zh)
JP (1) JP4495209B2 (zh)
CN (1) CN1926610B (zh)
AT (1) ATE378677T1 (zh)
AU (1) AU2004317678C1 (zh)
BR (1) BRPI0418665B1 (zh)
CA (1) CA2555182C (zh)
DE (1) DE602004010188T2 (zh)
ES (1) ES2295837T3 (zh)
RU (1) RU2381571C2 (zh)
WO (1) WO2005093717A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101662688B (zh) * 2008-08-13 2012-10-03 韩国电子通信研究院 音频信号的编码和解码方法及其装置
CN103188595A (zh) * 2011-12-31 2013-07-03 展讯通信(上海)有限公司 处理多声道音频信号的方法和系统
CN103854651A (zh) * 2009-12-16 2014-06-11 杜比国际公司 Sbr比特流参数缩混
TWI450266B (zh) * 2011-04-19 2014-08-21 Hon Hai Prec Ind Co Ltd 電子裝置及音頻資料的解碼方法
CN107004427A (zh) * 2014-12-12 2017-08-01 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
CN109074812A (zh) * 2016-01-22 2018-12-21 弗劳恩霍夫应用研究促进协会 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法
CN109155803A (zh) * 2016-08-26 2019-01-04 华为技术有限公司 音频数据处理方法、终端设备和存储介质
CN112218020A (zh) * 2019-07-09 2021-01-12 海信视像科技股份有限公司 一种多声道平台音频数据传输方法及其装置
WO2021004045A1 (zh) * 2019-07-09 2021-01-14 海信视像科技股份有限公司 一种多声道平台音频数据传输方法及其装置、显示设备
WO2021147718A1 (zh) * 2020-01-20 2021-07-29 维沃移动通信有限公司 音频传输方法及电子设备
CN113192523A (zh) * 2020-01-13 2021-07-30 华为技术有限公司 一种音频编解码方法和音频编解码设备
CN113316941A (zh) * 2019-01-11 2021-08-27 博姆云360公司 声场保存音频通道求和

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0515128A (pt) * 2004-08-31 2008-07-08 Matsushita Electric Ind Co Ltd aparelho de geração de sinal estéreo e método de geração de sinal estéreo
BRPI0519454A2 (pt) * 2004-12-28 2009-01-27 Matsushita Electric Ind Co Ltd aparelho de codificaÇço reescalonÁvel e mÉtodo de codificaÇço reescalonÁvel
US8271872B2 (en) * 2005-01-05 2012-09-18 Apple Inc. Composite audio waveforms with precision alignment guides
CN101111887B (zh) * 2005-02-01 2011-06-29 松下电器产业株式会社 可扩展编码装置和可扩展编码方法
US20090319277A1 (en) * 2005-03-30 2009-12-24 Nokia Corporation Source Coding and/or Decoding
FR2891098B1 (fr) * 2005-09-16 2008-02-08 Thales Sa Procede et dispositif de mixage de flux audio numerique dans le domaine compresse.
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
US9515843B2 (en) * 2006-06-22 2016-12-06 Broadcom Corporation Method and system for link adaptive Ethernet communications
JP5134623B2 (ja) * 2006-07-07 2013-01-30 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 複数のパラメータ的に符号化された音源を合成するための概念
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US8655650B2 (en) 2007-03-28 2014-02-18 Harris Corporation Multiple stream decoder
US8392198B1 (en) * 2007-04-03 2013-03-05 Arizona Board Of Regents For And On Behalf Of Arizona State University Split-band speech compression based on loudness estimation
CN101925953B (zh) * 2008-01-25 2012-06-20 松下电器产业株式会社 编码装置、解码装置以及其方法
KR101452722B1 (ko) 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
BRPI0910792B1 (pt) 2008-07-11 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. "sintetizador de sinal de áudio e codificador de sinal de áudio"
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
WO2011048820A1 (ja) * 2009-10-23 2011-04-28 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
PL2596497T3 (pl) 2010-07-19 2014-10-31 Dolby Int Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
EP2702776B1 (en) * 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
US11308928B2 (en) 2014-09-25 2022-04-19 Sunhouse Technologies, Inc. Systems and methods for capturing and interpreting audio
EP3889954A1 (en) 2014-09-25 2021-10-06 Sunhouse Technologies, Inc. Method for extracting audio from sensors electrical signals
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US11140483B2 (en) 2019-03-05 2021-10-05 Maxim Integrated Products, Inc. Management of low frequency components of an audio signal at a mobile computing device
CN111654745B (zh) * 2020-06-08 2022-10-14 海信视像科技股份有限公司 多声道的信号处理方法及显示设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
KR100228688B1 (ko) * 1991-01-08 1999-11-01 쥬더 에드 에이. 다차원 음장용 인코우더/디코우더
ATE309644T1 (de) 1996-02-08 2005-11-15 Koninkl Philips Electronics Nv Mit 2-kanal- und 1-kanal-übertragung kompatible n-kanalübertragung
US5899969A (en) * 1997-10-17 1999-05-04 Dolby Laboratories Licensing Corporation Frame-based audio coding with gain-control words
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6765930B1 (en) * 1998-12-11 2004-07-20 Sony Corporation Decoding apparatus and method, and providing medium
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7447321B2 (en) * 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
CN100481733C (zh) * 2002-08-21 2009-04-22 广州广晟数码技术有限公司 用于对多声道数字音频信号进行压缩编码的编码器
CN100349207C (zh) * 2003-01-14 2007-11-14 北京阜国数字技术有限公司 高频耦合的伪小波5声道音频编/解码方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101662688B (zh) * 2008-08-13 2012-10-03 韩国电子通信研究院 音频信号的编码和解码方法及其装置
CN103854651A (zh) * 2009-12-16 2014-06-11 杜比国际公司 Sbr比特流参数缩混
US9508351B2 (en) 2009-12-16 2016-11-29 Dobly International AB SBR bitstream parameter downmix
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
TWI450266B (zh) * 2011-04-19 2014-08-21 Hon Hai Prec Ind Co Ltd 電子裝置及音頻資料的解碼方法
CN103188595A (zh) * 2011-12-31 2013-07-03 展讯通信(上海)有限公司 处理多声道音频信号的方法和系统
CN103188595B (zh) * 2011-12-31 2015-05-27 展讯通信(上海)有限公司 处理多声道音频信号的方法和系统
CN107004427B (zh) * 2014-12-12 2020-04-14 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
CN107004427A (zh) * 2014-12-12 2017-08-01 华为技术有限公司 增强多声道音频信号内语音分量的信号处理装置
CN109074812A (zh) * 2016-01-22 2018-12-21 弗劳恩霍夫应用研究促进协会 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法
US11842742B2 (en) 2016-01-22 2023-12-12 Fraunhofer-Gesellschaft zur Foerderung der angewandten Forschung V. Apparatus and method for MDCT M/S stereo with global ILD with improved mid/side decision
CN109074812B (zh) * 2016-01-22 2023-11-17 弗劳恩霍夫应用研究促进协会 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法
CN109155803A (zh) * 2016-08-26 2019-01-04 华为技术有限公司 音频数据处理方法、终端设备和存储介质
CN109155803B (zh) * 2016-08-26 2021-07-20 荣耀终端有限公司 音频数据处理方法、终端设备和存储介质
US11477591B2 (en) 2016-08-26 2022-10-18 Honor Device Co., Ltd. Audio data processing method, terminal device, and storage medium
CN113316941B (zh) * 2019-01-11 2022-07-26 博姆云360公司 声场保存音频通道求和
CN113316941A (zh) * 2019-01-11 2021-08-27 博姆云360公司 声场保存音频通道求和
CN112218020A (zh) * 2019-07-09 2021-01-12 海信视像科技股份有限公司 一种多声道平台音频数据传输方法及其装置
CN112218020B (zh) * 2019-07-09 2023-03-21 海信视像科技股份有限公司 一种多声道平台音频数据传输方法及其装置
WO2021004045A1 (zh) * 2019-07-09 2021-01-14 海信视像科技股份有限公司 一种多声道平台音频数据传输方法及其装置、显示设备
CN113192523A (zh) * 2020-01-13 2021-07-30 华为技术有限公司 一种音频编解码方法和音频编解码设备
WO2021147718A1 (zh) * 2020-01-20 2021-07-29 维沃移动通信有限公司 音频传输方法及电子设备

Also Published As

Publication number Publication date
CA2555182C (en) 2011-01-04
CA2555182A1 (en) 2005-10-06
RU2381571C2 (ru) 2010-02-10
JP4495209B2 (ja) 2010-06-30
WO2005093717A1 (en) 2005-10-06
US7899191B2 (en) 2011-03-01
BRPI0418665B1 (pt) 2018-08-28
ES2295837T3 (es) 2008-04-16
US20070208565A1 (en) 2007-09-06
AU2004317678B2 (en) 2009-02-05
AU2004317678C1 (en) 2009-09-24
AU2004317678A1 (en) 2005-10-06
WO2005093717A8 (en) 2006-04-13
ATE378677T1 (de) 2007-11-15
BRPI0418665A (pt) 2007-06-05
DE602004010188T2 (de) 2008-09-11
CN1926610B (zh) 2010-10-06
JP2007529031A (ja) 2007-10-18
RU2006131451A (ru) 2008-04-20
DE602004010188D1 (de) 2007-12-27
EP1723639B1 (en) 2007-11-14
EP1723639A1 (en) 2006-11-22

Similar Documents

Publication Publication Date Title
CN1926610A (zh) 基于编码的多声道音频信号合成单声道音频信号
JP6214160B2 (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
TWI544479B (zh) 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
CN1279512C (zh) 用于改善高频重建的方法和装置
CN1756086A (zh) 多通道音频数据编码/解码方法和设备
JP2008527439A (ja) オーディオ信号のスケーラブル符号化及び復号
CN1947172A (zh) 方法、装置、编码器设备、解码器设备以及音频系统
CN1922654A (zh) 音频分发系统、音频编码器、音频解码器及其操作方法
CN101055720A (zh) 对音频信号编码和解码的方法和设备
CN1942928A (zh) 音频信号编码
CN1816847A (zh) 保真度优化的可变帧长编码
CN1623185A (zh) 可伸缩音频编码的有效改进
CN1470050A (zh) 可感知地改善的编码声信号的增强
JPWO2007026763A1 (ja) ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
CN1252585C (zh) 编辑音频数据的方法和数字音频播放器
CN1525436A (zh) 可伸缩地编解码音频数据的方法和装置
CN1918632A (zh) 音频编码
CN1822508A (zh) 对数字信号进行编码和解码的方法和设备
CN1765153A (zh) 表示多信道信号的主和副信号的编码
CN105164749A (zh) 多声道音频的混合编码
CN1193344C (zh) 语音解码器和一种语音解码方法
CN1677493A (zh) 一种增强音频编解码装置及方法
JP2005241761A (ja) 通信装置及び信号符号化/復号化方法
US8271275B2 (en) Scalable encoding device, and scalable encoding method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160111

Address after: Espoo, Finland

Patentee after: NOKIA TECHNOLOGIES OY

Address before: Espoo, Finland

Patentee before: NOKIA Corp.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20101006