CN1647156A - 参数多声道音频表示 - Google Patents

参数多声道音频表示 Download PDF

Info

Publication number
CN1647156A
CN1647156A CNA038089777A CN03808977A CN1647156A CN 1647156 A CN1647156 A CN 1647156A CN A038089777 A CNA038089777 A CN A038089777A CN 03808977 A CN03808977 A CN 03808977A CN 1647156 A CN1647156 A CN 1647156A
Authority
CN
China
Prior art keywords
audio signal
information
channel audio
encoded
parameter group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038089777A
Other languages
English (en)
Other versions
CN1647156B (zh
Inventor
A·W·J·奥门
E·G·P·舒杰斯
D·J·布里巴尔特
S·L·J·D·E·范德帕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1647156A publication Critical patent/CN1647156A/zh
Application granted granted Critical
Publication of CN1647156B publication Critical patent/CN1647156B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

将多声道音频信号编码成单耳音频信号和能够实现多声道音频信号还原的信息,通过所述单耳信号和信息能够还原所述多声道音频信号。所述信息是通过针对所述多声道音频信号的第一频率范围来确定该信息的第一部分、针对所述多声道音频信号的第二频率范围来确定所述信息的第二部分而产生的。所述第二频率范围是所述第一频率范围的一部分,并且因此是所述第一频率范围的一个子范围。所述信息是多层信息,能够针对位速率调整解码质量。

Description

参数多声道音频表示
技术领域
本发明涉及一种对多声道音频信号进行编码的方法、一种用于对多声道音频信号进行编码的编码器、一种用于提供音频信号的设备、一种经编码的音频信号、一种其上存储有经编码的音频信号的存储介质、一种对经编码的音频信号进行解码的方法、一种用于对经编码的音频信号进行解码的解码器以及一种用于提供解码后的音频信号的设备。
背景技术
EP-A-1107232公开了一种参数编码方案,用于产生立体声音频信号表示,所述立体声音频信号由左声道信号和右声道信号构成。为了有效利用传输带宽,这种表示包含了仅与单耳信号相关的信息以及参数信息,所述单耳信号可以是左声道信号或右声道信号。可以在单耳信号和参数信息相结合的基础上还原其它立体声信号。参数信息包括立体声音频信号的定位提示,该定位提示包含左声道和右声道信号的强度和相位特征。
发明内容
本发明的目的在于提供一种参数多声道音频系统,其能够以可用的位速率来调整编码音频信号的质量或,以编码器的复杂度或有效传输带宽来调整编码音频信号的质量。
本发明的第一方面提供了一种如权利要求1所要求保护的编码多声道音频信号的方法。本发明的第二方面提供了一种如权利要求2所要求保护的编码多声道音频信号的方法。本发明的第三方面提供了一种如权利要求14所要求保护的编码多声道音频信号的编码器。本发明第四方面提供了一种如权利要求15所要求保护的编码多声道音频信号的编码器。本发明第五方面提供了一种如权利要求16所要求保护的提供音频信号的装置。本发明第六方面提供了一种如权利要求17所要求保护的编码音频信号。本发明第七方面提供了一种如权利要求18所要求保护的其上存储有编码信号的存储介质。本发明的第八方面提供了一种如权利要求19所要求保护的解码方法。本发明第九方面提供了一种如权利要求20所要求保护的用于解码上所编码音频信号的解码器。本发明第十方面提供了一种如权利要求21所要求保护的用于提供解码音频信号的装置。在从属权利要求中定义了有益的实施例。
在按照本发明第一方面的对多声道音频信号进行编码的方法中,产生一个单一声道信号。此外,从所述多声道音频信号中产生这样的信息:通过所述单一声道音频信号和所述信息能够实现以期望的音质等级对所述多声道音频信号进行还原。最好,所述信息包括参数组,例如,如从EP-A-1107232中所获知的参数组。
按照本发明的第一方面,所述信息是通过针对所述多声道音频信号的第一频率范围确定所述信息的第一部分,并且针对所述多声道音频信号的第二频率范围确定所述信息的第二部分而产生的。所述第二频率范围是所述第一频率范围的一部分并且因此是所述第一频率范围的子范围。现在,可以得到两种级别的解码音质。对于解码多声道音频信号的低质量等级而言,解码器使用的是经编码的单一声道音频信号和所述信息的第一部分。对于解码多声道音频信号的较高质量等级而言,解码器使用的是经编码的单一声道音频信号和所述信息的第一部分和第二部分。当然,如果存在大量各自与不同的频率范围相关的信息部分,也可以从大量的等级中选取解码音质。例如,所述第一部分可以包括单独一组在覆盖了多声道音频信号的全部带宽的频率范围内确定的参数。而第二部分可以包括多组参数,每组参数是针对全部带宽的子范围或部分而确定的。这些部分合在一起最好能够覆盖全部带宽。不过也存在其它多种可行的方案。例如,所述第一部分可以包括两组参数,第一组是针对覆盖了全部带宽的低端部分频率范围而确定的,而第二组参数是针对覆盖了全部带宽的其余部分的频率范围而确定的。所述第二部分可以包括针对全部带宽中的低端部分中的两个频率范围而确定的两组参数。并不要求针对全部带宽的低端的参数组的数量与针对高端的参数组的数量相等。
编码音频信号的这种表达使得解码音频信号的质量取决于解码器的复杂程度。例如,在简单的便携式解码器中,可以使用低复杂程度的解码器,该解码器的能耗较低,并且因此仅能够使用所述信息的一部分。在高端应用设备中,使用了复杂的解码器,这种解码器能够使用编码信号中所有的可用信息。
解码音频信号的质量还取决于可用的传送带宽。如果传送带宽较高,解码器就可以对所有的可用层进行解码,这是由于所有的可用层都可以得到传送。如果传送带宽较低,发送器可以决定仅发送有限数量的层。
按照本发明的第二方面,解码器会接收编码多声道音频信号的最大允许位速率。该最大允许位速率可以由传输信道(比如因特网)或者存储介质的可用位速率进行定义。在传输带宽时常变化并且因此最大允许位速率随时间变化的应用系统中,能够适应传输带宽的波动以防止解码音频信号质量过低是非常重要的。在正常情况下,编码器会对所有的层进行编码。在发送端,根据可用的信道能力决定发送哪些层。这也可以通过环路中的解码器来实现,不过在发送之前正确地除去某些层是件比较复杂的事情。
如果包括单一声道音频信号和信息的第一和第二部分的编码多声道音频信号的位速率不高于最大允许位速率的话,则本发明的编码器仅将用于多声道音频信号的第二频率范围的信息的第二部分加入到经编码的音频信号中。这样,如果传输带宽不足以支持第二部分的传送的话,第二部分将不会存在于经编码的音频信号中。
按照权利要求4中所限定的实施方式,所述信息包括多个参数组,所述信息的每个部分由一个或多个参数组表示。在所述信息的各部分中存在的参数组的数量取决于频率范围的数量。
按照权利要求6所限定的实施方式,所述参数组包括至少一个定位提示。
按照权利要求7所限定的实施方式,所述第一频率范围基本上覆盖了所述多声道音频信号的全部带宽。按照这种方式,一组参数足以提供将单一信道音频信号解码为多声道音频信号所需的基本信息。这样,保障了经解码的音频信号质量的基本等级。第二频率范围覆盖全部带宽的一部分。这样,当经编码的音频信号中存在第二部分时,该第二部分提高了这一频率范围内的解码音频信号质量。
按照权利要求8所限定的实施方式,所述信息的第二部分包括至少两个频率范围,它们合在一起基本上覆盖了多声道音频信号的全部带宽。这样,将会在整个带宽上表现出第二部分提供的质量提高。
按照权利要求9所限定的实施方式,包括单一声道音频信号和所述信息的第一部分的基本层总是存在于经编码的音频信号中。包括所述信息的第二部分的增强层仅当经编码音频信号的位速率不超过最大允许位速率的情况下才进行编码。这样,解码音频信号的音质将取决于最大允许位速率。如果最大允许位速率过低而无法包含增强层,将会从基本层获取解码音频信号,这样会产生比编码音频信号的不可预知部分无法到达解码器的情况下更好的解码音频信号质量。
按照权利要求10到12中任何一项所限定的实施方式,下一帧中的所述信息的备部分(通常包含多个参数组,每个参数组对应于所表达的每个频段)是在前一帧的参数的基础上进行编码的。按常理,这减小了经编码的所述信息的各部分的位速率,因为,由于相关性,两个连续帧中的信息基本上差别不大。
按照权利要求13所限定的实施方式,对两个连续帧的参数的差值进行编码,而非参数本身。
目前已经提出来用于降低立体声节目素材的位速率的音频解码器的解决方案包括强度立体声和M/S立体声。
按照强度立体声算法,高频(一般高于5kHz)由与时变和取决于频率的缩放因子或强度因子结合在一起的单一音频信号(即,单声道)表示,这能够对于这些频率范围实现可与原始立体声信号相比拟的解码音频信号的还原。按照M/S算法,将信号分解为一个和(或中间,或公共)信号和一个差(或边带,或非公共)信号。这一分解有时要与主分量分析或时变缩放因素结合起来进行。然后对这些信号独立地进行编码,这一编码是通过变换编码器或子带编码器[它们都是波形编码器]来进行的。通过这种算法实现的信息量减少强烈依赖于源信号的空间属性。例如,如果源信号是单声道的,那么差信号为零并且可以被丢弃。不过,如果左右音频信号的相关性很低(对于高频范围而言,这是经常发生的情况),这种方案仅仅能够实现很小的位速率降低。对于低频区域,M/S编码通常具有提供显著的优点。
近年来,音频信号的参数表达得到了关注,尤其是在音频编码领域。已经证明,表述音频信号的传送(量化)参数仅需要很小的输送能力,以在接收端再合成感觉上相等的信号。不过,当前的参数音频编码器重点放在了对单耳信号进行编码上,而立体声信号被当作双单声道信号来进行处理。
附图说明
通过下文中介绍的实施方式,本发明的这些和其它优点将会显而易见,并且将会参照下文中介绍的实施方式对本发明的这些和其它优点进行解释说明。
附图中:
图1表示用于立体声音频信号的多声道编码器的方框图,
图2表示用于立体声音频信号的多声道编码器的方框图,
图3示出了编码数据流的表示,
图4表示根据本发明的频率范围的实施方式,
图5表示根据本发明的频率范围的另一实施方式,
图6表示根据本发明的一个实施方式的基于前一帧内的参数确定参数组的过程,
图7表示一组参数,
图8表示基本层的参数的差分确定,和
图9表示与增强层的频率范围相应的参数的求差确定。
具体实施方式
图1示出了多声道编码器的方框图。编码器接收多声道音频信号,所述多声道音频信号图示为立体声信号RI、LI,编码器提供编码多声道音频信号EBS。
下混频器1将立体声信号或立体声通道信号RI、LI混频为单一声道音频信号(也称为单耳信号)SC。例如,下混频器1可以确定输入音频信号RI、LI的平均值。
编码器3对单耳信号SC进行编码,以获得经编码的单耳信号ESC。编码器3可以是已知种类的编码器,例如,MPEG编码器(MPEG-LII,MPEG-LIII(mp3),或MPEG2-AAC)。
参数确定电路2根据输入音频信号RI、LI来确定表征信息INF的参数组S1、S2......。根据需要,参数确定电路2接收最大允许位速率MBR,以仅仅确定参数组S1、S2......,这些参数组在由参数编码器4编码的时候,与编码的单耳信号ESC一起不超过该最大允许位速率MBR。经编码参数由EIN表示。
格式器5将经过编码的单耳信号SC与经过编码的参数EIN以一种期望的格式合成在一个数据流中,以获得经过编码的多声道音频信号EBS。
下面将针对一种实施方式借助实例对编码器的操作进行详细地说明。将多声道音频信号L1、R1编码在一个单一的单耳信号SC(此外也称为单一声道音频信号)中。由参数确定电路2执行多声道音频信号的LI、RI的空间属性的参数。这些参数包含如何从单耳信号SC中还原多声道音频信号LI、RI的信息。这些参数通常是在将它们与经编码的单一单耳信号ESC进行合成之前由参数编码器4加以编码的。这样,对于一般的音频编码应用而言,发送或存储的是仅与一个单耳音频信号合成在一起的这些参数。合成后的编码信号是经编码的多声道音频信号EBS。与单独地处理多个声道的音频编码器相比,发送或存储该经编码的多声道音频信号EBS所需的发送或存储能力得到了大幅降低。不过,借助含有参数(组)的信息INF,原始的空间感得到了保留。
特别是,多声道音频RI、LI的参数描述与一个双声道处理模块有关,该模块旨在描述双耳立体声听觉系统的有效信号处理。
该模块将输入音频LI、RI分成数个限带信号,这些限带信号最好是以ERB比例刻度线性隔开的。这些信号的带宽取决于中心频率,满足ERB比例。其次,最好,对于每个频率带宽,对输入信号的下述属性进行分析:
-耳间电平差,或ILD,由源于左耳和右耳的限带信号的相对电平定义,
-耳间时间(或相位)差ITD(或IPD),由与耳间交叉相关函数中的峰值对应的耳间延迟(或相移)定义,
-无法由ITD或ILD说明的波形的相似(相异)性,这可以借助最大耳间交叉相关IC来实现参数(例如,在最大峰值位置上的交叉相关值)。
这三个参数的组S1、S2......随时间变化,对于每个频带FR1、FR2......各有一个组。不过,由于双耳立体声听觉系统就其处理而言是非常缓慢的,故而这些属性的更新速度是相当低的(一般为几十毫秒)。
可以假设(缓慢的)时间变化参数是双耳立体声听觉系统可以利用的仅有的空间信号属性,并且通过这些与时间和频率相关的参数,所感觉到的听觉世界是借助更高级别的听觉系统进行重建的。
附图2表示一个多声道解码器的框图。该解码器接收经过编码的多声道音频信号EBS并且给出经过还原的解码多声道音频信号,后者被表示为立体声信号RO、LO。
去格式器6从数据流EBS中恢复经过编码的单耳信号ESC’和经过编码的参数EIN’。解码器7把经过编码的单耳信号ESC’解码为输出单耳信号SCO。解码器7可以是任何公知类型的解码器(当然需要与所使用的编码器相匹配),例如,解码器7是一个MPEG解码器。解码器8将经过编码的参数EIN’解码为输出参数INO。
解多路复用器9通过对输出单耳信号SCO应用输出参数INO的参数组S1、S2......来还原输出立体声音频信号LO和RO。
附图3表示经过编码的数据流的表述。例如,在每一帧F1、F2......中,数据包以报头H开始,其后紧随着经过编码的单耳信号ECS(现在由A表示)、编码信息EIN的第一部分P1、编码信息EIN的第二部分P2和编码信息EIN的第三部分P3。
如果帧F1、F2......仅包括报头H和经过编码的单耳信号ECS,那么将仅发送单耳信号SC。
如EP-A-1107232中所述,将存在输入音频信号的全频段划分为多个子频段,这些子频段的总体覆盖了全频段。按照本发明的术语,多声道信息INF编码在了多个参数组S1、S2...中,对应于每个子频段FR1、FR2...。这多个参数组S1、S2...被编码成编码信息EIN的第一部分P1。这样,要发送基本水平音质的多声道音频信号,位流要包括报头H、部分A(经过编码的单耳信号ESC)和第一部分P1。
在按照本发明的一种实施方式的位流中,第一部分P1可以仅由单组参数S1组成。该单组参数是针对整个带宽FR1确定的。这个位流包括报头H和部分A以及P1,该位流提供了音质的基本层,由附图3中的BL表示。
为了支持增强音质,在位流中还存在有编码信息EIN的附加部分P2、P3。这些附加部分构成了增强层EL。该位流可以包括单独一个附加部分P2或者多于一个的附加部分。该附加部分P2最好包括多个参数组S2、S3...,对应于每个子频段FR2、FR3...,这些子频段FR2、FR3...最好覆盖整个频段FR1。增强后的音质还可以以逐步的方式表现出来,第一增强等级是由包括第一部分的增强层EL1提供的。而第二增强层EL包括第一增强层EL1和第二增强层EL2,第二增强层EL2包括部分P3。
附加部分P2还可以包括一个与单个频段FR2对应的单个参数组S2,频段FR2是全频段FR1的一个子频段。附加部分P2也可以包括多个参数组S2、S3...,这些参数组对应于频段FR2、FR3...,这些频段合在一起没有覆盖整个全频段FR1。
附加部分P3最好包含与再分了至少附加部分P2的子频段之一的频段相应的参数组。
按照本发明的这种位流的格式使得在传送信道上,或者在解码器端,能够依据传送信道的位速率或者解码器的解码复杂程度,来调整解码音频信号的音质。例如,如果音频解码器应当具有较低的功耗,比如这一点在便携式应用设备中很重要,解码器可以具有较低的复杂程度并且仅使用部分H、A和P1。如果用户表示,他希望得到解码音频信号的更高的音质,那么解码器能够以较高的功耗进行更为复杂的操作,同样也是可行的。
还有可能编码器知道最大允许位速率MBR,该位速率可以通过传送信道传送,或者可以保存在存储介质上。现在,编码器能够决定多少个(如果有的话)附加部分P1、P2...能够与所述最大允许位速率MBR相符。编码器仅将这些允许的部分P1、P2...编码在位流中。
附图4表示按照本发明的频率范围的实施方式。按照这种实施方式,频段FR1等于多声道音频信号LI、RI的全部带宽FBW,而频带FR2是全部带宽FBW的子频带。
如果这些是用于确定参数组S1、S2...的仅有的频率范围,那么将会针对频带FR1确定参数组S1,并且该参数组S1存在于部分P1中,而且针对频带FR2确定参数组S2,并且该参数组S2存在于部分P2中。通过使用或者不使用部分P2,音质调整可以得到实现。
附图5表示按照本发明的频率范围的另一种实施方式。按照这一实施方式,频带FR1再次等于全部带宽FBW,并且子频带FR2和FR3一起覆盖了全部带宽FBW。或者换句话说,将频带FR1再分成了子频带FR2和FR3。
如果这些是用于确定参数组S1、S2...的仅有的频率范围,那么部分P1包括一个针对频带FR1确定的单个参数组S1,而部分P2包括两个分别针对频带FR2和FR3确定的参数组S2和S3。质量调整可以通过使用或不使用部分P2来实现。
附图6表示按照本发明的一种实施方式,基于在前帧中的参数来确定参数组的过程。
附图6表示一个数据流,该数据流在每个帧F1、F2...中包括编码信息EIN,该编码信息EIN包括部分P1和P2,其中P1是基本层BL的一部分,而P2形成了增强层EL。
在帧F1中,部分P1包括一个单个的参数组S1,该参数组S1是针对全部带宽FR1而确定的。部分P2,作为例子,包括四组参数S2、S3、S4和S5,它们分别是针对子频带FR2、FR3、FR4和FR5确定的。这四个子频段FR2、FR3、FR4和FR5再分了频带FR1。
在紧随帧F1之后的帧F2中,部分P1包括一个单个的参数组S1’,该参数组S1’是针对全部带宽FR1而确定的,并且是基本层BL’的一部分。部分P2包括四组参数S2’、S3’、S4’和S5’,它们分别是针对子频带FR2、FR3、FR4和FR5确定的,并且它们形成了增强层EL’。
可以为帧F1、F2...的每一个独立地对每个参数组S1、S2...进行编码。也可以相对于部分P1的参数而对部分P2的参数组进行编码。这由帧F1中始于S1终于S2到S5的箭头表示。当然这在其它帧F2...中也是可行的(未示出)。按照相同的方式,可以相对于S1对参数组S1’进行编码。最终,可以相对于参数组S2、S3、S4和S5对参数组S2’、S3’、S4’和S5’进行编码。
按照这种方式,编码信息EIN的位速率将会得到降低,固为使用了参数组之间的冗余性和相关性。
最好,将新的参数组S1’、S2’、S3’、S4’和S5’的新参数编码为它们的值与在前面的参数组S1、S2、S3、S4和S5的参数值之间的差值。
每隔一段有规律的时间间隔,至少要将参数组S1绝对地编码而不进行求差,以防止错误延续过长时间。
附图7表示一组参数。每个参数组Si可以包括一个或多个参数。一般来说这些参数是定位提示,这些定位提示给出了有关声音对象在音频信息中的定位的信息。一般来说,所述定位提示是耳间电平差ILD、耳间时间或相位差ITD或IPD和耳间交叉相关IC。有关这些参数的更加详细的信息在由Christof Faller等人在2002年5月10-13日于德国慕尼黑召开的第112届音响工程协会会议(AdioEngineering Society Convention)中递交的论文5574号《应用于立体声和多声道音频信号压缩的耳间提示编码(Binaural Cue CodingApplied to Stereo and Multi-channel Audio Compression)》中给出。
附图8表示基本层的参数的差值求算。横轴表示连续的帧F1到F5。纵轴表示基本层BL的参数组S1的参数值PVG。这个参数对于帧F1到F5分别具有值A1到A5。如果不对该参数的实际值A2到A5进行编码,而是对较小的差值D1、D2...进行编码,那么这个参数对编码信息EIN的位速率的影响将会得到降低。
附图9表示与增强层的频率范围相应的参数的差值求算。横轴代表两个连续的帧F1和F2。纵轴代表基本层BL和增强层EL的特定参数的值。在这个例子中,基本层BL包括信息INF的部分P1,具有针对全部频率范围FBW而确定的单个参数组,部分P1的特定参数对于帧F1具有值A1,而对于帧F2具有值A2。增强层EL包括信息INF的部分P2,该部分P2具有为三个单独的频率范围FR2、FR3和FR4而确定的三组参数,其中所述三个频率范围合在一起占满了全部频率范围FBW。这三个特定的参数(例如,代表ILD的参数)在帧F1中具有值B11、B12、B13,而在帧F2中具有值B21、B22、B23。
如果不是对特定参数的实际值B11到B23进行编码,而是对差值D11、D12...进行编码,这三个参数对编码信息EIN的位速率的影响将会降低,这是因为这些差值的编码效率要比实际值高。
为了进行总结,在按照本发明的优选实施方式中,建议如此组织立体声参数信息INF:基本层BL包含一组参数(最好是时间/电平差和相关性)S1,该参数组是针对多声道音频信号LI、RI的全部带宽FBW确定的。增强层EL包含多组参数S2、S3...,这些参数组对应于全部带宽FBW中的连续频率间隔FR2、FR3...。为了位速率效率,可以相对于基本层BL中的参数组S1对增强层EL中的参数组S2、S3...进行差分编码。
采用多层方式对信息INF进行编码,以使得解码音质对位速率的按比例调节成为可能。
为了得出结论,下面,将会结合程序代码及其解释对按照本发明的优选实施方式进行说明。
首先,对于帧F1、F2...中的所有的子帧(部分P1、P2...),确定用于单耳表达SC的数据ESC、用于全部带宽FBW的立体声参数组S1的数据EIN、和针对频率段(frequency bins)(或区域)FR2、FR3...的立体声参数S2、S3...。
左边给出的是程序代码,而在右边的说明下面给出了程序代码的解释。
代码                                   说明
{
    {
    for(f=0;f<nrof_frames;f++)    对于所有的帧进行:
     {
       example_mono_frame(f)          取得用于单耳信号表
                                      达的数据(附图3中的部
                                      分A)
example_stereo_extension_layer_1(f)   取得全部带宽立体声
                                      参数数据(部分P1)
 example_stereo_extension_layer2(f)   取得频率段立体声参
       }                              数数据(部分P2)
 }
其次,取决于位refresh_stereo的值,对全部带宽的立体声参数进行独立编码(对实际值进行编码),或者对与在前值的差值进行编码。下面的代码适用于耳间电平差ILD。
代码                                   说明example_stereo_extension_layer_1(f){
     refresh_stereo                   1位,指示是否对数
                                      据进行绝对编码
if(refresh_stereo=1)                 如果要对数据进行
{                                     绝对编码
     ild_global[f]                    对整个频率域(全
                                      局)的实际的耳间强度差
}                                     (ild)进行编码
else                                  如果不是刷新
{
     ild_global_diff[f]               相对于在前的帧对
}                                     ild进行编码}
再次,取决于位refresh_stereo的值,对所有频率段的立体声参数进行绝对编码(对实际值进行编码),或者对全部带宽的相应参数的差值进行编码。下面的代码适用于耳间电平差ILD。
代码                                   说明example_stereo_extension_layer_2(f){
    if(refresh_stereo=1)             如果刷新
{
      for(b=0;b<nrof_bins;b++)    针对所有的频率段
      {
       ild_bin[f,b]                  相对于全局值对该段
                                      中的ild进行编码
       }
}
else                                  如果不刷新
{
      for(b=0;b<nrof_bins;b++)    针对所有段
      {
      ild_bin_diff[f,b]              相对于在前一帧的该
     }                                段中的值对特定段中的ild
}                                     进行编码}
其中:
项目“refresh_stereo”是指示是否对立体声参数进行刷新的标志(0=FALSE,1=TRUE)。
项目“ild_global[sf]”表示针对帧f的整个频率域的ILD的霍夫曼编码绝对表示级。
项目“ild_global_diff[f]”表示针对帧f的整个频率域的ILD的霍夫曼编码相对表示级。
项目“ild_bin[f,b]”表示针对帧f和段b的ILD的霍夫曼编码绝对表示级。
项目“ild_bin_diff[f,b]”表示针对帧f和段b的ILD的霍夫曼编码相对表示级。
应当注意到,上面给出的实施方式是用于解释说明,而非限制本发明,并且本领域的技术人员将能够设计出许多其它的实施方式,而不会超出所附的权利要求书的范围。
虽然在附图中针对立体声信号对本发明进行了说明,但是本领域技术人员能够很容易地将其扩展到多于两个声道的音频信号上。
在权利要求书中,放置在括号中的任何附图标记都不应理解为是对权利要求的限定。词“包括”并不排除除了权利要求中所列的元件或步骤之外还存在其它的元件或步骤。本发明可以借助包括数个性质不同元件的硬件来实现,也可以借助适当编程的计算机来实现。在列举了数个装置的产品权利要求中,这些装置中的某一些可以由同一硬件来实现。在相互不同的从属权利要求中引用了某些手段这一表面现象并不表示这些手段的组合不能有益地使用。
总之,将多声道音频信号编码成了单耳音频信号和能够实现多声道音频信号还原的信息。所述信息是通过针对所述多声道音频信号的第一频率范围来确定该信息的第一部分、针对所述多声道音频信号的第二频率范围来确定所述信息的第二部分而产生的。所述第二频率范围是所述第一频率范围的一部分,并且固此是所述第一频率范围的一个子范围。所述信息是多层次的,能够实现根据位速率而对解码质量进行的按比例调整。

Claims (21)

1.一种对包括至少两个音频声道的多声道音频信号进行编码的方法,该方法包括:
产生一个单一声道音频信号,并且将该单一声道音频信号编码到位流中,作为经编码单一声道音频信号,
从所述至少两个音频声道中产生信息,通过所述单一声道音频信号和所述信息能够实现以期望的音质等级对所述多声道音频信号进行还原,所述信息的产生包括,
针对所述多声道音频信号的第一频率范围确定所述信息的第一部分,并且将所述信息的所述第一部分编码到位流中,作为经编码的信息的第一部分,和
针对所述多声道音频信号的第二频率范围确定所述信息的第二部分,所述第二频率范围是所述第一频率范围的一部分,并且将所述信息的所述第二部分编码到位流中,作为经编码的信息第二部分。
2.一种对包括至少两个音频声道的多声道音频信号进行编码的方法,该方法包括:
产生一个单一声道音频信号;
从所述至少两个音频声道中产生信息,通过所述单一声道音频信号和所述信息能够实现以期望的音质等级对所述多声道音频信号进行还原,所述信息的产生包括,
接收所述经编码的多声道音频信号的最大允许位速率,和
如果包括所述单一声道音频信号和所述信息的第一部分的经编码多声道音频信号的位速率不高于所述最大允许位速率,则仅针对所述多声道音频信号的第一频率范围确定所述信息的第一部分。
3.按照权利要求1或2所述的编码方法,其中所述单一声道音频信号是所述至少两个音频声道的特定组合。
4.按照权利要求1所述的编码方法,其特征在于,所述信息包括多个参数组,所述第一部分至少包括所述参数组的第一参数组,所述第二部分至少包括所述参数组的第二参数组,其中每个所述参数组与相应的频率范围相关。
5.按照权利要求4所述的编码方法,其特征在于,所述参数组包括至少一个定位提示。
6.按照权利要求5所述的编码方法,其特征在于,所述至少一个定位提示是从下述各项中选择出来的:耳间电平差、耳间时间或相位差或者耳间交叉相关。
7.按照权利要求1或2所述的编码方法,其特征在于,所述第一频率范围覆盖了所述多声道音频信号的全部带宽。
8.按照权利要求1所述的编码方法,其特征在于,所述第一频率范围基本上覆盖了所述多声道音频信号的全部带宽,所述第二频率范围覆盖了所述全部带宽的一部分,并且在于,所述信息的第二部分的确定适用于针对所述第二频率范围和一组附加频率范围来确定参数组,所述第二频率范围和所述一组附加频率范围基本上覆盖了全部带宽,其中在所述一组附加频率范围中包括至少一个附加频率范围。
9.按照权利要求8所述的编码方法,其特征在于,所述单一声道音频信号和所述信息的第一部分构成了信息的基本层,该基本层总是存在于所述经编码的多声道音频信号中,并且在于,所述方法包括接收所述经编码多声道音频信号的最大允许位速率,所述信息的第二部分构成了信息的增强层,该第二部分仅当经编码的基本层和增强层的位速率不高于所述最大允许位速率时才进行编码。
10.按照权利要求4所述的编码方法,其特征在于,经编码的信息的特定帧中的信息的第一部分的确定包括,确定所述特定帧中的参数组中的第一个参数组,并且根据在所述特定帧之前的帧的参数组中的第一个参数组对所述参数组中的第一个参数组进行编码。
11.按照权利要求8所述的编码方法,其特征在于,经编码的信息的特定帧中的信息的第二部分的确定包括,确定所述特定帧中的第二部分的参数组,并且根据在所述特定帧之前的帧的参数组对所述特定帧中的第二部分的参数组进行编码。
12.按照权利要求8所述的编码方法,其特征在于,经编码的信息的特定帧中的信息的第二部分的确定包括,确定所述特定帧中的第二部分的参数组,并且根据在所述特定帧之前的帧的参数组中的第一个参数组对所述特定帧中的第二部分的参数组进行编码。
13.按照权利要求10到12中任何一项所述的编码方法,其特征在于,所述确定包括,计算所述特定帧与在所述特定帧之前的帧中的相应参数之间的差值。
14.一种用于对包括至少两个音频声道的多声道音频信号进行编码的编码器,该编码器包括:
用于产生一个单一声道音频信号的装置,
用于从所述至少两个音频声道中产生信息的装置,通过所述单一声道音频信号和所述信息能够实现以期望的音质等级对所述多声道音频信号进行还原,所述信息的产生包括,
用于针对所述多声道音频信号的第一频率范围来确定所述信息的第一部分的装置,和
用于针对所述多声道音频信号的第二频率范围来确定所述信息的第二部分的装置,所述第二频率范围是所述第一频率范围的一部分。
15.一种用于对包括至少两个音频声道的多声道音频信号进行编码的编码器,该编码器包括:
用于产生一个单一声道音频信号的装置,
用于从所述至少两个音频声道中产生信息的装置,通过所述单一声道音频信号和所述信息能够实现以期望的音质等级对所述多声道音频信号进行还原,所述信息的产生包括,
用于接收经编码的多声道音频信号的最大允许位速率的装置,和
如果包括所述单一声道音频信号和所述信息的第一部分的经编码多声道音频信号的位速率不高于所述最大允许位速率,则仅针对所述多声道音频信号的第一频率范围来确定所述信息的第一部分的装置。
16.一种用于提供音频信号的设备,该设备包括:
一个用于接收音频信号的输入端,
一个如权利要求14或15所述的编码器,用于对所述音频信号进行编码,以获得经编码的音频信号,和
一个用于提供所述经编码的音频信号的输出端。
17.一种经编码的音频信号,包括
一个单一声道音频信号,
来自所述至少两个音频声道的信息,通过所述单一声道音频信号和所述信息能够实现以期望的音质等级对所述多声道音频信号进行还原,所述信息包括,
针对所述多声道音频信号的第一频率范围的、所述信息的第一部分,和
针对所述多声道音频信号的第二频率范围的、所述信息的第二部分,所述第二频率范围是所述第一频率范围的一部分。
18.一种存储介质,在该存储介质上存储着如权利要求17所述的经编码的音频信号。
19.一种对如权利要求17中所述的那样进行了编码的多声道音频信号进行解码的方法,该解码方法包括:
获得一个解码的单一声道音频信号,
从这样的信息中获取解码的信息:该信息使得通过所述经解码的单一声道音频信号和所述解码信息能够还原所述多声道音频信号,所述解码信息包括所述信息的第一部分和所述信息的第二部分,和
对所述单一声道音频信号应用所述信息的第一部分或者所述信息的第一部分和第二部分,以产生解码后的多声道音频信号。
20.一种用于对编码音频信号进行解码的解码器,该解码器包括:
用于获得一个解码的单一声道音频信号的装置,
用于从这样的信息中获取解码信息的装置:该信息使得通过所述被解码的单一声道音频信号和所述解码信息能够对所述多声道音频信号进行还原,所述解码信息包括所述信息的第一部分和所述信息的第二部分,和
用于对所述单一声道音频信号应用所述信息的第一部分或所述信息的第一部分和第二部分的装置,以产生解码的多声道音频信号。
21.一种用于提供解码的音频信号的设备,该设备包括:
一个用于接收编码音频信号的输入端,
一个如权利要求20中所述的解码器,用于对所述编码的音频信号进行解码,以获得多声道输出信号,和
一个用于提供或再现所述多声道输出信号的输出端。
CN038089777A 2002-04-22 2003-04-22 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备 Expired - Lifetime CN1647156B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP02076588.9 2002-04-22
EP02076588 2002-04-22
EP02077869.2 2002-07-16
EP02077869 2002-07-16
PCT/IB2003/001591 WO2003090207A1 (en) 2002-04-22 2003-04-22 Parametric multi-channel audio representation

Publications (2)

Publication Number Publication Date
CN1647156A true CN1647156A (zh) 2005-07-27
CN1647156B CN1647156B (zh) 2010-05-26

Family

ID=29252214

Family Applications (1)

Application Number Title Priority Date Filing Date
CN038089777A Expired - Lifetime CN1647156B (zh) 2002-04-22 2003-04-22 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备

Country Status (11)

Country Link
US (1) US8498422B2 (zh)
EP (1) EP1500083B1 (zh)
JP (1) JP4714415B2 (zh)
KR (1) KR101021079B1 (zh)
CN (1) CN1647156B (zh)
AT (1) ATE332003T1 (zh)
AU (1) AU2003216686A1 (zh)
BR (2) BR0304542A (zh)
DE (1) DE60306512T2 (zh)
ES (1) ES2268340T3 (zh)
WO (1) WO2003090207A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930741B (zh) * 2005-11-21 2012-04-04 三星电子株式会社 对多声道音频信号进行编码/解码的系统和方法
CN102165520B (zh) * 2008-09-25 2012-11-28 Lg电子株式会社 处理信号的方法和装置
CN103534753A (zh) * 2012-04-05 2014-01-22 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
CN104285253A (zh) * 2012-05-15 2015-01-14 杜比实验室特许公司 具有多个子流的多声道音频信号的有效编码和解码
WO2017193549A1 (zh) * 2016-05-10 2017-11-16 华为技术有限公司 多声道信号的编码方法和编码器
WO2017193550A1 (zh) * 2016-05-10 2017-11-16 华为技术有限公司 多声道信号的编码方法和编码器

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644001B2 (en) 2002-11-28 2010-01-05 Koninklijke Philips Electronics N.V. Differentially coding an audio signal
US20040264713A1 (en) * 2003-06-27 2004-12-30 Robert Grzesek Adaptive audio communication code
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JP2007528025A (ja) * 2004-02-17 2007-10-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
WO2006003891A1 (ja) * 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. 音声信号復号化装置及び音声信号符号化装置
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI393120B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
BRPI0514998A (pt) * 2004-08-26 2008-07-01 Matsushita Electric Ind Co Ltd equipamento de codificação de sinal de canal múltiplo e equipamento de decodificação de sinal de canal múltiplo
US7848931B2 (en) * 2004-08-27 2010-12-07 Panasonic Corporation Audio encoder
RU2007107348A (ru) * 2004-08-31 2008-09-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство и способ генерирования стереосигнала
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
KR101158709B1 (ko) * 2004-09-06 2012-06-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 강화
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
US7860721B2 (en) * 2004-09-17 2010-12-28 Panasonic Corporation Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US7945448B2 (en) * 2004-11-29 2011-05-17 National University Of Singapore Perception-aware low-power audio decoder for portable devices
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
JP5017121B2 (ja) * 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
JP5046652B2 (ja) * 2004-12-27 2012-10-10 パナソニック株式会社 音声符号化装置および音声符号化方法
WO2006070760A1 (ja) * 2004-12-28 2006-07-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
JP5046653B2 (ja) * 2004-12-28 2012-10-10 パナソニック株式会社 音声符号化装置および音声符号化方法
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
PL1839297T3 (pl) * 2005-01-11 2019-05-31 Koninklijke Philips Nv Skalowalne kodowanie/dekodowanie sygnałów audio
JP4887279B2 (ja) * 2005-02-01 2012-02-29 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
CN101124740B (zh) * 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送系统
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
WO2006104017A1 (ja) * 2005-03-25 2006-10-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
WO2007004831A1 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
JP5113050B2 (ja) 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法
CN101233571B (zh) * 2005-07-29 2012-12-05 Lg电子株式会社 处理音频信号的方法和装置
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
CN101253555B (zh) * 2005-09-01 2011-08-24 松下电器产业株式会社 多声道音频信号处理装置及多声道音频信号处理方法
CN101283400B (zh) 2005-10-05 2015-04-29 Lg电子株式会社 信号处理的方法和装置以及编码和解码方法及其装置
KR100857121B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
DE602006019762D1 (de) * 2005-11-04 2011-03-03 Univ Singapore Einrichtung und verfahren zum wiedergeben von audio-clips
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US20090018824A1 (en) * 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
ATE456261T1 (de) 2006-02-21 2010-02-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
JP5254808B2 (ja) 2006-02-23 2013-08-07 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
US8504376B2 (en) 2006-09-29 2013-08-06 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
CN101652810B (zh) * 2006-09-29 2012-04-11 Lg电子株式会社 用于处理混合信号的装置及其方法
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
EP2092516A4 (en) 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
CN101632117A (zh) 2006-12-07 2010-01-20 Lg电子株式会社 用于解码音频信号的方法和装置
JP5209637B2 (ja) 2006-12-07 2013-06-12 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
EP3145200A1 (en) 2007-01-12 2017-03-22 ActiveVideo Networks, Inc. Mpeg objects and systems and methods for using mpeg objects
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
KR101453732B1 (ko) 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
US8665914B2 (en) * 2008-03-14 2014-03-04 Nec Corporation Signal analysis/control system and method, signal control apparatus and method, and program
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
KR101414412B1 (ko) * 2008-05-09 2014-07-01 노키아 코포레이션 오디오 신호의 인코딩 장치, 오디오 신호의 디코딩 장치, 오디오 신호의 인코딩 방법, 스케일러블 인코딩 오디오 신호의 디코딩 방법, 인코더, 디코더, 전자기기 및 컴퓨터 판독가능한 기록 매체
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346379B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US7975063B2 (en) * 2009-05-10 2011-07-05 Vantrix Corporation Informative data streaming server
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9021541B2 (en) 2010-10-14 2015-04-28 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2477418B1 (en) * 2011-01-12 2014-06-04 Nxp B.V. Signal processing method
WO2012138660A2 (en) 2011-04-07 2012-10-11 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
KR101930907B1 (ko) * 2011-05-30 2019-03-12 삼성전자주식회사 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
EP2875510A4 (en) * 2012-07-19 2016-04-13 Nokia Technologies Oy STEREO AUDIO SIGNAL ENCODER
WO2014046916A1 (en) * 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
WO2014147441A1 (en) * 2013-03-20 2014-09-25 Nokia Corporation Audio signal encoder comprising a multi-channel parameter selector
US9326047B2 (en) 2013-06-06 2016-04-26 Activevideo Networks, Inc. Overlay rendering of user interface onto source video
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP3095117B1 (en) 2014-01-13 2018-08-22 Nokia Technologies Oy Multi-channel audio signal classifier
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10063612B2 (en) * 2016-09-30 2018-08-28 Amazon Technologies, Inc. Request-based encoding for streaming content portions

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH09274500A (ja) * 1996-04-09 1997-10-21 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化方法
EP0990368B1 (en) * 1997-05-08 2002-04-24 STMicroelectronics Asia Pacific Pte Ltd. Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003036619A1 (en) * 2001-10-19 2003-05-01 Koninklijke Philips Electronics N.V. Frequency-differential encoding of sinusoidal model parameters
WO2003038813A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
CN1308913C (zh) * 2002-04-11 2007-04-04 松下电器产业株式会社 编码设备、解码设备及其方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930741B (zh) * 2005-11-21 2012-04-04 三星电子株式会社 对多声道音频信号进行编码/解码的系统和方法
CN101930742B (zh) * 2005-11-21 2012-04-04 三星电子株式会社 对多声道音频信号进行编码/解码的系统和方法
CN102165520B (zh) * 2008-09-25 2012-11-28 Lg电子株式会社 处理信号的方法和装置
CN103534753A (zh) * 2012-04-05 2014-01-22 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
CN103534753B (zh) * 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
US9275646B2 (en) 2012-04-05 2016-03-01 Huawei Technologies Co., Ltd. Method for inter-channel difference estimation and spatial audio coding device
CN104285253A (zh) * 2012-05-15 2015-01-14 杜比实验室特许公司 具有多个子流的多声道音频信号的有效编码和解码
US9779738B2 (en) 2012-05-15 2017-10-03 Dolby Laboratories Licensing Corporation Efficient encoding and decoding of multi-channel audio signal with multiple substreams
WO2017193549A1 (zh) * 2016-05-10 2017-11-16 华为技术有限公司 多声道信号的编码方法和编码器
WO2017193550A1 (zh) * 2016-05-10 2017-11-16 华为技术有限公司 多声道信号的编码方法和编码器
CN107358961A (zh) * 2016-05-10 2017-11-17 华为技术有限公司 多声道信号的编码方法和编码器

Also Published As

Publication number Publication date
AU2003216686A1 (en) 2003-11-03
DE60306512T2 (de) 2007-06-21
KR20040102163A (ko) 2004-12-03
CN1647156B (zh) 2010-05-26
KR101021079B1 (ko) 2011-03-14
EP1500083A1 (en) 2005-01-26
US20050226426A1 (en) 2005-10-13
JP4714415B2 (ja) 2011-06-29
EP1500083B1 (en) 2006-06-28
BR0304542A (pt) 2004-07-20
JP2005523479A (ja) 2005-08-04
ATE332003T1 (de) 2006-07-15
ES2268340T3 (es) 2007-03-16
US8498422B2 (en) 2013-07-30
BRPI0304542B1 (pt) 2018-05-08
DE60306512D1 (de) 2006-08-10
WO2003090207A1 (en) 2003-10-30

Similar Documents

Publication Publication Date Title
CN1647156A (zh) 参数多声道音频表示
CN1669359A (zh) 音频编码
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
US7292901B2 (en) Hybrid multi-channel/cue coding/decoding of audio signals
CN1030129C (zh) 高效数字数据编码和译码装置
US7693721B2 (en) Hybrid multi-channel/cue coding/decoding of audio signals
CN1993733A (zh) 用于空间音频参数的有效编码的能量相关量化
CN101103393B (zh) 音频信号的可缩放编码/解码
CN1957640A (zh) 用于生成对低位速率应用的参数表示的方案
CN1816847A (zh) 保真度优化的可变帧长编码
CN102800321B (zh) 多对象音频信号的附加信息比特流产生方法和装置
CN1947172A (zh) 方法、装置、编码器设备、解码器设备以及音频系统
CN1922654A (zh) 音频分发系统、音频编码器、音频解码器及其操作方法
US20050195981A1 (en) Frequency-based coding of channels in parametric multi-channel coding systems
Herre et al. MPEG-4 high-efficiency AAC coding [standards in a nutshell]
CN1705980A (zh) 参数音频编码
CN1926610A (zh) 基于编码的多声道音频信号合成单声道音频信号
CN1575621A (zh) 把两频道矩阵编码音频重构为多频道音频的解码方法
CN1822508A (zh) 对数字信号进行编码和解码的方法和设备
CN1765153A (zh) 表示多信道信号的主和副信号的编码
CN1922655A (zh) 音频信号编码装置、音频信号解码装置、方法及程序
CN1281329A (zh) 定向解码
CN1276407C (zh) 立体声音频编码方法及装置,音频流解码方法及装置
CN102369573A (zh) 嵌入和提取辅助数据
CN1666572A (zh) 信号处理

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20100526