CN101553867A - 用于处理音频信号的方法和装置 - Google Patents

用于处理音频信号的方法和装置 Download PDF

Info

Publication number
CN101553867A
CN101553867A CNA2007800453936A CN200780045393A CN101553867A CN 101553867 A CN101553867 A CN 101553867A CN A2007800453936 A CNA2007800453936 A CN A2007800453936A CN 200780045393 A CN200780045393 A CN 200780045393A CN 101553867 A CN101553867 A CN 101553867A
Authority
CN
China
Prior art keywords
information
signal
multichannel
mixed
reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800453936A
Other languages
English (en)
Other versions
CN101553867B (zh
Inventor
吴贤午
郑亮源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101553867A publication Critical patent/CN101553867A/zh
Application granted granted Critical
Publication of CN101553867B publication Critical patent/CN101553867B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

本发明公开了一种用于处理音频信号的方法,其包括:接收缩减混合信号、对象信息和混合信息;利用对象信息和混合信息生成包括至少一个增益修改因数的多声道信息,其中增益修改因数对应于用于控制缩减混合信号的增益的时间子频带变异因数。

Description

用于处理音频信号的方法和装置
技术领域
本发明涉及用于处理音频信号的方法和装置,尤其涉及用于解码在数字介质上接收的音频信号等作为广播信号的方法和装置。
背景技术
在将若干音频对象缩减混合成单声道或立体声信号时,能够提取来自各个对象信号的参数。这些参数可在音频信号的解码器中使用,且各个源的复位/摇移(panning)可由用户的选择来控制。
发明内容
技术问题
然而,为了控制各个对象信号,必需适当地执行包括在缩减混合信号中的各个源的复位/摇移。
然而,对于就面向声道的解码方法(如MPEG环绕)而言的反向兼容性,对象参数必需被灵活地转换成扩展混合过程所需的多声道参数。
技术方案
因此,本发明涉及一种基本上消除了一个或多个由于有关技术的局限和缺点引起的问题的处理音频信号的方法和装置。
本发明的目的是提供一种用于不受限制地控制对象增益和摇移的处理音频信号的方法和装置。
本发明的目的是提供一种用于基于用户选择控制对象增益和摇移的处理音频信号的方法和装置。
本发明的其它优点、目的和特征将在以下的说明中部分地阐述,且在本领域技术人员分析以下内容后将部分地变得显然易见,或者可从本发明的实施中获知。本发明的目的和其它优点可由书面说明书及其权利要求书和附图中具体指出的结构来实现并获得。
有益效果
本发明提供以下的效果或优点。
首先,本发明能够提供一种用于不受限制地控制对象增益和摇移的处理音频信号的方法和装置。
其次,本发明能够提供一种用于基于用户选择控制对象增益和摇移的处理音频信号的方法和装置。
附图简述
包括于此以提供对本发明的进一步理解、并被结合在本申请中且构成其一部分的附图示出本发明的实施例,其与说明书一起用来解释本发明的原理。在附图中:
图1是解释基于回放配置和用户控制渲染缩减混合信号的基本概念的示例性框图。
图2是根据本发明的一个实施例的对应于第一方案的用于处理音频信号的装置的示例性框图。
图3是根据本发明的另一个实施例的对应于第一方案的用于处理音频信号的装置的示例性框图。
图4是根据本发明的一个实施例的对应于第二方案的用于处理音频信号的装置的示例性框图。
图5是根据本发明的另一个实施例的对应于第二方案的用于处理音频信号的装置的示例性框图。
图6是根据本发明的又一个实施例的对应于第二方案的用于处理音频信号的装置的示例性框图。
图7是根据本发明的一个实施例的对应于第三方案的用于处理音频信号的装置的示例性框图。
图8是根据本发明的另一个实施例的对应于第三方案的用于处理音频信号的装置的示例性框图。
图9是解释渲染单元的基本概念的示例性框图。
图10A至10C是图7所示的缩减混合处理单元的第一实施例的示例性框图。
图11是图7所示的缩减混合处理单元的第二实施例的示例性框图。
图12是图7所示的缩减混合处理单元的第三实施例的示例性框图。
图13是图7所示的缩减混合处理单元的第四实施例的示例性框图。
图14是根据本发明的第二实施例的经压缩音频信号的比特流结构的示例性框图。
图15是根据本发明的第二实施例的用于处理音频信号的装置的示例性框图。
图16是根据本发明的第三实施例的经压缩音频信号的比特流结构的示例性框图。
图17是根据本发明的第四实施例的用于处理音频信号的装置的示例性框图。
图18是解释可变类型对象的发送方案的示例性框图。
图19是根据本发明的第五实施例的用于处理音频信号的装置的示例性框图。
本发明的最佳实施方式
为了实现这些和其它优点并根据本发明的目的,如本文具体体现和广泛描述的,一种用于处理音频信号的方法,包括:接收缩减混合信号、对象信息和混合信息;利用对象信息和混合信息生成包括至少一个增益修改因数的多声道信息,其中增益修改因数对应于用于控制缩减混合信号的增益的时间子频带变异因数。
根据本发明,其中如果缩减混合信号对应于单声道信号,则执行生成多声道信息。
根据本发明,其中增益修改因数描述基于混合信息和对象信息估计的第一增益与基于对象信息估计的第二增益之比。
根据本发明,还包括利用包括增益修改因数的多声道信息生成多声道比特流。
根据本发明,还包括利用对象信息和混合信息生成缩减混合处理信息;以及利用缩减混合处理信息处理缩减混合信号,其中如果缩减混合信号对应于立体声信号,则缩减混合处理信息对应于用于控制对象摇移的信息。
根据本发明,其中混合信息是利用对象位置信息和回放配置信息中的至少一个生成的。
根据本发明,其中接收缩减混合信号作为广播信号。
根据本发明,其中在数字介质上接收缩减混合信号。
在本发明的另一个方面中,一种用于处理音频信号的方法,包括:接收对象信息和混合信息;利用对象信息和混合信息生成多声道信息;利用混合信息生成额外的多声道信息;以及发送多声道信息和额外的多声道信息,其中多声道信息对应于用于将缩减混合信号扩展混合成多声道信号的信息,且额外的多声道信息对应于用于修改多声道信号的信息。
根据本发明,其中额外的多声道信息包括用于双耳模式的HRTF信息。
根据本发明,其中HRTF信息描述一定时间处对象的虚拟位置。
根据本发明,其中HRTF信息是利用HRTF数据库生成的。
根据本发明,其中在同一子频带域中执行生成多声道信息和生成额外的多声道信息。
根据本发明,其中额外的多声道信息与多声道信息同步发送。
根据本发明,其中接收缩减混合信号作为广播信号。
根据本发明,其中在数字介质上接收缩减混合信号。
在本发明的另一个方面中,一种有指令存储于其上的计算机可读介质,所述指令在由处理器执行时使得所述处理器执行以下操作,包括:接收缩减混合信号、对象信息和混合信息;利用对象信息和混合信息生成包括至少一个增益修改因数的多声道信息,其中增益修改因数对应于用于控制缩减混合信号的增益的时间子频带变异因数。
在本发明的另一个方面中,一种有指令存储于其上的计算机可读介质,所述指令在由处理器执行时使得所述处理器执行以下操作,包括:接收对象信息和混合信息;利用对象信息和混合信息生成多声道信息;利用混合信息生成额外的多声道信息;以及发送多声道信息和额外的多声道信息,其中多声道信息对应于用于将缩减混合信号扩展混合成多声道信号的信息,且额外的多声道信息对应于用于修改多声道信号的信息。
在本发明的另一个方面中,一种用于处理音频信号的装置,包括:接收混合信息的用户界面;以及信息生成单元,其接收对象信息和混合信息,利用对象信息和混合信息生成包括至少一个增益修改因数的多声道信息,其中增益修改因数对应于用于控制缩减混合信号的增益的时间子频带变异因数。
在本发明的另一个方面中,一种用于处理音频信号的装置,包括:接收混合信息的用户界面;以及信息生成单元,其接收对象信息,利用对象信息和混合信息生成多声道信息,利用混合信息生成额外的多声道信息;并发送多声道信息和额外的多声道信息,其中多声道信息对应于用于将缩减混合信号扩展混合成多声道信号的信息,且额外的多声道信息对应于用于修改多声道信号的信息。
应理解,本发明的以上一般描述和以下详细描述是示例性和说明性的,并且旨在提供对如所要求保护的本发明的进一步解释。
本发明的实施方式
现在详细参考在附图中示出其示例的本发明的优选实施例。只要有可能,在所有附图中始终使用相同的附图标记表示相同或相似的部件。
在对本发明进行叙述之前,应当指出的是本发明中揭示的大多数术语对应于本领域内公知的一般术语,但某些术语是由本申请人根据需要选择的,并且将在本发明以下的描述中予以揭示。因此,由申请人定义的术语优选基于它们在本发明中的含义来理解。
具体地,在以下的描述中“参数”表示包括值、狭义参数、系数、元素等的信息。在下文中,术语“参数”将代替术语“信息”使用,如对象参数、混合参数、缩减混合处理参数等,这不会对本发明构成限制。
在缩减混合若干声道信号或对象信号时,可提取对象参数和空间参数。解码器可利用缩减混合信号和对象参数(或空间参数)生成输出信号。可由解码器基于回放配置和用户控制渲染输出信号。如下将参考图1详细解释渲染过程。
图1是解释基于回放配置和用户控制渲染缩减混合的基本概念的示例性框图。参照图1,解码器100可包括渲染信息生成单元110和渲染单元120,且还可包括渲染器110a和合成器120a来代替渲染信息生成单元110和渲染单元120。
可将渲染信息生成单元110配置成从编码器接收包括对象参数或空间参数的辅助信息,且还从设备设置或用户界面接收回放配置或用户控制。对象参数可对应于在缩减混合至少一个对象信号时提取的参数,且空间参数可对应于在缩减混合至少一个声道信号时提取的参数。此外,可将每个对象的类型信息和特性信息包括在辅助信息中。类型信息和特性信息可描述乐器名称、演奏者姓名等。回放配置可包括扬声器位置和周围环境信息(扬声器的虚拟位置),且用户控制可对应于由用户输入以便于控制对象位置和对象增益的控制信息,且还可对应于便于回放配置的控制信息。同时可将回放配置和用户控制表示为混合信息,这不会对本发明构成限制。
渲染信息生成单元110可被配置成利用混合信息(回放配置和用户控制)和所接收的辅助信息生成渲染信息。渲染单元120可被配置成在不发送音频信号的缩减混合(简称“缩减混合信号”)的情形中利用渲染信息生成多声道参数,并且在发送音频信号的缩减混合的情形中利用渲染信息和缩减混合生成多声道信号。
渲染器110a可被配置成利用混合信息(回放配置和用户控制)和所接收的辅助信息生成多声道信号。合成器120a可被配置成利用由渲染器110a生成的多声道信号合成多声道信号。
如上所述,解码器可基于回放配置和用户控制渲染缩减混合信号。同时,为了控制各个对象信号,解码器可接收对象参数作为辅助信息并基于所发送的对象参数来控制对象摇移和对象增益。
1.控制对象信号的增益和摇移
可提供用于控制各个对象信号的可变方法。首先,如果解码器接收对象参数并利用该对象参数生成各个对象信号,则解码器可基于混合信号(回放配置、对象电平等)控制各个对象信号。
其次,如果解码器生成将被输入到多声道解码器的多声道参数,则多声道解码器可利用该多声道参数对从编码器接收的缩减混合信号进行扩展混合。上述第二方法可被分成三类方案。具体地,可提供1)利用常规的多声道解码器,2)修改多声道解码器,3)在输入到多声道解码器之前处理音频信号的缩减混合。常规的多声道解码器可对应于面向声道的空间音频编码(例如MPEG环绕解码器),这不会对本发明构成限制。如下将解释三类方案的细节。
1.1利用多声道解码器
第一方案可在不修改多声道解码器的情况下按原样使用常规的多声道解码器。首先,将如下参考图2解释使用控制对象增益的ADG(任意缩减混合增益)的情形和使用控制对象摇移的5-2-5配置的情形。随后,将参考图3解释与场景再混合单元有关的情形。
图2是根据本发明的一个实施例的对应于第一方案的用于处理音频信号的装置的示例性框图。参照图2,用于处理音频信号的装置200(在下文中简称为“解码器200”)可包括信息生成单元210和多声道解码器230。信息生成单元210可接收来自编码器的包括对象参数的辅助信息和来自用户界面的混合信息,并可生成包括任意缩减混合增益或增益修改增益(在下文中简称为“ADG”)的多声道参数。ADG可描述基于混合信息和对象信息估计的第一增益与基于对象信息估计的第二增益的比。具体地,仅当缩减混合信号对应于单声道信号时,信息生成单元210可生成ADG。多声道解码器230可接收来自编码器的音频信号的缩减混合和来自信息生成单元210的多声道参数,并可利用缩减混合信号和多声道参数生成多声道输出。
多声道参数可包括声道电平差(在下文中简称为“CLD”)、声道间相关性(在下文中简称为“ICC”)、声道预测系数(在下文中简称为“CPC”)。
因为CLD、ICC和CPC描述两个声道之间的强度差或相关性,所以它将控制对象摇移和相关性。能够利用CLD、ICC等控制对象位置和对象扩散(响度)。同时,CLD描述相对电平差而不是绝对电平,且保存被分离的两个声道的能量。因此不能通过处理CLD等控制对象增益。换言之,不能通过使用CLD等减弱或提高特定对象的音量。
此外,ADG描述用于由用户控制校正因数的时间和频率相关增益。如果应用该校正因数,则能够在多声道扩展混合之前处理缩减混合信号的修改。因此,在从信息生成单元210接收ADG参数的情形中,多声道解码器230可利用ADG参数控制特定时间和频率的对象增益。
同时,以下的公式1可定义所接收的立体声缩减混合信号作为立体声声道输出的情形。
[公式1]
y[0]=w11·g0·x[0]+w12·g1·x[1]
y[1]=w21·g0·x[0]+w22·g1·x[1]
其中x[]是输入声道,y[]是输出声道,gx是增益,且wxx是权重。
有必要控制左声道和右声道之间的串音以便对象摇移。具体地,缩减混合信号的左声道的一部分可作为输出信号的右声道输出,缩减混合信号的右声道的一部分可作为输出信号的左声道输出。在公式1中,w12和w21可以是串音组分(换言之,交叉项)。
上述情况对应于2-2-2配置,其表示2-声道输入,2-声道传输和2-声道输出。为了执行2-2-2配置,可使用常规面向声道的空间音频编码(例如MPEG环绕)的5-2-5配置(2-声道输入、5-声道传输和2-声道输出)。首先,为了输出用于2-2-2配置的2声道,5-2-5配置的5个输出声道中的某些声道可被设置成停用声道(假声道)。为了给出2传输声道和2输出声道之间的串音,可调节上述CLD和CPC。简言之,利用上述ADG获得公式1中的增益因数gx,且利用CLD和CPC获得公式1中的加权因数w11~w22
在利用5-2-5配置实现2-2-2配置时,为了减少复杂性,可应用常规空间音频编码的默认模式。因为假定默认CLD的特性是输出2-声道,所以如果应用默认CLD则能够减少计算量。具体地,因为不需要合成假声道,所以能够大量减少计算量。因此,应用默认模式是适当的。具体地,仅3CLD(对应于MPEG环绕标准中的0、1和2)的默认CLD用于解码。另一方面,生成用于控制对象的左声道、右声道和中央声道中的4CLD(对应于MPEG环绕标准中的3、4、5和6)和2ADG(对应于MPEG环绕标准中的7和8)。在这种情形中,对应3和5的CLD描述左声道加右声道与中央声道之间的声道电平差((1+r)/c)适于设置成150dB(近似无穷大)以便减小中央声道。并且,为了实现串音,可执行基于能量的扩展混合或基于预测的扩展混合,它在TTT模式(MPEG环绕标准中的“bsTttModeLow”)对应于基于能量的模式(利用减法,实现矩阵兼容性)(第三模式)或预测模式(第一模式或第二模式)的情形中被调用。
图3是根据本发明的另一个实施例的对应于第一方案的用于处理音频信号的装置的示例性框图。参照图3,根据本发明的另一个实施例用于处理音频信号的装置300(在下文中简称为解码器300)可包括信息生成单元310、场景渲染单元320、多声道解码器330和场景再混合单元350。
信息生成单元310可被配置成在缩减混合信号对应于单声道信号时(即缩减混合声道的数目是“1”)从编码器接收包括对象参数的辅助信息,可从用户界面接收混合信息,并可利用辅助信息和混合信息生成多声道参数。可基于包括在辅助信息中的标志信息以及缩减混合信号本身和用户选择估计缩减混合声道的数目。信息生成单元310可具有与前面的信息生成单元210相同的配置。多声道参数被输入到多声道解码器330,该多声道解码器330可具有与前面的多声道解码器230相同的配置。
场景渲染单元320可被配置成在缩减混合信号对应于非单声道信号时(即缩减混合声道的数目大于“2”)从编码器接收包括对象参数的辅助信息,可从用户界面接收混合信息,并可利用辅助信息和混合信息生成再混合参数。再混合参数对应于便于再混合立体声声道并生成大于2声道输出的参数。将再混合参数输入到场景再混合渲染单元350。场景再混合单元350可被配置成在缩减混合信号是大于2声道信号时利用再混合参数再混合该缩减混合信号。
简言之,可将两种途径视为解码器300中的单独应用的单独实现。
1.2修改多声道解码器
第二方案可修改常规的多声道解码器。首先,如下参考图4解释使用控制对象增益的虚拟输出的情形和修改控制对象摇移的设备设置的情形。随后参考图5解释在多声道解码器中执行TBT(2x2)功能的情形。
图4是根据本发明的一个实施例的对应于第二方案的用于处理音频信号的装置的示例性框图。参照图4,根据本发明的一个实施例对应于第二方案的用于处理音频信号的装置400(在下文中简称为“解码器400”)可包括信息生成单元410、内部多声道合成器420和输出映射单元430。内部多声道合成器420和输出映射单元430可被包括在合成单元中。
信息生成单元410可被配置成接收来自编码器的包括对象参数的辅助信息和来自用户界面的混合参数。并且信息生成单元410可被配置成利用辅助信息和混合信息生成多声道参数和设备设置信息。多声道参数可具有与前面的多声道参数相同的配置。所以,在以下的描述中将省略多声道参数的细节。设备设置信息可对应于用于双耳处理的参数化HRTF,这将在“1.2.2使用设备设置信息”的描述中予以解释。
内部多声道合成器420可被配置成接收来自参数生成单元410的多声道参数和设备设置信息以及来自编码器的缩减混合信号。内部多声道合成器420可被配置成生成包括虚拟输出的临时多声道输出,这将在“1.2.1使用虚拟输出”的描述中予以解释。
1.2.1使用虚拟输出
因为多声道参数(例如CLD)可控制对象摇移,所以很难通过常规的多声道解码器控制对象增益以及对象摇移。
同时,为了对象增益,解码器400(尤其是内部多声道合成器420)可将对象的相对能量映射到虚拟声道(例如中央声道)。对象的相对能量对应于将减少的能量。例如,为了使特定对象静音,解码器400可将对象能量的99.9%以上映射到虚拟声道。然后,解码器400(尤其是输出映射单元430)不输出对象的剩余能量所映射至的虚拟声道。总之,如果对象的99.9%以上被映射到不被输出的虚拟声道,期望的对象可以几乎是静音的。
1.2.2使用设备设置信息
解码器400可调节设备设置信息以便控制对象摇移和对象增益。例如,解码器可被配置成生成在MPEG环绕标准中用于双耳处理的参数化HRTF。参数化HRTF可根据设备设置变化。能够假设可根据以下的公式2控制对象信号。
[公式2]
L=a1*obj1+a2*obj2+a3*obj3+..+an*objn
R=b1*obj1+b2*obj2+b3*obj3+..+bn*objn
其中objk是对象信号,L和R是期望的立体声信号,且ak和bk是用于对象控制的系数。
可由所发送的辅助信息中包括的对象参数估计出对象信号objk的对象信息。可根据混合信息估计出根据对象增益和对象摇移定义的系数ak、bk。可利用系数ak、bk调节期望的对象增益和对象摇移。
可将系数ak、bk设置成对应于用于双耳处理的HRTF参数,这将详细解释如下。
在MPEG环绕标准(5-1-51配置)(来自SO/IEC FDIS 23003-1:2006(E),信息技术-MPEG音频技术-第一部分:MPEG环绕)中,双耳处理如下。
[公式3]
y B n , k = y L B n , k y R B n , k = H 2 n , k y m n , k D ( y m n , k ) = h 11 n , k h 12 n , k h 21 n , k h 22 n , k y m n , k D ( y m n , k ) , 0 &le; k < K ,
其中yB是输出,矩阵H是用于双耳处理的转换矩阵。
[公式4]
H 1 l , m = h 11 l , m h 12 l , m h 21 l , m - ( h 22 l , m ) * , 0 &le; m < M Proc , 0 &le; l < L
矩阵H的元素定义如下:
[公式5]
h 11 l , m = &sigma; L l , m ( cos ( IPD B l , m / 2 ) + j sin ( IPD B l , m / 2 ) ) ( idd l , m + ICC B l , m ) d l , m ,
[公式6]
( &sigma; X l , m ) 2 = ( P X , C m ) 2 ( &sigma; C l , m ) 2 + ( P X , L m ) 2 ( &sigma; L l , m ) 2 + ( P X , Ls m ) 2 ( &sigma; Ls l , m ) 2 + ( P X , R m ) 2 ( &sigma; R l , m ) 2 + ( P X , Rs m ) 2 ( &sigma; Rs l , m ) 2 + . . .
P X , L m P X , R m &rho; L m &sigma; L l , m &sigma; R l , m ICC 3 l , m cos ( &phi; L m ) + . . .
P X , L m P X , R m &rho; R m &sigma; L l , m &sigma; R l , m ICC 3 l , m cos ( &phi; R m ) + . . .
P X , Ls m P X , Rs m &rho; Ls m &sigma; Ls l , m &sigma; Rs l , m ICC 2 l , m cos ( &phi; Ls m ) + . . .
P X , Ls m P X , Rs m &rho; Rs m &sigma; Ls l , m &sigma; Rs l , m ICC 2 l , m cos ( &phi; Rs m )
[公式7]
( &sigma; L l , m ) 2 = r 1 ( CLD 0 l , m ) r 1 ( CLD 1 l , m ) r 1 ( CLD 3 l , m )
( &sigma; R l , m ) 2 = r 1 ( CLD 0 l , m ) r 1 ( CLD 1 l , m ) r 2 ( CLD 3 l , m )
( &sigma; C l , m ) 2 = r 1 ( CLD 0 l , m ) r 2 ( CLD 1 l , m ) / g c 2
( &sigma; Ls l , m ) 2 = r 2 ( CLD 0 l , m ) r 1 ( CLD 2 l , m ) / g s 2
( &sigma; Rs l , m ) 2 = r 2 ( CLD 0 l , m ) r 2 ( CLD 2 l , m ) / g s 2
其中 r 1 ( CLD ) = 10 CLD / 10 1 + 10 CLD / 10 以及 r 2 ( CLD ) = 1 1 + 10 CLD / 10 .
1.2.3在多声道解码器中执行TBT(2x2)功能
图5是根据本发明的另一个实施例的对应于第二方案的用于处理音频信号的装置的示例性框图。图5是多声道解码器中的TBT功能的示例性框图。参照图5,TBT模块510可被配置成接收输入信号和TBT控制信息并生成输出信号。TBT模块510可被包括在图2的解码器200中(或者,具体的是多声道解码器230)。多声道解码器230可根据MPEG环绕标准来实现,这不会对本发明构成限制。
[公式9]
y = y 1 y 2 = w 11 w 12 w 21 w 22 x 1 x 2 = Wx
其中x是输入声道,y是输出声道,且w是权重。
输出y1可对应于缩减混合的输入x1乘以第一增益w11与输入x2乘以第二增益w12的合并。
在TBT模块510中输入的TBT控制信息包括可构成权重w(w11、w12、w21、w22)的元素。
在MPEG环绕标准中,OTT(一至二)模块和TTT(二至三)模块不适合再混合输入信号,尽管OTT模块和TTT模块可扩展混合输入信号。
为了再混合输入信号,可提供TBT(2x2)模块510(在下文中简称为“TBT模块510”)。可将TBT模块510描绘成接收立体声信号并输出再混合立体声信号。可利用CLD(多个CLD)和ICC(多个ICC)构造权重w。
如果权重项w11~w22作为TBT控制信息发送,则解码器可利用所接收的权重项控制对象增益以及对象摇移。在发送权重项w时,可提供可变方案。首先,TBT控制信息包括类似w12和w21的交叉项。第二,TBT控制信息不包括类似w12和w21的交叉项。第三,作为TBT控制信息的项数自适应地改变。
首先,需要接收类似w12和w21的交叉项,以便在输入声道的左信号进入输出声道的右侧时控制对象摇移。在N个输入声道和M个输出声道的情形中,数目为NxM的项可作为TBT控制信息发送。可基于MPEG环绕中介绍的CLD参数量化表来量化这些项,这不会对本发明构成限制。
第二,除非左对象移位到右位置(即当左对象移动到更左位置或与中央位置相邻的左位置时,或当仅对象电平被调节时),否则不需要使用交叉项。在这种情形中,发送除交叉项以外的项是适当的。在N个输入声道和M个输出声道的情形中,可发送数目仅为N的项。
第三,TBT控制信息的数目根据交叉项的需要自适应地改变,以便减少TBT控制信息的比特率。指示是否存在交叉项的标志信息“交叉_标志”被设置成作为TBT控制信息发送。标志信息“交叉_标志”的含义在以下的表1中示出。
[表1]交叉_标志的含义
  交叉_标志   含义
  0   无交叉项(仅包括非交叉项)(仅存在w11和w22)
  1   包括交叉项(存在w11、w12、w21和w22)
在“交叉_标志”等于0的情形中,TBT控制信息不包括交叉项,仅存在类似w11和w22的非交叉项。否则(“交叉_标志”等于1),TBT控制信息包括交叉项。
此外,指示存在交叉项还是存在非交叉项的标志信息“逆_标志”被设置成作为TBT控制信息发送。标志信息“逆_标志”的含义在以下的表2中示出。
[表2]逆_标志的含义
  逆_标志   含义
  0   无交叉项(仅包括非交叉项)(仅存在w11和w22)
  1   仅有交叉项(仅存在w12和w21)
在“逆_标志”等于0的情形中,TBT控制信息不包括交叉项,仅存在类似w11和w22的非交叉项。否则(“逆_标志”等于1),TBT控制信息仅包括交叉项。
此外,指示存在交叉项还是存在非交叉项的标志信息“辅助_标志”被设置成作为TBT控制信息发送。标志信息“辅助_标志”的含义在以下的表3中示出。
[表3]辅助_配置的含义
  辅助_配置   含义
  0   无交叉项(仅包括非交叉项)(仅存在w11和w22)
  1   包括交叉项(存在w11、w12、w21和w22)
  2   逆(仅存在w12和w21)
因为表3对应于表1和表2的合并,所以略去表3的细节。
1.2.4通过修改双耳解码器来在多声道解码器中执行TBT(2x2)功能
可在不修改双耳解码器的情况下执行“1.2.2使用设备设置信息”的情形。在下文中,参考图6,通过修改MPEG环绕解码器中采用的双耳解码器执行TBT功能。
图6是根据本发明的又一个实施例的对应于第二方案的用于处理音频信号的装置的示例性框图。具体地,用于处理图6所示的音频信号630的装置可对应于图2的多声道解码器230或图4的合成单元中所包括的双耳解码器,这不会对本发明构成限制。
用于处理音频信号630的装置(在下文中是“双耳解码器630”)可包括QMF分析器632、参数转换器634、空间合成器636和QMF合成器638。双耳解码器630的元件可具有与MPEG环绕标准中的MPEG环绕双耳解码器相同的配置。例如,可根据以下的公式10将空间合成器636配置成包括1个2x2(滤波器)矩阵。
[公式10]
y B n , k = y L B n , k y R B n , k = &Sigma; i = 0 N q - 1 H 2 n - i , k y 0 n - i , k = &Sigma; i = 0 N q - 1 h 11 n - i , k h 12 n - i , k h 21 n - i , k h 22 n - i , k y L 0 n - i , k y R 0 n - i , k , 0 &le; k < K
其中y0是QMF域输入声道且yB是双耳输出声道,k表示混合QMF声道索引,且i是HRTF滤波器抽头索引,且n是QMF槽索引(slot index)。双耳解码器630可被配置成执行子目“1.2.2使用设备设置信息”中描述的上述功能。然而,可利用多声道参数和混合信息而不是多声道参数和HRTF参数生成元素hij。在这种情形中,双耳解码器600可执行图5中TBT模块510的功能。将略去双耳解码器630的元件的细节。
双耳解码器630可根据标志信息“双耳_标志”来操作。具体地,在标志信息双耳_标志为0的情形中可跳过双耳解码器630,否则(双耳_标志是“1”),双耳解码器630可如下操作。
[表4]双耳_标志的含义
  双耳_标志   含义
  0   不是双耳模式(停用双耳解码器)
  1   双耳模式(激活双耳解码器)
1.3在输入到多声道解码器之前处理音频信号的缩减混合
已经在子目“1.1”中解释了使用常规多声道解码器的第一方案,已经在子目“1.2”中解释了修改多声道解码器的第二方案。以下将解释在输入到多声道解码器之前处理音频信号的缩减混合的第三方案。
图7是根据本发明的一个实施例的对应于第三方案的用于处理音频信号的装置的示例性框图。图8是根据本发明的另一个实施例的对应于第三方案的用于处理音频信号的装置的示例性框图。首先,参照图7,用于处理音频信号的装置700(在下文中简称为“解码器700”)可包括信息生成单元710、缩减混合处理单元720和多声道解码器730。参照图8,用于处理音频信号的装置800(在下文中简称为“解码器800”)可包括信息生成单元810和具有多声道解码器830的多声道合成单元840。解码器800可以是解码器700的另一方面。换言之,信息生成单元810具有与信息生成单元710相同的配置,多声道解码器830具有与多声道解码器730相同的配置,且多声道合成单元840可具有与缩减混合处理单元720和多声道单元730相同的配置。因此,将详细解释解码器700的元件,但将略去解码器800的元件的细节。
信息生成单元710可被配置成接收来自编码器的包括对象参数的辅助信息和来自用户界面的混合信息,并生成将被输出到多声道解码器730的多声道参数。根据这一观点,信息生成单元710具有与前面图2的信息生成单元210相同的配置。缩减混合处理参数可对应于用于控制对象增益和对象摇移的参数。例如,在对象信号位于左声道和右声道两个声道处的情形中能够改变对象位置或对象增益。在对象信号仅位于左声道和右声道之一的情形中,还能够渲染位于相反位置处的对象信号。为了履行这些情形,缩减混合处理单元720可以是TBT模块(2x2矩阵运算)。在信息生成单元710可被配置成生成参考图2描述的ADG以便控制对象增益的情形中,缩减混合处理参数可包括用于控制对象摇移而非对象增益的参数。
此外,信息生成单元710可被配置成从HRTF数据库接收HRTF信息,并生成将被输入到多声道解码器730的包括HRTF参数的额外多声道参数。在这种情形中,信息生成单元710可生成在同一子频带域中的多声道参数和额外的多声道参数,并相互同步地发送到多声道解码器730。将在子目“3.处理双耳模式”中解释包括HRTF参数的额外多声道参数。
缩减混合处理单元720可被配置成接收来自编码器的音频信号的缩减混合和来自信息生成单元710的缩减混合处理参数,并利用子频带分析滤波器组分解子频带域信号。缩减混合处理单元720可被配置成利用缩减混合信号和缩减混合处理参数生成经处理的缩减混合信号。在这些处理中,能够预处理缩减混合信号以便控制对象摇移和对象增益。经处理的缩减混合信号可被输入到多声道解码器730以进行扩展混合。
此外,经处理的缩减混合信号还可经由扬声器输出和回放。为了经由扬声器直接输出经处理的信号,缩减混合处理单元720可利用经预处理的子频带域信号执行合成滤波器组并输出时域PCM信号。能够通过用户选择来选择直接作为PCM信号输出还是输入到多声道解码器。
多声道解码器730可被配置成利用经处理的缩减混合和多声道参数生成多声道输出信号。当经处理的缩减混合信号和多声道参数被输入到多声道解码器730中时,多声道解码器730可引入延迟。经处理的缩减混合信号可在频域中合成(例如QMF域、混合QMF域等),且多声道参数可在时域中合成。在MPEG环绕标准中,引入用于连接HE-AAC的延迟和同步。因此,多声道解码器730可根据MPEG环绕标准引入延迟。
将参考图9至图13解释缩减混合处理单元720的配置。
1.3.1缩减混合处理单元的一般情形和特殊情形
图9是解释渲染单元的基本概念的示例性框图。参照图9,渲染模块900可被配置成利用N个输入信号、回放配置和用户控制生成M个输出信号。N个输入信号可对应于对象信号或声道信号。此外,N个输入信号可对应于对象参数或多声道参数。渲染模块900的配置可在图7的缩减混合处理单元720、前面图1的渲染单元120和前面图1的渲染器110a之一中实现,这不会对本发明构成限制。
如果渲染模块900可被配置成利用N个对象信号直接生成M个声道信号而不将对应特定声道的各个对象信号求和,则渲染模块900的配置可被表示为以下的公式11。
[公式11]
C=RO
Figure A20078004539300211
Ci是第i个声道信号,Oj是第j个输入信号,且Rji是将第j个输入信号映射到第i个声道的矩阵。
如果将R矩阵分成能量分量E和解相关分量,则公式11可表示如下。
[公式12]
C=RO=EO+DO
Figure A20078004539300212
能够利用能量分量E控制对象位置,并且能够利用解相关分量D控制对象扩散。
假设仅第i个输入信号被输入以经由第j声道和第k声道输出,则公式12可被表示如下。
[公式13]
Cjk_i=RiOi
C j _ i C k _ i = &alpha; j _ i cos ( &theta; j _ i ) &alpha; j _ i sin ( &theta; j _ i ) &beta; k _ i cos ( &theta; k _ i ) &beta; k _ i sin ( &theta; k - i ) o i D ( o i )
αj_i是映射到第j声道的增益部分,βk_i是映射到第k声道的增益部分,θ是扩散电平,且D(oi)是解相关输出。
假设解相关被略去,则可将公式13简化如下。
[公式14]
Cjk_i=RiOi
C j _ i C k _ i = &alpha; j _ i cos ( &theta; j _ i ) &beta; k _ i cos ( &theta; k - i ) o i
如果根据上述方法估计映射到特定声道的所有输入的权重值,则能够通过以下方法获得每个声道的权重值。
1)对映射到特定声道的所有输入的权重值求和。例如,在输入1O1和输入2O2被输入且输入声道对应于左声道L、中央声道C和右声道R的情形中,可获得总权重值αL(tot)、αC(tot)、αR(tot)如下:
[公式15]
αL(tot)=αL1
αC(tot)=αC1C2
αR(tot)=αR2
其中αL1是映射到左声道L的输入1的权重值,αC1是映射到中央声道C的输入1的权重值,αC2是映射到中央声道C的输入2的权重值,而αR2是映射到右声道R的输入2的权重值。
在这种情形中,仅输入1被映射到左声道,仅输入2被映射到右声道,输入1和2被一起映射到中央声道。
2)对映射到特定声道的所有输入的权重值求和,然后将该和分到最优势声道对,并将经解相关信号映射到其它声道用于环绕效果。在这种情形中,在特定输入置于左和中央之间的点的情形中优势声道对可对应于左声道和中央声道。
3)估计最优势声道的权重值,将经衰减相关信号给予其它声道,该值是经估计权重值的相对值。
4)使用每个声道对的权重值,适当地组合经解相关信号,然后设置成每个声道的辅助信息。
1.3.2缩减混合处理单元包括对应于2x4矩阵的混合部件的情形
图10A至10C是图7所示的缩减混合处理单元的第一实施例的示例性框图。如上所述,缩减混合处理单元720a的第一实施例(在下文中简称为“缩减混合处理单元720a”)可以是渲染模块900的实现。
首先,假设D11=D21=aD且D12=D22=bD,公式12被简化如下。
[公式15]
C 1 C 2 = E 11 E 12 E 12 E 22 O 1 O 2 + aD aD bD bD O 1 O 2
根据公式15的缩减混合处理单元在图10A中示出。参照图10A,缩减混合处理单元720a可被配置成在单声道信号(m)的情形中绕过输入信号,并在立体声输入信号(L、R)的情形中处理输入信号。缩减混合处理单元720a可包括解相关部件722a和混合部件724a。解相关部件722a具有解相关器aD和解相关器bD,它们可被配置成解相关输入信号。解相关部件722a可对应于2x2矩阵。混合部件724a可被配置成将输入信号和经解相关信号映射到各个声道。混合部件724a可对应于2x4矩阵。
第二,假设D11=aD1、D21=bD1、D12=cD2且D22=dD2,则公式12简化如下。
[公式15-2]
C 1 C 2 = E 11 E 12 E 12 E 22 O 1 O 2 + aD 1 bD 1 cD 2 dD 2 O 1 O 2
根据公式15的缩减混合处理单元在图10B中示出。参照图10B,包括两个解相关器D1、D2的解相关部件722’可被配置成生成解相关信号D1(a*O1+b*O2)、D2(c*O1+d*O2)。
第三,假设D11=D1、D21=0、D12=0且D22=D2,则公式12简化如下。
[公式15-3]
C 1 C 2 = E 11 E 12 E 12 E 22 O 1 O 2 + D 1 0 0 D 2 O 1 O 2
根据公式15的缩减混合处理单元在图10C中示出。参照图10C,包括两个解相关器D1、D2的解相关部件722”可被配置成生成经解相关信号D1(O1)、D2(O2)。
1.3.2缩减混合处理单元包括对应于2x3矩阵的混合部件的情形
可将以上的公式15表示如下。
[公式16]
C 1 C 2 = E 11 E 21 E 12 E 22 O 1 O 2 + aD ( O 1 + O 2 ) bD ( O 1 + O 2 )
= E 11 E 21 &alpha; E 12 E 22 &beta; O 1 O 2 D ( O 1 + O 2 )
矩阵R是2x3矩阵,矩阵O是3x1矩阵,且C是2x1矩阵。
图11是图7所示的缩减混合处理单元的第二实施例的示例性框图。如上所述,缩减混合处理单元720b的第二实施例(在下文中简称为“缩减混合处理单元720b”)可以是类似于缩减混合处理单元720a的渲染模块900的实现。参照图11,缩减混合处理单元720b可被配置成在单声道输入信号(m)的情形中跳过输入信号,并在立体声输入信号(L、R)的情形中处理输入信号。缩减混合处理单元720b可包括解相关部件722b和混合部件724b。解相关部件722b具有解相关器D,其可被配置成解相关输入信号O1、O2并输出经解相关信号D(O1+O2)。解相关部件722b可对应于1x2矩阵。混合部件724b可被配置成将输入信号和经解相关信号映射到各个声道。混合部件724b可对应于2x3矩阵,其在公式6中可被示为矩阵R。
此外,解相关部件722b可被配置成将差信号O1-O2解相关为两个输入信号O1、O2的共用信号。混合部件724b可被配置成将输入信号和经解相关共用信号映射到各个声道。
1.3.3缩减混合处理单元包括具有若干矩阵的混合部件的情形
某些对象信号可以是可听成像不位于一特定位置的任意位置的类似印象,其可被称为“空间声音信号”。例如,音乐厅的掌声或噪声可以是空间声音信号的一个例子。空间声音信号需要经由所有的扬声器回放。如果空间声音信号经由所有的扬声器回放为同一信号,则由于高的信号间相关性(IC)很难感受到信号的空间性。因此,需要将相关信号添加到每个声道信号的信号。
图12是图7所示的缩减混合处理单元的第三实施例的示例性框图。参照图12,缩减混合处理单元720c的第三实施例(在下文中简称为“缩减混合处理单元720c”)可被配置成利用输入信号Oi生成空间声音信号,其可包括带有N个解相关器的解相关单元722c和混合部件724c。解相关部件722c可具有N个解相关器D1、D2、...、DN,这些解相关器可被配置成对输入信号Oi进行解相关。混合部件724c可具有N个矩阵Rj、Rk、...、R1,这些矩阵可被配置成利用输入信号Oi和经解相关信号DX(Oi)生成输出信号Cj、Ck、...、C1。矩阵Rj可表示为如下公式。
[公式17]
Cj_i=RjOi
C j _ i = &alpha; j _ i cos ( &theta; j _ i ) &alpha; j _ i sin ( &theta; j _ i ) o i Dx ( o i )
Oi是第i输入信号,Rj是将第i输入信号Oi映射到第j声道的矩阵,以及是Cj_i是第j输出信号。值θj_i是解相关率。
可基于多声道参数中所包括的ICC估计值θj_i。此外,混合部件724c可基于经由信息生成单元710从用户界面接收的构成解相关率θj_i的空间信息生成输出信号,这不对本发明构成限制。
解相关器的数目(N)可等于输出声道的数目。另一方面,经解相关信号可被添加到由用户选择的输出声道。例如,能够将特定空间声音信号置于左、右和中央,并经由左声道扬声器作为空间声音信号输出。
1.3.4缩减混合处理单元包括另一个缩减混合部件的情形
图13是图7所示的缩减混合处理单元的第四实施例的示例性框图。如果输入信号对应于单声道信号(m),则可将缩减混合处理单元720d的第四实施例(在下文中简称为“缩减混合处理单元720d”)配置成绕过。缩减混合处理单元720d包括另一个缩减混合部件722d,其可被配置成在输入信号对应于立体声信号时将立体声信号缩减混合成单声道信号。另一个经缩减混合的单声道(m)用作多声道解码器730的输入。多声道解码器730可通过使用单声道输入信号来控制对象摇移(尤其是串音)。在这种情形中,信息生成单元710可基于MPEG环绕标准的5-1-51配置生成多声道参数。
此外,如果应用类似上述图2的艺术缩减混合增益ADG的单声道缩减混合信号的增益,则能够更容易地控制对象摇移和对象增益。ADG可由信息生成单元710基于混合信息生成。
2.扩展混合声道信号并控制对象信号
图14是根据本发明的第二实施例的经压缩音频信号的比特流结构的示例性框图。图15是根据本发明的第二实施例的用于处理音频信号的装置的示例性框图。参照图14的(a),缩减混合信号α、多声道参数β和对象参数γ被包括在比特流结构中。多声道参数β是用于对缩减混合信号进行扩展混合的参数。另一方面,对象参数γ是用于控制对象摇移和对象增益的参数。参照图14的(b),缩减混合信号α、默认参数β’和对象参数γ被包括在比特流结构中。默认参数β’可包括用于控制对象增益和对象摇移的预设信息。预设信息可对应于由编码器侧的制作者建议的例子。例如,预设信息可描述吉他信号位于左和中央之间的点,且吉他电平被设置成特定音量,此时输出声道的数目被设置成特定声道。每个帧或特定帧的默认参数可存在于比特流中。指示用于该帧的默认参数是否不同于前一帧的默认参数的标志信息可存在于比特流中。通过将默认参数包括在比特流中,能够采取比具有被包括在比特流中的对象参数的辅助信息更少的比特率。此外,在图14中略去比特流的首部信息。可重新安排比特流的顺序。
参照图15,根据本发明的第二实施例的用于处理音频信号的装置1000(在下文中简称为“解码器1000”)可包括比特流分用器1005、信息生成单元1010、缩减混合处理单元1020和多声道解码器1030。分用器1005可被配置成将经复用的音频信号分成缩减混合α、第一多声道参数β和对象参数γ。可将信息生成单元1010可被配置成利用对象参数γ和混合参数生成第二多声道参数。混合参数包括指示第一多声道信息β是否被应用到经处理的缩减混合的模式信息。模式信息可对应于用于由用户选择的信息。根据模式信息,信息生成信息1020决定是发送第一多声道参数β还是第二多声道参数。
缩减混合处理单元1020可被配置成根据混合信息中所包括的模式信息确定处理方案。此外,缩减混合处理单元1020可被配置成根据所确定的处理方案处理缩减混合α。然后缩减混合处理单元1020将经处理的缩减混合发送到多声道解码器1030。
多声道解码器1030可被配置成接收第一多声道参数β或第二多声道参数。在默认参数β’被包括在比特流中的情形中,多声道解码器1030可使用默认参数β’而不是多声道参数β。
然后,多声道解码器1030可被配置成利用经处理的缩减混合信号和所接收的多声道参数生成多声道输出。多声道解码器1030可具有与前面的多声道解码器730相同的配置,这不会对本发明构成限制。
3.双耳处理
多声道解码器能够以双耳模式操作。这借助于首部相关传递函数(HRTF)滤波实现了耳机上的多声道印象。对于双耳解码侧,缩减混合信号和多声道参数与提供给解码器的HRTF滤波器结合使用。
图16是根据本发明的第三实施例的用于处理音频信号的装置的示例性框图。参照图16,根据第三实施例的用于处理音频信号的装置(在下文中简称为“解码器1100”)可包括信息生成单元1110、缩减混合处理器单元1120和带有同步匹配部件1130a的多声道解码器1130。
信息生成单元1110可具有与图7的信息生成单元700相同的配置,且生成动态HRTF。缩减混合处理单元1120可具有与图7的缩减混合处理单元720相同的配置。类似于上述元件,多声道解码器1130除同步匹配部件1130a以外与前面元件的情形相同。因此,信息生成单元1110、缩减混合处理单元1120和多声道解码器1130的细节将被略去。
动态HRTF描述对应于HRTF方位角和仰角的对象信号和虚拟扬声器信号之间的关系,它是根据实时用户控制的时间相关信息。
在多声道解码器包括所有的HRTF滤波器组的情形中,动态HRTF可对应于HRTF滤波器系数本身、参数化系数信息和索引信息中的一个。
无论动态HRTF的种类如何都需要将动态HRTF信息与缩减混合信号帧相匹配。为了将HRTF信息与缩减混合信息相匹配,能够提供如下的三种方案:
1)将标志信息插入每个HRTF信息和比特流缩减混合信号,然后基于所插入的标志信息使HRTF与比特流缩减混合信号相匹配。在该方案中,将标志信息包括在MPEG环绕标准中的辅助字段中是适当的。可将标志信息表示为时间信息、计数信息、索引信息等。
2)将HRTF信息插入比特流的帧。在该方案中,可能设置指示当前帧是否对应于默认模式的模式信息。如果应用描述当前帧的HRTF信息等于前一帧的HRTF信息的默认模式,则能够降低HRTF信息的比特率。
2-1)此外,可能定义指示是否已经发送当前帧的HRTF信息的传输信息。如果应用描述当前帧的HRTF信息等于已发送的帧的HRTF信息的传输信息,则还可能降低HRTF信息的比特率。
3)提前发送若干HRTF信息,然后发送指示哪个HRTF在按每个帧发送的HRTF信息中的标识信息。
此外,在HRTF系数突然改变的情形中,可产生失真。为了减少这种失真,执行系数或渲染信号的平滑是适当的。
4.渲染
图17是根据本发明的第四实施例的用于处理音频信号的装置的示例性框图。根据本发明的第四实施例用于处理音频信号的装置1200(在下文中简称为“处理器1200”)可包括编码器侧1200A处的编码器1210和解码器侧1200B处的渲染单元1220和合成单元1230。编码器1210可被配置成接收多声道对象信号并生成音频信号的缩减混合和辅助信息。渲染单元1220可被配置成接收来自编码器1210的辅助信息、来自设备设置或用户界面的回放配置和用户控制,并利用辅助信息、回放配置和用户控制生成渲染信息。合成单元1230可被配置成利用渲染信息和从编码器1210接收的缩减混合信号合成多声道输出信号。
4.1应用效果模式
效果模式是用于再混合或重构信号的模式。例如,可存在实况模式、俱乐部乐队模式、卡拉OK模式等。效果模式信息可对应于由制作者、其它用户等生成的混合参数集。如果应用效果模式信息,则终端用户完全不需要控制对象摇移和对象增益,因为用户可选择预定的效果模式信息之一。
生成效果模式信息的两种方法可加以区分。首先,效果模式信息由编码器1200A生成并发送到解码器1200B是可能的。第二,效果模式信息在解码器侧自动生成。两种方法的细节将描述如下。
4.1.1将效果模式信息发送到解码器侧
效果模式信息可由制作者在编码器1200A处生成。根据该方法,解码器1200B可被配置成接收包括效果模式信息的辅助信息并输出用户界面,通过该用户界面用户可选择效果模式信息之一。解码器1200B可被配置成基于所选择的效果模式信息生成输出声道。
此外,在编码器1200A缩减混和信号以便提高对象信号的质量的情形中,听众按原样收听缩减混合信号是不适当的。然而,如果将效果模式信息应用到解码器1200B中,则将缩减混合信号回放为最大质量是可能的。
4.1.2在解码器侧生成效果模式信息
可在解码器1200B处生成效果模式信息。解码器1200B可被配置成在缩减混合信号中搜索适当的效果模式信息。然后解码器1200B可被配置成选择所搜索到的效果模式之一自身(自动调节模式)或使用户能够选择它们之一(用户选择模式)。然后解码器1200B可被配置成获得包括在辅助信息中的对象信息(对象数、乐器名称等),并基于所选择的效果模式信息和对象信息控制对象。
此外,能够一次全部地控制类似的对象。例如,与节奏相关联的乐器在“节奏印象模式”的情形中是类似的对象。一次全部地控制表示同时控制每个对象而不是利用相同的参数控制对象。
此外,能够基于解码器设置和设备环境(包括不管是耳机还是扬声器)控制对象。例如,在设备的音量设置低的情形中,可强调对应于主旋律的对象,在设备的音量设置高的情形中,可抑制对应于主旋律的对象。
4.2编码器侧输入信号的对象类型
输入到编码器1200A的输入信号可被分成如下三种类型。
1)单声道对象
单声道对象是最一般的对象类型。通过将对象简单相加来合成内部缩减混合信号是可能的。利用对象增益与可以是用户控制和所提供的信息之一的对象摇移合成内部缩减混合信号也是可能的。在生成内部缩减混合信号时,利用对象特性、用户输入和设置有对象的信息中的至少一个生成渲染信息也是可能的。
在存在外部缩减混合信号的情形中,提取和发送指示外部缩减混合和对象之间的关系的信息是可能的。
2)立体声对象(立体声声道对象)
类似于前面的单声道对象的情形,通过将对象简单相加来合成内部缩减混合信号是可能的。利用对象增益与可以是用户控制和所提供的信息之一的对象摇移合成内部缩减混合信号也是可能的。在缩减混合信号对应于单声道信号的情形中,编码器1200A使用转换成单声道信号的对象以生成缩减混合信号是可能的。在这种情形中,在转换成单声道信号时能够提取并传送与对象相关联的信息(例如在各个时间-频率域中的摇移信息)。类似前面的单声道对象,在生成内部缩减混合信号时,利用对象特性、用户输入和设置有对象的信息中的至少一个生成渲染信息也是可能的。类似于前面的单声道对象,在存在外部缩减混合信号的情形中,提取和发送指示外部缩减混合和对象之间的关系的信息是可能的。
3)多声道对象
在多声道对象的情形中,能够执行利用单声道对象和立体声对象描述的上述方法。此外,能够输入多声道对象作为一种形式的MPEG环绕。在这种情形中,能够利用对象缩减混合声道生成基于对象的缩减混合(例如SAOC缩减混合),并使用多声道信息(例如MPEG环绕中的空间信息)来生成多声道信息和渲染信息。因此,因为以MPEG环绕形式存在的多声道对象不必利用面向对象的编码器(例如SAOC编码器)进行解码和编码,所以可能减少计算量。如果在此情形中对象缩减混合对应于立体声且基于对象的缩减混合(例如SAOC缩减混合)对应于单声道,则可能应用关于立体声对象描述的上述方法。
4)用于可变类型对象的发送方案
如上所述,可变类型的对象(单声道、立体声和多声道对象)可从编码器1200A发送到解码器1200B。可如下提供可变类型对象的发送方案:
参照图18,当缩减混合包括多个对象时,辅助信息包括每个对象的信息。例如,当多个对象包括第N单声道对象(A)、第N+1对象(B)的左声道和第N+1对象(C)的右声道时,辅助信息包括3个对象(A、B、C)的信息。
辅助信息可包括相关性标志信息,指示对象是否是立体声或多声道对象的一部分,例如单声道对象、立体声对象的一个声道(L或R)等。例如,如果存在单声道对象,则相关性标志信息是“0”,如果存在立体声对象的一个声道则相关性标志信息是“1”。当连续发送立体声对象的一部分和立体声对象的另一部分时,立体声对象的另一部分的相关性标志信息可以是任意值(例如“0”、“1”或任意)。此外,可不发送立体声对象的其它部分的相关性标志信息。
此外,在多声道对象的情形中,多声道对象的一个部分的相关性标志信息可以是描述多声道对象的数目的值。例如,在5.1声道对象的情形中,5.1声道的左声道的相关性标志信息可以是“5”,5.1声道的其它声道的相关性标志信息可以是“0”或不被发送。
4.3对象属性
对象可具有如下的三类属性:
a)单个对象
单个对象可被配置为源。在生成缩减混合信号和再现时,能够将一个参数应用到单个对象用于控制对象摇移和对象增益。“一个参数”不仅可表示关于所有时间/频率域的一个参数,还可表示用于每个时间/频率槽的一个参数。
b)成组对象
单个对象可被配置为两个以上的源。能够将一个参数应用到成组对象用于控制对象摇移和对象增益,尽管成组对象作为至少两个源输入。如下将参考图19解释成组对象的细节:参照图19,编码器1300包括编组单元1310和缩减混合单元1320。编组单元1310可被配置成基于编组信息在所输入的多对象输入中编组至少两个对象。编组信息可由制作者在编码器侧生成。缩减混合单元1320可被配置成利用编组单元1310生成的编组对象生成缩减混合信号。缩减混合单元1320可被配置成生成用于编组对象的辅助信息。
c)组合对象
组合对象是与至少一个源组合的对象。一次全部地控制对象摇移和增益但保持组合对象之间的关系不变是可能的。例如,在鼓的情形中,控制鼓但保持大鼓、铜锣和铙钹(symbol)之间的关系不变是可能的。例如当大鼓位于中心点且符号位于左侧点时,在鼓向右移动时将大鼓置于右侧点且将符号置于中心点和右侧点之间的点是可能的。
可将组合对象的关系信息发送到解码器。另一方面,解码器可利用组合对象提取关系信息。
4.4分级地控制对象
能够分级地控制对象。例如在控制鼓之后,能够控制鼓的每个子元件。为了分级地控制对象,提供如下的三个方案:
a)UI(用户界面)
可仅显示代表元素而不显示所有对象。如果用户选择代表元素,则显示所有对象。
b)对象编组
在编组对象以便表示代表元素之后,控制代表元素以控制编组为代表元素的所有对象是可能的。可将编组过程中提取的信息发送到解码器。同样,可在解码器中生成编组信息。可基于各个元素的预定控制信息执行一次全部地应用控制信息。
c)对象配置
使用上述组合对象是可能的。关于组合对象的元素的信息可在编码器或解码器中生成。关于来自编码器的元素的信息可被发射为与关于组合对象的信息不同的形式。
对于本领域技术人员而言,可对本发明作出各种修改和变化而不背离本发明的精神和范围是显而易见的。因此,本发明旨在涵盖本发明的更改和变化,只要它们落在所附权利要求及其等效方案的范围内即可。
工业实用性
因此,本发明适用于编码和解码音频信号。

Claims (20)

1.一种用于处理音频信号的方法,其包括:
接收缩减混合信号、对象信息和混合信息;
利用所述对象信息和所述混合信息生成包括至少一个增益修改因数的多声道信息,
其中所述增益修改因数对应于用于控制缩减混合信号的增益的时间子频带变异因数。
2.如权利要求1所述的方法,其特征在于,如果所述缩减混合信号对应于单声道信号,则执行生成多声道信息。
3.如权利要求1所述的方法,其特征在于,所述增益修改因数描述基于所述混合信息和所述对象信息估计的第一增益与基于所述对象信息估计的第二增益之比。
4.如权利要求1所述的方法,其特征在于,还包括:
利用包括所述增益修改因数的所述多声道信息生成多声道比特流。
5.如权利要求1所述的方法,其特征在于,还包括:
利用所述对象信息和所述混合信息生成缩减混合处理信息;以及
利用所述缩减混合处理信息处理所述缩减混合信号,
其中如果所述缩减混合信号对应于立体声信号,则所述缩减混合处理信息对应于用于控制对象摇移的信息。
6.如权利要求1所述的方法,其特征在于,所述混合信息是利用对象位置信息和回放配置信息中的至少一个生成的。
7.如权利要求1所述的方法,其特征在于,接收所述缩减混合信号作为广播信号。
8.如权利要求1所述的方法,其特征在于,在数字介质上接收所述缩减混合信号。
9.一种用于处理音频信号的方法,其包括:
接收对象信息和混合信息;
利用所述对象信息和所述混合信息生成多声道信息;
利用所述混合信息生成额外的多声道信息;以及
发送所述多声道信息和所述额外的多声道信息,
其中所述多声道信息对应于用于将缩减混合信号扩展混合成多声道信号的信息,且额外的多声道信息对应于用于修改所述多声道信号的信息。
10.如权利要求9所述的方法,其特征在于,所述额外的多声道信息包括用于双耳模式的HRTF信息。
11.如权利要求10所述的方法,其特征在于,所述HRTF信息描述一定时间处对象的虚拟位置。
12.如权利要求10所述的方法,其特征在于,所述HRTF信息是利用HRTF数据库生成的。
13.如权利要求9所述的方法,其特征在于,在同一子频带域中执行生成多声道信息和生成额外的多声道信息。
14.如权利要求9所述的方法,其特征在于,所述额外的多声道信息与多声道信息同步发送。
15.如权利要求1所述的方法,其特征在于,接收所述缩减混合信号作为广播信号。
16.如权利要求1所述的方法,其特征在于,在数字介质上接收所述缩减混合信号。
17.一种有指令存储于其上的计算机可读介质,所述指令在由处理器执行时使得所述处理器执行以下操作,包括:
接收缩减混合信号、对象信息和混合信息;
利用所述对象信息和所述混合信息生成包括至少一个增益修改因数的多声道信息,
其中所述增益修改因数对应于用于控制缩减混合信号的增益的时间子频带变异因数。
18.一种有指令存储于其上的计算机可读介质,所述指令在由处理器执行时使得所述处理器执行以下操作,包括:
接收对象信息和混合信息;
利用所述对象信息和所述混合信息生成多声道信息;
利用所述混合信息生成额外的多声道信息;以及
发送所述多声道信息和所述额外的多声道信息,
其中所述多声道信息对应于用于将缩减混合信号扩展混合成多声道信号的信息,且额外的多声道信息对应于用于修改所述多声道信号的信息。
19.一种用于处理音频信号的装置,其包括:
接收混合信息的用户界面;以及
信息生成单元,其接收对象信息和所述混合信息,利用所述对象信息和所述混合信息生成包括至少一个增益修改因数的多声道信息,
其中所述增益修改因数对应于用于控制缩减混合信号的增益的时间子频带变异因数。
20.一种用于处理音频信号的装置,其包括:
接收混合信息的用户界面;以及
信息生成单元,其接收对象信息,利用所述对象信息和所述混合信息生成多声道信息,利用所述混合信息生成额外的多声道信息;并发送所述多声道信息和所述额外的多声道信息,
其中所述多声道信息对应于用于将缩减混合信号扩展混合成多声道信号的信息,且额外的多声道信息对应于用于修改所述多声道信号的信息。
CN2007800453936A 2006-12-07 2007-12-06 用于处理音频信号的方法和装置 Active CN101553867B (zh)

Applications Claiming Priority (21)

Application Number Priority Date Filing Date Title
US86907706P 2006-12-07 2006-12-07
US60/869,077 2006-12-07
US87713406P 2006-12-27 2006-12-27
US60/877,134 2006-12-27
US88356907P 2007-01-05 2007-01-05
US60/883,569 2007-01-05
US88404307P 2007-01-09 2007-01-09
US60/884,043 2007-01-09
US88434707P 2007-01-10 2007-01-10
US60/884,347 2007-01-10
US88458507P 2007-01-11 2007-01-11
US60/884,585 2007-01-11
US88534707P 2007-01-17 2007-01-17
US88534307P 2007-01-17 2007-01-17
US60/885,343 2007-01-17
US60/885,347 2007-01-17
US88971507P 2007-02-13 2007-02-13
US60/889,715 2007-02-13
US95539507P 2007-08-13 2007-08-13
US60/955,395 2007-08-13
PCT/KR2007/006317 WO2008069595A1 (en) 2006-12-07 2007-12-06 A method and an apparatus for processing an audio signal

Publications (2)

Publication Number Publication Date
CN101553867A true CN101553867A (zh) 2009-10-07
CN101553867B CN101553867B (zh) 2013-04-17

Family

ID=39492395

Family Applications (5)

Application Number Title Priority Date Filing Date
CN2007800453673A Active CN101553866B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置
CN2007800454197A Active CN101553868B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置
CN2007800453936A Active CN101553867B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置
CN2007800453353A Active CN101553865B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置
CN2007800452685A Active CN101568958B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN2007800453673A Active CN101553866B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置
CN2007800454197A Active CN101553868B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN2007800453353A Active CN101553865B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置
CN2007800452685A Active CN101568958B (zh) 2006-12-07 2007-12-06 用于处理音频信号的方法和装置

Country Status (11)

Country Link
US (11) US7986788B2 (zh)
EP (6) EP2187386B1 (zh)
JP (5) JP5450085B2 (zh)
KR (5) KR101100222B1 (zh)
CN (5) CN101553866B (zh)
AU (1) AU2007328614B2 (zh)
BR (1) BRPI0719884B1 (zh)
CA (1) CA2670864C (zh)
MX (1) MX2009005969A (zh)
TW (1) TWI371743B (zh)
WO (5) WO2008069596A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105376691A (zh) * 2014-08-29 2016-03-02 杜比实验室特许公司 感知方向的环绕声播放
CN105659320A (zh) * 2013-10-21 2016-06-08 杜比国际公司 音频编码器和解码器

Families Citing this family (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8082157B2 (en) * 2005-06-30 2011-12-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007007500A1 (ja) * 2005-07-11 2007-01-18 Matsushita Electric Industrial Co., Ltd. 超音波探傷方法と超音波探傷装置
TWI329462B (en) * 2006-01-19 2010-08-21 Lg Electronics Inc Method and apparatus for processing a media signal
JP5054035B2 (ja) * 2006-02-07 2012-10-24 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
WO2008004812A1 (en) * 2006-07-04 2008-01-10 Electronics And Telecommunications Research Institute Apparatus and method for restoring multi-channel audio signal using he-aac decoder and mpeg surround decoder
JP5450085B2 (ja) * 2006-12-07 2014-03-26 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
EP2109861B1 (en) * 2007-01-10 2019-03-13 Koninklijke Philips N.V. Audio decoder
US8520873B2 (en) 2008-10-20 2013-08-27 Jerry Mahabub Audio spatialization and environment simulation
KR20080082916A (ko) * 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
ATE526663T1 (de) 2007-03-09 2011-10-15 Lg Electronics Inc Verfahren und vorrichtung zum verarbeiten eines audiosignals
EP2278582B1 (en) * 2007-06-08 2016-08-10 LG Electronics Inc. A method and an apparatus for processing an audio signal
JP2010538571A (ja) 2007-09-06 2010-12-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
KR101461685B1 (ko) * 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR101596504B1 (ko) * 2008-04-23 2016-02-23 한국전자통신연구원 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
JP5258967B2 (ja) * 2008-07-15 2013-08-07 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
WO2010008200A2 (en) 2008-07-15 2010-01-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
WO2010041877A2 (en) * 2008-10-08 2010-04-15 Lg Electronics Inc. A method and an apparatus for processing a signal
US8861739B2 (en) * 2008-11-10 2014-10-14 Nokia Corporation Apparatus and method for generating a multichannel signal
KR20100065121A (ko) * 2008-12-05 2010-06-15 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8670575B2 (en) * 2008-12-05 2014-03-11 Lg Electronics Inc. Method and an apparatus for processing an audio signal
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
KR101187075B1 (ko) * 2009-01-20 2012-09-27 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2010085083A2 (en) * 2009-01-20 2010-07-29 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
KR101137361B1 (ko) 2009-01-28 2012-04-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2010087627A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
US8255821B2 (en) * 2009-01-28 2012-08-28 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
RU2607266C2 (ru) * 2009-10-16 2017-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для формирования с использованием среднего значения параметров сигнала, подстроенных для обеспечения представления микшированного с повышением сигнала на базе представления микшированного с понижением сигнала и параметрической сторонней информации, связанной с представлением микшированного с понижением сигнала
PL2491551T3 (pl) 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Urządzenie do dostarczania reprezentacji sygnału upmixu w oparciu o reprezentację sygnału downmixu, urządzenie do dostarczania strumienia bitów reprezentującego wielokanałowy sygnał audio, sposoby, program komputerowy i strumień bitów wykorzystujący sygnalizację sterowania zniekształceniami
KR101106465B1 (ko) * 2009-11-09 2012-01-20 네오피델리티 주식회사 멀티밴드 drc 시스템의 게인 설정 방법 및 이를 이용한 멀티밴드 drc 시스템
AU2010321013B2 (en) * 2009-11-20 2014-05-29 Dolby International Ab Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
EP2511908A4 (en) * 2009-12-11 2013-07-31 Korea Electronics Telecomm AUDIO CREATING APPARATUS AND AUDIO PLAYING APPARATUS FOR AUDIO BASED OBJECT BASED SERVICE, AND AUDIO CREATING METHOD AND AUDIO PLAYING METHOD USING THE SAME
CN102696070B (zh) * 2010-01-06 2015-05-20 Lg电子株式会社 处理音频信号的设备及其方法
US20120318412A1 (en) * 2010-03-29 2012-12-20 Hitachi Metals, Ltd. Primary ultrafine-crystalline alloy, nano-crystalline, soft magnetic alloy and its production method, and magnetic device formed by nano-crystalline, soft magnetic alloy
KR20120004909A (ko) 2010-07-07 2012-01-13 삼성전자주식회사 입체 음향 재생 방법 및 장치
WO2012009851A1 (en) 2010-07-20 2012-01-26 Huawei Technologies Co., Ltd. Audio signal synthesizer
US8948403B2 (en) * 2010-08-06 2015-02-03 Samsung Electronics Co., Ltd. Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system
JP5903758B2 (ja) * 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
EP2727383B1 (en) 2011-07-01 2021-04-28 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
EP2560161A1 (en) 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
CN103050124B (zh) 2011-10-13 2016-03-30 华为终端有限公司 混音方法、装置及系统
IN2014CN03413A (zh) * 2011-11-01 2015-07-03 Koninkl Philips Nv
US9584912B2 (en) 2012-01-19 2017-02-28 Koninklijke Philips N.V. Spatial audio rendering and encoding
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
JP6045696B2 (ja) * 2012-07-31 2016-12-14 インテレクチュアル ディスカバリー シーオー エルティディIntellectual Discovery Co.,Ltd. オーディオ信号処理方法および装置
MX351687B (es) 2012-08-03 2017-10-25 Fraunhofer Ges Forschung Método y descodificador para codificación de objeto de audio especial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal.
BR122021021503B1 (pt) * 2012-09-12 2023-04-11 Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d
US9385674B2 (en) * 2012-10-31 2016-07-05 Maxim Integrated Products, Inc. Dynamic speaker management for multichannel audio systems
CA2893729C (en) 2012-12-04 2019-03-12 Samsung Electronics Co., Ltd. Audio providing apparatus and audio providing method
TR201808415T4 (tr) 2013-01-15 2018-07-23 Koninklijke Philips Nv Binoral ses işleme.
JP6433918B2 (ja) 2013-01-17 2018-12-05 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. バイノーラルのオーディオ処理
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
US9208775B2 (en) 2013-02-21 2015-12-08 Qualcomm Incorporated Systems and methods for determining pitch pulse period signal boundaries
JP5591423B1 (ja) 2013-03-13 2014-09-17 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
CN104982042B (zh) 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
WO2014174344A1 (en) * 2013-04-26 2014-10-30 Nokia Corporation Audio signal encoder
KR20140128564A (ko) * 2013-04-27 2014-11-06 인텔렉추얼디스커버리 주식회사 음상 정위를 위한 오디오 시스템 및 방법
CA3211308A1 (en) 2013-05-24 2014-11-27 Dolby International Ab Coding of audio scenes
EP2973551B1 (en) 2013-05-24 2017-05-03 Dolby International AB Reconstruction of audio scenes from a downmix
JP6248186B2 (ja) * 2013-05-24 2017-12-13 ドルビー・インターナショナル・アーベー オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ
US20140355769A1 (en) * 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
KR101454342B1 (ko) * 2013-05-31 2014-10-23 한국산업은행 서라운드 채널 오디오 신호를 이용한 추가 채널 오디오 신호 생성 장치 및 방법
EP3005344A4 (en) * 2013-05-31 2017-02-22 Nokia Technologies OY An audio scene apparatus
SG11201600466PA (en) 2013-07-22 2016-02-26 Fraunhofer Ges Forschung Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
KR102243395B1 (ko) * 2013-09-05 2021-04-22 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치
TWI847206B (zh) 2013-09-12 2024-07-01 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
KR101782916B1 (ko) 2013-09-17 2017-09-28 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
WO2015060654A1 (ko) 2013-10-22 2015-04-30 한국전자통신연구원 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
ES2755349T3 (es) 2013-10-31 2020-04-22 Dolby Laboratories Licensing Corp Renderización binaural para auriculares utilizando procesamiento de metadatos
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
WO2015099429A1 (ko) 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치
WO2015104447A1 (en) 2014-01-13 2015-07-16 Nokia Technologies Oy Multi-channel audio signal classifier
CN108600935B (zh) 2014-03-19 2020-11-03 韦勒斯标准与技术协会公司 音频信号处理方法和设备
KR101856127B1 (ko) 2014-04-02 2018-05-09 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
EP3192282A1 (en) * 2014-09-12 2017-07-19 Dolby Laboratories Licensing Corp. Rendering audio objects in a reproduction environment that includes surround and/or height speakers
TWI587286B (zh) 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
US9609383B1 (en) * 2015-03-23 2017-03-28 Amazon Technologies, Inc. Directional audio for virtual environments
WO2016204580A1 (ko) 2015-06-17 2016-12-22 삼성전자 주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
US10672408B2 (en) 2015-08-25 2020-06-02 Dolby Laboratories Licensing Corporation Audio decoder and decoding method
CN109427337B (zh) 2017-08-23 2021-03-30 华为技术有限公司 立体声信号编码时重建信号的方法和装置
US11004457B2 (en) * 2017-10-18 2021-05-11 Htc Corporation Sound reproducing method, apparatus and non-transitory computer readable storage medium thereof
DE102018206025A1 (de) * 2018-02-19 2019-08-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren für objektbasiertes, räumliches Audio-Mastering
KR102471718B1 (ko) * 2019-07-25 2022-11-28 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
EP4018686B1 (en) * 2019-08-19 2024-07-10 Dolby Laboratories Licensing Corporation Steering of binauralization of audio
CN111654745B (zh) * 2020-06-08 2022-10-14 海信视像科技股份有限公司 多声道的信号处理方法及显示设备
JP7457215B1 (ja) 2023-04-25 2024-03-27 マブチモーター株式会社 梱包構造

Family Cites Families (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0079886B1 (en) 1981-05-29 1986-08-27 International Business Machines Corporation Aspirator for an ink jet printer
FR2567984B1 (fr) * 1984-07-20 1986-08-14 Centre Techn Ind Mecanique Distributeur hydraulique proportionnel
SG49883A1 (en) 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US6141446A (en) 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US5838664A (en) 1997-07-17 1998-11-17 Videoserver, Inc. Video teleconferencing system with digital transcoding
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
EP0798866A2 (en) 1996-03-27 1997-10-01 Kabushiki Kaisha Toshiba Digital data processing system
US6128597A (en) 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
DE69817181T2 (de) 1997-06-18 2004-06-17 Clarity, L.L.C., Ann Arbor Verfahren und gerät zur blindseparierung von signalen
US6026168A (en) 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
WO1999053479A1 (en) * 1998-04-15 1999-10-21 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Fast frame optimisation in an audio encoder
US6122619A (en) 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
FI114833B (fi) * 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
US7103187B1 (en) * 1999-03-30 2006-09-05 Lsi Logic Corporation Audio calibration system
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
CA2402925A1 (en) * 2000-03-03 2001-09-13 Cardiac M.R.I., Inc. Magnetic resonance specimen analysis apparatus
WO2002007481A2 (en) 2000-07-19 2002-01-24 Koninklijke Philips Electronics N.V. Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7032116B2 (en) 2001-12-21 2006-04-18 Intel Corporation Thermal management for computer systems running legacy or thermal management operating systems
DE60326782D1 (de) 2002-04-22 2009-04-30 Koninkl Philips Electronics Nv Dekodiervorrichtung mit Dekorreliereinheit
ES2268340T3 (es) 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
JP4013822B2 (ja) 2002-06-17 2007-11-28 ヤマハ株式会社 ミキサ装置およびミキサプログラム
EP1523863A1 (en) 2002-07-16 2005-04-20 Koninklijke Philips Electronics N.V. Audio coding
KR100542129B1 (ko) 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
JP4084990B2 (ja) 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
JP4496379B2 (ja) 2003-09-17 2010-07-07 財団法人北九州産業学術推進機構 分割スペクトル系列の振幅頻度分布の形状に基づく目的音声の復元方法
US6937737B2 (en) 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
TWI233091B (en) 2003-11-18 2005-05-21 Ali Corp Audio mixing output device and method for dynamic range control
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
EP1768107B1 (en) 2004-07-02 2016-03-09 Panasonic Intellectual Property Corporation of America Audio signal decoding device
WO2006006809A1 (en) 2004-07-09 2006-01-19 Electronics And Telecommunications Research Institute Method and apparatus for encoding and cecoding multi-channel audio signal using virtual source location information
US7391870B2 (en) 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
KR100745688B1 (ko) 2004-07-09 2007-08-03 한국전자통신연구원 다채널 오디오 신호 부호화/복호화 방법 및 장치
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
KR101283525B1 (ko) * 2004-07-14 2013-07-15 돌비 인터네셔널 에이비 오디오 채널 변환
PL2175671T3 (pl) 2004-07-14 2012-10-31 Koninl Philips Electronics Nv Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
KR101271069B1 (ko) * 2005-03-30 2013-06-04 돌비 인터네셔널 에이비 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
US20060262936A1 (en) 2005-05-13 2006-11-23 Pioneer Corporation Virtual surround decoder apparatus
KR20060122693A (ko) * 2005-05-26 2006-11-30 엘지전자 주식회사 다운믹스된 오디오 신호에 공간 정보 비트스트림을삽입하는 프레임 크기 조절방법
EP1905004A2 (en) 2005-05-26 2008-04-02 LG Electronics Inc. Method of encoding and decoding an audio signal
KR101251426B1 (ko) 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
WO2007013784A1 (en) 2005-07-29 2007-02-01 Lg Electronics Inc. Method for generating encoded audio signal amd method for processing audio signal
US20070083365A1 (en) 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
EP1640972A1 (en) 2005-12-23 2006-03-29 Phonak AG System and method for separation of a users voice from ambient sound
WO2007080212A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Controlling the decoding of binaural audio signals
JP4399835B2 (ja) * 2006-07-07 2010-01-20 日本ビクター株式会社 音声符号化方法及び音声復号化方法
AU2007271532B2 (en) 2006-07-07 2011-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for combining multiple parametrically coded audio sources
CN101517637B (zh) 2006-09-18 2012-08-15 皇家飞利浦电子股份有限公司 音频编解码器 、编解码方法、 集线器、 发送接收器、 发送接收方法、通信系统、 播放设备
WO2008039041A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
DE602007013415D1 (de) * 2006-10-16 2011-05-05 Dolby Sweden Ab Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung
WO2008046530A2 (en) 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
JP5450085B2 (ja) * 2006-12-07 2014-03-26 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105659320A (zh) * 2013-10-21 2016-06-08 杜比国际公司 音频编码器和解码器
CN105659320B (zh) * 2013-10-21 2019-07-12 杜比国际公司 音频编码器和解码器
CN105376691A (zh) * 2014-08-29 2016-03-02 杜比实验室特许公司 感知方向的环绕声播放
US10362401B2 (en) 2014-08-29 2019-07-23 Dolby Laboratories Licensing Corporation Orientation-aware surround sound playback
CN105376691B (zh) * 2014-08-29 2019-10-08 杜比实验室特许公司 感知方向的环绕声播放
US10848873B2 (en) 2014-08-29 2020-11-24 Dolby Laboratories Licensing Corporation Orientation-aware surround sound playback
US11330372B2 (en) 2014-08-29 2022-05-10 Dolby Laboratories Licensing Corporation Orientation-aware surround sound playback
US11902762B2 (en) 2014-08-29 2024-02-13 Dolby Laboratories Licensing Corporation Orientation-aware surround sound playback

Also Published As

Publication number Publication date
US8428267B2 (en) 2013-04-23
CN101568958B (zh) 2012-07-18
CN101568958A (zh) 2009-10-28
KR20090098864A (ko) 2009-09-17
US20080205657A1 (en) 2008-08-28
US20100010821A1 (en) 2010-01-14
TW200834544A (en) 2008-08-16
EP2102856A4 (en) 2010-01-13
WO2008069593A1 (en) 2008-06-12
EP2122613B1 (en) 2019-01-30
EP2187386A3 (en) 2010-07-28
US20080199026A1 (en) 2008-08-21
US8340325B2 (en) 2012-12-25
MX2009005969A (es) 2009-06-16
CN101553865A (zh) 2009-10-07
JP2010511910A (ja) 2010-04-15
KR101111520B1 (ko) 2012-05-24
CN101553866B (zh) 2012-05-30
KR101100223B1 (ko) 2011-12-28
CN101553866A (zh) 2009-10-07
JP5290988B2 (ja) 2013-09-18
US7986788B2 (en) 2011-07-26
US20080205670A1 (en) 2008-08-28
US7783049B2 (en) 2010-08-24
WO2008069597A1 (en) 2008-06-12
US20080192941A1 (en) 2008-08-14
US20080205671A1 (en) 2008-08-28
EP2122613A4 (en) 2010-01-13
AU2007328614B2 (en) 2010-08-26
CA2670864C (en) 2015-09-29
CN101553868A (zh) 2009-10-07
CN101553868B (zh) 2012-08-29
EP2102856A1 (en) 2009-09-23
KR101128815B1 (ko) 2012-03-27
JP5270566B2 (ja) 2013-08-21
WO2008069596A1 (en) 2008-06-12
KR20090098863A (ko) 2009-09-17
WO2008069594A1 (en) 2008-06-12
US8488797B2 (en) 2013-07-16
WO2008069595A1 (en) 2008-06-12
US8005229B2 (en) 2011-08-23
JP2010511912A (ja) 2010-04-15
KR20090100386A (ko) 2009-09-23
US20100010820A1 (en) 2010-01-14
JP2010511911A (ja) 2010-04-15
CN101553867B (zh) 2013-04-17
EP2122612A1 (en) 2009-11-25
EP2122612A4 (en) 2010-01-13
EP2102857B1 (en) 2018-07-18
US20090281814A1 (en) 2009-11-12
EP2187386B1 (en) 2020-02-05
JP2010511908A (ja) 2010-04-15
KR20090098865A (ko) 2009-09-17
JP5302207B2 (ja) 2013-10-02
US20100010818A1 (en) 2010-01-14
JP5209637B2 (ja) 2013-06-12
EP2122612B1 (en) 2018-08-15
US7783050B2 (en) 2010-08-24
EP2122613A1 (en) 2009-11-25
AU2007328614A1 (en) 2008-06-12
EP2102857A1 (en) 2009-09-23
JP2010511909A (ja) 2010-04-15
US20100010819A1 (en) 2010-01-14
JP5450085B2 (ja) 2014-03-26
TWI371743B (en) 2012-09-01
BRPI0719884B1 (pt) 2020-10-27
EP2102858A1 (en) 2009-09-23
EP2102858A4 (en) 2010-01-20
US7715569B2 (en) 2010-05-11
US7783051B2 (en) 2010-08-24
US7783048B2 (en) 2010-08-24
US8311227B2 (en) 2012-11-13
EP2187386A2 (en) 2010-05-19
CN101553865B (zh) 2012-01-25
KR101100222B1 (ko) 2011-12-28
EP2102857A4 (en) 2010-01-20
KR20090098866A (ko) 2009-09-17
KR101111521B1 (ko) 2012-03-13
BRPI0719884A2 (pt) 2014-02-11
US20100014680A1 (en) 2010-01-21
CA2670864A1 (en) 2008-06-12

Similar Documents

Publication Publication Date Title
CN101553868B (zh) 用于处理音频信号的方法和装置
CN101821799B (zh) 使用上混合的音频编码
CN102892070B (zh) 多声道下混对象编码的增强编码和参数表示
CN101853660B (zh) 用于双声道提示码编码方案和类似方案的散射声音整形
CN101911181A (zh) 用于处理音频信号的方法和装置
CN101253808B (zh) 用于编码和解码音频信号的装置及其方法
CN101911732A (zh) 用于处理音频信号的方法和装置
MX2008012986A (es) Metodos y aparatos para codificar y decodificar señales de audio basadas en objetos.
CN101542597A (zh) 用于编码和解码基于对象的音频信号的方法和装置
Annadana et al. New Enhancements to Immersive Sound Field Rendition (ISR) System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant