CN101627425A - 用于处理音频信号的装置和方法 - Google Patents

用于处理音频信号的装置和方法 Download PDF

Info

Publication number
CN101627425A
CN101627425A CN200880004888A CN200880004888A CN101627425A CN 101627425 A CN101627425 A CN 101627425A CN 200880004888 A CN200880004888 A CN 200880004888A CN 200880004888 A CN200880004888 A CN 200880004888A CN 101627425 A CN101627425 A CN 101627425A
Authority
CN
China
Prior art keywords
information
target
gain margin
signal
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880004888A
Other languages
English (en)
Inventor
吴贤午
郑亮源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101627425A publication Critical patent/CN101627425A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

公开了一种处理音频信号的方法,包括:获取在主信号和子信号之间的比率信息,和目标的增益范围信息;基于比率信息和增益范围信息,对包括目标参数和控制参数的至少之一的参数信息进行修改。公开了一种处理音频信号的方法,包括:使用目标信息来生成比率信息;使用比率信息来生成目标的增益范围信息;以及基于增益范围信息,对包括目标参数和控制参数的至少之一的参数信息进行修改。

Description

用于处理音频信号的装置和方法
技术领域
本发明设计用于处理音频信号的装置及其方法。虽然本发明能够广泛适用于各种应用,但是其特别适用于处理经由数字介质接收的音频信号、广播信号等。
背景技术
技术问题
一般地,在用于将多个目标下混合(downmix)为单声道或者立体声信号的处理中,从每个目标信号中提取参数。该参数被解码器使用。并且,通过由用户做出的选择,可以对每个目标的淘选(panning)和增益进行控制。
发明内容
然而,为了控制每个目标信号,在下混合中包括的源应该被适当地定位或者淘选。
此外,为了通过信道定向解码方案提供后向兼容性,目标参数应该可以灵活地转变为用于上混合的多信道参数。
技术解决方法
因此,本发明涉及一种用于处理音频信号的装置及其方法,其基本上消除了由于现有技术的限制和不足而导致的问题中的一个或者多个。
本发明的目标在于提供一种用于处理音频信号的装置及其方法,通过其可以不受限制地对目标的增益和淘选进行控制。
本发明的另一目标在于提供一种用于处理音频信号的装置及其方法,通过其基于用户做出的选择可以控制目标的增益和淘选。
本发明的进一步的目标在于提供一种用于处理音频信号的装置及其方法,通过其在预定的限制范围内基于用户做出的选择可以控制目标的增益和淘选。
有利效果
因此,本发明提供以下的效果或优点。
首先,可以不受限制地控制目标的增益和淘选。
第二,可以基于用户做出的选择来控制目标的增益和淘选。
第三,在对目标的增益进行调整的情况下,通过提供关于增益调整的增益范围,根据增益调整,可以阻止音频质量失真。
附图说明
被包括用来提供对本发明的进一步理解和被合并用来构成该说明书的一部分的附图示出了本发明的实施例,并且与说明书一起来用于说明本发明的原理。
在附图中:
图1是根据本发明的实施例的音频信号处理装置的框图;
图2是根据本发明实施例的音频信号处理装置的信息生成单元的示例性详细示例框图;
图3是用于根据本发明一个实施例的音频信号处理方法的流程图;
图4是根据本发明实施例的音频信号处理装置的信息生成单元的另一详细示例框图;以及
图5是用于根据本发明另一实施例的音频信号处理方法的流程图。
具体实施方式
本发明的附加特征和优点将在以下的说明书中进行阐述,并且将从说明中部分地变得明显,或者可以通过本发明的实践来学习。通过在所写的说明书及其权利要求、以及附图中具体指出的结构,本发明的目标和其他优点将得以实现和获得。
为了实现这些和其他的优点,并且根据本发明的目的,如具体表达和广泛描述的,根据本发明的处理音频信号的方法包括获取在主信号和子信号之间的比率信息以及目标的增益范围信息;并且基于比率信息和增益范围信息,对包括目标参数和控制参数的至少之一的参数信息进行修改。
根据本发明,从音频信号比特流中获取比率信息。
根据本发明,所述方法进一步包括获取传输标记信息,其表示比率信息和增益范围信息是否被传输,其中,所述比率信息和增益范围信息基于传输标记信息从音频信号比特流中获取。
根据本发明,所述方法进一步包括获取关联标记信息,其表示目标信号是否与关联信号相对应,其中,基于关联标记信息来执行传输标记信息的获取。
根据本发明,关联标记信息表示目标信号是否与每个目标的关联信号相对应。
根据本发明,所述方法进一步包括接收频率分辨率信息,其中,基于频率分辨率信息来执行对参数信息的修改。
根据本发明,增益范围信息包括关于特定目标的绝对增益值和在目标之间的相对增益差值的至少之一。
根据本发明,增益范围信息按照时间和子带而变化。
根据本发明,所述方法包括显示增益范围信息和接收关于每个目标增益调整的用户控制信息,其中,基于用户控制信息来生成控制参数。
根据本发明,所述方法进一步包括使用修改的参数信息来生成多信道信息。
根据本发明,所述方法进一步包括接收包括主信号和子信号的下混合信息,以及使用下混合信息和多信道信息来生成多信道信号。
根据本发明,所述方法进一步包括接收包括控制参数的混合信息,其中,基于目标位置信息、目标增益信息和回放配置信息的至少之一而生成混合信息。
根据本发明,音频信号经由广播信号来接收。
根据本发明,音频信号经由数字介质来接收。
为了进一步实现这些和其他的优点,并且根据本发明的目的,一种计算机可读的记录介质包括记录于其上的程序,其中,程序执行获取在主信号和子信号之间的比率信息,和目标的增益范围信息;基于比率信息和增益范围信息,对包括目标参数和控制参数中的至少之一的参数信息进行修改。
为了进一步实现这些和其他的优点,并且根据本发明的目的,一种用于处理音频信号的装置包括信息收发部和信息修改部,所述信息收发部获取在主信号和子信号之间的比率信息以及目标的增益范围信息,所述信息修改部基于比率信息和增益范围信息,对包括目标参数和控制参数中的至少之一的参数信息进行修改。
为了进一步实现这些和其他的优点,并且根据本发明的目的,一种处理音频信号的方法包括获取包括第一级信息的目标信息;获取在主信号和子信号之间的比率信息和目标的增益范围信息;以及基于第一级信息和第二级信息的之一,对包括目标参数和控制参数的至少之一的参数信息进行修改,其中,所述第二级信息使用比率信息和增益范围信息来生成。
根据本发明,所述方法进一步包括使用修改的参数信息来生成多信道信息。
为了进一步实现这些和其他的优点,并且根据本发明的目的,一种计算机可读记录介质包括记录在其上的程序,其中,程序执行获取包括第一级信息的目标信息;获取在主信号和子信号之间的比率信息,和目标的增益范围信息;以及基于第一级信息和第二级信息的之一,对包括目标参数和控制参数中的至少之一的参数信息进行修改,其中,第二级信息使用比率信息和增益范围信息来生成。
为了进一步实现这些和其他的优点,并且根据本发明的目的,一种用于处理音频信号的装置包括信息收发部和信息修改部,所述信息收发部获取包括第一级信息的目标信息,并且获取在主信号和子信号之间的比率信息以及目标的增益范围信息;所述信息修改部基于第一级信息和第二级信息中的之一,对包括目标参数和控制参数中的至少之一的参数信息进行修改,其中,第二级信息使用比率信息和增益范围信息来生成。
为了进一步实现这些和其他的优点,并且根据本发明的目的,一种处理音频信号的方法包括使用目标信息来生成比率信息;使用比率信息来生成目标的增益范围信息;以及基于增益范围信息对包括目标参数和控制参数的至少之一的参数信息进行修改。
根据本发明,使用目标信号的目标级信息来执行比率信息的生成。
根据本发明,使用在特定目标信号的目标级信息和差分目标信号的目标级信息之间的比率来执行比率信息的生成。
根据本发明,差分目标信号的目标级信息是至少两个不同的目标信号的目标级信息的和。
根据本发明,使用缺省引导信息、用户引导信息和编码引导信息的至少之一来执行增益范围信息的生成。
根据本发明,增益范围信息包括关于特定目标的绝对增益值和在目标之间的相对增益差值的至少之一。
根据本发明,增益范围信息按照时间和子带而变化。
根据本发明,所述方法进一步包括接收包括主信号和子信号的下混合信息,其中,比率信息包括在主信号和子信号之间的相对比率。
根据本发明,所述方法进一步包括使用修改的参数信息来生成多信道信息。
根据本发明,所述方法进一步包括接收包括控制参数的混合信息,其中,基于目标位置信息、目标增益信息和回放配置信息的至少之一来生成混合信息。
根据本发明,音频信号经由广播信号来接收。
根据本发明,音频信号经由数字介质来接收。
为了进一步实现这些和其他的优点,并且根据本发明的目的,一种计算机可读记录介质包括记录在其上的程序,在其中,程序执行使用目标信息来生成比率信息;使用比率信息来生成目标的增益范围信息;以及基于增益范围信息,对包括目标参数和控制参数的至少之一的参数信息进行修改。
为了进一步实现这些和其他的优点,并且根据本发明的目的,一种用于处理音频信号的装置包括信息生成部和信息修改部,所述信息生成部使用目标信息来生成比率信息,并且使用比率信息来生成目标的增益范围信息;所述信息修改部基于增益范围信息,对包括目标参数和控制参数的至少之一的参数信息进行修改。
应该理解,上述一般的描述和以下的详细描述都是示例性和说明性的,并且其旨在为如所要求保护的本发明提供进一步的解释。
发明的实施例
现在将详细参考本发明优选的实施例,其示例在附图中示出。
在该公开中,信息是包括值、参数、系数、元件等的术语,并且不同的情况下能够被理解为不同的意思。
图1是根据本发明实施例的音频信号处理装置的框图。参考图1,根据本发明实施例的音频信号处理装置100包括信息生成单元110、下混合处理单元120、以及多信道解码器130。
信息生成单元110经由音频信号比特流来接收包括目标信息(OI)等的边信息(side information),并且还经由用户接口来接收混合信息(MXI)。在该情况下,目标信息(OI)是包括在下混合信号中的关于目标的信息,并且可以包括目标级(objects level)信息、目标相关性信息等。目标信息(OI)可以包括目标参数(OP),其是表示目标特征的参数。同时,混合参数(MXI)是基于目标位置信息、目标增益信息、回放配置信息等而生成的信息。具体地,目标位置信息是通过用户输入的信息,以控制每个目标的淘选或位置;并且目标增益信息是通过用户输入的信息,以控制每个目标的增益。回放配置信息是包括扬声器数量、扬声器位置、环境信息(扬声器的实际位置)等的信息。并且,回放配置信息可以通过用户输入,事先存储或者从另一设备接收。混合信息(MXI)可以包括控制参数(CP)。具体地,控制参数(CP)可以是与目标增益信息相对应的参数,本发明没有被限制于此。
同时,信息生成单元110从比特流中接收比率信息(RI)、增益范围信息(GI)等,或者通过自身来生成它们。比率信息(RI)、增益范围信息(GI)等的细节将随后参考图2至5来进行描述。信息生成单元110通过使用比率信息(RI)和增益范围信息(GI)来修改参数信息(PI),从而生成修改的参数信息(MPI);并且然后使用修改的参数信息(MPI)来生成多信道信息(MI)。在该种情况下,多信道信息(MI)是用于对下混合信号(DMX)进行上混合的信息,并且可以包括信道级信息、信道相关性信息等。这将随后参考图2至5来详细地描述。
信号生成单元110能够使用修改的参数信息(MPI)等来生成下混合处理信息(DPI)。如果下混合处理单元120不是用于调整增益而是用于调整目标淘选,则信息生成单元110能够使用未修改的参数信息(PI)而不是修改的参数信息(MPI)来生成下混合处理信息(DPI)。
下混合处理单元120接收下混合信息(在下文中,称为下混合信号(DMX))并且然后使用下混合处理信息(DPI)来处理下混合信号(DMX)。下混合处理单元120能够处理下混合信号(DMX)以调整目标的增益或者淘选。
多信道解码器130接收经处理的下混合信号,并且通过使用多信道信息(MI)对经处理的下混合信号进行上混合而生成多信道信号。
将如下参考图2至5来详细地解释通过使用接收或者生成的信息来生成多信道信息(MI)的处理,其中,信息生成单元110从比特流中接收比率信息(RI)、增益范围信息(GI)等,或者通过自身来生成比率信息(RI)、增益范围信息(GI)等。
图2是根据本发明实施例的音频信号处理装置的信息生成单元的详细示例框图,并且图3是用于根据本发明的一个实施例的音频信号处理方法的流程图。图2和图3示出了用于从比特流中接收比率信息(RI)的方案的实施例。参考图2,信息生成单元110包括信息收发部112a、信息修改部114a、以及多信道信息生成部116a。将如下参考图2和图3来详细解释元件和步骤。
首先,信息收发部112a从音频信号比特流中获取包括目标参数(OP)的目标信息(OI),并且还从用户接口等中获取包括控制参数(CP)的混合信息(MXI)[S110]。在该步骤中,目标信息(OI)可以与参考图1所解释的先前的目标信息相同。在目标级信息被包括在目标信息中并且然后其被传输的情况下,传输的目标级信息被称为第一目标级信息(OL1)。
并且,信息收发部112a从音频信号比特流获得关联标记信息[S120]。
关联标记信息的第一关联标记信息可以被包括在比特流中。第一关联标记信息的意义是表示包括在下混合信号中的每个目标信号是否是独立的,或者是否存在至少一个与关联信号相对应的信号。例如,如果第一关联标记信息被设置为0,则这将表示每个目标信号都是独立信号。如果第一关联标记信息被设置为1,则这将表示存在至少一个与关联信号相对应的目标信号。在该种情况下,在调整目标级中,如果与另一目标信号的相对级(relative level)大于或者小于预定级时,关联信号是可能导致音频质量退化的信号。
同时,根据第一关联标记信息,如果存在至少一个与关联信号相对应的目标信号(例如,如果第一关联标记信息被设置为1),则可以提取表示相应的目标是否与每个目标的关联信号相对应的第二关联标记信息。相反,如果不存在与关联信号相对应的任何目标信号(例如,如果第一关联标记信息被设置为0),则不需要提取表示相应的目标是否与每个目标的关联信号相对应的第二关联标记信息。
根据获取的第二关联标记信息,可以获知相应的目标信号是否与关联信号相对应。例如,如果第二关联标记信息被设置为0,则这将表示相应的目标信号不与关联信号相对应。如果第二关联标记信息被设置为1,则这将表示相应的目标信号与关联信号相对应。这并不对本发明的各种实现进行限制。
因此,基于在步骤S120中获取的关联标记信息,获取表示比率信息(RI)和增益范围信息(GI)是否被传输的传输标记信息[S130]。具体地,作为参考第二关联标记信息的结果,如果相应的目标与关联信号相对应(例如,如果第二关联标记信息被设置为1),则可以提取关于相应的目标的传输标记信息。
基于在步骤S130中获取的传输标记信息,可知关于相应的目标的增益范围信息(GI)和比率信息(RI)是否被传输。例如,如果传输标记信息被设置为0,则其表示比率信息(RI)和增益范围信息(GI)没有被传输。如果传输标记信息被设置为1,则其表示比率信息(RI)和增益范围信息(GI)被传输。
可选地,本发明可以实现如下的实施例,即,传输标记信息仅仅被包括在除了包括第一关联标记信息和第二关联标记信息的比特流之外的比特流中。并且,本发明能以各种方式来将其实现。
随后,作为参考在步骤S130中获取的传输标记信息的结果,如果比率信息和增益范围信息被传输(例如,如果传输标记信息被设置为1),则获取表示频率的分辨率的频率分辨率信息[S140],其中,存在增益范围信息(GI)。例如,如果频率分辨率信息是“1”,则其表示在其中存在增益范围信息(GI)的频率分辨率为“28”。如果频率分辨率信息是“2”,则其表示在其中存在增益范围信息(GI)的频率分辨率为“20”。并且,本发明能以各种方式来将其实现。
作为参考在步骤S130中获取的传输标记信息的结果,如果比率信息(RI)和增益范围信息(GI)被传输(例如,传输标记信息被设置为1),则获取比率信息(RI)和增益范围信息(GI)[S150]。在该种情况下,比率信息(RI)是与相应的目标信号是否接近于主信号或者子信号相对应的信息。具体地,比率信息能够包括在主信号和子信号之间的相对比率。例如,主信号与语音信号相对应,并且子信号与噪声信号相对应。再例如,主信号与主要的有声(vocal)信号相对应,并且子信号与后向和声(back-chorus)信号相对应。并且,本发明能以各种方式来将其实现。例如,如果比率信息被设置为“0”,则这将表示相应的目标信号非常接近于子信号。如果比率信息被设置为“1”,则这将表示相应的目标信号接近于子信号。如果比率信息被设置为“2”,则这将表示相应的目标信号接近于主信号。如果比率信息被设置为“3”,则这将表示相应的目标信号非常接近于主信号。并且,本发明能以各种方式来将其实现。
此外,增益范围信息(GI)可以包括关于目标增益调整的范围。在该情况下,该范围可以包括诸如上限、下限等的限制值。限制值可以与关于特定目标的绝对增益值相对应,或者与目标之间的相对增益差值相对应。在限制值与绝对增益值相对应的情况下,例如,有声信号的增益调整范围可以变为10dB或者以下。如果限制值与相对增益差值相对应,则相对于轻微信号(piano signal),有声信号的增益调整值可以变为10dB或者以下。在此情况下,仅仅能够将有声信号加强10dB。可选地,能够对有声信号加强5dB,同时抑制轻微信号5dB。该增益范围信息(GI)可以是在时间和频带上恒定的值,但是也可以是按照时间和子带变化的值。
此外,增益范围信息(GI)可以与相对增益调整互工作信息相对应。在特定目标被加强或者抑制的情况下,相对增益调整互工作信息是表示另一目标是否需要被相应地加强或者抑制的信息。例如,在有声信号和后向和声信号的情况下,如果有声信号被加强10dB,则后向和声信号需要被加强5~15dB以减小音频质量的失真。
在步骤S150中,可以每个目标每个参数地提取比率信息(RI),并且可以根据频率分辨率,每个目标都提取增益范围信息(GI)。并且,本发明能以各种方式来将其实现。
同时,在步骤S150中,仅仅从音频信号比特流中提取比率信息(RI),而增益范围信息(GI)通过自身生成,其没有被提取。在增益范围信息(GI)的生成中,可以使用将参考图4和图5说明的方法。
信息收发部112a能够经由用户接口200来显示在步骤S150中获取的比率信息(RI)和增益范围信息(GI)[S160]。例如,表示有声信号是否是另一信号的相关信号的消息、表示在有声信号的增益被调整10dB或者更多的情况下音频质量可能失真的消息等可以在屏幕上显示,从而使得用户可以观看。在用户确认该消息之后,经由用户接口200,能够输入关于每个目标增益调整的用户控制信息。在该情况下,即使输入了超过目标信号的限制值(10dB)的值(例如,20dB),也能够在限制值内强制调整用户控制信息。虽然超过了限制值,但是能够原样反映用户控制信息(20dB)。在该种情况下,在步骤S110中接收的混合信息(MXI)可以基于该用户控制信息而生成。
信息修改部114a使用在步骤S 150中获取的比率信息(RI)和增益范围信息(GI)来修改参数信息(PI)[S170],所述参数信息(PI)包括从在步骤S110中获取的控制参数(CP)和目标参数(OP)中选择的至少一个。具体地,在已经使用混合信息(MXI)和比率信息(RI)对增益范围信息(GI)进行修改之后,通过将修改的增益范围信息施加到目标参数(OP),能够生成修改的参数信息(MPI)。并且,本发明能以各种方式来将其实现。能够基于在步骤S140中提取的频率分辨率信息来执行步骤S170。具体地,根据在步骤S140中提取的频率分辨率信息、与每个频带相对应的增益范围信息,将相应的增益范围信息映射到整个频带,然后执行步骤S180。同时,修改的参数信息(MPI)可以包括与在步骤S110中接收的第一目标级信息(OL1)不同的第二目标级信息(OL2)。
多信道信息生成部116a生成多信道信息(MI)[S180]。在该情况下,能够使用在步骤S110中传输的第一目标级信息(OL1)来生成多信道信息(MI)。可选地,能够使用在步骤S170中生成的修改的参数信息(MPI)的第二目标级信息(OL2)来生成多信道信息(MI)。当然,使用第一目标级信息(OL1)的情况是在级调整中没有施加引导的情况。
图4是根据本发明实施例的音频信号处理装置的信息生成单元的另一详细示例框图,并且图5是关于根据本发明的另一实施例的音频信号处理方法的流程图。图4和图5与通过解码器自身来生成比率信息(RI)的实施例有关。参考图4,信息生成单元110包括信息收发部112b、信息生成部113b、信息修改部114b、以及多信道信息生成部116b。将如下参考图4和图5来详细说明元件和步骤。
首先,信息收发部112b从音频信号比特流中接收包括目标参数(OP)的目标信息(OI),并且还从用户接口等中接收包括控制参数(CP)的混合信息(MXI)[S310]。此外,信息收发部112b可以接收编码引导信息(EGI)。在此情况下,编码引导信息(EGI)是通过编码器生成的引导信息,包括关于目标的增益调整的范围,并且可以是经由音频信号比特流而接收的信息。
信息生成部113b使用在步骤S310中接收的目标信息(OI)来生成比率信息[S320]。具体地,能够使用在目标信息(OI)中的目标级信息(OL1)来生成比率信息(RI)。在此情况下,比率信息(RI)与主信号和子信号之间的相对比率相对应,或者可以和与另一目标信号的级信息比率相对应。与另一目标信号的级信息比率能够如下定义。
[公式1]
OLD ratio = OLD i OLD k
在公式1中,OLDi表示第i个目标信号的目标级信息,并且OLDk表示其他目标信号(k≠i)的目标级信息。
同时,如果存在至少两个其他的目标信号,比率信息可以和与所有其他的目标信号的级信息比率相对应。其可以如公式2来定义。
[公式2]
OLD ratio = OLD i OLD 1 + . . . + OLD k + . . . + OLD N
在公式2中,OLDi表示第i个目标信号的目标级信息,“N”表示目标信号的总数,并k=0~N(k≠i)。
随后,使用在步骤S320中生成的比率信息(RI)来生成增益范围信息(GI)[S330]。在该情况下,与参考图2和图3说明的先前的增益范围信息(GI)一样,增益范围信息(GI)可以包括关于目标的增益调整的范围。并且,所述范围可以包括诸如上限、下限等的限制值。在此情况下,限制值可以与关于特定目标的绝对增益值相对应,或者与目标之间的相对增益差值相对应。该增益范围信息(GI)可以是在时间和频带上恒定的值,但是也可以是按照时间和子带而变化的值。
可以使用比率信息(RI)以各种方式来生成增益范围信息(GI)。在OLDratio非常高的情况下,能够将增益范围信息(GI)的增益限制值(Ggain)设置为较大的值。这是因为如果OLDratio非常高,则即使给定了较大的表现自由度(rendering freedom degree),也可以减小音频质量的失真。例如,如果有声信号的OLDratio(有声)具有非常高的值,则关于有声信号的增益限制值Ggain可以变为20dB。如果有声信号的OLDratio(有声)仅仅具有关于轻微信号的较高的值,则关于轻微信号的有声信号的增益限制值Ggain(后向和声)可以被设置为较大的值。
同时,为了生成更加精确的增益范围信息(GI),当编码器生成目标级信息(OLD)时,可以给定特定地频率加权。例如,在已经使用滤波器发现OLD之后,可以将来自通过一般方法而发现的OLD中的差分信息包括作为边信息,其中,在所述滤波器中用于加强特定频率的加权被给予与最低频带相对应的第0个频带。在音频信号等的情况中,该差分信息被使用在生成增益范围信息(GI)中。
同时,在步骤S330中的增益范围信息(GI)的生成中,缺省引导信息(DGI)、用户引导信息(UGI)、编码引导信息(EGI)等是可用的。缺省引导信息(DGI)表示通过编码器自身预设的引导信息,用户引导信息(UGI)与经由用户接口200而输入的引导信息相对应,并且编码引导信息(EGI)与由编码器生成并且然后从音频比特流中提取的引导信息相对应。在增益范围信息(GI)的生成中,可以参考缺省引导信息(DGI)、用户引导信息(UGI)、编码引导信息(EGI)等。例如,虽然特定目标的增益限制值(Ggain)可以仅仅基于目标级信息而被设置为10dB。在此情况下,如果用户引导信息(UGI)是5dB,则可以通过参考用户引导信息(UGI)生成增益范围信息(GI)。
因此,与先前的步骤S160中的一样,在步骤S320中生成的比率信息(RI)和在步骤S330中生成的增益范围信息(GI)可以经由用户接口200来显示[S340]。
与先前的步骤S170中的一样,信息修改部114b修改包括目标参数(OP)和控制参数(CP)中的至少之一的参数信息(PI)[S350]。
并且,与先前的步骤S190中的一样,多信道信息生成部116b使用修改的参数信息(MPI)来生成多信道信息(MI)[S360]。
工业应用性
因此,本发明能够应用到音频信号编码和解码中。
虽然已经参考本发明的优选实施例对本发明进行了描述和图示,但是对于本领域的技术人员而言显而易见的是,在不脱离本发明的精神和范围的情况下,可以对其进行各种的修改和变化。因此,本发明旨在覆盖在所附权利要求及其等价物的范围内的该发明的修改和变化。

Claims (20)

1.一种用于处理音频信号的方法,包括:
获取在主信号和子信号之间的比率信息以及目标的增益范围信息;以及
基于所述比率信息和所述增益范围信息,对包括目标参数和控制参数的至少之一的参数信息进行修改。
2.根据权利要求1所述的方法,其中,所述比率信息从音频信号比特流中获取。
3.根据权利要求2所述的方法,进一步包括获取传输标记信息,所述传输标记信息表示所述比率信息和所述增益范围信息是否被传输,
其中,基于所述传输标记信息,从所述音频信号比特流中获取所述比率信息和所述增益范围信息。
4.根据权利要求3所述的方法,进一步包括获取关联标记信息,所述关联标记信息表示目标信号是否与关联信号相对应,
其中,基于所述关联标记信息而执行获取所述传输标记信息。
5.根据权利要求3所述的方法,其中,所述关联标记信息表示目标信号是否与每个目标的关联信号相对应。
6.根据权利要求2所述的方法,进一步包括接收频率分辨率信息,
其中,基于所述频率分辨率信息而执行修改所述参数信息。
7.根据权利要求1所述的方法,其中,所述增益范围信息包括关于特定目标的绝对增益值和目标之间的相对增益差值的至少之一。
8.根据权利要求1所述的方法,其中,所述增益范围信息按照时间和子带变化。
9.根据权利要求1所述的方法,包括:
显示所述增益范围信息;以及
接收关于每个目标增益调整的用户控制信息;
其中,所述控制参数基于所述用户控制信息而生成。
10.根据权利要求1所述的方法,进一步包括使用修改的所述参数信息来生成多信道信息。
11.根据权利要求10所述的方法,进一步包括:
接收包括所述主信号和所述子信号的下混合信息;以及
使用所述下混合信息和所述多信道信息生成多信道信号。
12.根据权利要求1所述的方法,进一步包括接收包括所述控制参数的混合信息,
其中,所述混合信息基于目标位置信息、目标增益信息、以及回放配置信息的至少之一而生成。
13.根据权利要求1所述的方法,其中,所述音频信号经由广播信号而接收。
14.根据权利要求1所述的方法,其中,所述音频信号经由数字介质而接收。
15.一种包括在其上记录程序的计算机可读记录介质,所述程序执行:
获取在主信号和子信号之间的比率信息以及目标的增益范围信息;以及
基于所述比率信息和所述增益范围信息,对包括目标参数和控制参数的至少之一的参数信息进行修改。
16.一种用于处理音频信号的装置,包括:
信息收发部,所述信息收发部获取在主信号和子信号之间的比率信息以及目标的增益范围信息;以及
信息修改部,所述信息修改部基于所述比率信息和所述增益范围信息,对包括目标参数和控制参数的至少之一的参数信息进行修改。
17.一种处理音频信号的方法,包括:
获取包括第一级信息的目标信息;
获取在主信号和子信号之间的比率信息以及目标的增益范围信息;以及
基于所述第一级信息和第二级信息的之一,对包括目标参数和控制参数的至少之一的参数信息进行修改,
其中,所述第二级信息使用所述比率信息和所述增益范围信息而生成。
18.根据权利要求17所述的方法,进一步包括使用修改的所述参数信息来生成多信道信息。
19.一种包括在其上记录程序的计算机可读记录介质,所述程序执行:
获取包括第一级信息的目标信息;
获取在主信号和子信号之间的比率信息以及目标的增益范围信息;以及
基于所述第一级信息和第二级信息的之一,对包括目标参数和控制参数的至少之一的参数信息进行修改,
其中,所述第二级信息使用所述比率信息和所述增益范围信息而生成。
20.一种用于处理音频信号的装置,包括:
信息收发部,所述信息收发部获取包括第一级信息的目标信息,所述信息收发部获取在主信号和子信号之间的比率信息以及目标的增益范围信息;以及
信息修改部,所述信息修改部基于所述第一级信息和第二级信息中的一个,对包括目标参数和控制参数的至少之一的参数信息进行修改,
其中,所述第二级信息使用所述比率信息和所述增益范围信息而生成。
CN200880004888A 2007-02-13 2008-02-13 用于处理音频信号的装置和方法 Pending CN101627425A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US88971507P 2007-02-13 2007-02-13
US60/889,715 2007-02-13
US2456208P 2008-01-30 2008-01-30
US61/024,562 2008-01-30
PCT/KR2008/000836 WO2008100067A1 (en) 2007-02-13 2008-02-13 A method and an apparatus for processing an audio signal

Publications (1)

Publication Number Publication Date
CN101627425A true CN101627425A (zh) 2010-01-13

Family

ID=39690253

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200880010500A Pending CN101647060A (zh) 2007-02-13 2008-02-13 处理音频信号的方法和装置
CN200880004888A Pending CN101627425A (zh) 2007-02-13 2008-02-13 用于处理音频信号的装置和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200880010500A Pending CN101647060A (zh) 2007-02-13 2008-02-13 处理音频信号的方法和装置

Country Status (6)

Country Link
US (1) US20100119073A1 (zh)
EP (2) EP2118886A4 (zh)
JP (2) JP2010518452A (zh)
KR (2) KR20090115200A (zh)
CN (2) CN101647060A (zh)
WO (2) WO2008100068A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN102549655B (zh) * 2009-08-14 2014-09-24 Dts有限责任公司 自适应成流音频对象的系统
BR122021008670B1 (pt) * 2009-10-16 2022-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mecanismo e método para fornecer um ou mais parâmetros ajustados para a provisão de uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação lateral paramétrica associada com a representação de sinal downmix, usando um valor médio
KR101418661B1 (ko) * 2009-10-20 2014-07-14 돌비 인터네셔널 에이비 다운믹스 시그널 표현에 기초한 업믹스 시그널 표현을 제공하기 위한 장치, 멀티채널 오디오 시그널을 표현하는 비트스트림을 제공하기 위한 장치, 왜곡 제어 시그널링을 이용하는 방법들, 컴퓨터 프로그램 및 비트 스트림
MY154641A (en) * 2009-11-20 2015-07-15 Fraunhofer Ges Forschung Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear cimbination parameter
US9042559B2 (en) 2010-01-06 2015-05-26 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
EP2717261A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
JP5591423B1 (ja) 2013-03-13 2014-09-17 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
TWI505724B (zh) * 2013-06-10 2015-10-21 Princeton Technology Corp 增益控制系統、聲音播放系統及其增益控制之方法
WO2016038876A1 (ja) * 2014-09-08 2016-03-17 日本放送協会 符号化装置、復号化装置及び音声信号処理装置
KR102465286B1 (ko) 2015-06-17 2022-11-10 소니그룹주식회사 송신 장치, 송신 방법, 수신 장치 및 수신 방법

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5128597A (en) * 1990-06-14 1992-07-07 Kabushiki Kaisha Tokai-Rika-Denki-Seisakusho Control apparatus for power window regulator
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US5838664A (en) * 1997-07-17 1998-11-17 Videoserver, Inc. Video teleconferencing system with digital transcoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6026168A (en) * 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
DE69826529T2 (de) * 1998-04-15 2005-09-22 Stmicroelectronics Asia Pacific (Pte) Ltd. Schnelle datenrahmen-optimierung in einem audio-kodierer
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US7103187B1 (en) * 1999-03-30 2006-09-05 Lsi Logic Corporation Audio calibration system
JP4870896B2 (ja) * 2000-07-19 2012-02-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ステレオサラウンド及び/又はオーディオ中央信号を得るマルチチャンネルステレオコンバータ
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP4714416B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
WO2004080125A1 (en) * 2003-03-04 2004-09-16 Nokia Corporation Support of a multichannel audio extension
US6937737B2 (en) * 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
TWI233091B (en) * 2003-11-18 2005-05-21 Ali Corp Audio mixing output device and method for dynamic range control
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP2006337767A (ja) * 2005-06-02 2006-12-14 Matsushita Electric Ind Co Ltd 低演算量パラメトリックマルチチャンネル復号装置および方法
WO2007010785A1 (ja) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. オーディオデコーダ
US20070083365A1 (en) * 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
ATE542216T1 (de) * 2006-07-07 2012-02-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zum kombinieren mehrerer parametrisch kodierter audioquellen

Also Published As

Publication number Publication date
US20100119073A1 (en) 2010-05-13
WO2008100068A1 (en) 2008-08-21
KR20090115200A (ko) 2009-11-04
WO2008100067A1 (en) 2008-08-21
JP2010518452A (ja) 2010-05-27
EP2118886A4 (en) 2010-04-21
JP2010518460A (ja) 2010-05-27
EP2111618A1 (en) 2009-10-28
KR20090122221A (ko) 2009-11-26
EP2118886A1 (en) 2009-11-18
EP2111618A4 (en) 2010-04-21
CN101647060A (zh) 2010-02-10

Similar Documents

Publication Publication Date Title
CN101627425A (zh) 用于处理音频信号的装置和方法
CN101536086B (zh) 用于解码音频信号的方法和装置
RU2460155C2 (ru) Кодирование и декодирование звуковых объектов
Faller Parametric coding of spatial audio
CN101461258B (zh) 用于混合音频的方法和装置
CN101578658B (zh) 音频译码器
CN101675471B (zh) 用于处理音频信号的方法和装置
US20060115090A1 (en) Stereo widening network for two loudspeakers
CN101366321A (zh) 双声道音频信号的解码
CN101542596A (zh) 用于编码和解码基于对象的音频信号的方法和装置
JP6010176B2 (ja) オーディオ信号のデコーディング方法及びその装置
CN106796799A (zh) 高效drc配置文件传输
CN101361115A (zh) 解码信号的方法和装置
CN105284133A (zh) 基于信号下混比进行中心信号缩放和立体声增强的设备和方法
US20220303710A1 (en) Sound Field Related Rendering
KR100849030B1 (ko) 복수 채널 스피커 환경에서 가상 스피커 기술을 사용한입체음향 재생 장치
US20100121470A1 (en) Method and an apparatus for processing an audio signal
KR20080078907A (ko) 양 귀 오디오 신호들의 복호화 제어
US20230188924A1 (en) Spatial Audio Object Positional Distribution within Spatial Audio Communication Systems
Czyzewski et al. Some rules and methods for Creation of Surround Sound

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100113