CN102007532B

CN102007532B - 用于处理音频信号的方法和装置

Info

Publication number: CN102007532B
Application number: CN2009801132382A
Authority: CN
Inventors: 吴贤午; 郑亮源
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2008-04-16
Filing date: 2009-04-16
Publication date: 2013-06-19
Anticipated expiration: 2029-04-16
Also published as: JP2011518353A; WO2009128663A2; US8175295B2; CN102007532A; EP2111060A1; JP5249408B2; EP2111060B1; US20090262957A1; WO2009128663A3

Abstract

公开了一种用于处理音频信号的装置及其方法。本发明包括：接收包括至少一个对象的下混合信号、表现下混合信号的预置信息和指示所述预置信息属性的预置属性信息；如果基于所述预置属性信息，所述预置信息包括在配置信息区域的扩展区域中，则通过将所述预置信息应用到所述下混合信号的所有数据区域来表现所述下混合信号；和如果基于所述预置属性信息，所述预置信息包括在数据区域的扩展区域中，则通过将所述预置信息应用到所述下混合信号的一个对应的数据区域来表现所述下混合信号，其中基于指示所述预置信息的数目的预置数目信息和指示被表现的下混合信号的输出通道的数目的输出通道信息来获得所述预置信息。因此，使用多个预置元数据来选择多个预置信息中的一个，而不需要用户对每个对象的设置，由此可以容易地调节对象输出通道的级别。

Description

用于处理音频信号的方法和装置

技术领域

本发明涉及一种用于处理音频信号的装置及其方法。更具体地，它适合于处理经由数字介质、广播信号等接收到的音频信号。

背景技术

通常，在通过将包括至少一个对象的音频信号下混合为单声道或立体声信号来生成下混合信号的过程中，从对象提取参数。这些参数用于解码下混合信号。并且，可以通过用户所做的选择以及参数来控制对象的位置和增益。

发明内容

技术问题

下混合信号中包括的对象应当通过用户的选择来控制。然而，在用户控制对象的情况下，对于用户来说直接控制所有对象信号是不方便的。并且，相比于专家控制对象的情况，重现音频信号的最佳状态可能是更加困难的。

技术方案

因此，本发明涉及一种用于处理音频信号的装置及其方法，其基本上避免了由于相关技术的限制和缺点造成的一个或多个问题。

本发明的一个目的是提供一种用于处理音频信号的装置及其方法，通过所述装置和方法，可以使用预置信息和预置元数据来控制对象的级别和位置。

本发明的另一个目的是提供一种用于处理音频信号的装置及其方法，通过所述装置和方法，可以通过根据声音源的特征将预置信息和预置元数据应用到下混合信号的全部数据区域或者下混合信号的一个数据区域来控制下混合信号中包括的对象。

本发明的另一个目的是提供一种用于处理音频信号的装置及其方法，通过所述装置和方法，基于用户的选择来选择在显示单元上显示的多个预置元数据中的一个，并且通过所述装置和方法，可以使用对应于选定的元数据的预置信息来控制对象的级别和位置。

本发明的另一个目的是提供一种用于处理音频信号的装置及其方法，通过所述装置和方法，可以以在显示单元上显示通过将预置信息应用到其而调节的对象和选定的预置元数据的方式，来从用户接收选择信号。

有利效果

因此，本发明提供了以下效果或优点。

首先，使用多个预置元数据来选择多个预置信息中的一个，而不需要用户在每个对象上的设置，由此可以容易地调节对象的输出通道的级别。

第二，通过根据声音源的特征来分别选择按数据区域单元来应用预置信息，或者选择将相同的预置信息应用到下混合信号的全部数据区域，能够有效地重现音频信号。

第三，通过以经由显示单元检查通过应用预置信息而调节的对象和选定的预置元数据的方式来选择更适合的预置信息，能够调节对象输出通道的级别或位置。

附图说明

附图被包括以提供对本发明的进一步理解并且合并到说明书和构成本说明书的一部分，示出了本发明的实施例并且连同描述一起用于说明本发明的原理。

在附图中：

图1是根据本发明一个实施例的应用到下混合信号中包括的对象的预置模式的概念图；

图2A和图2B是根据本发明一个实施例的通过基于预置属性信息应用预置信息来调节包括在下混合信号中的对象的概念图；

图3是根据本发明一个实施例的音频信号处理装置的框图；

图4A和图4B是根据本发明一个实施例的将预置信息应用到表现单元的方法的框图；

图5是根据本发明另一个实施例的动态预置信息接收单元和静态预置信息接收单元的示意性框图；

图6是根据本发明另一个实施例的音频信号处理装置的框图；

图7到11是根据本发明另一个实施例的关于音频信号处理方法中的预置信息的各种句法；

图12是根据本发明另一个实施例的音频信号处理装置的框图；

图13是根据本发明另一个实施例的音频信号处理装置的显示单元示例的框图；

图14是根据本发明另一个实施例的用于显示应用了预置信息的对象的至少一个图形元素的示图；

图15是根据本发明另一个实施例的包括动态预置模式接收单元和静态预置模式接收单元的产品的示意图；

图16A和图16B分别是根据本发明另一个实施例的包括动态预置模式接收单元和静态预置模式接收单元的产品的关系的示意图；以及

图17是根据本发明又另一个实施例的包括动态预置模式接收单元和静态预置模式接收单元的广播信号解码装置的示意性框图。

具体实施方式

本发明的另外特征和优点将在随后的描述中阐述，并且根据描述将部分地变得明显，或者可以通过实践本发明习得。本发明的目的和其它优点将通过所撰写的描述及其权利要求以及附图中特别指出的结构来实现和获得。

为了获得这些和其它优点并且根据本发明的目的，如所体现和概括描述的，一种根据本发明的处理音频信号的方法，包括：接收包括至少一个对象的下混合信号、表现下混合信号的预置信息和指示预置信息属性的预置属性信息；如果基于预置属性信息，预置信息包括在配置信息区域的扩展区域中，则通过将预置信息应用到下混合信号的所有数据区域来表现下混合信号；以及如果基于预置属性信息，将预置信息包括在数据区域的扩展区域中，则通过将预置信息应用到下混合信号的一个对应的数据区域来表现下混合信号，其中基于指示预置信息的数目的预置数目信息和指示被表现的下混合信号的输出通道的数目的输出通道信息来获得预置信息。

优选地，预置信息是基于对象的数目和输出通道的数目的预置矩阵。

优选地，预置信息包括单声道预置信息、立体声预置信息和多通道预置信息。

优选地，表现下混合信号还包括通过使用预置信息来控制对象的输出级别。

优选地，预置属性信息指示预置信息是动态的还是静态的。

优选地，预置信息被包括在配置信息区域的扩展区域中或者数据区域的扩展区域中。

为了进一步获得这些和其它优点并且根据本发明的目的，如所体现和概括描述的，一种根据本发明的处理音频信号的装置包括：信号接收单元，接收包括至少一个对象的下混合信号、表现下混合信号的预置信息和指示预置信息的属性的预置属性信息；静态预置模式接收单元，如果基于预置属性信息，预置信息被包括在配置信息区域的扩展区域中，则接收对应于下混合信号的所有数据区域的预置信息和对应于预置信息的预置元数据；动态预置模式接收单元，如果基于预置属性信息，预置信息被包括在数据区域的扩展区域中，则接收对应于下混合信号的数据区域的预置信息和对应于预置信息的预置元数据；以及表现单元，通过将预置信息应用到下混合信号的所有数据区域或数据区域，来表现下混合信号，其中基于指示预置元数据长度的预置元数据长度信息来获得预置元数据，并且其中基于指示预置信息的数目的预置数目信息和指示被表现的下混合信号的输出通道的数目的输出通道信息来获得预置信息。

应当理解，前述一般描述和以下详细描述是示例性和说明性的，并且旨在按所要求的提供对本发明的进一步解释。

发明模式

现在将详细参考本发明的优选实施例，在附图中示出其示例。首先，本发明中的术语可以按以下的引用来解释。并且，本说明书中未公开的术语可以按匹配本发明技术思想的以下含义和概念来解释。因此，本公开的实施例和附图中实现的结构仅是本发明的一个最优选的实施例，并且不能代表本发明的全部技术思想。因此，应当理解，可能存在各种修改/变化和等同物来代替在提交本申请时的内容。

在本公开中，‘信息’是通常包括值、参数、系数、元素等的术语，并且它的含义有时候可以解释为不相同，由此本发明是非限制性的。

图1是根据本发明一个实施例的应用到下混合信号中包括的对象的预置模式的概念图。在本公开中，预置以调节对象的一组信息称为预置模式。预置模式可以指示根据音频信号的特征或者收听环境用户可选择的各种模式中的一个。并且，可以存在至少一种预置模式。而且，预置模式包括应用以调节对象的预置信息和用于表示预置信息的属性等的预置元数据。可以以文本来表示预置元数据。预置元数据不仅指示预置信息的属性(例如音乐厅模式、卡拉OK模式、新闻模式等)，而且包括用于将预置信息表示为预置信息的作者、写作日期、具有预置信息被用到其的对象名称等的这样的有关信息。同时，预置信息是基本上应用到对象的数据。预置信息对应于预置元数据并且可以以各种形式之一来表示。特定地，预置信息可以以矩阵形式表示。

参考图1，预置模式1可以是用于提供摄影棚效果的音乐厅模式，所述摄影棚效果使得听众能够听到音乐厅中的音乐信号。预置模式2可以是卡拉OK模式，用于减少音频信号中语音对象的级别。并且，预置模式n可以是新闻模式，用于增加话音对象的级别。而且，预置模式包括预置元数据和预置信息。如果用户选择了预置模式2，则将显示预置模式2的卡拉OK模式，并且通过将有关于预置元数据2的预置信息2应用到对象，能够调节级别。

在该情况下，预置信息可以包括单声道预置信息、立体声预置信息和多通道预置信息。根据对象的输出通道来确定预置信息。单声道预置信息是如果对象的输出通道是单声道应用的预置信息。立体声预置信息是如果对象的输出通道是立体声应用的预置信息。并且，多通道预置信息是如果对象的输出通道是多通道应用的预置信息。一旦根据配置信息确定了对象的输出通道，使用所确定的输出通道来确定预置信息的类型。然后，通过将预置信息应用到对象，能够调节级别或声相(panning)。

图2A和图2B是根据本发明一个实施例的通过根据预置属性信息应用预置信息来调节下混合信号中包括的对象的概念图。

首先，本发明的音频信号由编码器编码为下混合信号和对象信息。下混合信号和对象信息作为一个比特流或分离的比特流传送到解码器。

参考图2A和图2B，比特流中包括的对象信息具体地包括配置信息区域和多个数据区域1到n。配置信息区域是位于对象信息的比特流报头部分的区域，并且包括共同地应用到对象信息的所有数据区域的信息。例如，对象信息可以包括包含树结构等的配置信息、数据区域长度信息、对象数目信息等。相反，数据区域是根据基于数据区域长度信息来划分整个音频信号的时域所得到的单元。对象信息的数据区域对应于下混合信号的数据区域，并且包括用于上混下混合信号的对应数据区域的对象信息。对象信息包括对象级别信息和对象增益信息等。

在根据本发明一个实施例的音频信号处理方法中，首先从比特流的对象信息读取预置属性信息(preset_attribute_information)。预置属性信息指示预置信息包括在比特流的哪个区域中。优选地，预置属性信息指示预置信息是包括在对象信息的配置信息区域中还是对象信息的数据区域中。并且，它的细节如表1中所示。

[表1]

参考图2A，如果将预置属性信息设置为0以表示预置信息包括在配置信息区域中，从配置信息区域提取的预置信息通过被同样地应用到下混合信号的所有数据区域来被表现。

参考图2B，如果配置属性信息被设置为1以表示预置信息包括在数据区域中，从数据区域提取的预置信息通过被应用到下混合信号的一个对应的数据区域来被表现。例如，将从数据区域1提取的预置信息应用到下混合信号的数据区域1。并且，将从数据区域n提取的预置信息应用到下混合信号的数据区域n。

另外，预置属性信息指示预置信息是动态的还是静态的。如果将预置属性信息设置为0以指示预置信息包括在配置信息区域中，则预置信息可能是静态的。另一方面，如果将预置属性信息设置为1以表示预置信息包括在数据区域中，则预置信息可能是动态的。在该情况下，因为预置信息可以通过应用到一个对应的数据区域来表现下混合信号的一个对应的数据区域，动态地应用数据区域单元。优选地，在动态的情况下预置信息存在于数据区域的扩展区域中，并且在静态的情况下预置信息存在于配置信息区域的扩展区域中。

因此，根据本发明一个实施例的音频信号处理方法能够基于预置属性信息根据声音源的特征使用每个数据区域的适当预置信息或者用于所有数据区域的相同预置信息，来上混下混合信号。

图3是根据本发明一个实施例的音频信号处理装置300的框图。

参考图3，音频信号处理装置300可以包括预置模式生成单元310、信息接收单元(图中未示出)、动态预置模式接收单元320、静态预置模式信息330和表现单元340。

预置模式生成单元310生成用于在表现包括在音频信号中的对象中进行调节的预置模式，并且能够包括预置属性确定单元311、预置元数据生成单元312和预置信息生成单元313。

如在前面描述中所提及的，预置属性确定单元311确定预置属性信息，所述预置属性信息指示是通过将预置信息包括在配置信息区域中来将其应用到下混合信号的所有数据区域，还是通过将预置信息包括在数据区域中来将其按下混合信号的每个数据区域应用。

随后，预置元数据生成单元312和预置信息生成单元313能够生成一个预置元数据和预置信息，或者总计为下混合信号的数据区域的数目的多个预置元数据和预置信息。

预置元数据生成单元312能够通过接收文本输入来生成预置元数据，以表示预置信息。相反，如果将用于调节对象级别和/或对象位置的增益输入到预置信息生成单元313，则预置信息生成单元313能够生成将应用到对象的预置信息。

可以生成为可应用到每个对象的预置信息。预置信息可以以各种类型实现。例如，预置信息可以实现为通道级别差异(CLD)参数、矩阵等。

预置信息生成单元313还能够生成指示对象的输出通道的数目的输出通道信息。

可以以包括在比特流中的形式传送预置元数据生成单元312生成的预置元数据和预置信息，预置信息生成单元313生成的输出通道信息等。优选地，它们可以以被包括在包括下混合信号的比特流的附属区域中的形式传送。

同时，预置模式生成单元312还能够生成指示预置信息和输出通道信息包括在比特流中的预置存在信息。在该情况下，预置存在信息可以以指示预置信息等包括在比特流的哪个区域中的容器类型来表示。可选地，预置存在信息可以以标志类型来表示，该标志类型仅指示预置信息等是否包括在比特流中而不是指示指定的区域。并且，预置存在信息也可以以各种类型实现。

预置模式生成单元312能够生成多种预置模式。每种预置模式包括预置信息、预置元数据和输出通道信息。在该情况下，预置模式生成单元312还能够生成指示预置模式的数目的预置数目信息。

因此，预置模式生成单元310能够以比特流的格式生成和输出预置属性信息、预置元数据和预置信息。

如图2A或2B中所示，将比特流输入到信息接收单元(图中未示出)。从输入到信息接收单元(图中未示出)的比特流获得预置属性信息。然后，确定预置信息包括在所传送比特流的哪个区域中。

如果基于从预置属性确定单元311输出的预置属性信息，预置信息包括在数据区域中(表1中所示的‘preset_attribute_flag＝1’)，则启动动态预置模式接收单元320。

并且，动态预置模式接收单元320可以包括接收对应于相应数据区域的预置元数据的动态预置元数据接收单元321和接收每个数据区域预置信息的动态预置信息接收单元322。动态预置元数据接收单元321接收选定的元数据并且然后输出接收到的元数据。动态预置信息接收单元322接收预置信息。并且，将随后参考图4A到5详细说明相关细节。

如果基于预置属性信息，预置信息包括在配置信息区域中(表1中示出的‘preset_attribute_flag＝0’)，则启动静态预置模式接收单元330。

并且，静态预置模式接收单元330可以包括接收对应于所有数据区域的预置元数据的静态预置元数据接收单元331和接收预置信息的静态预置信息接收单元332。

尽管静态预置模式接收单元330的静态预置元数据接收单元331和静态预置信息接收单元332与动态预置模式接收单元320的动态预置元数据接收单元321和动态预置信息接收单元322具有相同的结构和功能，它们彼此不同之处在于对应于所接收和所输出预置信息和元数据的下混合信号的范围。

表现单元340接收根据下混合音频信号生成的下混合信号，所述音频信号包括多个对象和从动态预置信息接收单元322输出的预置信息或者从静态预置信息接收单元332输出的预置信息的输入。在该情况下，预置信息用于通过被应用到下混合信号中包括的对象来调节对象的级别或位置。

在音频信号处理装置300包括显示单元(图中未示出)的情况下，可以在显示单元的屏幕上显示从动态预置元数据接收单元321输出的选定的预置元数据或者从静态预置元数据接收单元331输出的选定的预置元数据。

图4A和图4B是根据本发明一个实施例的将预置信息应用到表现单元的方法的框图。

图4A示出了在表现单元440中应用从动态预置模式接收单元320输出的预置信息的方法。图4A中示出的动态预置模式接收单元320等同于前面的图3中示出的动态预置模式接收单元320，并且包括动态预置元数据接收单元321和动态预置信息接收单元322。

动态预置模式接收单元320接收和输出按每个数据区域的预置元数据和预置信息。然后将预置信息输入到表现单元440。

表现单元440通过接收下混合信号以及预置信息来按数据区域执行表现。并且，表现单元440包括数据区域1的表现单元、数据区域2的表现单元、数据区域n的表现单元。在该情况下，表现单元440的数据区域44X的每个表现单元以接收对应于每个数据区域的预置信息的输入并且将该输入应用到下混合信号的方式来执行表现。

例如，将作为体育场模式的预置信息_1应用到数据区域1。将作为卡拉OK模式的预置信息_3应用到数据区域2。并且，将作为新闻模式的预置信息_2应用到数据区域6。在该情况下，预置信息_n中的‘n’指示数据区域模式的索引。同时，应该理解也可以按数据区域来输出预置元数据。

图4B示出了在表现单元440中应用从静态预置模式接收单元330输出的预置信息的方法。图4B中示出的静态预置模式接收单元330等同于前面的图3中示出的静态预置模式接收单元330。

静态预置模式接收单元330接收和输出对应于下混合信号的所有数据区域的预置元数据和预置信息。然后将预置信息输入到表现单元440。

图4B中示出的表现单元440包括数据区域44X的多个表现单元，其像前面图4A中示出的表现单元一样总计为数据区域的数目。在从静态预置模式接收单元330接收预置信息的情况下，表现单元440以数据区域44X的所有表现单元同样地将接收到的预置信息应用到下混合信号的方式来执行表现。

例如，如果从静态预置信息接收单元332输出的预置信息是指示新闻模式的预置信息2，新闻模式可应用于包括第1到第n个数据区域的所有数据区域。

图5是本发明的音频信号处理装置300的包括在动态预置模式接收单元320中的动态预置信息接收单元322和包括在静态预置模式接收单元330中的静态预置信息接收单元332的示意性框图。

参考图5，动态/静态预置信息接收单元322/332包括输出通道信息接收单元322a/332a和预置信息确定单元322b/332b。

输出通道信息接收单元322a/332a接收指示输出通道的数目的输出通道信息并且然后输出接收到的输出通道信息，根据所述输出通道信息，将重现包括在下混合信号中的对象。在该情况下，输出通道信息可以包括单声道通道、立体声通道或多通道(即5.1通道)，由此，本发明是非限制性的。

预置信息确定单元322b/332b基于从输出通道信息接收单元322a/332a输入的输出通道信息来接收对应的预置信息，并且然后输出接收到的预置信息。在该情况下，预置信息可以包括单声道预置信息、立体声预置信息或多通道预置信息中的一种。

在预置信息具有矩阵类型的情况下，可以基于对象的数目和输出通道的数目来确定预置信息的维数。并且，预置矩阵可以具有‘(对象数目)*(输出通道数目)’的形式。例如，如果下混合信号中包括的对象数目为‘n’并且来自输出通道信息接收单元322a/332a的输出通道是5.1通道，即六个通道，则预置信息确定单元322b/332b能够输出实现为‘n*6’类型的多通道预置信息。在该情况下，矩阵的元素是指示第a个对象包括在第i个通道中的范围的增益值。

图6是根据本发明另一个实施例的音频信号处理装置600的框图。

参考图6，音频信号处理装置600主要包括下混合单元610、对象信息生成单元620、预置模式生成单元630、下混合信号处理单元640、信息处理单元650和多通道解码单元660。

将多个对象输入到下混合单元610以生成单声道下混合信号或立体声下混合信号。并且，将多个对象输入到对象信息生成单元620以生成对象信息。对象信息可以包括指示对象级别的对象级别信息、对象增益信息，以及指示对象间相关性存在或不存在的对象相关性信息，所述对象增益信息包括在下混合信号中包括的对象的增益值和在立体声下混合信号的情况下在下混合信号中包括的对象的范围。

随后，将下混合信号和对象信息输入到预置模式生成单元630以生成预置模式，所述预置模式包括指示预置信息包括在比特流的数据区域中还是配置信息区域中的预置属性信息、用于调节对象的级别的预置信息和用于表示预置信息的预置元数据。用于生成预置属性信息、预置信息和预置元数据的过程等同于前面的参考图1到5说明的音频信号处理装置和方法的描述，并且为了清楚起见，将省略它的细节。

预置模式生成单元630还能够生成指示预置信息是否存在于比特流中的预置存在信息，指示预置信息的数目的预置数目信息和指示预置元数据长度的预置元数据长度信息。

对象信息生成单元620生成的对象信息和预置模式生成单元630生成的预置属性信息、预置信息、预置元数据、预置存在信息、预置数目信息和预置元数据长度信息可以以包括在SAOC比特流中的方式被传送，或者也可以在包括下混合信号的一个比特流中被传送。在该情况下，可以将其中包括下混合信号和预置有关信息的比特流输入到解码装置的信号接收单元(图中未示出)。

信息处理单元650包括对象信息处理单元651、动态预置模式接收单元652和静态预置模式接收单元653，并且接收SAOC比特流。如参考图2到5的前述描述中所提及的，基于SAOC比特流中包括的预置属性信息来确定将SAOC比特流输入到动态预置模式接收单元652还是静态预置模式接收单元653。

动态预置模式接收单元652或者静态预置模式接收单元653经由SAOC比特流接收预置属性信息、预置存在信息、预置数目信息、预置元数据、输出通道信息和预置信息(例如预置矩阵)并且使用根据参考图1到5描述的音频信号处理方法和装置的各种实施例的方法。

动态预置模式接收单元652或静态预置模式接收单元653输出预置元数据和预置信息。

对象信息处理单元651接收输出的预置元数据和预置信息，并且然后使用接收到的预置元数据和预置信息连同SAOC中包括的对象信息，生成用于预处理下混合信号的下混合处理信息和用于表现下混合信号的多通道信息。在该情况下，从动态预置模式接收单元652输出的预置信息和预置元数据对应于下混合信号的一个数据区域，而从静态预置模式接收单元653输出的预置信息和预置元数据对应于下混合信号的所有数据区域。

随后，将下混合处理信息输入到下混合信号处理单元640以便通过改变其中包括下混合信号中所包括的对象的通道来执行声相。预处理的下混合信号通过与从信息处理单元650输出的多通道信息一起被输入到多通道解码单元660来被向上混，由此生成多通道音频信号。

因此，在本发明的音频信号处理装置中，当使用对象信息将包括多个对象的下混合信号解码为多通道信号时，通过进一步使用先前建立的预置信息和预置元数据，调节对象级别是便利的。而且，以基于预置属性信息将应用到对象的预置信息按数据区域单独地应用或者同样地应用到所有数据区域的方式，能够根据声音源的特征适当地增强舞台声音效果。

图7到11是根据本发明另一个实施例的与音频信号处理方法中的预置信息有关的各种句法。

参考图7，与预置信息有关的信息可以存在于比特流的配置信息区域(SAOCSpecificConfig())中。

首先，能够从比特流的配置信息区域预置数目信息(bsNumPresets)。并且，还能够基于预置数目信息获得指示按预置信息(第i个预置信息)应用了预置信息的对象的输出通道的输出通道信息(bsPresetLevel[i])。在表2中表示输出通道信息的含义。

[表2]

bsPresetLevel[i]	含义
		0	仅增益
1	立体声声相
		2	多通道声相
3	保留

随后，能够获得指示预置信息包括在配置信息区域中还是数据区域中的预置属性信息(bsPresetDynamic[i])。在将预置属性信息(bsPresetDynamic[i])设置为0的情况下，如图7中所示，它指示静态预置模式。并且，用于调节下混合信号的对象级别或声相的预置信息(getPreset())对应于下混合信号的所有数据区域。在该情况下，预置元数据(PresetMetaData(numPresets)可以包括在配置信息区域中以同样对应于预置信息。在表3中表示预置属性信息的含义。

[表3]

bsPresetDynamic[i]	含义
		0	非时变的(静态的)
1	时变的(动态的)

图8示出了在图7中示出的预置属性信息(bsPresetDynamic[i])包括在数据区域中的情况下用于数据区域信息的句法。

参考图8，如果图7中示出的预置属性信息(bsPresetDynamic[i])被设置为1，则它不同于‘if(bsPresetDynamic[i])’。因此，未从配置信息区域获得预置信息。其后，如图8中所示，由于在数据区域中满足(SAOCFrame()(if(bsPresetDynamic[i])条件，所以能够获得预置信息(getPreset())。由于从数据区域获得预置信息，不像前面的图7中示出的预置信息同样地应用到所有数据区域，后面的预置信息可以仅应用到对应的数据区域。

同时，在图7和图8中，尽管预置信息包括在配置信息区域(SAOCSpecificConfig())和数据区域(SAOCFrame())中，它也可以包括在配置信息区域扩展区域(SAOCExtensionConfig())和数据区域扩展区域(SAOCExtensionFrame())中。

在这种情况下，配置信息区域的扩展区域和数据区域的扩展区域中包括的预置信息等同于前面参考图7和图8描述的预置信息。而且，配置信息区域的扩展区域和数据区域的扩展区域还可以包括对应于预置信息的预置元数据、输出通道信息、预置存在信息等以及预置信息。

图9示出了根据本发明另一个实施例的指示预置信息的句法。

参考图9，预置信息可以通过使用EcData来生成。相反，预置信息能够使用传送的方法来使用增益值本身而不是使用EcData。并且，可以使用通道级别差异(CLD)表或者另外的独立表来量化该预置信息。

图10示出了根据本发明另一个实施例的指示预置元数据的句法。

参考图10，预置元数据首先获得指示对应于预置信息的元数据的长度的预置元数据长度信息(bsNumCharMetaData[prst])。其后，能够基于预置元数据长度信息获得对应于每个预置信息的预置元数据(bsMetaData[prst])。

因此，通过基于指示元数据长度的预置长度信息以文本类型表示代表预置信息的预置元数据，根据本发明的音频信号处理方法和装置可以减少不必要的编码。

图11示出了根据本发明的另一个实施例的包括预置信息的数据区域的句法。

参考图11，基于对象的数目(numObjects)，预置信息能够携带按对象映射到输出通道(numRenderingChannel[i])的信息。如图11中所示的预置信息可以从比特流的数据区域获得。在预置信息包括在数据区域扩展区域中的情况下，可以从数据区域扩展区域(SAOCExtensionFrame())获得它。在预置信息包括在比特流的配置信息区域中的情况下，可以从配置信息区域获得它。

图12是根据本发明另一个实施例的音频信号处理装置1200的框图。

参考图12，音频信号处理装置1200主要包括预置模式生成单元1210、信息接收单元(图中未示出)、预置模式输入单元1220、预置模式选择单元1230、动态预置模式接收单元1240、静态预置模式接收单元1250、表现单元1260和显示单元1270。

图12中示出的预置模式生成单元1210、信息接收单元(图中未示出)、动态预置模式接收单元1240、静态预置模式接收单元1250和表现单元1260与图3中示出的预置模式生成单元310、动态预置模式接收单元320、静态预置模式接收单元330和表现单元340具有相同的结构和功能，并且在本公开中省略它们的细节。

参考图12，预置模式输入单元1220在显示单元(1270)上显示从预置元数据生成单元1212接收到的多个预置元数据，并且然后接收用于选择多个预置元数据中的一个的选择信号的输入。预置模式选择单元1230通过选择信号来选择预置元数据中的一个和对应于预置元数据的预置信息。

在该情况下，如果从预置属性确定单元1211接收的预置属性信息(preset_attribute_information)指示预置信息包括在数据区域中，则选择单元1230选择的预置元数据和对应于预置元数据的预置信息分别输入到动态预置模式接收单元1240的预置元数据接收单元1241和预置信息接收单元1242。这样做时，显示单元1270、预置模式输入单元1220和预置模式选择单元1230可以将上面的操作重复像数据区域的数目那么多的次数。

相反，如果从预置属性确定单元1211接收的预置属性信息(preset_attribute_information)指示预置信息包括在配置信息区域中，则预置模式选择单元1220选定的预置元数据和对应于预置元数据的预置信息分别输入到静态预置模式接收单元1250的预置元数据接收单元1251和预置信息接收单元1252。

此外，将选定的预置元数据输出到显示单元1270以被显示，而将选定的预置信息输出到表现单元1260。

显示单元1270与显示多个预置元数据的单元相同，以使得可以将选择信号输入到预置模式输入单元1220。同时，显示单元1270可以不同于显示多个预置元数据的单元。在显示单元1270和预置模式输入单元1220使用相同单元的情况下，能够以不同地配置屏幕上显示的描述(例如‘选择预置模式’、‘预置模式X被选择’等)、可视对象、字符等的方式来区分每种操作。

图13是根据本发明另一个实施例的音频信号处理装置1200的显示单元1270的示例的框图。

首先，显示单元1270可以包括选定的预置元数据和指示对象的级别或位置的至少一个或多个图形元素，所述对象的级别或位置使用对应于预置元数据的预置信息来调节。

参考图13，在经由预置模式选择单元1230从在图12中所示的显示单元1270上显示的多个预置元数据(例如体育场模式、屏蔽室模式、新闻模式、实况模式等)选择新闻模式的情况下，将对应于新闻模式的预置信息应用到下混合信号中包括的每个对象。在该情况下，语音级别将升高，而外部对象(吉它、小提琴、鼓、…、大提琴)的级别将降低。

变换在显示单元1270中包括的图形元素以指示相应对象的级别或位置的启动或改变。例如，如图13所示，将指示语音的图形元素的开关移动到右侧，而将指示对象重置的图形元素的开关移动到左侧。

图形元素能够以各种方式指示使用预置信息调节的对象的级别或位置。可以存在指示每个对象的至少一个图形元素。在该情况下，第一图形元素指示在应用预置信息之前对象的级别或位置。并且，第二图形元素能够指示通过向其应用了预置信息所调节的对象的级别或位置。在该情况下，便于比较在应用预置信息之前和之后对象的级别或位置。因此，便于用户得知预置信息如何调节每个对象。

图14是根据本发明另一个实施例的用于显示应用了预置信息的对象的至少一个图形元素的示图。

参考图14，第一图形元素具有条类型，并且第二图形元素可以表示为第一图形元素内的扩展线。在该情况下，第一图形元素指示在应用预置信息之前对象的级别或位置。并且，第二图形元素指示通过应用了预置信息所调节的对象的级别或位置。

如图14中所示，在上部的图形元素指示在应用预置信息之前对象的级别等同于应用了预置信息之后的对象级别。中间部分的图形元素指示通过应用预置信息所调节的对象的级别高于应用预置信息之前的对象的级别。并且，下部的图形元素指示通过应用预置信息降低了对象的级别。

因此，使用指示应用预置信息之前和之后的对象的级别或位置的至少一个或多个图形元素，便于用户得知预置信息如何调节每个对象。而且，便于用户认识到预置信息的特征，以帮助用户选择适当的预置模式，如必要的话。

图15是根据本发明另一个实施例的包括动态预置模式接收单元和静态预置模式接收单元的产品的示意图，并且图16A和图16B分别是根据本发明另一个实施例的包括动态预置模式接收单元和静态预置模式接收单元的产品的关系的示意图。

参考图15，有线/无线通信单元1510通过有线/无线通信接收比特流。特别是，有线/无线通信单元1510包括有线通信单元1511、红外通信单元1512、蓝牙单元1513和无线LAN通信单元1514中的至少一个。

用户验证单元1520接收用户信息的输入并且然后执行用户验证。用户验证单元1520可以包括指纹识别单元1521、虹膜识别单元1522、面部识别单元1523和语音识别单元1524中的至少一个。在该情况下，用户验证可以以接收指纹信息、虹膜信息、面部轮廓信息或者话音信息的输入，将输入的信息转换为用户信息，并且然后确定用户信息是否与所注册的用户数据匹配的方式来执行。

输入单元1530是使得用户能够输入各种类型的命令的输入设备。并且，输入单元1530可以包括键区单元1531、触摸板单元1532和遥控器单元1533中的至少一个，照此输入单元1530的示例是非限制性的。同时，如果从元数据接收单元1541输出的用于多个预置信息的预置元数据，这将在随后说明，经由显示单元1562可见，则用户能够经由输入单元1530选择预置元数据，并且将选定的预置元数据上的信息输入到控制单元1550。

信号解码单元1540包括动态预置模式接收单元1541和静态预置模式接收单元1542。动态预置模式接收单元1541基于预置属性信息接收对应于每个数据区域的预置信息和预置元数据。并且，静态预置模式接收单元1542基于预置属性信息接收对应于所有数据区域的预置信息和预置元数据。而且，基于指示元数据长度的预置元数据长度信息来接收预置元数据。并且，基于指示预置信息是否存在的预置存在信息、指示预置信息的数目的预置数目信息和指示输出通道是单声道通道、立体声通道和多通道中的一个的输出通道信息来获得预置信息。如果以矩阵表示预置信息，则接收输出通道信息并且然后基于接收到的输出通道信息来接收预置矩阵。

信号解码单元1540通过使用接收到的比特流、预置元数据和预置信息解码音频信号来生成输出信号并且输出文本类型的预置元数据。

控制单元1550从输入设备接收输入信号并且控制信号解码单元1540和输出单元1560的所有过程。如前面描述中所提及的，如果将关于选定的预置元数据的信息作为输入信号类型来从输入单元1530输入到控制单元1550，并且从有线/无线通信单元1510输入指示预置信息包括在比特流的哪个区域中的预置属性信息(preset_attribute_information)，动态预置模式接收单元1541和静态预置模式接收单元1542基于预置属性信息和输入信号来接收对应于选定的预置元数据的预置信息，并且然后使用接收到的预置信息解码音频信号。

并且，输出单元1560是用于输出由信号解码单元1540生成的输出信号等的元件。输出单元1560可以包括扬声器单元1561和显示单元1562。如果输出信号是音频信号，则经由扬声器单元1561输出。如果输出信号是视频信号，则经由显示单元1562输出。而且，输出单元1560经由显示单元1562在屏幕上显现从控制单元1550输入的预置元数据。

图16示出了终端之间或者终端和服务器之间的关系，其每一个对应于图15中示出的产品。

参考图16(A)，可以观察到，可以经由有线/无线通信单元在第一终端1610和第二终端1620之间执行数据或比特流的双向通信。

经由有线/无线通信单元通信的数据或比特流可以是图2A和图2B的比特流和包括如上面参考图1到15的描述提及的预置属性信息、预置信息和预置元数据的数据。

参考图16(B)，可以观察到，可以在服务器1630和第一终端1640之间执行有线/无线通信。

图17是广播信号解码装置1700的示意性框图，其中实现了根据本发明实施例的包括动态预置模式接收单元和静态预置模式接收单元的预置接收单元。

参考图17，信号分离器1720从调谐器1710接收涉及TV广播的多个数据。接收到的数据由信号分离器1720分离并且然后由数据解码器1730解码。同时，信号分离器1720分离的数据可以存储在例如HDD这样的存储介质1750中。

将信号分离器1720分离的数据输入到包括音频解码器1741和视频解码器1742的解码器1740，以被解码为音频信号和视频信号。根据本发明的一个实施例，音频解码器1741包括动态预置模式接收单元1741A和静态预置模式接收单元1741B。动态预置模式接收单元1741A基于预置属性信息接收对应于每个数据区域的预置信息和预置元数据。并且，静态预置模式接收单元1741B基于预置属性信息接收对应于所有数据区域的预置信息和预置元数据。

而且，基于指示元数据长度的预置元数据长度信息来接收预置元数据。并且，基于指示预置信息是否存在的预置存在信息、指示预置信息的数目的预置数目信息和指示输出通道是单声道通道、立体声通道和多通道之一的输出通道信息来获得预置信息。如果预置信息以矩阵表示，则接收输出通道信息并且然后基于接收到的输出通道信息来接收预置矩阵。

信号解码单元1741通过使用接收到的比特流、预置元数据和预置信息解码音频信号来生成输出信号并且输出文本类型的预置元数据。

显示单元1770显现或显示从视频解码器1742输出的视频信号和从音频解码器1741输出的预置元数据。显示单元1770包括扬声器单元(图中未示出)。并且，其中使用预置信息调节从音频解码器1741输出的对象的级别的音频信号经由显示单元1770中包括的扬声器单元输出。而且，解码器1740解码的数据可以存储在例如HDD这样的存储介质1750中。

同时，信号解码装置1700还可以包括能够控制通过用户输入的信息而接收到的多个数据的应用管理器1760。

应用管理器1760包括用户接口管理器1761和服务管理器1762。用户接口管理器1761控制用于从用户接收信息输入的接口。例如，用户接口管理器1761能够控制显示单元1770上显现的文本的字体类型、屏幕亮度、菜单配置等。同时，如果广播信号由解码器1740和显示单元1770解码和输出，则服务管理器1762能够使用用户输入的信息来控制接收到的广播信号。例如，服务管理器1762能够提供广播通道设置、报警功能设置、成人验证功能等。从应用管理器1760输出的数据通过被传送到显示单元1770以及解码器1740，是可用的。

尽管在此参考本发明的优选实施例描述和阐释了本发明，但对于本领域技术人员来说明显的是，可以在不偏离本发明精神和范围的情况下在其中做出各种修改和变化。因此，旨在本发明覆盖落入所附权利要求及其等同物的范围内的本发明的修改和变化。

工业适用性

本发明可应用于音频信号编码和解码。

Claims

1.一种处理音频信号的方法，包括：

接收包括至少一个对象的下混合信号、表现所述下混合信号的预置信息和指示所述预置信息的属性的预置属性信息；

如果基于所述预置属性信息，所述预置信息包括在配置信息区域中，则通过将所述预置信息应用到所有数据区域来表现所述下混合信号，该所有数据区域应用有所述配置信息区域中的信息；以及

基于所述预置属性信息，如果所述预置信息包括在数据区域中，则通过将所述预置信息应用到所述下混合信号的一个对应的数据区域来表现所述下混合信号，

其中，基于指示所述预置信息的数目的预置数目信息和指示被表现的下混合信号的输出通道的数目的输出通道信息来获得所述预置信息。

2.根据权利要求1所述的方法，其中，所述预置信息是基于所述对象的数目和所述输出通道的数目的预置矩阵。

3.根据权利要求1所述的方法，其中，所述预置信息包括单声道预置信息、立体声预置信息和多通道预置信息。

4.根据权利要求1所述的方法，其中，表现所述下混合信号进一步包括通过使用所述预置信息来控制所述对象的输出级别。

5.根据权利要求1所述的方法，其中，所述预置属性信息指示所述预置信息是动态的还是静态的。

6.根据权利要求1所述的方法，其中，所述预置信息包括在所述配置信息区域的扩展区域中或者所述数据区域的扩展区域中。

7.一种处理音频信号的装置，包括：

信号接收单元，接收包括至少一个对象的下混合信号、表现所述下混合信号的预置信息和指示所述预置信息的属性的预置属性信息；

静态预置模式接收单元，基于所述预置属性信息，如果所述预置信息包括在配置信息区域中，则接收对应于所有数据区域的预置信息和对应于所述预置信息的预置元数据，该所有数据区域应用有配置信息区域中的信息；和

动态预置模式接收单元，基于所述预置属性信息，如果所述预置信息包括在对应的数据区域中，则接收对应于所述下混合信号的数据区域的预置信息和对应于所述预置信息的预置元数据；以及

表现单元，通过将所述预置信息应用到所述下混合信号的所有数据区域或通过将所述预置信息应用到所述下混合信号的对应的数据区域来表现所述下混合信号，

其中，基于指示所述预置元数据的长度的预置元数据长度信息来获得所述预置元数据，以及

8.根据权利要求7所述的装置，其中，所述预置信息基于所述对象的数目和所述输出通道的数目来表示预置矩阵。

9.根据权利要求7所述的装置，其中，所述预置信息包括单声道预置信息、立体声预置信息和多通道预置信息。

10.根据权利要求7所述的装置，其中，所述表现单元通过使用所述预置信息来控制所述对象的输出级别。

11.根据权利要求7所述的装置，其中，所述预置信息包括在所述配置信息区域的扩展区域中或者所述数据区域的扩展区域中。

12.根据权利要求7所述的装置，其中，所述预置属性信息指示所述预置信息是动态的还是静态的。

13.一种处理音频信号的方法，包括：

生成下混合至少一个对象的下混合信号，其中所述下混信号包括多个数据区域；

生成预置信息，以通过应用到所述下混合信号来控制所述对象；

生成指示所述预置信息的数目的预置数目信息和指示上混的下混合信号的输出通道是单声道、立体声和多通道中的一个的输出通道信息；

生成对应于所述预置信息的预置元数据；以及

确定预置属性信息，所述预置属性信息指示包括所述预置信息的区域，其中所述区域是配置信息数据区域或比特流的数据区域。

14.一种处理音频信号的装置，包括：

下混合单元，通过下混合至少一个对象生成下混合信号；

预置信息生成单元，生成预置信息以通过应用到所述下混合信号来控制所述对象；

信息生成单元，生成指示所述预置信息的数目的预置数目信息和指示上混的下混合信号的输出通道是单声道、立体声和多通道中的一个的输出通道信息；

预置元数据生成单元，生成对应于所述预置信息的预置元数据；和

预置属性信息确定单元，确定预置属性信息，所述预置属性信息指示包括所述预置信息的区域，其中所述区域是配置信息数据区域或比特流的数据区域。