ES2293556T3

ES2293556T3 - Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica.

Info

Publication number: ES2293556T3
Application number: ES05723489T
Authority: ES
Inventors: Christof Faller; Juergen Herre
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV; Agere Systems LLC
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV; Agere Systems LLC
Priority date: 2004-03-04
Filing date: 2005-02-23
Publication date: 2008-03-16
Anticipated expiration: 2025-02-23
Also published as: KR100717598B1; ATE373402T1; BRPI0508146A; HK1101634A1; NO340421B1; TWI376967B; EP1721489A1; TW200603653A; CA2557993C; JP2007526520A; DE602005002463D1; US7805313B2; PT1721489E; MXPA06009931A; JP4418493B2; KR20060131866A; EP1721489B1; NO20064472L; CA2557993A1; AU2005226536A1

Abstract

Método para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el método: aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; y aplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que: la segunda región de frecuencia es diferente de la primera región de frecuencia; y el segundo subconjunto es diferente del primer subconjunto.

Description

Codificación basada en frecuencia de canales de audio en sistemas de codificación multicanal paramétrica.

\global\parskip0.920000\baselineskip

Antecedentes de la invención Campo de la invención

La presente invención se refiere a la codificación de señales de audio y la posterior síntesis de escenas auditivas a partir de los datos de audio codificados.

Referencia cruzada con solicitudes relacionadas

Esta solicitud reivindica el beneficio de la fecha de presentación de la solicitud provisional estadounidense número 60/549.972, presentada el 04/03/2004. El contenido de esta solicitud se refiere al contenido de la solicitud de patente estadounidense US-A-2 003 026 441, presentada el 04/05/2001 ("la solicitud '441"), la solicitud de patente estadounidense US-A-2 003 035 553 presentada el 07/11/2001 ("la solicitud '553"), y la solicitud de patente estadounidense US-A-2 003 219 130, presentada el 24/05/2002 ("la solicitud '130"), y la solicitud de patente estadounidense US-A-2 005 180 579, presentada el 01/04/2004 ("la solicitud '579") y publicada el 18/08/2005.

Descripción de la técnica relacionada

Los sistemas de audio envolvente multicanal han sido estándar en salas de cine durante años. A medida que la tecnología ha avanzado, se ha vuelto asequible producir sistemas envolventes multicanal para uso doméstico. En la actualidad, tales sistemas se venden en su mayoría como "sistemas de cine en casa". De acuerdo con una recomendación ITU-R, la amplia mayoría de estos sistemas proporciona cinco canales de audio regulares y un canal de infragraves de baja frecuencia (denotado canal de efectos de baja frecuencia o LFE). Tal sistema multicanal se denota sistema envolvente 5,1. Existen otros sistemas envolventes, tales como 7,1 (siete canales regulares y un canal LFE) y 10,2 (diez canales regulares y dos canales LFE).

C. Faller y F. Baumgarte, "Efficient representation of spatial audio coding using perceptual parametrization," IEEE Workshop on Appl. of Sig. Proc. to Audio and Acoust., octubre de 2001, y C. Faller y F. Baumgarte,"Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression," Preprint 112th Conv. Aud. Eng. Soc., mayo de 2002, (conjuntamente, "los documentos BCC") las enseñanzas de ambos de los cuales están incorporadas en el presente documento por referencia, describen una técnica de codificación de audio multicanal paramétrica (denominada como codificación BCC).

La figura 1 muestra un diagrama de bloques de un sistema 100 de procesamiento de audio que realiza codificación de indicación binaural (BCC, Binaural Cue Coding) según los documentos BCC. El sistema 100 BCC presenta un codificador 102 BCC que recibe C canales 108 de entrada de audio, por ejemplo, uno desde cada uno de C micrófonos 106 diferentes. El codificador 102 BCC presenta un elemento 110 de downmix, que convierte los C canales de entrada de audio en una señal 112 de suma de audio mono.

Además, el codificador 102 BCC presenta un analizador 114 BCC, que genera flujo 116 de datos de códigos de indicación BCC para los C canales de entrada. Los códigos de indicación BCC (también denominados como parámetros de escena auditiva) incluyen datos de diferencia de nivel entre canales (ICLD, Inter-Channel Level Difference) y de diferencia de tiempo entre canales (ICTD, Inter-Channel Time Difference) para cada canal de entrada. El analizador 114 BCC realiza procesamiento basado en banda para generar datos ICLD e ICTD para cada una de una o más subbandas de frecuencia diferentes (por ejemplo, bandas críticas diferentes) de los canales de entrada de audio.

El codificador 102 BCC transmite la señal 112 de suma y el flujo 116 de datos de códigos de indicación BCC (por ejemplo, como información lateral o bien en banda o bien fuera de banda con respecto a la señal de suma) a un descodificador 104 BCC del sistema 100 BCC. El descodificador 104 BCC presenta un procesador 118 de información lateral, que procesa el flujo 116 de datos para recuperar los códigos 120 de indicación BCC (por ejemplo, datos ICLD e ICTD). El descodificador 104 BCC también presenta un sintetizador 122 BCC, que utiliza los códigos 120 de indicación BCC recuperados para sintetizar C canales 126 de salida de audio a partir de una señal 112 de suma para dar mediante los C altavoces 126, respectivamente.

El sistema 100 de procesamiento de audio puede implementarse en el contexto de señales de audio multicanal, tales como sonido envolvente 5,1. En particular, el elemento 110 de downmix del codificador 102 BCC convertiría los seis canales de entrada del sonido envolvente 5,1 convencional (es decir, cinco canales regulares + un canal LFE) en la señal 112 de suma. Además, el analizador 114 BCC del codificador 102 transformaría los seis canales de entrada al dominio de la frecuencia para generar los códigos 116 de indicación BCC correspondientes. Análogamente, el procesador 118 de información lateral del codificador 104 BCC recuperaría los códigos 120 de indicación BCC del flujo 116 de información lateral recibido, y el sintetizador 122 BCC del descodificador 104 (1) transformaría la señal 112 de suma recibida al dominio de la frecuencia, (2) aplicaría los códigos 120 de indicación BCC recuperados a la señal de suma en el dominio de la frecuencia para generar seis señales en el dominio de la frecuencia, y (3) transformaría esas señales en el dominio de la frecuencia en seis canales en el dominio del tiempo de sonido envolvente 5,1 sintetizado (es decir, cinco canales regulares sintetizados + un canal LFE sintetizado) para dar mediante los altavoces 126.

\global\parskip1.000000\baselineskip

Sumario de la invención

Para aplicaciones de sonido envolvente, las realizaciones de la presente invención implican una técnica de codificación de audio paramétrica basada en BCC en la que la codificación BCC basada en banda no se aplica al (a los) canal(es) de infragraves de baja frecuencia (LFE) para subbandas de frecuencia por encima de una frecuencia de corte. Por ejemplo, para sonido envolvente 5,1, la codificación BCC se aplica a todos los seis canales (es decir, los cinco canales regulares más el un canal LFE) para subbandas por debajo de la frecuencia de corte, mientras que la codificación BCC se aplica a sólo los cinco canales regulares (es decir, y no al canal LFE) para subbandas por encima de la frecuencia de corte. Evitando la codificación BCC del canal LFE a "altas" frecuencias, estas realizaciones de la presente invención (1) han reducido las cargas de procesamiento tanto en el codificador como en el descodificador y (2) presentan flujos de bits de códigos BCC más pequeños que los correspondientes a sistemas basados en BCC que procesan todos los seis canales en todas las frecuencias.

Más generalmente, la presente invención implica la aplicación de técnicas de codificación de audio paramétrica, tales como codificación BCC, pero no necesariamente limitadas a codificación BCC, en la que dos o más subconjuntos diferentes de canales de entrada se procesan para dos o más intervalos de frecuencia diferentes. Tal como se utiliza en esta memoria descriptiva, el término "subconjunto" puede referirse al conjunto que contiene todos los canales de entrada así como esos subconjuntos apropiados que incluyen menos que todos los canales de entrada. La aplicación de la presente invención a codificación BCC de 5,1 y otras señales de sonido envolvente es sólo un ejemplo particular de la presente invención.

\vskip1.000000\baselineskip

Breve descripción de los dibujos

Otros aspectos, características, y ventajas de la presente invención se volverán completamente evidentes a partir de la siguiente descripción detallada, las reivindicaciones adjuntas, y los dibujos adjuntos, en los que:

la figura 1 muestra un diagrama de bloques de un sistema de procesamiento de audio que realiza codificación de indicación binaural (BCC); y

la figura 2 muestra un diagrama de bloques de un sistema de procesamiento de audio que realiza codificación BCC según una realización de la presente invención.

\vskip1.000000\baselineskip

Descripción detallada

La figura 2 muestra un diagrama de bloques de un sistema 200 de procesamiento que realiza codificación de indicación binaural (BCC) para audio envolvente 5,1, según una realización de la presente invención. El sistema 200 BCC presenta un codificador 202 BCC, que recibe seis canales 208 de entrada de audio (es decir, cinco canales regulares y un canal LFE). El codificador 202 BCC presenta un elemento 210 de downmix, que convierte (por ejemplo, promedia) los canales de entrada de audio (incluyendo el canal LFE) en uno o más, pero menos de seis, canales 212 combinados.

Además, el codificador 202 BCC presenta un analizador 214 BCC, que genera un flujo 216 de datos de códigos de indicación BCC para los canales de entrada. Tal como se indica en la figura 2, para subbandas de frecuencia en o por debajo de una frecuencia f_{c} de corte especificada, el analizador 214 BCC utiliza todos los seis canales de entrada de sonido envolvente 5,1 (incluyendo el canal LFE) cuando genera los datos de códigos de indicación BCC. Para todas las otras subbandas (es decir, de alta frecuencia), el analizador 214 BCC utiliza sólo los cinco canales regulares (y no el canal LFE) para generar los datos de códigos de indicación BCC. Como resultado, el canal LFE aporta códigos BCC para sólo subbandas en o por debajo de la frecuencia de corte en vez de para el intervalo de frecuencia BCC completo, reduciendo así el tamaño total del flujo de bits de información lateral.

La frecuencia de corte se elige preferiblemente de tal manera que el ancho de banda de audio efectivo del canal LFE es menos o igual a f_{c} (es decir, el canal LFE presenta sustancialmente energía cero o contenido de audio insustancial más allá de la frecuencia de corte). A menos que las subbandas de frecuencia están alineadas con la frecuencia de corte, la frecuencia de corte cae dentro de una subbanda de frecuencia particular. En ese caso, parte de esa subbanda superará la frecuencia de corte. Para fines de esta memoria descriptiva, una subbanda de este tipo se denomina como que está "en" la frecuencia de corte. En realizaciones preferidas, la totalidad de esa subbanda del canal LFE se codifica por BCC, y la siguiente subbanda de frecuencia superior es la primera subbanda de alta frecuencia que no se codifica por BCC.

En una posible implementación, los códigos de indicación BCC incluyen datos de diferencia de nivel entre canales (ICLD), diferencia de tiempo entre canales (ICTD), y correlación entre canales (ICC, Inter-Channel Correlation). El analizador 214 BCC realiza preferiblemente procesamiento basado en banda análogo al descrito en las solicitudes '411 y '553 para generar datos ICLD e ICTD para diferentes subbandas de frecuencia de los canales de entrada de audio. Además, el analizador 214 BCC genera preferiblemente medidas de coherencia tales como los datos ICC para las diferentes subbandas de frecuencia. Estas medidas de coherencia se describen en mayor detalle en las solicitudes '130 y '579.

El codificador 202 BCC transmite el uno o más canales 212 combinados y el flujo 216 de datos de códigos de indicación BCC (por ejemplo, como información lateral o bien en banda o bien fuera de banda con respecto a los canales combinados) a un descodificador 204 BCC del sistema 200 BCC. El descodificador 204 BCC presenta un procesador 218 de información lateral, que procesa el flujo 216 de datos para recuperar los códigos 220 de indicación BCC (por ejemplo, datos ICLD, ICTD, e ICC). El descodificador 204 BCC también presenta un sintetizador 222 BCC, que utiliza los códigos 220 de indicación BCC recuperados para sintetizar seis canales 224 de salida de audio a partir del uno o más canales 212 combinados para dar mediante seis altavoces 226 de sonido envolvente, respectivamente.

Tal como se indica en la figura 2, el sintetizador 22 realiza síntesis BCC de seis canales para subbandas en o por debajo de la frecuencia f_{c} de corte para generar contenido de frecuencia para todos los seis canales envolventes 5,1 (es decir, incluyendo el canal LFE), mientras que realiza síntesis BCC de cinco canales para subbandas por encima de la frecuencia de corte para generar contenido de frecuencia para sólo los cinco canales regulares del sonido envolvente 5,1. En particular, el sintetizador 222 BCC descompone el (los) canal(es) 212 combinado(s) recibido(s) en un número de subbandas de frecuencia (por ejemplo, bandas críticas). En estas subbandas, se aplica diferente procesamiento para obtener las subbandas correspondientes de los canales de audio de salida. El resultado es que, para el canal LFE, sólo se obtienen subbandas con frecuencias en o por debajo de la frecuencia de corte. Dicho de otro modo, el canal LFE presenta contenido de frecuencia sólo para subbandas en o por debajo de la frecuencia de corte. Las subbandas superiores del canal LFE (es decir, aquellas por encima de la frecuencia de corte) pueden llenarse con señales cero (si es necesario).

Dependiendo de la implementación particular, un codificador BCC podría diseñarse para generar códigos de indicación BCC para todas las frecuencias y simplemente no transmitir aquellos códigos para subbandas particulares (por ejemplo, subbandas por encima de la frecuencia de corte y/o subbandas que presentan energía cero sustancialmente). De manera similar, el descodificador BCC correspondiente podría diseñarse para realizar síntesis BCC convencional para todas las frecuencias, donde el descodificador BCC aplica valores de códigos de indicación BCC apropiados para aquellas subbandas que no presentan códigos transmitidos de manera explícita.

Aunque la presente invención se ha descrito en el contexto de descodificadores BCC que aplican las técnicas de las solicitudes '411 y '553 para sintetizar escenas auditivas, la presente invención también puede implementarse en el contexto de descodificadores BCC que aplican otras técnicas para sintetizar escenas auditivas que no se basan necesariamente en las técnicas de las solicitudes '441 y '553. Por ejemplo, el procesamiento BCC de la presente invención puede implementarse sin datos ICTD, ICLD, y/o ICC, con o sin otros códigos de indicación adecuados, tales como, por ejemplo, aquellos asociados con funciones de transferencia relacionadas con la parte de cabeza.

En la realización de la figura 2, se codifica sonido envolvente 5,1 aplicando análisis BCC de seis canales a subbandas en o por debajo de la frecuencia de corte y análisis BCC de cinco canales a subbandas por encima de la frecuencia de corte. En otra realización, la presente invención puede aplicarse a sonido envolvente 7,1 en el que se aplica análisis BCC de ocho canales a subbandas en o por debajo de una frecuencia de corte especificada y se aplica análisis BCC de siete canales (excluyendo el único canal LFE) a subbandas por encima de la frecuencia de corte.

La presente invención también puede aplicarse a audio envolvente que presenta más de un canal LFE. Por ejemplo, para sonido envolvente 10,2, podría aplicarse análisis BCC de doce canales a subbandas en o por debajo de una frecuencia de corte especificada, mientras que podría aplicarse análisis BCC de diez canales (excluyendo los dos canales LFE) a subbandas por encima de la frecuencia de corte. Como alternativa, podría haber dos frecuencias de corte diferentes especificadas: una primera frecuencia de corte para un primer canal LFE del sonido envolvente 10,2 y una segunda frecuencia de corte para el segundo canal LFE. En este caso y suponiendo que la primera frecuencia de corte es menor que la segunda frecuencia de corte, podría aplicarse análisis BCC de doce canales a subbandas en o por debajo de la primera frecuencia de corte, podría aplicarse análisis BCC de once canales (excluyendo el primer canal LFE) a subbandas que están (1) por encima de la primera frecuencia de corte y (2) en o por debajo de la segunda frecuencia de corte, y podría aplicarse análisis BCC de diez canales (excluyendo ambos canales LFE) a subbandas por encima de la segunda frecuencia de corte.

De manera similar, algunos equipos multicanal de consumo están diseñados a propósito con diferentes canales de salida que presentan diferentes intervalos de frecuencia. Por ejemplo, algunos equipos de sonido envolvente 5,1 presentan dos canales posteriores que están diseñados para reproducir sólo frecuencias por debajo de 7 kHz. La presente invención podría aplicarse a sistemas de este tipo especificando dos frecuencias de corte: una para el canal LFE y una mayor para los canales posteriores. En este caso, podría aplicarse análisis BCC de seis canales a subbandas en o por debajo de la frecuencia de corte de LFE, podría aplicarse análisis BCC de cinco canales (excluyendo el canal LFE) a subbandas que están (1) por encima de la frecuencia de corte de LFE y (2) en o por debajo de la frecuencia de corte de los canales posteriores, y podría aplicarse análisis BCC de tres canales (excluyendo el canal LFE y los dos canales posteriores) a subbandas por encima de la frecuencia de corte de los canales posteriores.

La presente invención puede generalizarse además para aplicar codificación de audio paramétrica a dos o más subconjuntos diferentes de canales de entrada para dos o más regiones de frecuencia diferentes, en la que la codificación de audio paramétrica podría ser distinta a la codificación BCC y las diferentes regiones de frecuencia se eligen de tal manera que el contenido de frecuencia de los diferentes canales de entrada se refleja en estas regiones. Dependiendo de la aplicación particular, podrían excluirse diferentes canales de diferentes regiones de frecuencia en cualquier combinación apropiada. Por ejemplo, los canales de baja frecuencia podrían excluirse de las regiones de alta frecuencia y/o los canales de alta frecuencia podrían excluirse de las regiones de baja frecuencia. Incluso puede darse el caso de que ninguna región de frecuencia única implique todos los canales de entrada.

Tal como se describió previamente, aunque se puede realizar downmix sobre los canales 208 de entrada para formar un único canal 212 combinado (por ejemplo, mono), en implementaciones alternativas, puede realizarse downmix sobre los múltiples canales de entrada para formar dos o más canales "combinados" diferentes, dependiendo de la aplicación de procesamiento de audio particular. Puede encontrarse más información de tales técnicas en la solicitud de patente estadounidense US-A-2 005 157 883, presentada el 20/01/04, publicada el 21/07/2005.

En algunas implementaciones, cuando el downmix genera múltiples canales combinados, los datos de canales combinados pueden transmitirse utilizando técnicas de transmisión de audio convencionales. Por ejemplo, cuando se generan dos canales combinados, puede que puedan emplearse técnicas de transmisión estéreo convencionales. En este caso, un descodificador BCC puede extraer y utilizar los códigos BCC para sintetizar una señal multicanal (por ejemplo, sonido envolvente 5,1) a partir de dos canales combinados. Además, esto puede proporcionar retrocompatibilidad, donde los dos canales combinados por BCC se reproducen utilizando descodificadores estéreos convencionales (es decir, no basados en BCC) que ignoran los códigos BCC. Análogamente, la retrocompatibilidad puede conseguirse para un descodificador mono convencional cuando se genera un único canal combinado por BCC. Obsérvese que, en teoría, cuando hay múltiples canales "combinados", uno o más de los canales combinados pueden basarse realmente en canales de entrada individuales.

Aunque el sistema 200 BCC puede presentar el mismo número de canales de entrada de audio que de canales de salida de audio, en realizaciones alternativas, el número de canales de entrada podría ser o bien mayor o bien menor que el número de canales de salida, dependiendo de la aplicación particular. Por ejemplo, el audio de entrada podría corresponder a sonido envolvente 7,1 y el audio de salida sintetizado podría corresponder a sonido envolvente 5,1, o viceversa.

En general, los codificadores BCC de la presente invención pueden implementarse en el contexto de convertir M canales de audio de entrada en N canales de audio combinados y uno o más conjuntos correspondientes de códigos BCC, donde M>N\geq1. De manera similar, los descodificadores BCC de la presente invención pueden implementarse en el contexto de generar P canales de audio de salida a partir de los N canales de audio combinados y los conjuntos correspondientes de códigos BCC, donde P>N, y P puede igual a o diferente de M.

Dependiendo de la implementación particular, las diversas señales recibidas y generadas por tanto el codificador 202 BCC como el descodificador 204 BCC de la figura 2 pueden ser cualquier combinación adecuada de señales analógicas y/o digitales, incluyendo todas analógicas o todas digitales. Aunque no se muestra en la figura 2, los expertos en la técnica apreciarán que el uno o más canales 212 combinados y el flujo 216 de datos de códigos de indicación BCC pueden codificarse adicionalmente mediante el codificador 202 BCC y descodificarse en consecuencia mediante el descodificador 204 BCC, por ejemplo, basándose en algún esquema de compresión apropiado (por ejemplo, ADPCM) para reducir adicionalmente el tamaño de los datos transmitidos.

La definición de transmisión de datos desde el codificador 202 BCC hasta el descodificador 204 BCC dependerá de la aplicación particular del sistema 200 de procesamiento de audio. Por ejemplo, en algunas aplicaciones, tales como emisiones en directo de conciertos de música, la transmisión puede implicar transmisión en tiempo real de los datos para la reproducción inmediata en una ubicación remota. En otras aplicaciones, "transmisión" puede implicar almacenamiento de los datos en CD u otros medios de almacenamiento adecuados para la reproducción posterior (es decir, en tiempo no real). Por supuesto también pueden ser posibles otras aplicaciones.

Dependiendo de la implementación particular, los canales de transmisión pueden ser cableados o inalámbricos y pueden utilizar protocolos personalizados o estandarizados (por ejemplo, IP). Pueden utilizarse para el almacenamiento medios como CD, DVD, grabadoras de cinta digital, y memorias de estado sólido. Además, la transmisión y/o el almacenamiento pueden, pero no necesitan, incluir codificación de canales. De manera similar, aunque la presente invención se ha descrito en el contexto de sistemas de audio digital, los expertos en la técnica entenderán que la presente invención también puede implementarse en el contexto de sistemas de audio analógico, tales como radio AM, radio FM, y la parte de audio de emisión de televisión analógica, cada uno de los cuales soporta la inclusión de un canal de transmisión de baja tasa de bits en banda adicional.

La presente invención puede implementarse para muchas aplicaciones diferentes, tales como reproducción de música, radiodifusión, y telefonía. Por ejemplo, la presente invención puede implementarse para emisión de radio/TV/Internet digitales (por ejemplo, difusión por Internet ("Webcast")) tales como Sirius Satellite Radio o XM. Otras aplicaciones incluyen voz sobre IP, PSTN y otras redes de voz, emisión de radio analógica, y radio por Internet.

Dependiendo de la aplicación particular, pueden emplearse diferentes técnicas para embeber los conjuntos de códigos BCC en un canal combinado para conseguir una señal BCC de la presente invención. La disponibilidad de cualquier técnica particular puede depender, al menos en parte, del (de los) medio(s) de transmisión/almacenamiento particular(es) utilizado(s) para la señal BCC. Por ejemplo, los protocolos para emisión de radio digital soportan normalmente la inclusión de bits de mejora adicionales (por ejemplo, en la parte de cabecera de paquetes de datos) que los receptores convencionales ignoran. Estos bits adicionales pueden utilizarse para representar los conjuntos de parámetros de escenas auditivas para proporcionar una señal BCC. En general, la presente invención puede implementarse utilizando cualquier técnica adecuada para realizar marca de agua digital sobre señales de audio en las que los datos correspondientes a los conjuntos de parámetros de escenas auditivas están embebidos en la señal de audio para formar una señal BCC. Por ejemplo, estas técnicas pueden implicar ocultación de datos bajo curvas de enmascaramiento de percepción u ocultación de datos en ruido pseudoaleatorio. El ruido pseudoaleatorio puede percibirse como ruido aceptable. El embeber los datos también puede implementarse utilizando métodos similares al robo de bits ("bit robbing") utilizado en transmisión TDM (multiplexación por división de tiempo, Time Division Multiplexing) para señalización en banda. Otra posible técnica es inversión de bits ("bit flipping") LSB de ley mu, donde los bits menos significativos se utilizan para transmitir datos.

La presente invención puede implementarse como procesos basados en circuitos, incluyendo posible implementaciones sobre un único circuito integrado. Tal como sería evidente para un experto en la técnica, también pueden implementarse diversas funciones de elementos de circuito como etapas de procesamiento en un programa de software. Tal software puede emplearse en, por ejemplo, un procesador de señal digital, microcontrolador u ordenador de propósito general.

La presente invención puede realizarse en la forma de métodos y aparatos para poner en práctica esos métodos. La presente invención también puede realizarse en la forma de código de programa realizado en medios tangibles, tales como disquetes, CD-ROM, discos duros, o cualquier otro medio de almacenamiento legible por máquina, en los que, cuando el código de programa se carga en y se ejecuta por una máquina, tal como un ordenador, la máquina se vuelve un aparato para poner en práctica la invención. La presente invención también puede realizarse en la forma de código de programa, por ejemplo, o bien almacenado en un medio de almacenamiento, cargado en y/o ejecutado por una máquina, o bien transmitido sobre algún medio o portador de transmisión, tal como sobre cableado o alambrado eléctrico, a través de fibra óptica, o a través de radiación electromagnética, en la que, cuando el código de programa se carga en y se ejecuta por una máquina, tal como un ordenador, la máquina se vuelve un aparato para poner en práctica la invención. Cuando se implementa sobre un procesador de propósito general, los segmentos del código de programa se combinan con el procesador para proporcionar un dispositivo único que funciona análogamente a circuitos lógicos específicos.

Además se entenderá que los expertos en la técnica pueden realizar diversos cambios en los detalles, materiales, y disposiciones de las partes que se han descrito e ilustrado con el fin de explicar la naturaleza de esta invención sin apartarse del alcance de la invención tal como se expresa en las siguientes reivindicaciones.

Claims

```
\global\parskip0.900000\baselineskip
```
1. Método para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el método:

aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; y

aplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que:

la segunda región de frecuencia es diferente de la primera región de frecuencia; y

el segundo subconjunto es diferente del primer subconjunto.
2. Método según la reivindicación 1, en el que la técnica de codificación de audio paramétrica es codificación de tipo codificación de indicación binaural (BCC).
3. Método según la reivindicación 1, en el que:

la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal de baja frecuencia (LFE);

el primer subconjunto incluye todos los canales de entrada de audio;

la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;

el segundo subconjunto excluye el canal LFE; y

la segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
4. Método según la reivindicación 3, en el que la técnica de codificación de audio paramétrica es codificación BCC.
5. Método según la reivindicación 3, en el que la frecuencia de corte es al menos el ancho de banda de audio efectivo del canal LFE.
6. Método según la reivindicación 3, en el que la señal de audio multicanal es una señal de sonido envolvente 5,1.
7. Método según la reivindicación 1, que comprende además transmitir los códigos de audio paramétricos para el primer y segundo subconjuntos de canales de entrada de audio.
8. Aparato para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el aparato:

medios para aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; y

medios para aplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que:

la segunda región de frecuencia es diferente de la primera región de frecuencia; y

el segundo subconjunto es diferente del primer subconjunto.
9. Codificador de audio paramétrico, que comprende:

un elemento de downmix adaptado para generar uno o más canales combinados a partir de una pluralidad de canales de entrada de audio de una señal de audio multicanal; y

un analizador adaptado para generar:

(1)

códigos de audio paramétricos para un primer subconjunto de los canales de salida de audio en una primera región de frecuencia; y

(2)

códigos de audio paramétricos para un segundo subconjunto de los canales de salida de audio en una segunda región de frecuencia, en el que:

la segunda región de frecuencia es diferente de la primera región de frecuencia; y

el segundo subconjunto es diferente del primer subconjunto.
```
\global\parskip1.000000\baselineskip
```
10. Codificador según la reivindicación 9, en el que los códigos de audio paramétricos son códigos BCC.
11. Codificador según la reivindicación 9, en el que:

la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;

el primer subconjunto incluye todos los canales de salida de audio;

la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;

el segundo subconjunto excluye el canal LFE; y

la segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
12. Codificador según la reivindicación 9, codificador de audio paramétrico que además está adaptado para transmitir los códigos de audio paramétricos para el primer y segundo subconjuntos de canales de entrada de audio.
13. Método para sintetizar una señal de audio multicanal que presenta una pluralidad de canales de salida de audio, comprendiendo el método:

aplicar una técnica de descodificación de audio paramétrica para generar un primer subconjunto de los canales de salida de audio para una primera región de frecuencia; y

aplicar la técnica de descodificación de audio paramétrica para generar un segundo subconjunto de los canales de salida de audio para una segunda región de frecuencia, en el que:

la segunda región de frecuencia es diferente de la primera región de frecuencia; y

el segundo subconjunto es diferente del primer subconjunto.
14. Invención según la reivindicación 13, en la que la técnica de descodificación de audio paramétrica es descodificación BCC.
15. Invención según la reivindicación 13, en la que:

la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;

el primer subconjunto incluye todos los canales de salida de audio;

la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;

el segundo subconjunto excluye el canal LFE; y

la segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
16. Invención según la reivindicación 15, en la que la técnica de descodificación de audio paramétrica es descodificación BCC.
17. Invención según la reivindicación 15, en la que la frecuencia de corte es al menos el ancho de banda de audio efectivo del canal LFE.
18. Invención según la reivindicación 15, en la que la señal de audio multicanal es una señal de sonido envolvente 5,1.
19. Aparato para sintetizar una señal de audio multicanal que presenta una pluralidad de canales de salida de audio, comprendiendo el aparato:

medios para aplicar una técnica de descodificación de audio paramétrica para generar un primer subconjunto de los canales de salida de audio para una primera región de frecuencia; y

medios para aplicar la técnica de descodificación de audio paramétrica para generar un segundo subconjunto de los canales de salida de audio para una segunda región de frecuencia, en el que:

la segunda región de frecuencia es diferente de la primera región de frecuencia; y

el segundo subconjunto es diferente del primer subconjunto.
20. Descodificador de audio paramétrico, que comprende:

un procesador de códigos paramétricos adaptado para generar códigos paramétricos; y

el aparato para sintetizar según la reivindicación 19.
21. Descodificador según la reivindicación 20, en el que los códigos paramétricos son códigos BCC.
22. Descodificador según la reivindicación 20, en el que:

la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;

el primer subconjunto incluye todos los canales de salida de audio;

la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;

el segundo subconjunto excluye el canal LFE; y

la segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.