ES2641538T3

ES2641538T3 - Codificación de contenido de audio multicanal

Info

Publication number: ES2641538T3
Application number: ES14759219.0T
Authority: ES
Inventors: Heiko Purnhagen; Harald Mundt; Kristofer Kjoerling
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2013-09-12
Filing date: 2014-09-08
Publication date: 2017-11-10
Anticipated expiration: 2034-09-08
Also published as: EP3293734A1; EP3561809B1; JP6644732B2; EP3044784B1; JP7196268B2; US11410665B2; CN107134280A; JP2022010239A; JP2016534410A; JP6978565B2; WO2015036352A1; JP2023029374A; US20190267012A1; US20220375481A1; CN117037810A; US20180108364A1; CN110473560B; JP2018146975A; CN110648674B; JP2020204778A

Description

5

10

15

20

25

30

35

40

45

DESCRIPCION

Codificacion de contenido de audio multicanal.

Campo tecnico

La descripcion en la presente memoria se refiere, en general, a la codificacion de senales de audio multicanal. En particular, se refiere a un codificador y un descodificador para codificar y descodificar multiples senales de audio de entrada para la reproduccion en una configuracion de altavoz que tiene cierto numero de canales.

Antecedentes

El contenido de audio multicanal corresponde a una configuracion de altavoz que tiene cierto numero de canales. Por ejemplo, el contenido de audio multicanal puede corresponder a una configuracion de altavoz con cinco canales frontales, cuatro canales ambiente, cuatro canales superiores y un canal de efectos de frecuencia baja (LFE, por sus siglas en ingles). Se puede hacer referencia a dicha configuracion de canales como una configuracion 5/4/4.1, 9.1 +4, o 13.1. A veces es deseable reproducir el contenido de audio multicanal codificado en un sistema de reproduccion que tiene una configuracion de altavoz con menos canales, a saber altavoces, que el contenido de audio multicanal codificado. A continuacion, se hace referencia a dicho sistema de reproduccion como un sistema de reproduccion heredado. Por ejemplo, puede ser deseable reproducir contenido de audio 13.1 codificado en una configuracion de altavoz con tres canales frontales, dos canales ambiente, dos canales superiores y un canal LFE. Tambien se hace referencia a dicha configuracion de canales como una configuracion 3/2/2.1, 5.1+2, o 7.1.

Segun la tecnica anterior, se requerira una descodificacion total de todos los canales del contenido de audio multicanal original seguida por la submezcla de la configuracion de canal del sistema de reproduccion heredado. De manera aparente, dicho enfoque es computacionalmente ineficiente dado que todos los canales del contenido de audio multicanal original necesitan descodificarse. Existe, por consiguiente, la necesidad de un esquema de codificacion que permita descodificar, de manera directa, una submezcla apropiada para un sistema de reproduccion heredado.

El Informe de Busqueda Internacional emitido en conexion con la presente solicitud ha citado la Publicacion de Solicitud de Patente Internacional No. WO 2013/173314 A1, el "documento 314", como un "documento de relevancia particular". El "documento 314" se refiere a las mejoras en la calidad de senales de audio multicanal codificadas. Se describe un codificador de audio configurado para codificar una senal de audio multicanal segun una velocidad binaria total disponible. La senal de audio multicanal se puede representar como un grupo basico de canales para reproducir la senal de audio multicanal segun una configuracion de canal basica y como un grupo de extension de canales, el cual -en combinacion con el grupo basico- se utiliza para reproducir la senal de audio multicanal segun una configuracion de canal extendida. La configuracion de canal basica y la configuracion de canal extendida son diferentes entre sf.

Breve descripcion de los dibujos

Las realizaciones a modo de ejemplo se describiran ahora con referencia a los dibujos anexos, en los cuales: la Figura 1 ilustra un esquema de descodificacion segun realizaciones a modo de ejemplo, la Figura 2 ilustra un esquema de codificacion correspondiente al esquema de descodificacion de la Figura 1, la Figura 3 ilustra un descodificador segun realizaciones a modo de ejemplo,

las Figuras 4 y 5 ilustran una primera y una segunda configuracion, respectivamente, de un modulo de descodificacion segun realizaciones a modo de ejemplo,

las Figuras 6 y 7 ilustran un descodificador segun realizaciones a modo de ejemplo,

la Figura 8 ilustra un componente de reconstruccion de alta frecuencia usado en el descodificador de la Figura 7, la Figura 9 ilustra un codificador segun realizaciones a modo de ejemplo,

las Figuras 10 y 11 ilustran una primera y una segunda configuracion, respectivamente, de un modulo de codificacion segun realizaciones a modo de ejemplo.

Todas las figuras son esquematicas y, en general, solo muestran partes que son necesarias para elucidar la descripcion, mientras que otras partes se pueden omitir o simplemente sugerir. A menos que se indique lo contrario, iguales numerales de referencia se refieren a partes iguales en las diferentes figuras.

Descripcion detallada

5

10

15

20

25

30

35

40

45

Por consiguiente, segun se describe mas arriba, es un objeto proveer metodos de codificacion/descodificacion para codificar/descodificar contenido de audio multicanal que permita la descodificacion eficiente de una submezcla apropiada para un sistema de reproduccion heredado.

I. Resumen - Descodificador

Segun un primer aspecto, se provee un metodo de descodificacion, un descodificador y un producto de programa de ordenador para descodificar contenido de audio multicanal.

Segun realizaciones a modo de ejemplo, se provee un metodo para un descodificador para descodificar multiples senales de audio de entrada para la reproduccion en una configuracion de altavoz con N canales, las multiples senales de audio de entrada representando contenido de audio multicanal codificado correspondiente a K>N canales, que comprende:

del contenido de audio multicanal codificado correspondiente a K canales, extraer M senales de audio de entrada, en donde 1<M<N<2M;

en donde si N=M, el metodo ademas comprende la etapa de:

descartar cualquier senal restante en el contenido de audio multicanal codificado;

descodificar, en un primer modulo de descodificacion, las M senales de audio de entrada en M senales media que son apropiadas para la reproduccion en una configuracion de altavoz con M canales;

en donde si N>M, el metodo ademas comprende las etapas de:

del contenido de audio multicanal codificado correspondiente a K canales, extraer N-M senales de audio de entrada adicionales, en donde cada una de las senales de audio de entrada adicionales corresponde a una de las M senales media y es una senal lateral o una senal complementaria que, junto con la senal media a la cual corresponde y un parametro de ponderacion a, permite la reconstruccion de una senal lateral; y para cada uno de los N canales que supere los M canales

descodificar, en un modulo de descodificacion estereo, la senal de audio de entrada adicional y la senal media a la cual corresponde para generar una senal estereo que incluye una primera y una segunda senal de audio que son apropiadas para la reproduccion en dos de los N canales de la configuracion de altavoz;

por medio de lo cual se generan las N senales de audio.

El metodo de mas arriba es ventajoso en que el descodificador no tiene que descodificar todos los canales del contenido de audio multicanal y forma una submezcla del contenido de audio multicanal total en caso de que el contenido de audio se reproduzca en un sistema de reproduccion heredado.

En mayor detalle, un descodificador heredado que se disena para descodificar contenido de audio correspondiente a una configuracion de altavoz de M canal puede simplemente usar las M senales de audio de entrada y descodificar dichas senales en M senales media que son apropiadas para la reproduccion en la configuracion de altavoz de M canal. No se necesita otra submezcla del contenido de audio en el lado de descodificador. De hecho, una submezcla que es apropiada porque la configuracion de altavoz de reproduccion heredado ya se ha preparado y codificado en el lado de codificador y se representa por las M senales de audio de entrada.

Un descodificador que se disena para descodificar contenido de audio correspondiente a mas de los M canales puede recibir senales de audio de entrada adicionales y combinar dichas senales con las correspondientes de las M senales media por medio de tecnicas de descodificacion estereo con el fin de llegar a canales de salida correspondientes a una configuracion de altavoz deseada. El metodo propuesto es, por lo tanto, ventajoso en que es flexible con respecto a la configuracion de altavoz que se usara para la reproduccion.

Segun realizaciones a modo de ejemplo, el modulo de descodificacion estereo es utilizable en al menos dos configuraciones dependiendo de la velocidad binaria a la cual el descodificador recibe datos. El metodo puede ademas comprender recibir una indicacion sobre cual de las al menos dos configuraciones usar en la etapa de descodificacion de la senal de audio de entrada adicional y su correspondiente senal media.

Ello es ventajoso en que el metodo de descodificacion es flexible con respecto a la velocidad binaria usada por el sistema de codificacion/descodificacion.

Segun realizaciones a modo de ejemplo, la etapa de recibir una senal de audio de entrada adicional comprende:

5

10

15

20

25

30

35

40

45

50

recibir un par de senales de audio correspondientes a una codificacion conjunta de una senal de audio de entrada adicional correspondiente a una primera de las M senales medias y una senal de audio de entrada adicional correspondiente a una segunda de las M senales media; y

descodificar el par de senales de audio para generar las senales de audio de entrada adicionales correspondientes a la primera y segunda de las M senales media, respectivamente.

Ello es ventajoso en que las senales de audio de entrada adicionales se pueden codificar de forma eficiente por pares.

Segun realizaciones a modo de ejemplo, la senal de audio de entrada adicional es una senal con forma de onda codificada que comprende datos espectrales correspondientes a frecuencias hasta una primera frecuencia, y la senal media correspondiente es una senal con forma de onda codificada que comprende datos espectrales correspondientes a frecuencias hasta una frecuencia que es mas grande que la primera frecuencia, y en donde la etapa de descodificar la senal de audio de entrada adicional y su correspondiente senal media segun la primera configuracion del modulo de descodificacion estereo comprende las etapas de:

si la senal de audio de entrada adicional es en la forma de una senal complementaria, calcular una senal lateral para frecuencias hasta la primera frecuencia multiplicando la senal media por el parametro de ponderacion a y sumando el resultado de la multiplicacion a la senal complementaria; y

mezclar de forma ascendente la senal media y la senal lateral para generar una senal estereo que incluye una primera y una segunda senal de audio, en donde para las frecuencias por debajo de la primera frecuencia la mezcla ascendente comprende llevar a cabo una transformada inversa de suma y diferencia de la senal media y la senal lateral, y para las frecuencias por encima de la primera frecuencia la mezcla ascendente comprende llevar a cabo la mezcla ascendente parametrica de la senal media.

Ello es ventajoso en que la descodificacion llevada a cabo por los modulos de descodificacion estereo permite la descodificacion de la senal media y una senal de audio de entrada adicional correspondiente, donde la senal de audio de entrada adicional tiene forma de onda codificada hasta una frecuencia que es inferior a la frecuencia correspondiente para la senal media. Por consiguiente, el metodo de descodificacion permite al sistema de codificacion/descodificacion funcionar a una velocidad binaria reducida.

Llevar a cabo la mezcla ascendente parametrica de la senal media en general significa que la primera y la segunda senal de audio, para frecuencias por encima de la primera frecuencia, se reconstruyen parametricamente segun la senal media.

Segun realizaciones a modo de ejemplo, la senal media con forma de onda codificada comprende datos espectrales correspondientes a frecuencias hasta una segunda frecuencia, el metodo ademas comprende:

extender la senal media a un rango de frecuencia por encima de la segunda frecuencia llevando a cabo la reconstruccion de alta frecuencia antes de llevar a cabo la mezcla ascendente parametrica.

Por consiguiente, el metodo de descodificacion permite al sistema de codificacion/descodificacion funcionar a una velocidad binaria que es incluso mas reducida.

Segun realizaciones a modo de ejemplo, la senal de audio de entrada adicional y la senal media correspondiente son senales con forma de onda codificada que comprenden datos espectrales correspondientes a frecuencias hasta una segunda frecuencia, y la etapa de descodificacion de la senal de audio de entrada adicional y su correspondiente senal media segun la segunda configuracion del modulo de descodificacion estereo comprende las etapas de:

si la senal de audio de entrada adicional es en la forma de una senal complementaria, calcular una senal lateral multiplicando la senal media por el parametro de ponderacion a y sumando el resultado de la multiplicacion a la senal complementaria; y

llevar a cabo una transformada inversa de suma y diferencia de la senal media y la senal lateral para generar una senal estereo que incluye una primera y una segunda senal de audio.

Ello es ventajoso en que la descodificacion llevada a cabo por los modulos de descodificacion estereo permite ademas la descodificacion de la senal media y una senal de audio de entrada adicional correspondiente, donde la senal de audio de entrada adicional tiene forma de onda codificada hasta la misma frecuencia. Por consiguiente, el metodo de descodificacion permite al sistema de codificacion/descodificacion funcionar tambien a una velocidad binaria alta.

5

10

15

20

25

30

35

40

45

Segun realizaciones a modo de ejemplo, el metodo ademas comprende: extender la primera y la segunda senal de audio de la senal estereo a un rango de frecuencia por encima de la segunda frecuencia llevando a cabo la reconstruccion de alta frecuencia. Ello es ventajoso en que la flexibilidad con respecto a la velocidad binaria del sistema de codificacion/descodificacion aumenta.

Segun realizaciones a modo de ejemplo donde las M senales media se reproduciran en una configuracion de altavoz con M canales, el metodo puede ademas comprender:

extender el rango de frecuencia de al menos una de las M senales media llevando a cabo la reconstruccion de alta frecuencia segun los parametros de reconstruccion de alta frecuencia que se asocian a la primera y segunda senal de audio de la senal estereo que se puede generar a partir de al menos una de las M senales media y su correspondiente senal de entrada de audio adicional.

Ello es ventajoso en que la calidad de las senales medias de alta frecuencia reconstruida puede mejorar.

Segun realizaciones a modo de ejemplo donde la senal de audio de entrada adicional es en la forma de una senal lateral, la senal de audio de entrada adicional y la correspondiente senal media tienen forma de onda codificada mediante el uso de una transformada discreta del coseno modificada que tiene diferentes tamanos de transformada. Ello es ventajoso en que la flexibilidad con respecto a la eleccion de tamanos de transformada aumenta.

Realizaciones a modo de ejemplo se refieren tambien a un producto de programa de ordenador que comprende un medio legible por ordenador con instrucciones para llevar a cabo cualquiera de los metodos de codificacion descritos mas arriba. El medio legible por ordenador puede ser un medio legible por ordenador no transitorio.

Realizaciones a modo de ejemplo se refieren tambien a un descodificador para llevar a cabo el metodo.

II. Resumen - Codificador

Segun un segundo aspecto, se proveen un metodo de codificacion, un codificador y un producto de programa de ordenador para descodificar contenido de audio multicanal.

El segundo aspecto puede tener, en general, las mismas caractensticas y ventajas que el primer aspecto.

Segun realizaciones a modo de ejemplo se provee un metodo para un codificador (900) para codificar multiples senales de audio de entrada (920) que representan contenido de audio multicanal correspondiente a K canales, que comprende:

recibir K senales de audio de entrada correspondientes a los canales de una configuracion de altavoz con K canales;

generar M senales media que son apropiadas para la reproduccion en una configuracion de altavoz con M canales, en donde 1<M<K<2M, y K-M senales de audio de salida de las K senales de audio de entrada, en donde 2M-K de las senales media corresponde, cada una, a una senal respectiva de 2M-K de las senales de audio de entrada; y

en donde K-M senales media no correspondientes a las senales de audio de entrada y las K-M senales de audio de salida se generan para cada valor de K que supera M:

codificando, en un modulo de codificacion estereo, dos de las K senales de audio de entrada para generar una senal media y una senal de audio de salida, la senal de audio de salida siendo una senal lateral o una senal complementaria que junto con la senal media y un parametro de ponderacion a permite la reconstruccion de una senal lateral;

codificando, en un segundo modulo de codificacion, las M senales media en M canales de audio de salida adicionales; e

incluyendo las K-M senales de audio de salida y los M canales de audio de salida adicionales en una corriente de datos para su transmision a un descodificador.

Segun realizaciones a modo de ejemplo, el metodo puede ademas comprender llevar a cabo la codificacion estereo de las K-M senales de audio de salida por pares antes de la inclusion en la corriente de datos.

Segun realizaciones a modo de ejemplo donde el modulo de codificacion estereo funciona segun una primera configuracion, la etapa de codificar dos de las K senales de audio de entrada para generar una senal media y una senal de audio de salida comprende:

transformar las dos senales de audio de entrada en una primera senal que es una senal media y una segunda senal que es una senal lateral;

5

10

15

20

25

30

35

40

45

codificar con forma de onda la primera y la segunda senal en una primera y una segunda senal con forma de onda codificada, respectivamente, en donde la segunda senal tiene forma de onda codificada hasta la primera frecuencia y la primera senal tiene forma de onda codificada hasta una segunda frecuencia que es mas grande que la primera frecuencia;

sujetar las dos senales de audio de entrada a la codificacion estereo parametrica para extraer parametros estereo parametricos que permitan la reconstruccion de datos espectrales de las dos de las K senales de audio de entrada para frecuencias por encima de la primera frecuencia; e

incluir la primera y la segunda senal con forma de onda codificada y los parametros estereo parametricos en la corriente de datos.

Segun realizaciones a modo de ejemplo, el metodo ademas comprende:

para frecuencias por debajo de la primera frecuencia, transformar la segunda senal con forma de onda codificada, la cual es una senal lateral, en una senal complementaria multiplicando la primera senal con forma de onda codificada, la cual es una senal media, por un parametro de ponderacion a y restando el resultado de la multiplicacion de la segunda senal con forma de onda codificada; e

incluir el parametro de ponderacion a en la corriente de datos.

Segun realizaciones a modo de ejemplo, el metodo ademas comprende:

sujetar la primera senal, la cual es una senal media, a la codificacion de reconstruccion de alta frecuencia para generar parametros de reconstruccion de alta frecuencia que permitan la reconstruccion de alta frecuencia de la primera senal por encima de la segunda frecuencia; e

incluir los parametros de reconstruccion de alta frecuencia en la corriente de datos.

Segun realizaciones a modo de ejemplo donde el modulo de codificacion estereo funciona segun una segunda configuracion, la etapa de codificacion de dos de las K senales de audio de entrada para generar una senal media y una senal de audio de salida comprende:

codificar con forma de onda la primera y la segunda senal en una primera y una segunda senal con forma de onda codificada, respectivamente, en donde la primera y la segunda senal tienen forma de onda codificada hasta la segunda frecuencia; e

incluir la primera y la segunda senales con forma de onda codificada.

Segun realizaciones a modo de ejemplo, el metodo ademas comprende:

transformar la segunda senal con forma de onda codificada, la cual es una senal lateral, en una senal complementaria multiplicando la primera senal con forma de onda codificada, la cual es una senal media, por un parametro de ponderacion a y restando el resultado de la multiplicacion de la segunda senal con forma de onda codificada; e

incluir el parametro de ponderacion a en la corriente de datos.

Segun realizaciones a modo de ejemplo, el metodo ademas comprende:

sujetar cada una de dichas dos K senales de audio de entrada a la codificacion de reconstruccion de alta frecuencia para generar parametros de reconstruccion de alta frecuencia que permitan la reconstruccion de alta frecuencia de dichas dos de las K senales de audio de entrada por encima de la segunda frecuencia; e

Realizaciones a modo de ejemplo se refieren tambien a un producto de programa de ordenador que comprende un medio legible por ordenador con instrucciones para llevar a cabo el metodo de codificacion de las realizaciones a modo de ejemplo. El medio legible por ordenador puede ser un medio legible por ordenador no transitorio.

Realizaciones a modo de ejemplo se refieren tambien a un codificador para llevar a cabo el metodo de codificacion.

III. Realizaciones a modo de ejemplo

5

10

15

20

25

30

35

40

45

Una senal estereo que tiene un canal izquierdo (I) y un canal derecho (D) se puede representar de diferentes formas correspondientes a diferentes esquemas de codificacion estereo. Segun un primer esquema de codificacion al que en la presente memoria se hace referencia como codificacion izquierda-derecha "ID-codificacion" de los canales de entrada I, D y canales de salida A, B de un componente de conversion estereo se relacionan segun las siguientes expresiones:

imagen1

En otras palabras, ID-codificacion simplemente significa una transferencia de los canales de entrada. Se dice que una senal estereo que se representa por sus canales I y D tiene una representacion I/D o se encuentra en una forma

I/D.

Segun un segundo esquema de codificacion al que en la presente memoria se hace referencia como codificacion de suma y diferencia (o codificacion de lado medio "LM-codificacion"), los canales de entrada y salida de un componente de conversion estereo se relacionan segun las siguientes expresiones:

imagen2

En otras palabras, LM-codificacion supone calcular una suma y una diferencia de los canales de entrada. En la presente memoria, se hace referencia a ello como llevar a cabo una transformada de suma y diferencia. Por dicho motivo, el canal A se puede ver como una senal media (una senal de suma M) del primer y segundo canales I y D, y el canal B se puede ver como una senal lateral (una senal de diferencia L) del primer y segundo canales I y D. En caso de que una senal estereo se hubiera sujetado a una codificacion de suma y diferencia, se dice que tiene una representacion media/lateral (M/L) o que se encuentra en una forma media/lateral (M/L).

Desde la perspectiva de un descodificador, la expresion correspondiente es:

imagen3

En la presente memoria, se hace referencia a la conversion de una senal estereo que es en la forma media/lateral en una forma I/D como llevar a cabo una transformada inversa de suma y diferencia.

El esquema de codificacion media-lateral se puede generalizar en un tercer esquema de codificacion al que en la presente memoria se hace referencia como "LM-codificacion mejorada" (o codificacion de suma-diferencia mejorada). En la LM-codificacion mejorada, los canales de entrada y salida de un componente de conversion estereo se relacionan segun las siguientes expresiones:

A = 0,5 (I+D); B = 0,5 (I (1 - a) - D(l+a)),

imagen4

donde a es un parametro de ponderacion. El parametro de ponderacion a puede ser variante en el tiempo y la frecuencia. Tambien en el presente caso se puede pensar la senal A como una senal media y la senal B como una senal lateral modificada o senal lateral complementaria. En particular, para a = 0, el esquema LM-codificacion mejorada degenera en la codificacion media-lateral. En caso de que se hubiera sometido una senal estereo a la codificacion media/lateral mejorada, se dice que tiene una representacion media/complementaria/a (M/c/a) o que se encuentra en una forma media/complementaria/a.

Segun lo descrito mas arriba, una senal complementaria se puede transformar en una senal lateral multiplicando la senal media correspondiente por el parametro a y sumando el resultado de la multiplicacion a la senal complementaria.

La Figura 1 ilustra un esquema de descodificacion 100 en un sistema de descodificacion segun realizaciones a modo de ejemplo. Un componente de recepcion 102 recibe una corriente de datos 120. La corriente de datos 120 representa el contenido de audio multicanal codificado correspondiente a K canales. El componente de recepcion 102 puede demultiplexar y descuantificar la corriente de datos 120 para formar M senales de audio de entrada 122 y K-M senales de audio de entrada 124. Aqrn se supone que M<K.

Las M senales de audio de entrada 122 se descodifican por un primer modulo de descodificacion 104 en M senales media 126. Las M senales media son apropiadas para la reproduccion en una configuracion de altavoz con M canales. El primer modulo de descodificacion 104 puede, en general, funcionar segun cualquier esquema de descodificacion conocido para descodificar contenido de audio correspondiente a M canales. Por consiguiente, en

5

10

15

20

25

30

35

40

45

50

55

caso de que el sistema de descodificacion sea un sistema de descodificacion heredado o de baja complejidad que solo admite la reproduccion en una configuracion de altavoz con M canales, las M senales media se pueden reproducir en los M canales de la configuracion de altavoz sin la necesidad de descodificar todos los K canales del contenido de audio original.

En el caso de un sistema de descodificacion que admite la reproduccion en una configuracion de altavoz con N canales, con M<N<K, el sistema de descodificacion puede sujetar las M senales media 126 y al menos algunas de las K-M senales de audio de entrada 124 a un segundo modulo de descodificacion 106 que genera N entradas de audio de salida 128 apropiadas para la reproduccion en la configuracion de altavoz con N canales.

Cada una de las K-M senales de audio de entrada 124 corresponde a una de las M senales media 126 segun una de dos alternativas. Segun una primera alternativa, la senal de audio de entrada 124 es una senal lateral correspondiente a una de las M senales media 126, de modo que la senal media y la senal de audio de entrada correspondiente forman una senal estereo representada en una forma media/lateral. Segun una segunda alternativa, la senal de audio de entrada 124 es una senal complementaria correspondiente a una de las M senales media 126, de modo que la senal media y la senal de audio de entrada correspondiente forman una senal estereo representada en una forma media/complementaria/a. Por consiguiente, segun la segunda alternativa, una senal lateral se puede reconstruir a partir de la senal complementaria junto con la senal media y un parametro de ponderacion a. Cuando se usa la segunda alternativa, el parametro de ponderacion a queda comprendido en la corriente de datos 120.

Como se explicara en mayor detalle mas abajo, algunas de las N senales de audio de salida 128 del segundo modulo de descodificacion 106 pueden ser correspondencias directas a algunas de las M senales media 126. Ademas, el segundo modulo de descodificacion puede comprender uno o mas modulos de descodificacion estereo que funcionan, cada uno, en una de las M senales media 126 y su correspondiente senal de audio de entrada 124 para generar un par de senales de audio de salida, en donde cada par de las senales de audio de salida generadas es apropiado para la reproduccion en dos de los N canales de la configuracion de altavoz.

La Figura 2 ilustra un esquema de codificacion 200 en un sistema de codificacion correspondiente al esquema de descodificacion 100 de la Figura 1. Las K senales de audio de entrada 228, en donde K>2, correspondientes a los canales de una configuracion de altavoz con K canales se reciben por un componente de recepcion (no se muestra). Las K senales de audio de entrada se ingresan en un primer modulo de codificacion 206. Segun las K senales de audio de entrada 228, el primer modulo de codificacion 206 genera M senales media 226, en donde M<K<2M, que son apropiadas para la reproduccion en una configuracion de altavoz con M canales, y K-M senales de audio de salida 224.

En general, como se explicara en mayor detalle mas abajo, algunas de las M senales media 226, normalmente 2M-K de las senales media 226, corresponden a una senal respectiva de las K senales de audio de entrada 228. En otras palabras, el primer modulo de codificacion 206 genera algunas de las M senales media 226 mediante la transferencia de algunas de las K senales de audio de entrada 228.

Las K-M restantes de las M senales media 226 se generan, normalmente, mediante la submezcla, a saber combinacion lineal, de las senales de audio de entrada 228, a las cuales no transfiere el primer modulo de codificacion 206. En particular, el primer modulo de codificacion puede submezclar dichas senales de audio de entrada 228 por pares. Con tal fin, el primer modulo de codificacion puede comprender uno o mas (normalmente KM) modulos de codificacion estereo que funcionan, cada uno, en un par de senales de audio de entrada 228 para generar una senal media (a saber una submezcla o una senal de suma) y una senal de audio de salida 224 correspondiente. La senal de audio de salida 224 corresponde a la senal media segun cualquiera de las dos alternativas descritas mas arriba, a saber la senal de audio de salida 224 es una senal lateral o una senal complementaria que junto con la senal media y un parametro de ponderacion a permite la reconstruccion de una senal lateral. En el ultimo caso, el parametro de ponderacion a se incluye en la corriente de datos 220.

Las M senales media 226 se ingresan entonces en un segundo modulo de codificacion 204 en el cual se codifican en M senales de audio de salida adicionales 222. El segundo modulo de codificacion 204 puede, en general, funcionar segun cualquier esquema de codificacion conocido para codificar contenido de audio correspondiente a M canales.

Las N-M senales de audio de salida 224 del primer modulo de codificacion, y las M senales de audio de salida adicionales 222 se cuantifican entonces e incluyen en una corriente de datos 220 mediante un componente de multiplexacion 202 para su transmision a un descodificador.

Con los esquemas de codificacion/descodificacion descritos con referencia a las Figuras 1-2, la submezcla apropiada del contenido de audio de K canal en un contenido de audio de M canal se lleva a cabo en el lado de codificador (por el primer modulo de codificacion 206). Por consiguiente, se logra la descodificacion eficiente del contenido de audio de K canal para la reproduccion en una configuracion de canal que tiene M canales o, mas generalmente, N canales, donde M<N<K.

5

10

15

20

25

30

35

40

45

50

Realizaciones a modo de ejemplo de descodificadores se describiran a continuacion con referencia a las Figuras 38.

La Figura 3 ilustra un descodificador 300 que se configura para descodificar multiples senales de audio de entrada para la reproduccion en una configuracion de altavoz con N canales. El descodificador 300 comprende un componente de recepcion 302, un primer modulo de descodificacion 104, un segundo modulo de descodificacion 106, incluidos los modulos de descodificacion estereo 306. El segundo modulo de descodificacion 106 puede ademas comprender componentes de extension de alta frecuencia 308. El descodificador 300 tambien puede comprender componentes de conversion estereo 310.

A continuacion se explicara el funcionamiento del descodificador 300. El componente de recepcion 302 recibe una corriente de datos 320, a saber un tren de bits, de un codificador. El componente de recepcion 302 puede por ejemplo comprender un componente de demultiplexacion para demultiplexar la corriente de datos 320 en sus partes constituyentes, y descuantificadores para la descuantificacion de los datos recibidos.

La corriente de datos 320 recibida comprende multiples senales de audio de entrada. En general, las multiples senales de audio de entrada pueden corresponder a contenido de audio multicanal codificado correspondiente a una configuracion de altavoz con K canales, donde K>N.

En particular, la corriente de datos 320 comprende M senales de audio de entrada 322, donde 1<M<N. En el ejemplo ilustrado, M es igual a siete de modo que existen siete senales de audio de entrada 322. Sin embargo, segun otros ejemplos, puede tomar otros numeros como, por ejemplo, cinco. Ademas, la corriente de datos 320 comprende N-M senales de audio 323 de las cuales N-M senales de audio de entrada 324 se pueden descodificar. En el ejemplo ilustrado, N es igual a trece de modo que existen seis senales de audio de entrada adicionales 324.

La corriente de datos 320 puede comprender ademas una senal de audio adicional 321, la cual normalmente corresponde a un canal LFE codificado.

Segun un ejemplo, un par de las N-M senales de audio 323 puede corresponder a una codificacion conjunta de un par de las N-M senales de audio de entrada 324. Los componentes de conversion estereo 310 pueden descodificar dichos pares de las N-M senales de audio 323 para generar pares correspondientes de las N-M senales de audio de entrada 324. Por ejemplo, un componente de conversion estereo 310 puede llevar a cabo la descodificacion aplicando la descodificacion LM o LM mejorada al par de las N-M senales de audio 323.

Las M senales de audio de entrada 322 y la senal de audio adicional 321, si estuvieran disponibles, se ingresan en el primer modulo de descodificacion 104. Como se describe con referencia a la Figura 1, el primer modulo de descodificacion 104 descodifica las M senales de audio de entrada 322 en M senales media 326 que son apropiadas para la reproduccion en una configuracion de altavoz con M canales. Como se ilustra en el ejemplo, los M canales pueden corresponder a un altavoz frontal central (C), un altavoz frontal izquierdo (I), un altavoz frontal derecho (D), un altavoz ambiente izquierdo (AI), un altavoz ambiente derecho (AD), un altavoz superior izquierdo (SI) y un altavoz superior derecho (SD). El primer modulo de descodificacion 104 ademas descodifica la senal de audio adicional 321 en una senal de audio de salida 325 que normalmente corresponde a un altavoz con efectos de baja frecuencia, LFE.

Como se describe mas arriba con referencia a la Figura 1, cada una de las senales de audio de entrada adicionales 324 corresponde a una de las senales media 326 en que es una senal lateral correspondiente a la senal media o una senal complementaria correspondiente a la senal media. A modo de ejemplo, una primera de las senales de audio de entrada 324 puede corresponder a la senal media 326 asociada al altavoz frontal izquierdo, una segunda de las senales de audio de entrada 324 puede corresponder a la senal media 326 asociada al altavoz frontal derecho, etc.

Las M senales media 326 y las N-M senales de audio de entrada de audio 324 se ingresan en el segundo modulo de descodificacion 106 que genera N senales de audio 328 que son apropiadas para la reproduccion en una configuracion de altavoz de N canal.

El segundo modulo de descodificacion 106 mapea dichas senales media 326 que no tienen una senal residual correspondiente hacia un canal correspondiente de la configuracion de altavoz de N canal, opcionalmente mediante un componente de reconstruccion de alta frecuencia 308. Por ejemplo, la senal media correspondiente al altavoz frontal central (C) de la configuracion de altavoz de M canal se puede mapear al altavoz frontal central (C) de la configuracion de altavoz de N canal. El componente de reconstruccion de alta frecuencia 308 es similar al que se describe mas abajo con referencia a las Figuras 4 y 5.

El segundo modulo de descodificacion 106 comprende N-M modulos de descodificacion estereo 306, uno para cada par que consta de una senal media 326 y una senal de audio de entrada 324 correspondiente. En general, cada modulo de descodificacion estereo 306 lleva a cabo una descodificacion estereo conjunta para generar una senal de

5

10

15

20

25

30

35

40

45

50

55

audio estereo que mapea hacia dos de los canales de la configuracion de altavoz de N canal. A modo de ejemplo, el modulo de descodificacion estereo 306 que toma la senal media correspondiente al altavoz frontal izquierdo (I) de la configuracion de altavoz de 7 canales y su correspondiente senal de audio de entrada 324 como entrada, genera una senal de audio estereo que mapea hacia dos altavoces frontales izquierdos ("Ideancho" y "Ipantalla") de una configuracion de altavoz de l3 canales.

El modulo de descodificacion estereo 306 funciona en al menos dos configuraciones dependiendo de una tasa de transmision de datos (velocidad binaria) a la cual el sistema de codificador/descodificador funciona, a saber la velocidad binaria a la cual el descodificador 300 recibe datos. Una primera configuracion puede, por ejemplo, corresponder a una velocidad binaria media como, por ejemplo, de aproximadamente 32-48 kbps por modulo de descodificacion estereo 306. Una segunda configuracion puede, por ejemplo, corresponder a una velocidad binaria alta como, por ejemplo, velocidades binarias que superan los 48 kbps por modulo de descodificacion estereo 306. El descodificador 300 recibe una indicacion sobre que configuracion usar. Por ejemplo, dicha indicacion se puede senalizar al descodificador 300 por el codificador mediante uno o mas bits en la corriente de datos 320.

La Figura 4 ilustra el modulo de descodificacion estereo 306 cuando funciona segun una primera configuracion que corresponde a una velocidad binaria media. El modulo de descodificacion estereo 306 comprende un componente de conversion estereo 440, varios componentes de transformada de tiempo/frecuencia 442, 446, 454, un componente de reconstruccion de alta frecuencia (HFR, por sus siglas en ingles) 448 y un componente de mezcla ascendente estereo 452. El modulo de descodificacion estereo 306 se encuentra limitado a tomar una senal media 326 y una senal de audio de entrada 324 correspondiente como entrada. Se supone que la senal media 326 y la senal de audio de entrada 324 se representan en un dominio de la frecuencia, normalmente un dominio de transformada discreta del coseno modificada (MDCT, por sus siglas en ingles).

Con el fin de lograr una velocidad binaria media, el ancho de banda de al menos la senal de audio de entrada 324 se encuentra limitado. Mas precisamente, la senal de audio de entrada 324 es una senal con forma de onda codificada que comprende datos espectrales correspondientes a frecuencias hasta una primera frecuencia ki. La senal media 326 es una senal con forma de onda codificada que comprende datos espectrales correspondientes a frecuencias hasta una frecuencia que es mayor que la primera frecuencia ki. En algunos casos, con el fin de ahorrar mas bits que tienen que enviarse en la corriente de datos 320, el ancho de banda de la senal media 326 tambien se encuentra limitado, de modo que la senal media 326 comprende datos espectrales hasta una segunda frecuencia k2 que es mayor que la primera frecuencia ki.

El componente de conversion estereo 440 transforma las senales de entrada 326, 324 en una representacion media/lateral. Como se describe mas arriba, la senal media 326 y la senal de audio de entrada 324 correspondiente pueden representarse en una forma media/lateral o en una forma media/complementaria/a. En el caso anterior, dado que las senales de entrada ya se encuentran en una forma media/lateral, el componente de conversion estereo 440 transfiere, por consiguiente, las senales de entrada 326, 324 sin modificaciones. En el ultimo caso, el componente de conversion estereo 440 transfiere la senal media 326 mientras que la senal de audio de entrada 324, que es una senal complementaria, se transforma en una senal lateral para frecuencias hasta la primera frecuencia ki. Mas precisamente, el componente de conversion estereo 440 determina una senal lateral para frecuencias hasta la primera frecuencia ki multiplicando la senal media 326 por un parametro de ponderacion a (que se recibe de la corriente de datos 320) y sumando el resultado de la multiplicacion a la senal de audio de entrada 324. Como resultado, el componente de conversion estereo produce, por consiguiente, la senal media 326 y una senal lateral 424 correspondiente.

En conexion con ello, cabe mencionar que en caso de que la senal media 326 y la senal de audio de entrada 324 se reciban en una forma media/lateral, no tiene lugar ninguna mezcla de las senales 324, 326 en el componente de conversion estereo 440. Como consecuencia, la senal media 326 y la senal de audio de entrada 324 se pueden codificar por medio de una transformada MDCT que tiene diferentes tamanos de transformada. Sin embargo, en caso de que la senal media 326 y la senal de audio de entrada 324 se reciban en una forma media/complementaria/a, la codificacion MDCT de la senal media 326 y la senal de audio de entrada 324 se limitan al mismo tamano de transformada.

En caso de que la senal media 326 tenga un ancho de banda limitado, a saber si el contenido espectral de la senal media 326 se limita a las frecuencias hasta la segunda frecuencia k2, la senal media 326 se sujeta a la reconstruccion de alta frecuencia (HFR) por el componente de reconstruccion de alta frecuencia 448. HFR significa, en general, una tecnica parametrica que, segun el contenido espectral para frecuencias bajas de una senal (en el presente caso frecuencias por debajo de la segunda frecuencia k2) y parametros recibidos del codificador en la corriente de datos 320, reconstruye el contenido espectral de la senal para altas frecuencias (en el presente caso frecuencias por encima de la segunda frecuencia k2). Dichas tecnicas de reconstruccion de alta frecuencia se conocen en la tecnica e incluyen, por ejemplo, tecnicas de replicacion de la banda espectral (SBR, por sus siglas en ingles). El componente HFR 448 producira, por consiguiente, una senal media 426 que tiene un contenido espectral

5

10

15

20

25

30

35

40

45

50

55

hasta la frecuencia maxima representada en el sistema, en donde el contenido espectral por encima de la segunda frecuencia k2 se reconstruye de manera parametrica.

El componente de reconstruccion de alta frecuencia 448 normalmente funciona en un dominio de filtros espejo en cuadratura (QMF, por sus siglas en ingles). Por lo tanto, antes de llevar a cabo la reconstruccion de alta frecuencia, la senal media 326 y la senal lateral 424 correspondiente pueden primero transformarse en el dominio temporal mediante componentes de transformada de tiempo/frecuencia 442, lo cual normalmente lleva a cabo una transformada MDCT inversa, y luego transformarse en el dominio QMF mediante componentes de transformada de tiempo/frecuencia 446.

La senal media 426 y la senal lateral 424 se ingresan entonces en el componente de mezcla ascendente estereo 452 que genera una senal estereo 428 representada en una forma I/D. Dado que la senal lateral 424 solo tiene un contenido espectral para frecuencias hasta la primera frecuencia ki, el componente de mezcla ascendente estereo 452 trata las frecuencias por debajo y por encima de la primera frecuencia ki de manera diferente.

En mayor detalle, para frecuencias hasta la primera frecuencia ki, el componente de mezcla ascendente estereo 452 transforma la senal media 426 y la senal lateral 424 de una forma media/lateral en una forma I/D. En otras palabras, el componente de mezcla ascendente estereo lleva a cabo una transformada de suma-diferencia inversa para frecuencias hasta la primera frecuencia ki.

Para frecuencias por encima de la primera frecuencia ki, donde no se proveen datos espectrales a la senal lateral 424, el componente de mezcla ascendente estereo 452 reconstruye el primer y segundo componentes de la senal estereo 428 de forma parametrica a partir de la senal media 426. En general, el componente de mezcla ascendente estereo 452 recibe parametros que se han extrafdo para dicho proposito en el lado de codificador mediante la corriente de datos 320 y usa dichos parametros para la reconstruccion. En general, se puede usar cualquier tecnica conocida para la reconstruccion estereo parametrica.

Segun lo descrito mas arriba, la senal estereo 428, que se produce por el componente de mezcla ascendente estereo 452, tiene, por consiguiente, un contenido espectral hasta la frecuencia maxima representada en el sistema, en donde el contenido espectral por encima de la primera frecuencia ki se reconstruye de manera parametrica. De manera similar al componente HFR 448, el componente de mezcla ascendente estereo 452 normalmente funciona en el dominio QMF. Por consiguiente, la senal estereo 428 se transforma en el dominio temporal mediante componentes de transformada de tiempo/frecuencia 454 para generar una senal estereo 328 representada en el dominio temporal.

La Figura 5 ilustra el modulo de descodificacion estereo 306 cuando funciona segun una segunda configuracion que corresponde a una velocidad binaria alta. El modulo de descodificacion estereo 306 comprende un primer componente de conversion estereo 540, varios componentes de transformada de tiempo/frecuencia 542, 546, 554, un segundo componente de conversion estereo 452 y componentes de reconstruccion de alta frecuencia (HFR) 548a, 548b. El modulo de descodificacion estereo 306 se encuentra limitado a tomar una senal media 326 y una senal de audio de entrada 324 correspondiente como entrada. Se supone que la senal media 326 y la senal de audio de entrada 324 se representan en un dominio de la frecuencia, normalmente un dominio de transformada discreta del coseno modificada (MDCT).

En el caso de la velocidad binaria alta, las restricciones con respecto al ancho de banda de las senales de entrada 326, 324 son diferentes del caso de la velocidad binaria media. Mas precisamente, la senal media 326 y la senal de audio de entrada 324 son senales con forma de onda codificada que comprenden datos espectrales correspondientes a frecuencias hasta una segunda frecuencia k2. En algunos casos, la segunda frecuencia k2 puede corresponder a una frecuencia maxima representada por el sistema. En otros casos, la segunda frecuencia k2 puede ser mas baja que la frecuencia maxima representada por el sistema.

La senal media 326 y la senal de audio de entrada 324 se ingresan en el primer componente de conversion estereo 540 para la transformacion en una representacion media/lateral. El primer componente de conversion estereo 540 es similar al componente de conversion estereo 440 de la Figura 4. La diferencia es que en el caso en que la senal de audio de entrada 324 se encuentra en la forma de una senal complementaria, el primer componente de conversion estereo 540 transforma la senal complementaria en una senal lateral para frecuencias hasta la segunda frecuencia k2. Por consiguiente, el componente de conversion estereo 540 produce la senal media 326 y una senal lateral 524 correspondiente que tienen, ambas, contenido espectral hasta la segunda frecuencia.

La senal media 326 y la senal lateral 524 correspondiente se ingresan entonces en el segundo componente de conversion estereo 552. El segundo componente de conversion estereo 552 forma una suma y una diferencia de la senal media 326 y la senal lateral 524 para transformar la senal media 326 y la senal lateral 524 de una forma media/lateral a una forma I/D. En otras palabras, el segundo componente de conversion estereo lleva a cabo una transformada inversa de suma y diferencia para generar una senal estereo que tiene un primer componente 528a y un segundo componente 528b.

5

10

15

20

25

30

35

40

45

50

55

Preferiblemente, el segundo componente de conversion estereo 552 funciona en el dominio temporal. Por lo tanto, antes de ingresarse en el segundo componente de conversion estereo 552, la senal media 326 y la senal lateral 524 se pueden transformar del dominio de la frecuencia (dominio MDCT) al dominio temporal mediante componentes de transformada de tiempo/frecuencia 542. Como alternativa, el segundo componente de conversion estereo 552 puede funcionar en el dominio QMF. En dicho caso, el orden de los componentes 546 y 552 de la Figura 5 se invertina. Ello es ventajoso en que la mezcla que tiene lugar en el segundo componente de conversion estereo 552 no pondra mas restricciones a los tamanos de transformada MDCT con respecto a la senal media 326 y las senales de audio de entrada 324. Por consiguiente, como se describe mas arriba, en caso de que la senal media 326 y la senal de audio de entrada 324 se reciban en una forma media/lateral, se pueden codificar por medio de una transformada MDCT que usa diferentes tamanos de transformada.

En caso de que la segunda frecuencia k2 sea mas baja que la frecuencia mas alta representada, el primer y segundo componentes 528a, 528b de la senal estereo pueden estar sujetos a la reconstruccion de alta frecuencia (HFR) por los componentes de reconstruccion de alta frecuencia 548a, 548b. Los componentes de reconstruccion de alta frecuencia 548a, 548b son similares al componente de reconstruccion de alta frecuencia 448 de la Figura 4. Sin embargo, en el presente caso, cabe destacar que se recibe un primer conjunto de parametros de reconstruccion de alta frecuencia, mediante la corriente de datos 230, y se usa en la reconstruccion de alta frecuencia del primer componente 528a de la senal estereo, y se recibe un segundo conjunto de parametros de reconstruccion de alta frecuencia, mediante la corriente de datos 230, y se usa en la reconstruccion de alta frecuencia del segundo componente 528b de la senal estereo. Por consiguiente, los componentes de reconstruccion de alta frecuencia 548a, 548b producen un primer y un segundo componentes 530a, 530b de una senal estereo que comprende datos espectrales hasta la maxima frecuencia representada en el sistema, en donde el contenido espectral por encima de la segunda frecuencia k2 se reconstruye de forma parametrica.

Preferiblemente, la reconstruccion de alta frecuencia se lleva a cabo en un dominio QMF. Por lo tanto, antes de estar sujetos a la reconstruccion de alta frecuencia, el primer y segundo componentes 528a, 528b de la senal estereo se pueden transformar en un dominio QMF mediante componentes de transformada de tiempo/frecuencia 546.

El primer y segundo componentes 530a, 530b de la senal estereo que se produce a partir de los componentes de reconstruccion de alta frecuencia 548 se pueden transformar entonces en el dominio temporal mediante componentes de transformada de tiempo/frecuencia 554 para generar una senal estereo 328 representada en el dominio temporal.

La Figura 6 ilustra un descodificador 600 que se configura para descodificar multiples senales de audio de entrada comprendidas en una corriente de datos 620 para la reproduccion en una configuracion de altavoz con canales 11.1. La estructura del descodificador 600 es, en general, similar a la ilustrada en la Figura 3. La diferencia es que el numero ilustrado de canales de la configuracion de altavoz es menor en comparacion con la Figura 3 donde una configuracion de altavoz con canales 13.1 se ilustra como una que tiene un altavoz LFE, tres altavoces frontales (central C, izquierdo I y derecho D), cuatro altavoces ambiente (lateral izquierdo Ilateral, posterior izquierdo Iposterior, lateral derecho Dlateral, posterior derecho Dposterior) y cuatro altavoces superiores (frontal superior izquierdo FSI, posterior superior izquierdo PSI, frontal superior derecho FSD, y posterior superior derecho PSD).

En la Figura 6, el primer componente de descodificacion 104 produce siete senales media 626 que pueden corresponder a una configuracion de altavoz de los canales C, I, D, AI, AD, SI y SD. Ademas, existen cuatro senales de audio de entrada adicionales 624a-d. Las senales de audio de entrada adicionales 624a-d corresponden, cada una, a una de las senales media 626. A modo de ejemplo, la senal de audio de entrada 624a puede ser una senal lateral o una senal complementaria correspondiente a la AI senal media, la senal de audio de entrada 624b puede ser una senal lateral o una senal complementaria correspondiente a la AD senal media, la senal de audio de entrada 624c puede ser una senal lateral o una senal complementaria correspondiente a la SI senal media, y la senal de audio de entrada 624d puede ser una senal lateral o una senal complementaria correspondiente a la SD senal media.

En la realizacion ilustrada, el segundo modulo de descodificacion 106 comprende cuatro modulos de descodificacion estereo 306 del tipo ilustrado en las Figuras 4 y 5. Cada modulo de descodificacion estereo 306 toma una de las senales media 626 y la senal de audio de entrada adicional 624a-d correspondiente como entrada y produce una senal de audio estereo 328. Por ejemplo, segun la AI senal media y la senal de audio de entrada 624a, el segundo modulo de descodificacion 106 puede producir una senal estereo correspondiente a un altavoz Ilateral e Iposterior. Ejemplos adicionales son evidentes a partir de la figura.

Ademas, el segundo modulo de descodificacion 106 actua como una transferencia de tres de las senales media 626, aqrn las senales media correspondientes a los canales C, I y D. Dependiendo del ancho de banda espectral de dichas senales, el segundo modulo de descodificacion 106 puede llevar a cabo la reconstruccion de alta frecuencia usando componentes de reconstruccion de alta frecuencia 308.

5

10

15

20

25

30

35

40

45

50

La Figura 7 ilustra como un descodificador heredado o de baja complejidad 700 descodifica el contenido de audio multicanal de una corriente de datos 720 correspondiente a una configuracion de altavoz con K canales para la reproduccion en una configuracion de altavoz con M canales. A modo de ejemplo, K puede ser igual a once o trece, y M puede ser igual a siete. El descodificador 700 comprende un componente de recepcion 702, un primer modulo de descodificacion 704, y modulos de reconstruccion de alta frecuencia 712.

Como se describe con referencia a la corriente de datos 120 de la Figura 1, la corriente de datos 720 puede comprender, en general, M senales de audio de entrada 722 (es preciso ver las senales 122 y 322 en las Figuras 1 y 3) y K-M senales de audio de entrada adicionales (es preciso ver las senales 124 y 324 en las Figuras 1 y 3). De manera opcional, la corriente de datos 720 puede comprender una senal de audio adicional 721, normalmente correspondiente a un canal LFE. Dado que el descodificador 700 corresponde a una configuracion de altavoz con M canales, el componente de recepcion 702 solo extrae las M senales de audio de entrada 722 (y la senal de audio adicional 721 si estuviera presente) de la corriente de datos 720 y descarta las K-M senales de audio de entrada adicionales restantes.

Las M senales de audio de entrada 722, aqu ilustradas por siete senales de audio, y la senal de audio adicional 721 se ingresan entonces en el primer modulo de descodificacion 104 que descodifica las M senales de audio de entrada 722 en M senales media 726 que corresponden a los canales de la configuracion de altavoz de M canal.

En caso de que las M senales media 726 solo comprendan contenido espectral hasta una cierta frecuencia que es mas baja que la frecuencia maxima representada por el sistema, las M senales media 726 pueden estar sujetas a la reconstruccion de alta frecuencia por medio de modulos de reconstruccion de alta frecuencia 712.

La Figura 8 ilustra un ejemplo de dicho modulo de reconstruccion de alta frecuencia 712. El modulo de reconstruccion de alta frecuencia 712 comprende un componente de reconstruccion de alta frecuencia 848, y varios componentes de transformada de tiempo/frecuencia 842, 846, 858.

La senal media 726 que se ingresa en el modulo HFR 712 esta sujeta a la reconstruccion de alta frecuencia por medio del componente HFR 848. La reconstruccion de alta frecuencia se lleva a cabo preferiblemente en el dominio QMF. Por lo tanto, la senal media 726, que normalmente se encuentra en la forma de espectros MDCT, se puede transformar en el dominio temporal mediante el componente de transformada de tiempo/frecuencia 842,y luego en el dominio QMF mediante el componente de transformada de tiempo/frecuencia 846, antes de ingresarse en el componente HFR 848.

El componente HFR 848 en general funciona de la misma manera que, p.ej. los componentes HFR 448, 548 de las Figuras 4 y 5 en que usa el contenido espectral de la senal de entrada para frecuencias mas bajas junto con parametros recibidos de la corriente de datos 720 para reconstruir, de manera parametrica, el contenido espectral para frecuencias mas altas. Sin embargo, dependiendo de la velocidad binaria del sistema de codificador/descodificador, el componente HFR 848 puede usar diferentes parametros.

Como se explica con referencia a la Figura 5, para casos de velocidad binaria alta y para cada senal media que tiene una senal de audio de entrada adicional correspondiente, la corriente de datos 720 comprende un primer conjunto de parametros HFR, y un segundo conjunto de parametros HFR (es preciso ver la descripcion de los artfculos 548a, 548b de la Figura 5). Aunque el descodificador 700 no usa la senal de audio de entrada adicional correspondiente a la senal media, el componente HFR 848 puede usar una combinacion del primer y segundo conjuntos de parametros HFR cuando se lleva a cabo la reconstruccion de alta frecuencia de la senal media. Por ejemplo, el componente de reconstruccion de alta frecuencia 848 puede usar una submezcla como, por ejemplo, una combinacion media o lineal, de los parametros HFR del primer y segundo conjuntos.

El componente HFR 854 produce, por consiguiente, una senal media 828 que tiene un contenido espectral extendido. La senal media 828 puede entonces transformarse en el dominio temporal por medio del componente de transformada de tiempo/frecuencia 854 para proveer una senal de salida 728 que tiene una representacion de dominio temporal.

Realizaciones a modo de ejemplo de codificadores se describiran a continuacion con referencia a las Figuras 9-11.

La Figura 9 ilustra un codificador 900 que cae bajo la estructura general de la Figura 2. El codificador 900 comprende un componente de recepcion (no se muestra), un primer modulo de codificacion 206, un segundo modulo de codificacion 204, y un componente de cuantificacion y multiplexacion 902. El primer modulo de codificacion 206 puede ademas comprender componentes de codificacion de reconstruccion de alta frecuencia (HFR) 908 y modulos de codificacion estereo 906. El descodificador 900 tambien puede comprender componentes de conversion estereo 910.

Ahora se explicara el funcionamiento del codificador 900. El componente de recepcion recibe K senales de audio de entrada 928 correspondientes a los canales de una configuracion de altavoz con K canales. Por ejemplo, los K

5

10

15

20

25

30

35

40

45

50

canales pueden corresponder a los canales de una configuracion de 13 canales como se describe mas arriba. Ademas, se puede recibir un canal adicional 925 normalmente correspondiente a un canal LFE. Los K canales se ingresan en un primer modulo de codificacion 206 que genera M senales media 926 y K-M senales de audio de salida 924.

El primer modulo de codificacion 206 comprende K-M modulos de codificacion estereo 906. Cada uno de los K-M modulos de codificacion estereo 906 toma dos de las K senales de audio de entrada como entrada y genera una de las senales media 926 y una de las senales de audio de salida 924 como se explicara en mayor detalle mas abajo.

El primer modulo de codificacion 206 ademas mapea las senales de audio de entrada restantes, las cuales no se ingresan en uno de los modulos de codificacion estereo 906, hacia una de las M senales media 926, de manera opcional mediante un componente de codificacion HFR 908. El componente de codificacion HFR 908 es similar a aquellos que se describiran con referencia a las Figuras 10 y 11.

Las M senales media 926, opcionalmente junto con la senal de audio de entrada adicional 925 que normalmente representa el canal LFE, se ingresa en el segundo modulo de codificacion 204 como se describe mas arriba con referencia a la Figura 2 para la codificacion en M canales de audio de salida 922.

Antes de incluirse en la corriente de datos 920, las K-M senales de audio de salida 924 pueden codificarse, de manera opcional, por pares por medio de los componentes de conversion estereo 910. Por ejemplo, un componente de conversion estereo 910 puede codificar un par de las K-M senales de audio de salida 924 llevando a cabo la codificacion LM o LM mejorada.

Las M senales de audio de salida 922 (y la senal adicional resultante de la senal de audio de entrada adicional 925) y las K-M senales de audio de salida 924 (o las senales de audio que se producen a partir de los componentes de codificacion estereo 910) se cuantifican e incluyen en una corriente de datos 920 por el componente de cuantificacion y multiplexacion 902. Ademas, los parametros que se extraen por los diferentes modulos y componentes de codificacion se pueden cuantificar e incluir en la corriente de datos.

El modulo de codificacion estereo 906 es utilizable en al menos dos configuraciones dependiendo de una tasa de transmision de datos (velocidad binaria) a la cual el sistema de codificador/descodificador funciona, a saber la velocidad binaria a la cual el codificador 900 transmite datos. Una primera configuracion puede, por ejemplo, corresponder a una velocidad binaria media. Una segunda configuracion puede, por ejemplo, corresponder a una velocidad binaria alta. El codificador 900 incluye una indicacion sobre que configuracion usar en la corriente de datos 920. Por ejemplo, dicha indicacion se puede senalizar mediante uno o mas bits en la corriente de datos 920.

La Figura 10 ilustra el modulo de codificacion estereo 906 cuando funciona segun una primera configuracion que corresponde a una velocidad binaria media. El modulo de codificacion estereo 906 comprende un primer componente de conversion estereo 1040, varios componentes de transformada de tiempo/frecuencia 1042, 1046, un componente de codificacion HFR 1048, un componente de codificacion estereo parametrico 1052 y un componente con forma de onda codificada 1056. El modulo de codificacion estereo 906 puede ademas comprender un segundo componente de conversion estereo 1043. El modulo de codificacion estereo 906 toma dos de las senales de audio de entrada 928 como entrada. Se supone que las senales de audio de entrada 928 se representan en un dominio temporal.

El primer componente de conversion estereo 1040 transforma las senales de audio de entrada 928 en una representacion media/lateral formando una suma y diferencia segun lo descrito mas arriba. Por consiguiente, el primer componente de conversion estereo 940 produce una senal media 1026 y una senal lateral 1024.

En algunas realizaciones, la senal media 1026 y la senal lateral 1024 se transforman entonces en una representacion media/complementaria/a por el segundo componente de conversion estereo 1043. El segundo componente de conversion estereo 1043 extrae el parametro de ponderacion a para su inclusion en la corriente de datos 920. El parametro de ponderacion a puede ser dependiente del tiempo y la frecuencia, a saber puede variar entre diferentes tramas de tiempo y bandas de frecuencia de datos.

El componente con codificacion de forma de onda 1056 sujeta la senal media 1026 y la senal lateral o complementaria a la codificacion de forma de onda para generar una senal media con forma de onda codificada 926 y una senal lateral o complementaria con forma de onda codificada 924.

El segundo componente de conversion estereo 1043 y el componente con codificacion de forma de onda 1056 normalmente funcionan en un dominio MDCT. Por consiguiente, la senal media 1026 y la senal lateral 1024 se pueden transformar en el dominio MDCT por medio de componentes de transformada de tiempo/frecuencia 1042 antes de la segunda conversion estereo y la codificacion de forma de onda. En caso de que las senales 1026 y 1024 no esten sujetas a la segunda conversion estereo 1043, diferentes tamanos de transformada MDCT se pueden usar para la senal media 1026 y la senal lateral 1024. En caso de que las senales 1026 y 1024 esten sujetas a la

segunda conversion estereo 1043, se deben usar los mismos tamanos de transformada MDCT para la senal media 1026 y la senal complementaria 1024.

Con el fin de lograr una velocidad binaria media, el ancho de banda de al menos la senal lateral o complementaria 924 se encuentra limitado. Mas precisamente, la senal lateral o complementaria tiene forma de onda codificada para 5 frecuencias hasta una primera frecuencia k|. Por consiguiente, la senal lateral o complementaria 924 con forma de onda codificada comprende datos espectrales correspondientes a frecuencias hasta la primera frecuencia k|. La senal media 1026 es una senal con forma de onda codificada para frecuencias hasta una frecuencia que es mas grande que la primera frecuencia k|. Por consiguiente, la senal media 926 comprende datos espectrales correspondientes a frecuencias hasta una frecuencia que es mas grande que la primera frecuencia k|. En algunos 10 casos, con el fin de ahorrar mas bits que tienen que enviarse en la corriente de datos 920, el ancho de banda de la senal media 926 tambien se encuentra limitado, de modo que la senal media 926 con forma de onda codificada comprende datos espectrales hasta una segunda frecuencia k2 que es mas grande que la primera frecuencia k|.

En caso de que el ancho de banda de la senal media 926 sea limitado, a saber si el contenido espectral de la senal media 926 se limita a frecuencias hasta la segunda frecuencia k2, la senal media 1026 se encuentra sujeta a la 15 codificacion HFR por el componente de codificacion HFR 1048. En general, el componente de codificacion HFR 1048 analiza el contenido espectral de la senal media 1026 y extrae un conjunto de parametros 1060 que permiten la reconstruccion del contenido espectral de la senal para altas frecuencias (en el presente caso, frecuencias por encima de la segunda frecuencia k2) segun el contenido espectral de la senal para bajas frecuencias (en el presente caso frecuencias por encima de la segunda frecuencia k2). Dichas tecnicas de codificacion HFR son conocidas en la 20 tecnica e incluyen, por ejemplo, tecnicas de replicacion de la banda espectral (SBR). El conjunto de parametros 1060 se incluye en la corriente de datos 920.

El componente de codificacion HFR 1048 normalmente funciona en un dominio de filtros espejo en cuadratura (QMF). Por ejemplo, antes de llevar a cabo la codificacion HFR, la senal media 1026 puede transformarse en el dominio QMF por el componente de transformada de tiempo/frecuencia 1046.

25 Las senales de audio de entrada 928 (o, alternativamente, la senal media 1046 y la senal lateral 1024) estan sujetas a la codificacion estereo parametrica en el componente de codificacion estereo parametrico (PS) 1052. En general, el componente de codificacion estereo parametrico 1052 analiza las senales de audio de entrada 928 y extrae parametros 1062 que permiten la reconstruccion de las senales de audio de entrada 928 segun la senal media 1026 para frecuencias por encima de la primera frecuencia k|. El componente de codificacion estereo parametrico 1052 30 puede aplicar cualquier tecnica conocida para la codificacion estereo parametrica. Los parametros 1062 se incluyen en la corriente de datos 920.

El componente de codificacion estereo parametrico 1052 normalmente funciona en el dominio QMF. Por lo tanto, las senales de audio de entrada 928 (o, de manera alternativa, la senal media 1046 y la senal lateral 1024) se pueden transformar en el dominio QMF por el componente de transformada de tiempo/frecuencia 1046.

35 La Figura 11 ilustra el modulo de codificacion estereo 906 cuando funciona segun una segunda configuracion que corresponde a una velocidad binaria alta. El modulo de codificacion estereo 906 comprende un primer componente de conversion estereo 1140, varios componentes de transformada de tiempo/frecuencia 1142, 1146, componentes de codificacion HFR 1048a, 1048b, y un componente con forma de onda codificada 1156. De manera opcional, el modulo de codificacion estereo 906 puede comprender un segundo componente de conversion estereo 1143. El 40 modulo de codificacion estereo 906 toma dos de las senales de audio de entrada 928 como entrada. Se supone que las senales de audio de entrada 928 se representan en un dominio temporal.

El primer componente de conversion estereo 1140 es similar al primer componente de conversion estereo 1040 y transforma las senales de audio de entrada 928 en una senal media 1126 y una senal lateral 1124.

En algunas realizaciones, la senal media 1126 y la senal lateral 1124 se transforman entonces en una 45 representacion media/complementaria/a por el segundo componente de conversion estereo 1143. El segundo componente de conversion estereo 1043 extrae el parametro de ponderacion a para su inclusion en la corriente de datos 920. El parametro de ponderacion a puede ser dependiente del tiempo y la frecuencia, a saber puede variar entre diferentes tramas de tiempo y bandas de frecuencia de datos. El componente con codificacion de forma de onda 1156 sujeta entonces la senal media 1126 y la senal lateral o complementaria a la codificacion de forma de 50 onda para generar una senal media con forma de onda codificada 926 y una senal lateral o complementaria con forma de onda codificada 924.

El componente con codificacion de forma de onda 1156 es similar al componente con codificacion de forma de onda 1056 de la Figura 10. Una diferencia importante, sin embargo, aparece con respecto al ancho de banda de las senales de salida 926, 924. Mas precisamente, el componente con codificacion de forma de onda 1156 lleva a cabo 55 la codificacion de forma de onda de la senal media 1126 y la senal lateral o complementaria hasta una segunda frecuencia k2 (que es, normalmente, mas grande que la primera frecuencia k descrita con respecto al caso de la

5

10

15

20

25

30

35

40

45

50

velocidad media). Como resultado, la senal media con forma de onda codificada 926 y la senal lateral o complementaria con forma de onda codificada 924 comprenden datos espectrales correspondientes a frecuencias hasta la segunda frecuencia k2. En algunos casos, la segunda frecuencia k2 puede corresponder a una frecuencia maxima representada por el sistema. En otros casos, la segunda frecuencia k2 puede ser mas baja que la frecuencia maxima representada por el sistema.

En caso de que la segunda frecuencia k2 sea mas baja que la frecuencia maxima representada por el sistema, las senales de audio de entrada 928 estan sujetas a la codificacion HFR por los componentes HFR 1148a, 1148b. Cada uno de los componentes de codificacion HFR 1148a, 1148b funciona de manera similar al componente de codificacion HFR 1048 de la Figura 10. Por consiguiente, los componentes de codificacion HFR 1148a, 1148b generan un primer conjunto de parametros 1160a y un segundo conjunto de parametros 1160b, respectivamente, que permiten la reconstruccion del contenido espectral de la senal de audio de entrada 928 respectiva para altas frecuencias (en el presente caso, frecuencias por encima de la segunda frecuencia k2) segun el contenido espectral de la senal de audio de entrada 928 para bajas frecuencias (en el presente caso, frecuencias por encima de la segunda frecuencia k2). El primer y segundo conjuntos de parametros 1160a, 1160b se incluyen en la corriente de datos 920.

Equivalentes, extensiones, alternativas y varios

Realizaciones adicionales de la presente descripcion seran aparentes para una persona con experiencia en la tecnica tras estudiar la descripcion de mas arriba. Aunque la presente descripcion y los dibujos describen realizaciones y ejemplos, la descripcion no se limita a dichos ejemplos espedficos. Se pueden llevar a cabo numerosas modificaciones y variaciones sin apartarse del alcance de la presente descripcion, el cual se define por las reivindicaciones anexas. Todo signo de referencia que aparezca en las reivindicaciones no se comprendera como uno que limita su alcance.

Ademas, las variaciones de las realizaciones descritas se pueden comprender y llevar a cabo por una persona con experiencia al practicar la descripcion, a partir de un estudio de los dibujos, la descripcion y las reivindicaciones anexas. En las reivindicaciones, la palabra "que comprende" no excluye otros elementos o etapas, y el artfculo indefinido "un" o "una/o" no excluye una pluralidad. El mero hecho de que ciertas medidas se incluyan en reivindicaciones dependientes mutuamente diferentes no indica que una combinacion de dichas medidas no se pueda usar.

Los sistemas y metodos descritos mas arriba se pueden implementar como software, firmware, hardware o una combinacion de ellos. En una implementacion de hardware, la division de tareas entre unidades funcionales a la que se hace referencia en la descripcion de mas arriba no corresponde, necesariamente, a la division en unidades ffsicas; por el contrario, un componente ffsico puede tener multiples funcionalidades y una tarea puede llevarse a cabo por varios componentes ffsicos en colaboracion. Ciertos componentes o todos los componentes se pueden implementar como software ejecutado por un procesador de senal digital o microprocesador, o se pueden implementar como hardware o como un circuito integrado para aplicaciones espedficas. Dicho software se puede distribuir en medios legibles por ordenador, los cuales pueden comprender medios de almacenamiento de ordenador (o medios no transitorios) y medios de comunicacion (o medios transitorios). Como una persona con experiencia en la tecnica conoce, el termino medio de almacenamiento de ordenador incluye medios no permanentes y permanentes, removibles y no removibles implementados en cualquier metodo o tecnologfa para el almacenamiento de informacion como, por ejemplo, instrucciones legibles por ordenador, estructuras de datos, modulos de programa u otros datos. Los medios de almacenamiento de ordenador incluyen, pero sin limitacion, RAM, ROM, EePROM, memoria flash u otra tecnologfa de memoria, CD-ROM, discos versatiles digitales (DVD, por sus siglas en ingles) u otro almacenamiento de disco optico, casetes magneticos, cinta magnetica, almacenamiento de disco magnetico u otros dispositivos de almacenamiento magnetico, o cualquier otro medio que se pueda usar para almacenar la informacion deseada y al que se pueda acceder por un ordenador. Ademas, una persona con experiencia sabe que los medios de comunicacion normalmente realizan instrucciones legibles por ordenador, estructuras de datos, modulos de programa u otros datos en una senal de datos modulada como, por ejemplo, una onda portadora u otro mecanismo de transporte e incluye cualquier medio de entrega de informacion.

Claims

5

10

15

20

25

30

35

40

45

REIVINDICACIONES

1. Un metodo para un descodificador (700) para descodificar multiples senales de audio de entrada (720) para la reproduccion en una configuracion de altavoz con N canales, las multiples senales de audio de entrada representando contenido de audio multicanal codificado correspondiente a K>N canales, que comprende:

del contenido de audio multicanal codificado correspondiente a K canales, extraer M senales de audio de entrada, en donde 1<M<N<2M;

en donde si N=M, el metodo ademas comprende la etapa de:

descartar cualquier senal restante en el contenido de audio multicanal codificado;

descodificar, en un primer modulo de descodificacion, las M senales de audio de entrada en M senales media que son apropiadas para la reproduccion en una configuracion de altavoz con M canales;

en donde si N>M, el metodo ademas comprende las etapas de:

del contenido de audio multicanal codificado correspondiente a K canales, extraer N-M senales de audio de entrada adicionales, en donde cada una de las senales de audio de entrada adicionales corresponde a una de las M senales media y es una senal lateral o una senal complementaria que, junto con la senal media a la cual corresponde y un parametro de ponderacion a, permite la reconstruccion de una senal lateral; y para cada uno de los N canales que supere los M canales

descodificar, en un modulo de descodificacion en estereo, la senal de audio de entrada adicional y la senal media a la cual corresponde para generar una senal estereo que incluye una primera y una segunda senal de audio que son apropiadas para la reproduccion en dos de los N canales de la configuracion de altavoz;

por medio de lo cual se generan las N senales de audio.
2. El metodo de la reivindicacion 1, en donde el modulo de descodificacion estereo es utilizable en al menos dos configuraciones dependiendo de una velocidad binaria a la cual el descodificador recibe datos, el metodo ademas comprende recibir una indicacion acerca de cual de las al menos dos configuraciones usar en la etapa de descodificacion de la senal de audio de entrada adicional y su senal media correspondiente.
3. El metodo de cualquiera de las reivindicaciones precedentes, en donde la etapa de recibir una senal de audio de entrada adicional comprende:

recibir un par de senales de audio correspondientes a una codificacion conjunta de una senal de audio de entrada adicional correspondiente a una primera de las M senales media y una senal de audio de entrada adicional correspondiente a una segunda de las M senales media; y

descodificar el par de senales de audio para generar las senales de audio de entrada adicionales correspondientes a la primera y segunda de las M senales media, respectivamente.
4. El metodo de cualquiera de las reivindicaciones 2-3, en donde la senal de audio de entrada adicional es una senal con forma de onda codificada que comprende datos espectrales correspondientes a frecuencias hasta una primera frecuencia, y la senal media correspondiente es una senal con forma de onda codificada que comprende datos espectrales correspondientes a frecuencias hasta una frecuencia que es mas grande que la primera frecuencia, y en donde la etapa de descodificar la senal de audio de entrada adicional y su correspondiente senal media segun la primera configuracion del modulo de descodificacion estereo comprende las etapas de:

si la senal de audio de entrada adicional es en la forma de una senal complementaria, calcular una senal lateral para frecuencias hasta la primera frecuencia multiplicando la senal media por el parametro de ponderacion a y sumando el resultado de la multiplicacion a la senal complementaria; y

mezclar de forma ascendente la senal media y la senal lateral para generar una senal estereo que incluye una primera y una segunda senal de audio, en donde para las frecuencias por debajo de la primera frecuencia la mezcla ascendente comprende llevar a cabo una transformada inversa de suma y diferencia de la senal media y la senal lateral, y para las frecuencias por encima de la primera frecuencia la mezcla ascendente comprende llevar a cabo la mezcla ascendente parametrica de la senal media,

en donde, de modo opcional, la senal media con forma de onda codificada comprende datos espectrales correspondientes a frecuencias hasta una segunda frecuencia, el metodo ademas comprende:

5

10

15

20

25

30

35

40

45

extender la senal media a un rango de frecuencia por encima de la segunda frecuencia llevando a cabo la reconstruccion de alta frecuencia antes de llevar a cabo la mezcla ascendente parametrica.
5. El metodo de cualquiera de las reivindicaciones 2-3, en donde la senal de audio de entrada adicional y la senal media correspondiente son senales con forma de onda codificada que comprenden datos espectrales correspondientes a frecuencias hasta una segunda frecuencia, y la etapa de descodificacion de la senal de audio de entrada adicional y su correspondiente senal media segun la segunda configuracion del modulo de descodificacion estereo comprende las etapas de:

si la senal de audio de entrada adicional es en la forma de una senal complementaria, calcular una senal lateral multiplicando la senal media por el parametro de ponderacion a y sumando el resultado de la multiplicacion a la senal complementaria; y

llevar a cabo una transformada inversa de suma y diferencia de la senal media y la senal lateral para generar una senal estereo que incluye una primera y una segunda senal de audio.
6. Un descodificador (700) para descodificar multiples senales de audio de entrada (720) para la reproduccion en una configuracion de altavoz con N canales, las multiples senales de audio de entrada representando contenido de audio multicanal codificado correspondiente a K>N canales, que comprende:

un componente de recepcion configurado para, del contenido de audio multicanal codificado correspondiente a K canales, extraer M senales de audio de entrada, en donde 1<M<N<2M, y N-M senales de audio de entrada adicionales;

un primer modulo de descodificacion configurado para descodificar las M senales de audio de entrada en M senales media que son apropiadas para la reproduccion en una configuracion de altavoz con M canales;

un segundo modulo de descodificacion que comprende un modulo de codificacion estereo para cada uno de los N canales que supera los M canales, el modulo de codificacion estereo configurado para:

recibir una senal de audio de entrada adicional correspondiente a una de las M senales media, la senal de audio de entrada adicional siendo una senal lateral o una senal complementaria que, junto con la senal media a la cual corresponde y un parametro de ponderacion a, permite la reconstruccion de una senal lateral; y

descodificar la senal de audio de entrada adicional y su correspondiente senal media para generar una senal estereo que incluye una primera y una segunda senal de audio que son apropiadas para la reproduccion en dos de los N canales de la configuracion de altavoz;

en donde el segundo modulo de descodificacion se configura para actuar como transformacion para todas las M senales media que no se ingresan en un modulo de codificacion estereo y, de manera opcional, para llevar a cabo la reconstruccion de alta frecuencia de una o mas senales media de todas las M senales media que no se ingresan en un modulo de codificacion estereo antes de dejar que las senales se transformen,

por medio de lo cual el descodificador se configura para generar N senales de audio.
7. Un metodo para un codificador (900) para codificar multiples senales de audio de entrada (920) que representan contenido de audio multicanal correspondiente a K canales, que comprende:

recibir K senales de audio de entrada correspondientes a los canales de una configuracion de altavoz con K canales;

generar M senales media que son apropiadas para la reproduccion en una configuracion de altavoz con M canales, en donde 1<M<K<2M, y K-M senales de audio de salida de las K senales de audio de entrada,

en donde 2M-K de las senales media corresponden, cada una, a una senal respectiva de 2M-K de las senales de audio de entrada; y

en donde las K-M senales media no correspondientes a las senales de audio de entrada y las K-M senales de audio de salida se generan para cada valor de K que supera M:

codificando, en un modulo de codificacion estereo, dos de las K senales de audio de entrada para generar una senal media y una senal de audio de salida, la senal de audio de salida siendo una senal lateral o una senal complementaria que junto con la senal media y un parametro de ponderacion a permite la reconstruccion de una senal lateral;

codificando, en un segundo modulo de codificacion, las M senales media en M canales de audio de salida adicionales; e

5

10

15

20

25

30

35

40

45

incluyendo las K-M senales de audio de salida y los M canales de audio de salida adicionales en una corriente de datos para su transmision a un descodificador.
8. El metodo de la reivindicacion 7, en donde el modulo de codificacion estereo es utilizable en al menos dos configuraciones dependiendo de una velocidad binaria deseada del codificador, el metodo ademas comprende incluir una indicacion en la corriente de datos sobre cual de las al menos dos configuraciones ha usado el modulo de codificacion estereo en la etapa de codificacion de dos de las K senales de audio de entrada.
9. El metodo de cualquiera de la reivindicacion 7 o reivindicacion 8, que ademas comprende llevar a cabo la codificacion estereo de las K-M senales de audio de salida por pares antes de su inclusion en la corriente de datos.
10. El metodo de cualquiera de las reivindicaciones 7-9, en donde, a condicion de que el modulo de codificacion estereo funcione segun una primera configuracion, la etapa de codificacion de dos de las K senales de audio de entrada para generar una senal media y una senal de audio de salida comprende:

transformar las dos senales de audio de entrada en una primera senal que es una senal media y una segunda senal que es una senal lateral;

codificar con forma de onda la primera y la segunda senal en una primera y una segunda senal con forma de onda codificada, respectivamente, en donde la segunda senal se codifica con forma de onda hasta la primera frecuencia y la primera senal se codifica con forma de onda hasta una segunda frecuencia que es mas grande que la primera frecuencia;

sujetar las dos senales de audio de entrada a la codificacion estereo parametrica para extraer parametros estereo parametricos que permitan la reconstruccion de datos espectrales de las dos de las K senales de audio de entrada para frecuencias por encima de la primera frecuencia; e

incluir la primera y la segunda senal con forma de onda codificada y los parametros estereo parametricos en la corriente de datos,

de forma opcional, ademas comprende

para frecuencias por debajo de la primera frecuencia, transformar la segunda senal con forma de onda codificada, la cual es una senal lateral, en una senal complementaria multiplicando la primera senal con forma de onda codificada, la cual es una senal media, por un parametro de ponderacion a y restando el resultado de la multiplicacion de la segunda senal con forma de onda codificada; e

incluir el parametro de ponderacion a en la corriente de datos.
11. El metodo de la reivindicacion 10, que ademas comprende:

sujetar la primera senal, la cual es una senal media, a la codificacion de reconstruccion de alta frecuencia para generar parametros de reconstruccion de alta frecuencia que permitan la reconstruccion de alta frecuencia de la primera senal por encima de la segunda frecuencia; e

incluir los parametros de reconstruccion de alta frecuencia en la corriente de datos.
12. El metodo de cualquiera de las reivindicaciones 7-9, en donde, a condicion de que el modulo de codificacion estereo funcione segun una primera configuracion, la etapa de codificacion de dos de las K senales de audio de entrada para generar una senal media y una senal de audio de salida comprende:

transformar las dos senales de audio de entrada en una primera senal que es una senal media y una segunda senal que es una senal lateral;

codificar con forma de onda la primera y la segunda senal en una primera y una segunda senal con forma de onda codificada, respectivamente, en donde la primera y la segunda senal se codifican con forma de onda hasta la segunda frecuencia; e

incluir la primera y la segunda senales con forma de onda codificada, de forma opcional, ademas comprende:

transformar la segunda senal con forma de onda codificada, la cual es una senal lateral, en una senal complementaria multiplicando la primera senal con forma de onda codificada, la cual es una senal media, por un parametro de ponderacion a y restando el resultado de la multiplicacion de la segunda senal con forma de onda codificada; e

5

10

15

20

25

30

incluir el parametro de ponderacion a en la corriente de datos.
13. El metodo de la reivindicacion 12, que ademas comprende:

sujetar cada una de dichas dos K senales de audio de entrada a la codificacion de reconstruccion de alta frecuencia para generar parametros de reconstruccion de alta frecuencia que permitan la reconstruccion de alta frecuencia de dichas dos de las N senales de audio de entrada por encima de la segunda frecuencia; e

incluir los parametros de reconstruccion de alta frecuencia en la corriente de datos.
14. Un producto de programa de ordenador que comprende un medio legible por ordenador con instrucciones para llevar a cabo el metodo de cualquiera de las reivindicaciones 1-5, o con instrucciones para llevar a cabo el metodo de cualquiera de las reivindicaciones 7-13.
15. Un codificador (900) para codificar multiples senales de audio de entrada (920) que representan contenido de audio multicanal correspondiente a K canales, que comprende:

un componente de recepcion configurado para recibir K senales de audio de entrada correspondientes a los canales de una configuracion de altavoz con K canales;

un primer modulo de codificacion configurado para generar M senales media que son apropiadas para la reproduccion en una configuracion de altavoz con M canales, en donde 1<M<K<2M, y K-M senales de audio de salida de las K senales de audio de entrada,

en donde 2M-K de las senales media corresponden, cada una, a una senal respectiva de 2M-K de las senales de audio de entrada, de modo que el primer modulo de codificacion se configura para actuar como una transformacion para dichas 2M-K de las senales de audio de entrada y generar asf dichas 2M-K de las senales media, y

en donde el primer modulo de codificacion comprende K-M modulos de codificacion estereo configurados para generar las K-M senales media no correspondientes a las senales de audio de entrada y las K-M senales de audio de salida, cada modulo de codificacion estereo configurado para:

codificar dos de las K senales de audio de entrada para generar una senal media y una senal de audio de salida, la senal de audio de salida siendo una senal lateral o una senal complementaria que junto con la senal media y un parametro de ponderacion a permite la reconstruccion de una senal lateral; y

un segundo modulo de codificacion configurado para codificar las M senales media en M canales de audio de salida adicionales; y

un componente de multiplexacion configurado para incluir las K-M senales de audio de salida y los M canales de audio de salida adicionales en una corriente de datos para su transmision a un descodificador.