ES2595220T3

ES2595220T3 - Aparato y métodos para adaptar información de audio a codificación de objeto de audio espacial

Info

Publication number: ES2595220T3
Application number: ES13732189.9T
Authority: ES
Inventors: Thorsten Kastner; Jürgen HERRE; Leon Terentiv; Oliver Hellmuth; Jouni PAULUS; Falko Ridderbusch
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2012-08-10
Filing date: 2013-06-28
Publication date: 2016-12-28
Anticipated expiration: 2033-06-28
Also published as: AU2013301864B2; KR101837686B1; EP2883226B1; CA2880412A1; KR20170016997A; US20150154968A1; RU2609097C2; CA2880412C; CN104704557B; WO2014023477A1; EP2883226A1; CN104704557A; KR20150043404A; KR102033985B1; AU2013301864A1; BR112015002794B1; BR112015002794A2; MX350687B; RU2015104055A; MX2015001748A

Abstract

Un aparato para adaptar información de audio de entrada, que codifica uno o más objetos de audio, para obtener información de audio adaptada, en el que la información de audio de entrada comprende dos o más canales de mezcla descendente de audio de entrada y comprende, además, información lateral paramétrica de entrada, en el que la información de audio adaptada comprende uno o más canales de mezcla descendente de audio adaptados y comprende, además, información lateral paramétrica adaptada, en el que el aparato comprende: un modificador de señal de mezcla descendente (110) para adaptar, dependiendo de la información de adaptación, los dos o más canales de mezcla descendente de audio de entrada para obtener el uno o más canales de mezcla descendente de audio adaptados, y un adaptador de información lateral paramétrica (120) para adaptar, dependiendo de la información de adaptación, la información lateral paramétrica de entrada para obtener la información lateral paramétrica adaptada, en el que la información de adaptación comprende una matriz de adaptación ( DSM dmx D ), en el que el modificador de señal de mezcla descendente (110) está configurado para adaptar, dependiendo de la matriz de adaptación ( DSM dmx D ), los dos o más canales de mezcla descendente de audio de entrada ( ENC dmx X ) para obtener el uno o más canales de mezcla descendente de audio adaptados ( DSM dmx X ), en el que el adaptador de información lateral paramétrica (120) está configurado para adaptar, dependiendo de la matriz de adaptación ( DSM dmx D ), la información lateral paramétrica de entrada ( ENC dmx D ) para obtener la información lateral paramétrica adaptada ( PSI dmx D ).

Description

5

10

15

20

25

30

35

40

45

50

55

60

Aparato y metodos para adaptar informacion de audio a codificacion de objeto de audio espacial

DESCRIPCION

La presente invencion se refiere a la decodificacion de senales de audio y el procesamiento de senales de audio y, en particular, a un decodificador y unos metodos para adaptar informacion de audio a la codificacion de objetos de audio espacial (SAOC).

En los sistemas de audio digitales modernos, hay una tendencia importante a permitir modificaciones relacionadas con el objeto de audio del contenido transmitido en el lado del receptor. Estas modificaciones incluyen modificaciones de ganancia de partes seleccionadas de la senal de audio y/o el re-posicionamiento espacial de objetos de audio dedicados en caso de reproduccion multicanal a traves de altavoces distribuidos espacialmente. Esto puede lograrse entregando individualmente diferentes partes del contenido de audio a los diferentes altavoces.

En otras palabras, en la tecnica del procesamiento de audio, la transmision de audio y el almacenamiento de audio, existe un deseo en aumento de permitir la interaccion del usuario en la reproduccion de contenidos de audio orientada a objetos y tambien una demanda para utilizar las posibilidades extendidas de la reproduccion multicanal para presentar individualmente contenidos de audio o partes de los mismos, con el fin de mejorar la impresion de audicion. Mediante esto, el uso del contenido de audio multicanal trae consigo mejoras significativas para el usuario. Por ejemplo, puede obtenerse una impresion de audicion tridimensional, lo que trae consigo una mejora en la satisfaccion del usuario en las aplicaciones de entretenimiento. Sin embargo, el contenido de audio multicanal tambien es util en entornos profesionales, por ejemplo, en aplicaciones de conferencia telefonica, debido a que la inteligibilidad del hablante puede mejorarse usando una reproduccion de audio multicanal. Otra aplicacion posible es ofrecer a un oyente de una pieza musical la posibilidad de ajustar individualmente el nivel de reproduccion y/o posicion espacial de diferentes partes (tambien denominadas "objetos de audio") o pistas, tales como una parte vocal o diferentes instrumentos. El usuario puede realizar tal ajuste por razones de gusto personal, para transcribir mas facilmente una o mas partes de la pieza musical, con fines educativos, karaoke, ensayo, etc.

La transmision discreta directa de todo el contenido de audio multicanal o multi-objeto digital, por ejemplo en forma de datos de modulacion de codigo de impulso (PCM) o incluso formatos de audio comprimidos, exige velocidades de bits muy altas. Sin embargo, tambien es deseable transmitir y almacenar datos de audio de una manera eficiente en velocidad de bits. Por lo tanto, se esta dispuesto a aceptar una solucion intermedia razonable entre la calidad de audio y los requisitos de velocidad de bits con el fin de evitar una carga de recursos excesiva provocada por las aplicaciones multicanal/multiobjeto.

Recientemente, en el campo de la codificacion de audio, se han introducido tecnicas parametricas para la transmision/almacenamiento eficiente en velocidad de bits de senales de audio multicanal/multi-objeto, por ejemplo, por el Moving Picture Experts Group (MPEG) y otros. Un ejemplo es el Surround de MPEG (MPS) como un enfoque orientado al canal [MPS, BCC] o la codificacion de objeto de audio espacial (SAOC) de MPEG como un enfoque orientado al objeto [JSC, SAOC, SAOC1, SAOC2]. Otro enfoque orientado al objeto se denomina "separacion de fuentes informada" [ISS1, ISS2, ISS3, ISS4, ISS5, ISS6]. Estas tecnicas tienen como objetivo reconstruir una escena de audio de salida deseada o un objeto de fuente de audio deseada basandose en una mezcla descendente de canales/objetos e informacion lateral adicional que describe la escena de audio transmitida/almacenada y/o los objetos de fuente de audio en la escena de audio.

La estimacion y aplicacion de la informacion lateral relacionada con el canal/objeto en tales sistemas se hace de manera selectiva por tiempo-frecuencia. Por lo tanto, tales sistemas emplean transformadas de tiempo-frecuencia tales como la transformada discreta de Fourier (DFT), la transformada de Fourier de tiempo corto (STFT) o bancos de filtros como los bancos de filtros de espejo en cuadratura (QMF), etc. El principio basico de tales sistemas se representa en la figura 3, usando el ejemplo de SAOC de MPEG.

En el caso de la STFT, la dimension temporal se representa por el numero de tiempo-bloque y la dimension espectral se captura por el numero de coeficiente espectral ("bin"). En caso de QMF, la dimension temporal se representa por el numero de tiempo-segmento y la dimension espectral se captura por el numero de sub-banda. Si la resolucion espectral del QMF se mejora por la aplicacion subsiguiente de una segunda etapa de filtro, todo el banco de filtros se denomina QMF hubrido y las sub-bandas de resolucion fina se denominan sub-bandas hfbridas.

Como ya se ha mencionado anteriormente, en SAOC el procesamiento general se realiza de manera selectiva por tiempo-frecuencia y puede describirse de la siguiente manera dentro de cada banda de frecuencia, como se representa en la figura 3:

- N senales de objeto de audio de entrada si ... sn se mezclan con los P canales xi ... xp como parte del procesamiento de codificador, usando una matriz de mezcla descendente que consiste en los elementos di,i ...

5

10

15

20

25

30

35

40

45

50

55

60

dN,p. Ademas, el codificador extrae informacion lateral que describe las caractensticas de los objetos de audio de entrada (modulo estimador de informacion lateral (SIE)). Para SAOC DE MPEG, las relaciones de las potencias de objeto w.r.t. entre sf son la forma mas basica de tal informacion lateral.

- La o las senales de mezcla descendente y la informacion lateral se transmiten/se almacenan. Para este fin, la o las senales de audio de mezcla descendente pueden comprimirse, por ejemplo, usando codificadores de audio perceptual bien conocidos, tales como MPEG-1/2 Capa II o III (tambien conocido como .mp3), codificacion de audio avanzada de MPEG-2/4 (AAC), etc.

- En el extremo receptor, el decodificador intenta, conceptualmente, restablecer las senales de objeto originales ("separacion de objeto") de las senales de mezcla descendente (decodificadas) usando la informacion lateral transmitida. Estas senales de objeto aproximadas si ... Sn se mezclan, a continuacion, en una escena objetivo representada por M canales de salida de audio yi ... yM usando una matriz de presentacion descrita por los coeficientes ri,i ... rN,M en la figura 3. La escena objetivo deseada puede ser, en caso extremo, la presentacion de solo una senal fuente fuera de la mezcla (escenario de separacion de fuente), pero tambien cualquier otra escena acustica arbitraria que consiste en los objetos transmitidos. Por ejemplo, la salida puede ser una escena objetivo de un solo canal, de 2 canales estereo o 5.1 multicanal.

La figura 6 representa esquematicamente el principio de un esquema de codificacion/decodificacion de audio. En particular, la figura 6 es una descripcion del principio de una cadena de codificacion/decodificacion de audio.

En el lado de codificacion, la senal de audio se comprime por un esquema de codificacion de audio (que normalmente aprovecha efectos perceptuales) y se calcula la informacion lateral parametrica (PSI) (vease codificador 601). El flujo de bits resultante que consiste en la senal de audio codificada y la PSI se almacena en (o se transmite a) el lado del decodificador, en el que pueden decodificarse por varias instancias de decodificador 620, 621, 622, marcadas como "A", "B", etc. en la figura 6. Estas instancias de decodificador pueden diferir entre sf (por ejemplo, diferentes niveles de complejidad en la especificacion convencional, restricciones de aplicacion o de implementacion, etc.) [SAOC. SAOcI, SAOC2].

Los esquemas de codificacion del estado de la tecnica no son capaces de adaptar la PSI a un escenario o plataforma de aplicacion objetivo espedfica de manera eficiente. Esto puede conducir a una complejidad computacional mas alta (de lo necesario) en el lado del decodificador o puede dar como resultado problemas de compatibilidad.

El objeto de la presente invencion es proporcionar conceptos mejorados para la codificacion de objetos de audio. El objeto de la presente invencion se resuelve por un aparato para adaptar informacion de audio de entrada de acuerdo con la reivindicacion 1, por un metodo para adaptar informacion de audio de entrada de acuerdo con la reivindicacion 11 y por un programa informatico de acuerdo con la reivindicacion 13.

Se proporciona un aparato para adaptar informacion de audio de entrada, que codifica uno o mas objetos de audio, para obtener informacion de audio adaptada. La informacion de audio de entrada comprende dos o mas canales de mezcla descendente de audio de entrada y comprende ademas informacion lateral parametrica de entrada. La informacion de audio adaptada comprende uno o mas canales de mezcla descendente de audio adaptados y comprende ademas informacion lateral parametrica adaptada.

El aparato comprende un modificador de senales de mezcla descendente para adaptar, dependiendo de la informacion de adaptacion, los dos o mas canales de mezcla descendente de audio de entrada para obtener el uno o mas canales de mezcla descendente de audio adaptados.

Ademas, el aparato comprende un adaptador de informacion lateral parametrica para adaptar, dependiendo de la informacion de adaptacion, la informacion lateral parametrica de entrada para obtener la informacion lateral parametrica adaptada.

La informacion de adaptacion comprende una matriz de adaptacion (D^j^f ).

El modificador de senal de mezcla descendente esta configurado para adaptar, dependiendo de la matriz de adaptacion (D), los dos o mas canales de mezcla descendente de audio de entrada (X) para obtener el

uno o mas canales de mezcla descendente de audio adaptados (X^j).

El adaptador de informacion lateral parametrica esta configurado para adaptar, dependiendo de la matriz de adaptacion (D^j^f ), la informacion lateral parametrica de entrada (D) para obtener la informacion lateral

5

10

15

20

25

30

35

40

45

50

parametrica adaptada (Ddmx ).

De acuerdo con una realizacion, el modificador de senal de mezcla descendente puede estar configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada dependiendo de la informacion de adaptacion, de tal manera que el numero del uno o mas canales de mezcla descendente de audio adaptados es menor que el numero de los dos o mas canales de mezcla descendente de audio de entrada.

En una realizacion, la informacion de adaptacion puede depender de una instancia de decodificador. El modificador de senal de mezcla descendente puede estar configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada dependiendo de la instancia de decodificador. En este caso y en lo sucesivo, las expresiones "decodificador" e "instancia de decodificador" tienen el mismo significado.

De acuerdo con una realizacion, la instancia de decodificador puede ser capaz de decodificar a lo sumo un numero maximo de canales de mezcla descendente. La informacion de adaptacion puede depender de dicho numero maximo de canales de mezcla descendente. Ademas, el modificador de senal de mezcla descendente puede estar configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada, dependiendo de la informacion de adaptacion para obtener el uno o mas canales de mezcla descendente de audio adaptados, de tal manera que el numero del uno o mas canales de mezcla descendente adaptados es igual a dicho numero maximo de canales de mezcla descendente.

De acuerdo con una realizacion, el modificador de senal de mezcla descendente puede estar configurado para adaptar, dependiendo de la matriz de adaptacion D, los dos o mas canales de mezcla descendente de audio

de entrada X^X para obtener el uno o mas canales de mezcla descendente de audio adaptados Xdd^ aplicando la formula:

_-D-DSM

^ dmx dmx dmx ■

De acuerdo con una realizacion, el adaptador de informacion lateral parametrica puede estar configurado para adaptar, dependiendo de la matriz de adaptacion Ddd^d , la informacion lateral parametrica de entrada Dddddd para

PSI

obtener la informacion lateral parametrica adaptada Ddmx aplicando la formula:

dPSI _ dDSM dENC

dmx dmx dmx .

En una realizacion, la informacion lateral parametrica de entrada (Dejmjx) puede indicar una matriz de mezcla descendente inicial, de tal manera que aplicando la matriz de mezcla descendente inicial (Dejmjx) sobre el uno o

mas objetos de audio (S) se obtienen los dos o mas canales de mezcla descendente de audio de entrada (xem).

El adaptador de informacion lateral parametrica puede estar configurado para determinar una matriz de mezcla descendente adaptada (Ddmx) como la informacion lateral parametrica adaptada, de tal manera que aplicando la

PSI

matriz de mezcla descendente adaptada (Ddmx) sobre uno o mas objetos de audio (S), se obtienen el uno o mas canales de mezcla descendente de audio adaptados (Xddddd ).

Ademas, de acuerdo con una realizacion, se proporciona un aparato para generar uno o mas canales de audio a partir de la informacion de audio que codifican uno o mas objetos de audio.

El aparato para generar el uno o mas canales de audio comprende un aparato de acuerdo con una de las realizaciones descritas anteriormente para adaptar la informacion de audio de entrada para obtener informacion de audio adaptada, en el que la informacion de audio de entrada comprende dos o mas canales de mezcla descendente de audio de entrada y comprende, ademas, informacion lateral parametrica de entrada, en el que la informacion de audio adaptada comprende uno o mas canales de mezcla descendente de audio adaptados y comprende, ademas, informacion lateral parametrica adaptada.

5

10

15

20

25

30

35

40

45

50

55

60

Ademas, el aparato para generar el uno o mas canales de audio comprende una instancia de decodificador, para decodificar, dependiendo de la informacion lateral parametrica adaptada, el uno o mas canales de mezcla descendente de audio adaptados para obtener el uno o mas canales de audio.

De acuerdo con una realizacion, el adaptador de informacion lateral parametrica del aparato para adaptar la informacion de audio de entrada puede estar configurado para recibir un flujo de bits de entrada que comprende la informacion lateral parametrica de entrada. El adaptador de informacion lateral parametrica del aparato para adaptar informacion de audio de entrada puede estar configurado para adaptar la informacion lateral parametrica de entrada para obtener la informacion lateral parametrica adaptada y para introducir la informacion lateral parametrica adaptada en la instancia de decodificador. La instancia de decodificador puede estar configurada para decodificar el uno o mas canales de mezcla descendente de audio adaptados dependiendo de la informacion lateral parametrica adaptada.

En otra realizacion, el adaptador de informacion lateral parametrica del aparato para adaptar informacion de audio de entrada puede estar configurado para recibir un flujo de bits de entrada que comprende la informacion lateral parametrica de entrada. El adaptador de informacion lateral parametrica del aparato para adaptar informacion de audio de entrada puede estar configurado para sustituir la informacion lateral parametrica de entrada dentro del flujo de bits de entrada por la informacion lateral parametrica adaptada para obtener un flujo de bits modificado. El adaptador de informacion lateral parametrica del aparato para adaptar la informacion de audio de entrada puede estar configurado para introducir el flujo de bits modificado en la instancia de decodificador. Ademas, la instancia de decodificador puede estar configurada para decodificar el uno o mas canales de mezcla descendente de audio adaptados dependiendo del flujo de bits modificado.

Ademas, se proporciona un metodo para adaptar informacion de audio de entrada, que codifica uno o mas objetos de audio, para obtener informacion de audio adaptada. La informacion de audio de entrada comprende dos o mas canales de mezcla descendente de audio de entrada y comprende ademas informacion lateral parametrica de entrada. La informacion de audio adaptada comprende uno o mas canales de mezcla descendente de audio adaptados y comprende ademas informacion lateral parametrica adaptada. El metodo comprende las etapas de la reivindicacion 11.

Ademas, se proporciona un programa informatico para implementar el metodo descrito anteriormente, cuando se ejecuta por un ordenador o un procesador de senales.

Las realizaciones preferidas se proporcionaran en las reivindicaciones dependientes.

A continuacion, se describen en mas detalle realizaciones de la presente invencion con referencia a las figuras, en las que:

Figura 1

Figura 2

Figura 3 Figura 4

Figura 5

Figura 6 Figura 7

Figura 8

Figura 9

ilustra un aparato para adaptar informacion de audio de entrada, que codifica uno o mas objetos de audio, para obtener informacion de audio adaptada de acuerdo con una realizacion.

ilustra un aparato para adaptar informacion de audio de entrada, que codifica uno o mas objetos de audio, para obtener informacion de audio adaptada de acuerdo con otra realizacion.

muestra un diagrama de bloques esquematico de una vision general conceptual de un sistema de SAOC.

muestra un diagrama esquematico e ilustrativo de una representacion temporal-espectral de una senal de audio de un solo canal.

muestra un diagrama de bloques esquematico de un calculo selectivo de tiempo-frecuencia de informacion lateral dentro de un codificador de SAOC.

representa esquematicamente el principio de un esquema de codificacion/decodificacion de audio.

ilustra un aparato para generar uno o mas canales de audio a partir de una informacion de audio de entrada que codifica uno o mas objetos de audio de acuerdo con una realizacion.

ilustra una aplicacion de PSIA junto con un esquema de codificacion/decodificacion de acuerdo con una realizacion.

ilustra una aplicacion de PSIA por separado dentro de un esquema de codificacion/decodificacion de acuerdo con una realizacion.

Antes de describir las realizaciones de la presente invencion, se proporcionan mas antecedentes del estado de la

5

10

15

20

25

30

35

40

45

50

55

60

tecnica de los sistemas de SAOC.

La figura 3 muestra una disposicion general de un codificador de SAOC 10 y un decodificador de SAOC 12. El codificador de SAOC 10 recibe como entrada N objetos, es decir, senales de audio si a sn. En particular, el codificador 10 comprende un mezclador descendente 16 que recibe las senales de audio si a sn y mezcla de manera descendente las mismas con una senal de mezcla descendente 18. Como alternativa, la mezcla descendente puede proporcionarse externamente ("mezcla descendente artfstica") y el sistema estima la informacion lateral adicional para hacer que la mezcla descendente proporcionada coincida con la mezcla descendente calculada. En la figura 3, se muestra que la senal de mezcla descendente es una senal de canal P. Por lo tanto, es concebible cualquier configuracion de senal de mezcla descendente monofonica (P = 1), estereofonica (P = 2) o multicanal (P > 2).

En el caso de una mezcla descendente estereofonica, los canales de la senal de mezcla descendente 18 se indican como L0 y R0, en el caso de una mezcla descendente monofonica, lo mismo se indica simplemente como L0. Con el fin de permitir que el decodificador de SAOC 12 recupere los objetos individuales si a sn, el estimador de informacion lateral 17 provee al decodificador de SAOC 12 de una informacion lateral que incluye unos parametros de SAOC. Por ejemplo, en el caso de una mezcla descendente estereofonica, los parametros de SAOC comprenden diferencias a nivel de objeto (OLD), correlaciones inter-objeto (COI) (parametros de correlacion cruzada de inter- objeto), valores de ganancia de mezcla descendente (DMG) y diferencias de nivel de canal de mezcla descendente (DCLD). La informacion lateral 20, que incluye los parametros de SAOC, junto con la senal de mezcla descendente 18, forma la corriente de datos de salida de SAOC recibida por el decodificador de SAOC 12.

El decodificador de SAOC 12 comprende un mezclador ascendente que recibe la senal de mezcla descendente 18, asf como la informacion lateral 20 con el fin de recuperar y presentar las senales de audio si y Sn sobre cualquier conjunto de canales seleccionados por el usuario yi a yM, prescribiendose la presentacion por la informacion de presentacion 26 introducida en el decodificador de SAOC 12.

Las senales de audio si a sn pueden introducirse en el codificador 10 en cualquier dominio de codificacion, tal como en un dominio de tiempo o espectral. En caso de que las senales de audio si a sn se introduzcan en el codificador 10 en el dominio de tiempo, tal como PCM codificadas, el codificador 10 puede usar un banco de filtros, tal como un banco de QMF tnbrido, con el fin de transferir las senales a un dominio espectral, en el que las senales de audio se representan en varias sub-bandas asociadas con diferentes porciones espectrales, en una resolucion de banco de filtros espedfica. Si las senales de audio si a sn ya estan en la representacion esperada por el codificador 10, el mismo no tiene que realizar la descomposicion espectral.

La figura 4 muestra una senal de audio en el dominio espectral recien mencionado. Como puede verse, la senal de audio se representa como una pluralidad de senales de sub-banda. Cada senal de sub-banda 301 a 30k consiste en una secuencia temporal de valores de sub-banda indicados por las cajas pequenas 32. Como puede verse, los valores de sub-banda 32 de las senales de sub-banda 301 a 30k se sincronizan entre sf en el tiempo, de manera que, por cada uno de los segmentos de tiempo de banco de filtros consecutivos 34, cada sub-banda 301 a 30k comprende un valor de sub-banda exacto 32. Como se ilustra por el eje de frecuencia 36, las senales de sub-banda 301 a 30k se asocian con diferentes regiones de frecuencia y como se ilustra por el eje del tiempo 38, los segmentos de tiempo de banco de filtros 34 se disponen consecutivamente en el tiempo.

Como se ha descrito anteriormente, el extractor de informacion lateral 17 de la figura 3 calcula los parametros de SAOC a partir de las senales de audio de entrada a s1 a sn. De acuerdo con la norma de SAOC implementada actualmente, el codificador 10 realiza este calculo en una resolucion de tiempo/frecuencia que puede reducirse en relacion con la resolucion de tiempo/frecuencia original como se determino por los segmentos de tiempo de banco de filtros 34 y por la descomposicion de sub-banda, en una cierta cantidad, senalandose esta cierta cantidad en el lado del decodificador dentro de la informacion lateral 20. Los grupos de segmentos de tiempo de banco de filtros consecutivos 34 pueden formar un marco de SAOC 41. Ademas, el numero de bandas de parametro dentro del marco de SAOC 41 se transporta dentro de la informacion lateral 20. Por lo tanto, el dominio de tiempo/frecuencia se divide en mosaicos de tiempo/frecuencia ejemplificados en la figura 4 por las lmeas discontinuas 42. En la figura 4 las bandas de parametros se distribuyen de la misma manera en los diversos marcos de SAOC ilustrados 41, de tal manera que se obtiene una disposicion regular de mosaicos de tiempo/frecuencia. En general, sin embargo, las bandas de parametros pueden variar de un marco de SAOC 41 al siguiente, dependiendo de las diferentes necesidades de resolucion espectral en los marcos de SAOC respectivos 41. Ademas, la longitud de los marcos de SAOC 41 tambien puede variar. Como consecuencia, la disposicion de los mosaicos de tiempo/frecuencia puede ser irregular. Sin embargo, los mosaicos de tiempo/frecuencia dentro de un marco de SAOC espedfico 41 tienen habitualmente la misma duracion y estan alineados en la direccion del tiempo, es decir, todos los mosaicos de tiempo/frecuencia en dicho marco de SAOC 41 empiezan al inicio del marco de SAOC dado 41 y terminan al final de dicho marco de SAOC 41.

El extractor de informacion lateral 17 representado en la figura 3 calcula los parametros de SAOC de acuerdo con

5

10

15

20

25

30

35

40

45

las siguientes formulas. En particular, el extractor de informacion lateral 17 calcula diferencias a nivel de objeto para cada objeto i como

OLDm =■

IS xfxf

net kem

"is k'

V net kem J

max

j

en donde las sumas y los indices n y k, respectivamente, avanzan a traves de todos los mdices temporales 34 y todos los mdices espectrales 30 que pertenecen a un cierto mosaico de tiempo/frecuencia 42, referenciado por los indices l para el marco de SAOC (o segmento de tiempo de procesamiento) y m para la banda de parametro. Por lo tanto, las energfas de todos los valores de sub-banda Xi de una senal u objeto de audio i se suman hasta, y se normalizan con respecto a, el valor de energfa mas alto de ese mosaico entre todos los objetos o senales de audio.

n k* n k

xt’ indica el conjugado complejo de xt’ .

Ademas, el extractor de informacion lateral de SAOC 17 es capaz de calcular una medida de similitud de los mosaicos de tiempo/frecuencia correspondientes de pares de objetos de entrada diferentes s1 a sn. Aunque el extractor de informacion lateral de SAOc 17 puede calcular la medida de similitud entre todos los pares de objetos de entrada s1 a sn, el extractor de informacion lateral 17 tambien puede suprimir la senalizacion de las medidas de similitud o restringir el calculo de las medidas de similitud a los objetos de audio s1 a sn, que forman los canales izquierdo o derecho de un canal estereofonico comun. En cualquier caso, la medida de similitud se denomina

parametro de correlacion cruzada de inter-objetos IOC* j” . El calculo es de la siguiente manera:

IOC t ■ m = IOCj ■m = Re <

*5 J J , *

IS

net kem

xnkxjk‘

IS x-x-* IS

n k n k*

xj xj

ne l ke m

avanzando de nuevo los indices n y k a traves de todos los valores de sub-banda pertenecientes a un determinado mosaico de tiempo/frecuencia 42, indicando i y j un determinado par de objetos de audio si a sn e indicando Re{} la operacion de descartar la parte imaginaria del argumento complejo.

El mezclador descendente 16 de la figura 3 mezcla de manera descendente los objetos si a sn mediante el uso de factores de ganancia aplicados a cada objeto si a sn. Es decir, se aplica un factor de ganancia di al objeto i y, a continuacion, todos los objetos asf ponderados s1 a sn se suman hasta obtener una senal de mezcla descendente monofonica, que se ejemplifica en la figura 3 si P = 1. En otro caso a modo de ejemplo de una senal de mezcla descendente de dos canales, representado en la figura 3, si P = 2, se aplica un factor de ganancia dij al objeto i y, a continuacion, todos estos objetos amplificados de ganancia se suman con el fin de obtener el canal de mezcla descendente izquierdo L0 y se aplican los factores de ganancia d2,i al objeto i y, a continuacion, los objetos amplificados de ganancia se suman con el fin de obtener el canal de mezcla descendente derecho R0. Se aplicara un procesamiento que es analogo al anterior en el caso de una mezcla descendente multicanal (P > 2).

Esta prescripcion de mezcla descendente se senala al lado del decodificador por medio de ganancias de mezcla descendente DMGi y en el caso de una senal de mezcla descendente estereofonica, diferencias de nivel de canal de mezcla descendente DCLDi.

Las ganancias de mezcla descendente se calculan de acuerdo con:

DMG* = 20log10 (dt + g) , (mezcla descendente monofonica),

DMGt = 10log10 (d^ + d2 * + s') , (mezcla descendente estereofonica),

donde g es un numero pequeno tal como 10-9.

Para las DCLD se aplica la siguiente formula:

5

10

15

20

25

30

35

40

DCLDi = 20logj,

r d \

d1,i

V d2,i + *

En el modo normal, el mezclador descendente 16 genera la senal de mezcla descendente de acuerdo con:

r? >

(L0) = ( di)

V SN J

para una mezcla descendente monofonica o

r L0 ^

v R0 J

r d< ^

v d2,i J

r s \

V SN J

para una mezcla descendente estereofonica, respectivamente.

Por lo tanto, en las formulas mencionadas anteriormente, los parametros OLD e IOC son una funcion de las senales de audio y los parametros DMG y DCLD son una funcion de d. Por cierto, cabe senalar que d puede ser variable en tiempo y en frecuencia.

Por lo tanto, en el modo normal, el mezclador descendente 16 mezcla todos los objetos si a sn sin preferencias, es decir, manejando todos los objetos si a sn por igual.

En el lado del decodificador, el mezclador ascendente realiza la inversion del procedimiento de mezcla descendente y la implementacion de la "informacion de presentacion" 26 representada por una matriz R (en la literatura tambien denominada algunas veces A) en una etapa de calculo, es decir, en el caso de una mezcla descendente de dos canales

r y'

V yM J

RED*(DED*)

i r lo ^

V ro J’

donde la matriz E un una funcion de los parametros OLD e IOC y la matriz D contiene los coeficientes de mezcla descendente como

D

r du •: d1,N

V dP,1: dP,N j

La matriz E es una matriz de covarianza estimada de los objetos de audio si a sn. En implementaciones de SAOC actuales, el calculo de la matriz de covarianza estimada E se realiza habitualmente en la resolucion espectral/temporal de los parametros de SAOC, esto es, para cada (l, m), de tal manera que la matriz de covarianza estimada puede escribirse como Elm. La matriz de covarianza estimada Elm es de tamano N x N definiendose sus coeficientes como

J,m = j

JOLDli,mOLDl;mIOCi

V i J i

l,m

uj .

Por lo tanto, la matriz Elm con

5

10

15

20

25

30

35

40

45

50

55

E ,m ___

m

el’m

e

l,m \

e’m

eN, N J

tiene a lo largo de su diagonal las diferencias a nivel de objeto, es decir, ei’1" _ OLDIj ’m para i=j, debido a que

OLD1/m _ OLDjm e IOC]’™ _ 1 para i=j. Fuera de su diagonal, la matriz de covarianza estimada E tiene coeficientes de matriz que representan la media geometrica de las diferencias a nivel de objeto de los objetos i y j, respectivamente, ponderados con la medida de correlacion cruzada de inter-objeto IOC]’ j .

La figura 5 muestra un posible principio de implementacion en el ejemplo del estimador de informacion lateral (SIE) como parte de un codificador de SAOC 10. El codificador de SAOC 10 comprende el mezclador 16 y el estimador de informacion lateral (SIE) 17. El SIE consiste conceptualmente en dos modulos: un modulo 45 para calcular una representacion de tiempo/frecuencia basada en tiempo corto (por ejemplo, STFT o QMF) de cada senal. La representacion de tiempo/frecuencia de tiempo corto calculada se introduce en el segundo modulo 46, el modulo de estimacion de informacion lateral selectivo en tiempo/frecuencia(t/f-SIE). El modulo de t/f-SIE 46 calcula la informacion lateral para cada mosaico de tiempo/frecuencia. En implementaciones de SAOC actuales, la transformada de tiempo/frecuencia es fija e identica para todos los objetos de audio si a sn Ademas, los parametros de SAOC se determinan sobre marcos de SAOC que son los mismos para todos los objetos de audio y tienen la misma resolucion de tiempo/frecuencia para todos los objetos de audio si a sn, independientemente por lo tanto de las necesidades de objeto-espedfico para la resolucion temporal fina en algunos casos o la resolucion espectral fina en otros casos.

A continuacion, se describen realizaciones de la presente invencion.

La figura 1 ilustra un aparato para adaptar informacion de audio de entrada, que codifica uno o mas objetos de audio, para obtener informacion de audio adaptada de acuerdo con una realizacion.

La informacion de audio de entrada comprende dos o mas canales de mezcla descendente de audio de entrada y comprende, ademas, informacion lateral parametrica de entrada. La informacion de audio adaptada comprende uno o mas canales de mezcla descendente de audio adaptados y comprende, ademas, informacion lateral parametrica adaptada.

El aparato comprende un modificador de senal de mezcla descendente (DSM) 110 para adaptar, dependiendo de la informacion de adaptacion, los dos o mas canales de mezcla descendente de audio de entrada para obtener el uno o mas canales de mezcla descendente de audio adaptados.

Ademas, el aparato comprende un adaptador de informacion lateral parametrica (PSIA) 120 para adaptar, dependiendo de la informacion de adaptacion, la informacion lateral parametrica de entrada para obtener la informacion lateral parametrica adaptada.

La figura 2 ilustra un aparato para adaptar informacion de audio de entrada, que codifica uno o mas objetos de audio, para obtener informacion de audio adaptada de acuerdo con otra realizacion.

En una realizacion, la informacion de adaptacion puede depender de una instancia de decodificador y el modificador de senal de mezcla descendente 110 puede estar configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada dependiendo de la instancia de decodificador.

Por ejemplo, el modificador de senal de mezcla descendente 110 de la figura 2 adapta la mezcla descendente a las capacidades de la instancia de decodificador espedfica.

De acuerdo con una realizacion, el modificador de senal de mezcla descendente 110 puede estar configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada dependiendo de la informacion de adaptacion, de tal manera que el numero del uno o mas canales de mezcla descendente de audio adaptados es menor que el numero de los dos o mas canales de mezcla descendente de audio de entrada.

Por ejemplo, en la realizacion de la figura 2, el modificador de senal de mezcla descendente 110 reduce el numero de canales de transporte/mezcla descendente.

Por ejemplo, 22,2 canales de mezcla descendente de audio de entrada (= 24 canales de mezcla descendente de

9

5

10

15

20

25

30

35

40

45

50

55

audio de entrada) pueden reducirse a 7,1 canales de mezcla descendente de audio adaptados (= 8 canales de mezcla descendente de audio adaptados).

O, por ejemplo, 5,1 canales de mezcla descendente de audio de entrada (= 6 canales de mezcla descendente de audio de entrada) se reducen a 2,0 canales de mezcla descendente de audio adaptados (= 2 canales de mezcla descendente de audio adaptados).

O, por ejemplo, 2 canales de mezcla descendente de audio de entrada se reducen a 1 canal de mezcla descendente de audio adaptado.

Otras diversas combinaciones de canales de mezcla descendente de audio de entrada y canales de mezcla descendente de audio adaptados son posibles.

De acuerdo con una realizacion, la instancia de decodificador puede ser capaz de decodificar a lo sumo un numero maximo de canales de mezcla descendente. La informacion de adaptacion puede depender de dicho numero maximo de canales de mezcla descendente. Ademas, el modificador de senal de mezcla descendente 110 puede estar configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada dependiendo de la informacion de adaptacion para obtener el uno o mas canales de mezcla descendente de audio adaptados, de tal manera que el numero del uno o mas canales de mezcla descendente adaptados es igual a dicho numero maximo de canales de mezcla descendente.

Por ejemplo, el modificador de senal de mezcla descendente 110 de la figura 2 convierte la mezcla descendente a la senal de audio que corresponde a la configuracion de canal de salida soportada maxima de la instancia de codificador espedfica.

De acuerdo con la invencion, la informacion de adaptacion comprende una matriz de adaptacion (D^X ).

El adaptador de informacion lateral parametrica 120 puede, por ejemplo, adaptar la PSI para que corresponda a la mezcla descendente modificada, con el fin de disminuir la complejidad computacional del decodificador y para reducir el tamano de flujo de bits de datos/velocidad de bits correspondiente sin producir una influencia negativa sobre la calidad de audio de salida del decodificador.

Por ejemplo, la PSIA 120 modifica el flujo de bits de PSI correspondiente sustituyendo la informacion que representa la matriz de mezcla descendente inicial por la informacion actualizada que describe la mezcla descendente resultante (tomando en cuenta las modificaciones de DSM) para corresponder a la especificacion espedfica del decodificador.

Por ejemplo, un codificador de SAOC proporciona la senal de mezcla descendente estereofonica resultante

de la aplicacion de la matriz de mezcla descendente de codificador D^ a las senales de objeto de audio de entrada S:

X^NC

dmx

D

dm

S.

De acuerdo con la invencion, el modificador de senal de mezcla descendente 110 esta configurado para adaptar, dependiendo de la matriz de adaptacion D^X , los dos o mas canales de mezcla descendente de audio de entrada

Xdm™ para obtener el uno o mas canales de mezcla descendente de audio adaptados XXX . En una realizacion,

XDSM t^DSM^tENC

dmx _ Ddmx Xdmx

Por ejemplo, en una realizacion, donde se supone que la instancia de decodificador de SAOC espedfica soporta solamente una mezcla descendente monofonica (por ejemplo, perfil de bajo retardo de SAOC/nivel 1). En este caso,

el DSM 110 convierte la mezcla descendente estereo X^X a la senal monofonica X^X usando una matriz de mezcla descendente predefinida Ddm^ de la siguiente manera:

XDsm _ dDsm xEnc *~dm dmx *~<dm '

De acuerdo con la invencion, el adaptador de informacion lateral parametrica 120 puede estar configurado para

5

10

15

20

25

30

35

40

45

50

adaptar, dependiendo de la matriz de adaptacion D, la informacion lateral parametrica de entrada Dd^X para

PSI

obtener la informacion lateral parametrica adaptada Ddmx. En una realizacion, esto puede realizarse, por ejemplo, aplicando la formula:

dPSI — dDSM dFNC

dmx dmx dmx

Por ejemplo, de acuerdo con una realizacion, el PSIA 120 analiza el flujo de bits de PSI correspondiente; extrae informacion que describe la matriz de mezcla descendente D^; sustituye estos datos por informacion actualizada

que describe la nueva matriz de mezcla descendente DpmX:

DPsi — dDsm d£nc

dmx dmx dmx '

Por lo tanto, de acuerdo con una realizacion, la informacion lateral parametrica de entrada (Dedmx) puede indicar una matriz de mezcla descendente inicial, de tal manera que al aplicar la matriz de mezcla descendente inicial (Ddmx) sobre el uno o mas objetos de audio (S), se obtienen los dos o mas canales de mezcla descendente de

audio de entrada (Xedmx). El adaptador de informacion lateral parametrica puede estar configurado para determinar

una matriz de mezcla descendente adaptada (Ddmx) como la informacion lateral parametrica adaptada, de tal

PSI

manera que al aplicar la matriz de mezcla descendente adaptada (Ddmx) sobre el uno o mas objetos de audio (S),

se obtienen el uno o mas canales de mezcla descendente de audio adaptados (XdldX ).

En una realizacion, el PSIA formatea el nuevo flujo de bits modificado o hace pasar directamente estos parametros al decodificador.

Este proceso de codificacion y decodificacion realizado por el PSIA tambien puede incluir la conversion de diferentes formatos de representacion de matriz de mezcla descendente (por ejemplo, sistema de coordenadas polar a cartesiano, etc.).

Esta funcion descrita del PSIA puede resolver posibles problemas de compatibilidad y reducir el tamano del flujo de bits correspondiente.

La figura 7 ilustra un aparato 700 para generar uno o mas canales de audio a partir de informacion de audio de entrada que codifica uno o mas objetos de audio de acuerdo con una realizacion.

El aparato 700 para generar el uno o mas canales de audio comprende un aparato 710 de acuerdo con una de las realizaciones descritas anteriormente para adaptar la informacion de audio de entrada para obtener informacion de audio adaptada. La informacion de audio de entrada comprende dos o mas canales de mezcla descendente de audio de entrada y comprende, ademas, informacion lateral parametrica de entrada. La informacion de audio adaptada comprende uno o mas canales de mezcla descendente de audio adaptados y comprende, ademas, informacion lateral parametrica adaptada.

El aparato 710 de acuerdo con una de las realizaciones descritas anteriormente para adaptar la informacion de audio de entrada comprende un modificador de senal de mezcla descendente 110 y un adaptador de informacion lateral parametrica 120.

Ademas, el aparato 700 para generar el uno o mas canales de audio comprende una instancia de decodificador 720, para decodificar, dependiendo de la informacion lateral parametrica adaptada, el uno o mas canales de mezcla descendente de audio adaptados para obtener el uno o mas canales de audio.

De acuerdo con una realizacion, el adaptador de informacion lateral parametrica 120 del aparato 710 para adaptar informacion de audio de entrada puede estar configurado para recibir un flujo de bits de entrada que comprende la informacion lateral parametrica de entrada. El adaptador de informacion lateral parametrica 120 del aparato 710 para adaptar informacion de audio de entrada puede estar configurado para adaptar la informacion lateral parametrica de entrada para obtener la informacion lateral parametrica adaptada y para introducir la informacion lateral parametrica adaptada en la instancia de decodificador 720. La instancia de decodificador 720 puede estar configurada para

11

5

10

15

20

25

30

35

40

45

50

55

60

decodificar el uno o mas canales de mezcla descendente de audio adaptados dependiendo de la informacion lateral parametrica adaptada.

En otra realizacion, el adaptador de informacion lateral parametrica 120 del aparato 710 para adaptar la informacion de audio de entrada puede estar configurado para recibir un flujo de bits de entrada que comprende la informacion lateral parametrica de entrada. El adaptador de informacion lateral parametrica 120 del aparato 710 para adaptar la informacion de audio de entrada puede estar configurado para sustituir la informacion lateral parametrica de entrada dentro del flujo de bits de entrada por la informacion lateral parametrica adaptada para obtener un flujo de bits modificado. El adaptador de informacion lateral parametrica 120 del aparato 710 para adaptar la informacion de audio de entrada puede estar configurado para introducir el flujo de bits modificado en la instancia de decodificador 720. Ademas, la instancia de decodificador 720 puede estar configurada para decodificar el uno o mas canales de mezcla descendente de audio adaptados dependiendo de la corriente de bits modificada.

Las figuras 8 y 9 ilustran dos posibilidades para incorporar el aparato para adaptar informacion de audio de entrada a la cadena de procesamiento de decodificacion.

En particular, la figura 8 ilustra una aplicacion de PSIA conjunta dentro de un esquema de codificacion/decodificacion de acuerdo con una realizacion.

La figura 8 ilustra una pluralidad de aparatos 800, 801, 802 para generar uno o mas canales de audio a partir de informacion de audio de entrada que codifica uno o mas objetos de audio, comprendiendo el aparato 800 para generar uno o mas canales de audio un aparato 810 para adaptar informacion de audio de entrada y una instancia de decodificador 820, comprendiendo el aparato 801 para generar uno o mas canales de audio un aparato 811 para adaptar informacion de audio de entrada y una instancia de decodificador 821 y comprendiendo el aparato 802 para generar uno o mas canales de audio un aparato 812 para adaptar informacion de audio de entrada y una instancia de decodificador 822. Cabe senalar que, por ejemplo, el aparato 800 para generar uno o mas canales de audio, que comprende el aparato 810 para adaptar informacion de audio de entrada y la instancia de decodificador 820, no tiene que realizarse como una sola unidad de hardware 800, sino que en lugar de esto puede realizarse por dos unidades separadas 810, 820 que se conectan por un alambre o que se conectan de manera inalambrica.

La implementacion conjunta (integrada) del aparato para adaptar informacion de audio de entrada puede realizarse con el fin de reducir la complejidad computacional para la decodificacion (vease la figura 8). Ademas, esto permite implementar una interfaz no cuantificada (no codificada) entre el aparato para adaptar informacion de audio de entrada y el decodificador. Esto puede ser relevante, en particular para dispositivos de aplicaciones moviles para reducir el consumo de energfa.

La figura 9 ilustra la aplicacion PSIA disjunta en un esquema de codificacion/decodificacion de acuerdo con una realizacion.

En particular, la figura 9 ilustra una pluralidad de aparatos 900, 901, 902 para generar uno o mas canales de audio a partir de informacion de audio de entrada que codifica uno o mas objetos de audio, comprendiendo el aparato 900 para generar uno o mas canales de audio un aparato 910 para adaptar informacion de audio de entrada y una instancia de decodificador 920, comprendiendo el aparato 901 para generar uno o mas canales de audio un aparato 911 para adaptar informacion de audio de entrada y una instancia de decodificador 921 y comprendiendo el aparato 902 para generar uno o mas canales de audio un aparato 912 para adaptar informacion de audio de entrada y una instancia de decodificador 922. Cabe senalar que, por ejemplo, el aparato 900 para generar uno o mas canales de audio, que comprende el aparato 910 para adaptar informacion de audio de entrada y la instancia del decodificador 920, no tiene que realizarse como una sola unidad de hardware 900, sino que puede realizarse por dos unidades separadas 910, 920 que se conectan por un alambre o que se conectan de manera inalambrica.

La implementacion disjunta (separada) del aparato para adaptar informacion de audio de entrada puede realizarse con el fin de reducir el tamano de flujo de bits de datos/velocidad de bits correspondiente, vease la figura 9. Esto puede ser relevante, en particular, para dispositivos de aplicacion movil con capacidad de almacenamiento y transmision limitada y sistemas de unidad de control de multipuntos (MCU) con canales de transicion de datos estrechos.

Aunque algunos aspectos se han descrito en el contexto de un aparato, es evidente que estos aspectos tambien representan una descripcion del metodo correspondiente, correspondiendo un bloque o dispositivo a una etapa de metodo o una caractenstica de una etapa de metodo. Analogamente, los aspectos descritos en el contexto de una etapa de metodo tambien representan una descripcion de un bloque o elemento o caractenstica correspondiente de un aparato correspondiente.

La senal descompuesta de la invencion puede almacenarse en un medio de almacenamiento digital o puede transmitirse en un medio de transmision, tal como un medio de transmision inalambrico o un medio de transmision por cable, tal como internet.

5

10

15

20

25

30

35

40

45

50

55

60

Dependiendo de ciertos requisitos de implementacion, las realizaciones de la invencion pueden implementarse en hardware o en software. La implementacion puede realizarse usando un medio de almacenamiento digital, por ejemplo, un disquete, un DVD, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene senales de control legibles electronicamente almacenadas en el mismo, que cooperan (o son capaces de cooperar) con un sistema informatico programable, de tal manera que se realiza el metodo respectivo.

Algunas realizaciones de acuerdo con la invencion comprenden un portador de datos no transitorio que tiene senales de control legibles electronicamente, que son capaces de cooperar con un sistema informatico programable, de tal manera que se realiza uno de los metodos descritos en el presente documento.

En general, las realizaciones de la presente invencion pueden implementarse como un producto de programa informatico con un codigo de programa, siendo el codigo de programa operativo para realizar uno de los metodos, cuando el producto de programa informatico se ejecuta en un ordenador. El codigo del programa puede almacenarse, por ejemplo, en un portador legible por maquina.

Otras realizaciones comprenden el programa informatico para realizar uno de los metodos descritos en el presente documento, almacenado en un portador legible por maquina.

En otras palabras, una realizacion del metodo de la invencion es, por lo tanto, un programa informatico que tiene un codigo de programa para realizar uno de los metodos descritos en el presente documento, cuando el programa informatico se ejecuta en un ordenador.

Una realizacion adicional de los metodos de la invencion es, por lo tanto, un portador de datos (o un medio de almacenamiento digital o un medio legible por ordenador) que comprende, registrado en el mismo, el programa informatico para realizar uno de los metodos descritos en el presente documento.

Una realizacion adicional del metodo de la invencion es, por lo tanto, un flujo de datos o una secuencia de senales que representan el programa informatico para realizar uno de los metodos descritos en el presente documento. El flujo de datos o la secuencia de senales pueden, por ejemplo, configurarse para transferirse a traves de una conexion de comunicacion de datos, por ejemplo, a traves de internet.

Una realizacion adicional comprende un medio de procesamiento, por ejemplo, un ordenador o un dispositivo logico programable, configurado o adaptado para realizar uno de los metodos descritos en el presente documento.

Una realizacion adicional comprende un ordenador que tiene instalado en el mismo el programa informatico para realizar uno de los metodos descritos en el presente documento.

En algunas realizaciones, un dispositivo logico programable (por ejemplo, una disposicion de compuertas programable en el campo) puede usarse para realizar algunas o todas las funcionalidades de los metodos descritos en el presente documento. En algunas realizaciones, una disposicion de compuertas programable en el campo puede cooperar con un microprocesador con el fin de realizar uno de los metodos descritos en el presente documento. En general, los metodos se realizan, preferentemente, por cualquier aparato de hardware.

Las realizaciones descritas anteriormente son meramente ilustrativas de los principios de la presente invencion. Se entiende que las modificaciones y las variaciones de las disposiciones y los detalles descritos en el presente documento seran evidentes para otros expertos en la materia. Es la intencion, por consiguiente, estar limitados solamente por el alcance de las siguientes reivindicaciones de patente y no por los detalles espedficos presentados a modo de descripcion y explicacion de las realizaciones del presente documento.

Referencias

[MPS] ISO/IEC 23003-1:2007, MPEG-D (tecnologfas de audio MPEG), Parte 1: MPEG Surround, 2007.

[BCC] C. Faller y F. Baumgarte, “Binaural Cue Coding - Part II: Schemes and applications”, IEEE Trans. on Speech and Audio Proc., vol. 11, n.° 6, Nov. 2003.

[JSC] C. Faller, “Parametric Joint-Coding of Audio Sources”, 120° Convencion de AES, Pans, 2006.

[SAOC1] J. Herre, S. Disch, J. Hilpert, O. Hellmuth: " From SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio”, 22a conferencia de AES UK Regional, Cambridge, Reino Unido, abril 2007.

[SAOC2] J. Engdegard, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Holzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers y W. Oomen: " Spatial Audio Object Coding (SAOC) - The Upcoming MPEG Standard on

Parametric Object Based Audio Coding”, 124a Convencion de AES, Amsterdam 2008.

[SAOC] ISO/IEC, “MPEG audio technologies - Part 2: Spatial Audio Object Coding (SAOC)”, norma internacional 23003-2 ISO/IEC JTC1/SC29/WG11 (MPEG).

5

[1551] M. Parvaix y L. Girin: “Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding”, IEEE ICASSP, 2010

[1552] M. Parvaix, L. Girin, J.-M. Brossier: “A watermarking-based method for informed source separation of 10 audio signals with a single sensor”, operaciones del IEEE en procesamiento de audio, habla y lenguaje, 2010.

[1553] A. Liutkus, J. Pinel, R. Badeau, L. Girin y G. Richard: “Informed source separation through spectrogram coding and data embedding”, Signal Processing Journal, 2011.

15 [ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: “Informed source separation: source coding meets source separation”, Taller del IEEE en cuanto a aplicaciones de procesamiento de Senal a audio y acustica, 2011.

[1555] Shuhua Zhang y Laurent Girin: “An Informed Source Separation System for Speech Signals”, INTERSPEECH, 2011.

20

[1556] L. Girin y J. Pinel: “Informed Audio Source Separation from Compressed Linear Stereo Mixtures”, AES 42a Conferencia internacional: Semantica de audio, 2011.

Claims

5

10

15

20

25

30

35

40

45

50

REIVINDICACIONES

1. Un aparato para adaptar informacion de audio de entrada, que codifica uno o mas objetos de audio, para obtener informacion de audio adaptada, en el que la informacion de audio de entrada comprende dos o mas canales de mezcla descendente de audio de entrada y comprende, ademas, informacion lateral parametrica de entrada, en el que la informacion de audio adaptada comprende uno o mas canales de mezcla descendente de audio adaptados y comprende, ademas, informacion lateral parametrica adaptada, en el que el aparato comprende:

un modificador de senal de mezcla descendente (110) para adaptar, dependiendo de la informacion de adaptacion, los dos o mas canales de mezcla descendente de audio de entrada para obtener el uno o mas canales de mezcla descendente de audio adaptados, y

un adaptador de informacion lateral parametrica (120) para adaptar, dependiendo de la informacion de adaptacion, la informacion lateral parametrica de entrada para obtener la informacion lateral parametrica adaptada,

en el que la informacion de adaptacion comprende una matriz de adaptacion (DdjjX ),

en el que el modificador de senal de mezcla descendente (110) esta configurado para adaptar, dependiendo de la matriz de adaptacion (D), los dos o mas canales de mezcla descendente de audio de entrada (Xdj. ) para

obtener el uno o mas canales de mezcla descendente de audio adaptados (XdjX ),

en el que el adaptador de informacion lateral parametrica (120) esta configurado para adaptar, dependiendo de la matriz de adaptacion (D), la informacion lateral parametrica de entrada (DdjX ) para obtener la informacion

PSI

lateral parametrica adaptada (Ddnix).
2. Un aparato de acuerdo con la reivindicacion 1,

en el que la informacion lateral parametrica de entrada (DXX) indica una matriz de mezcla descendente inicial, de tal manera que aplicando la matriz de mezcla descendente inicial (DXX) sobre el uno o mas objetos de audio (S), se obtienen los dos o mas canales de mezcla descendente de audio de entrada (XXX), y

en el que el adaptador de informacion lateral parametrica (120) esta configurado para determinar una matriz de

PSI

mezcla descendente adaptada (DdjX) como la informacion lateral parametrica adaptada, de tal manera que

PSI

aplicando la matriz de mezcla descendente adaptada (DdjX ) sobre el uno o mas objetos de audio (S), se obtienen el uno o mas canales de mezcla descendente de audio adaptados (XdjX ).
3. Un aparato de acuerdo con la reivindicacion 1 o 2, en el que el modificador de senal de mezcla descendente (110) esta configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada dependiendo de la informacion de adaptacion, de tal manera que el numero del uno o mas canales de mezcla descendente de audio adaptados es menor que el numero de los dos o mas canales de mezcla descendente de audio de entrada.
4. Un aparato de acuerdo con una de las reivindicaciones 1 a 3, en el que la informacion de adaptacion depende de una instancia de decodificador y en el que el modificador de senal de mezcla descendente (110) esta configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada dependiendo de la instancia de decodificador.
5. Un aparato de acuerdo con la reivindicacion 4,

en el que la instancia de decodificador es capaz de decodificar a lo sumo un numero maximo de canales de mezcla descendente,

en el que la informacion de adaptacion depende de dicho numero maximo de canales de mezcla descendente, y en el que el modificador de senal de mezcla descendente (110) esta configurado para adaptar los dos o mas canales de mezcla descendente de audio de entrada dependiendo de la informacion de adaptacion para obtener el uno o mas canales de mezcla descendente de audio adaptados, de tal manera que el numero del uno o mas canales de mezcla descendente adaptados es igual a dicho numero maximo de canales de mezcla descendente.
6. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el modificador de senal de mezcla descendente (110) esta configurado para adaptar, dependiendo de la matriz de adaptacion DdjX , los dos o mas

5

10

15

20

25

30

35

40

45

50

55

canales de mezcla descendente de audio de entrada X^mX para obtener el uno o mas canales de mezcla descendente de audio adaptados Xaplicando la formula:

-xDSM ^yDSM 'xENC

^dmx ^ dmx ^dmx ■
7. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el adaptador de informacion lateral parametrica (120) esta configurado para adapta^ dependiendo de la matriz de adaptacion D , la informacion

lateral parametrica de entrada Dpara obtener la informacion lateral parametrica adaptada DpjX aplicando la formula:

D

PSI

dmx

D

pSM

dmx

D

enc

dmx
8. Un aparato (700; 800, 801, 802; 900, 901, 902) para generar uno o mas canales de audio a partir de una informacion de audio de entrada que codifica uno o mas objetos de audio, en el que el aparato comprende:

un aparato (710; 810, 811, 812; 910, 911, 912) de acuerdo con una de las reivindicaciones 1 a 6 para adaptar la informacion de audio de entrada para obtener informacion de audio adaptada, en el que la informacion de audio de entrada comprende dos o mas canales de mezcla descendente de audio de entrada y comprende, ademas, informacion lateral parametrica de entrada, en el que la informacion de audio adaptada comprende uno o mas canales de mezcla descendente de audio adaptados y comprende, ademas, informacion lateral parametrica adaptada, y

una instancia de decodificador (720; 820, 821, 822; 920, 921, 922) para decodificar, dependiendo de la informacion lateral parametrica adaptada, el uno o mas canales de mezcla descendente de audio adaptados para obtener el uno o mas canales de audio.
9. Un aparato (700; 800, 801, 802) de acuerdo con la reivindicacion 8,

en el que el adaptador de informacion lateral parametrica (120) del aparato (710; 810, 811, 812) de acuerdo con una de las reivindicaciones 1 a 7 esta configurado para recibir un flujo de bits de entrada que comprende la informacion lateral parametrica de entrada,

en el que el adaptador de informacion lateral parametrica (120) del aparato (710; 810, 811, 812) de acuerdo con una de las reivindicaciones 1 a 7 esta configurado para adaptar la informacion lateral parametrica de entrada para obtener la informacion lateral parametrica adaptada, y para introducir la informacion lateral parametrica adaptada en la instancia de decodificador (720; 820, 821, 822) y

en el que la instancia de decodificador (720; 820, 821, 822) esta configurada para decodificar el uno o mas canales de mezcla descendente de audio adaptados dependiendo de la informacion lateral parametrica adaptada.
10. Un aparato (700; 900, 901, 902) de acuerdo con la reivindicacion 8,

en el que el adaptador de informacion lateral parametrica (120) del aparato (710; 910, 911, 912) de acuerdo con una de las reivindicaciones 1 a 7 esta configurado para recibir un flujo de bits de entrada que comprende la informacion lateral parametrica de entrada,

en el que el adaptador de informacion lateral parametrica (120) del aparato (710; 910, 911, 912) de acuerdo con una de las reivindicaciones 1 a 7 esta configurado para sustituir la informacion lateral parametrica de entrada dentro del flujo de bits de entrada por la informacion lateral parametrica adaptada para obtener un flujo de bits modificado, en el que el adaptador de informacion lateral parametrica (120) del aparato (710; 910, 911, 912) de acuerdo con una de las reivindicaciones 1 a 7 esta configurado para introducir el flujo de bits modificado en la instancia de decodificador (720; 920, 921, 922) y

en el que la instancia de decodificador (720; 920, 921, 922) esta configurada para decodificar el uno o mas canales de mezcla descendente de audio adaptados dependiendo del flujo de bits modificado.
11. Un metodo para adaptar informacion de audio de entrada, que codifica uno o mas objetos de audio, para obtener informacion de audio adaptada, en el que la informacion de audio de entrada comprende dos o mas canales de mezcla descendente de audio de entrada y comprende, ademas, informacion lateral parametrica de entrada, en el que la informacion de audio adaptada comprende uno o mas canales de mezcla descendente de audio adaptados y comprende, ademas, informacion lateral parametrica adaptada, en el que el metodo comprende:

adaptar, dependiendo de la informacion de adaptacion, los dos o mas canales de mezcla descendente de audio

de entrada para obtener el uno o mas canales de mezcla descendente de audio adaptados y

adaptar, dependiendo de la informacion de adaptacion, la informacion lateral parametrica de entrada para

obtener la informacion lateral parametrica adaptada, en e| que |a informaci0n de adaptaci0n comprende una matriz de adaptaci0n (D^ ),

en el que la etapa de adaptar los dos o mas canales de mezcla descendente de audio de entrada comprende adaPtan dependiendo de la matriz de adaptaci0n (D^ ), los dos o mas canales de mezcla descendente de audio

de entrada (Xdj") para obtener el uno o mas canales de mezcla descendente de audio adaptados (X), en el que la etapa de adaptar la informacion lateral parametrica de entrada comprende adaptar, dependiendo de la

matriz de adaptacion (DDdS ), la informacion lateral parametrica de entrada (DEN ) para obtener la informacion

PSI

lateral parametrica adaptada (Ddmx).

10 12. Un metodo de acuerdo con la reivindicacion 11,

en el que la informacion lateral parametrica de entrada (DedjlX) indica una matriz de mezcla descendente inicial, de tal manera que aplicando la matriz de mezcla descendente inicial (Dedjx) sobre el uno o mas objetos de audio (S), se obtienen los dos o mas canales de mezcla descendente de audio de entrada (X‘e’mjlX) y

en el que la etapa de adaptar la informacion lateral parametrica de entrada comprende determinar una matriz de

PSI

15 mezcla descendente adaptada (Ddmx ) como la informacion lateral parametrica adaptad^ de tal manera que

PSI

aplicando la matriz de mezcla descendente adaptada (Ddmx ) sobre el uno o mas objetos de audio (S), se obtienen el uno o mas canales de mezcla descendente de audio adaptados( X).
13. Un programa informatico configurado para implementar el metodo de la reivindicacion 11 o 12 cuando se ejecuta 20 por un ordenador o un procesador de senales.

imagen1

FIGURA 1

imagen2

FIGURA 2

imagen3

FIGURA 3

imagen4

FIGURA 4

imagen5

FIGURA 5

imagen6

FIGURA 6

apnrato para gjeaerar inm o nnis canales die audio

I

1

I I

aparalo para adapter in for- 1 1

I l 1

maridn dp audio ffo enlrada h—700 j

1 1

modiiitador dr sfnal 1 1 1

1

rie mezcia

1

information

deswndente 1 i

rip audio ric j

informaiimi ifo canapes)

Piitrtda

1 audio adapted# inslama de 1 dpatidh

i I

110 descodiQcadut 1 1

1 1 i

adapts dor da in forma- 1 1 1

i 1 i i

lion la fora 1 panufolrira 1 1 \ 1

i i i i

! 120 J 1 1 1

i i j i

C5 I : o L-_. cxi x- J 1 1 1 J

FIGURA 7

imagen7

FIGURA 8

FIGURA9

entrada de aidio

<~3

t:

imagen8

salida ili1 amliu

9U03-0U-S0

Q2VZZLZV3

(jj) in.iiJkr,iiiii!tLti>j jfi sojpuiuud