MX2015001514A - Metodo y descodificador para codificacion de objeto de audio especial de multi-instancias que emplea un concepto parametrico para casos de mezcla descendente/mezcla ascendente de multicanal. - Google Patents

Metodo y descodificador para codificacion de objeto de audio especial de multi-instancias que emplea un concepto parametrico para casos de mezcla descendente/mezcla ascendente de multicanal.

Info

Publication number
MX2015001514A
MX2015001514A MX2015001514A MX2015001514A MX2015001514A MX 2015001514 A MX2015001514 A MX 2015001514A MX 2015001514 A MX2015001514 A MX 2015001514A MX 2015001514 A MX2015001514 A MX 2015001514A MX 2015001514 A MX2015001514 A MX 2015001514A
Authority
MX
Mexico
Prior art keywords
channels
downmix
processing units
channel processing
channel
Prior art date
Application number
MX2015001514A
Other languages
English (en)
Other versions
MX351687B (es
Inventor
Jürgen Herre
Oliver Hellmuth
Thorsten Kastner
Leon Terentiv
Original Assignee
Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V filed Critical Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V
Publication of MX2015001514A publication Critical patent/MX2015001514A/es
Publication of MX351687B publication Critical patent/MX351687B/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Se provee un descodificador para generar una señal de salida de audio que comprende uno o más canales de salida de audio de una señal de mezcla descendente que comprende tres o más canales de mezcla descendente, en donde la señal de mezcla descendente codifica tres o más señales de objeto de audio. El descodificador comprende un ruteador de canal de entrada (110) para recibir los tres o más canales de mezcla descendente y para recibir información lateral y por lo menos dos unidades de procesamiento de canal (121, 122) para generar por lo menos dos canales procesados para obtener el uno o más canales de salida de audio. El ruteador de canal de entrada (110) está configurado para alimentar cada uno de por lo menos dos de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122), de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal recibe uno o más de los tres o más canales de mezcla descendente y de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal (121, 122) recibe menos que el número total de los tres o más canales de mezcla descendente. Cada unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal (121, 122) está configurada para generar uno o más de los por lo menos dos canales procesados dependiendo de la información lateral y dependiendo del uno o más de los por lo menos dos de los tres o más canales de mezcla descendente recibidos por la unidad de procesamiento de canal del ruteador de canal de entrada.

Description

MÉTODO Y DESCODIFICADOR PARA CODIFICACIÓN DE OBJETO DE AUDIO ESPECIAL DE MULTI-INSTANCIAS QUE EMPLEA UN CONCEPTO PARAMÉTRICO PARA CASOS DE MEZCLA DESCENDENTE/MEZCLA ASCENDENTE DE MULTICANAL DESCRIPCIÓN DE LA INVENCIÓN La presente invención es concerniente con un descodificador y método para codificación de objeto de audio espacial de multi-instancias (M-SAOC) que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal.
En los sistemas de audio digital modernos, hay una tendencia principal para permitir modificaciones relacionadas con el objeto de audio del contenido transmitido en el lado del receptor. Estas modificaciones incluyen modificaciones de ganancia de partes seleccionadas de la señal de audio y/o reposicionamiento espacial de objetos de audio dedicados en caso de reproducción de multi-canal vía altavoces distribuidos espacialmente. Esto puede ser obtenido al alimentar individualmente diferentes partes del contenido de audio a los diferentes altavoces.
En otras palabras, en el arte de procesamiento de audio, transmisión de audio y almacenamiento de audio, hay el deseo incrementado de permitir la interacción del usuario en la reproducción del contenido de audio orientada al objeto y también la demanda de utilizar las posibilidades extendidas de reproducción de multicanal para presentar individualmente contenido de audio o partes del mismo con el fin de mejorar la impresión de audición. Mediante esto, el uso del contenido de audio de multi-canal trae mejoras significativas para el usuario. Por ejemplo, se puede obtener una impresión de audición tridimensional, lo que efectúa una satisfacción mejorada del usuario en aplicaciones de entretenimiento. Sin embargo, el contenido de audio de multi-canal es también útil en medios ambientes profesionales, por ejemplo, en aplicaciones de conferencia telefónica, debido a que la inteligibilidad del usuario puede ser mejorada al usar una reproducción de audio de multi-canal. Otra aplicación posible es ofrecer al oyente de una pieza musical para ajustar individualmente el nivel de reproducción y/o posición espacial de diferentes partes (también denominadas como "objetos de audio") o pistas, tales como una parte vocal o diferentes instrumentos. El usuario puede efectuar tal ajuste por razones de gusto personal, para una transcripción más fácil de una o más partes de la pieza musical, propósitos educacionales, karaoke, ensayo, etc.
La transmisión discreta directa de todo el contenido de audio de multi-canal o multi-objeto digital, por ejemplo en forma de datos de modulación de código de impulse (PCM) o aún formatos de audio comprimidos, demanda velocidades de bits muy altas. Sin embargo, también es deseable transmitir y almacenar datos de audio de manera eficiente en velocidad de bits. Por consiguiente, se desea aceptar una solución intermedia razonable entre requerimientos de calidad de audio y velocidad de bits con el fin de evitar una carga de recursos excesiva mediante aplicaciones de multi-canal/multi-objetos.
Recientemente, en el campo de codificación de audio, se han introducido téenicas paramétricas para la transmisión/almacenamiento eficiente en velocidad de bits de señales de audio de multi-canal/multi-objeto mediante, por ejemplo, el grupo de expertos en películas (MPEG) y otros. Un ejemplo es MPEG envolvente (MPS) como un procedimiento orientado al canal [MPS, BCC] o codificación de objeto de audio especial de MPEG (SAOC) como un procedimiento orientado al objeto [JSC, SAOC, SA0C1, SA0C2]. Otro procedimiento orientado al objeto es denominado como "separación de fuente informada" [ISS1, ISS2, ISS3, ISS4, ISS5, ISS6]. Estas técnicas tienen como objetivo reconstruir una escena de audio de salida deseada o un objeto fuente de audio deseada en base a una mezcla descendente de canales/objetos e información lateral adicional que describe la escena de audio transmitida/almacenada y/o los objetos fuente de audio en la escena de audio.
La estimación y la aplicación de información lateral relacionada con el canal/objeto en tales sistemas se hacen de una manera selectiva en tiempo-frecuencia. Por consiguiente, tales sistemas emplean transformadas de tiempo-frecuencia tales como la transformada de Fourier discreta (DFT), la transformada de Fourier de tiempo corto (STFT) o bancos de filtros como bancos de filtros de espejo en cuadratura (QMF), etc. El principio básico de tales sistemas es ilustrado en la figura 2, usando el ejemplo de SAOC de MPEG.
En el caso de STFT, la dimensión temporal es representada por el número de tiempo-bloque y la dimensión espectral es capturada por el número de coeficiente espectral ( "bin"). En el caso de QMF, la dimensión temporal es representada por el número de tiempo-ranura y la dimensión espectral es capturada por el número de sub-banda. Si la resolución espectral de QMF es mejorada por la aplicación subsecuente de una segunda etapa de filtro, todo el banco de filtros es denominado QMF híbrido y las sub-bandas de resolución fina son denominadas sub-bandas híbridas.
Como ya se mencionó anteriormente, en SAOC el procesamiento general se lleva a cabo de manera selectiva en tiempo-frecuencia y puede ser descrita como sigue dentro de cada banda de frecuencia, como se ilustra en la figura 2: - N señales de objeto de audio Si ... sN son mezcladas de manera descendente a P canales ... xP como parte del procesamiento del codificador usando una matriz de mezcla descendente que consiste de los elementos dlr í ... dN P. Además, el codificador extrae información lateral que describe las características de los objetos de audio de entrada (módulo estimador de información lateral (SIE)). Para SAOC de MPEG, las relaciones de las potencias de objeto w.r.t. entre sí son la forma más básica de tal información lateral. la(s) señal(es) de mezcla descendente e información lateral son transmitidas/almacenadas. Para este fin, la(s) señal(es) de audio de mezcla descendente puede(n) ser comprimida(s), por ejemplo, usando codificadores de audio perceptual bien conocidos, tales como MPEG-1/2 capa II o III (aka .mp3), codificación de audio avanzada de MPEG-2/4 (AAC), etc. en el extremo de recepción, el descodificador conceptualmente trata de restaurar las señales de objeto originales ("separación del objeto") de las señales de mezcla descendente (descodificadas) usando la información lateral transmitida. Estas señales de objeto aproximadas ... sN son luego mezcladas a una escena objetivo representada por M canales de salida de audio yi ... yM usando una matriz de presentación descrita por los coeficientes ri7... rNM en la figura 2. La escena objetivo deseada puede ser en el caso extremo, la presentación de solamente una señal fuente de la mezcla (escenario de separación de fuente), pero tambien cualquier otra escena acústica arbitraria que consiste de los objetos transmitidos. Por ejemplo, la salida puede ser de un solo canal, estéreo de 2 canales o escena objetivo de multicanal 5.1.
El incremento en ancho de banda/almacenamiento disponible y mejoras en marcha en el campo de codificación de audio permite al usuario seleccionar de una elección altamente incrementada de producciones de audio de multicanal. Los formatos de audio 5.1 de multicanal ya son estándar en producciones de DVD y Blue-Ray. Los nuevos formatos de audio como audio MPEG-H 3D con aún más canales de transporte de audio aparecen en el horizonte, que proveerán a los usuarios finales una experiencia de audio altamente inmersiva.
Los esquemas de codificación de objeto de audio paramétricos están actualmente restringidos a un máximo de dos canales de mezcla descendente. Pueden solamente ser aplicados a alguna extensión en mezclas de multicanal, por ejemplo en solamente dos canales de mezcla descendente seleccionados. La flexibilidad que estos esquemas de codificación ofrecen al usuario para ajustar la escena de audio a sus propias preferencias es así severamente limitada, por ejemplo, con respecto a cambiar el nivel de audio del comentarista deportivo y la atmósfera en la difusión de deportes.
Además, los esquemas de codificación de objeto de audio actuales ofrecen solamente variabilidad limitada en el proceso de mezcla en el lado del codificador. El proceso de mezcla es limitado a mezcla variable en el tiempo de los objetos de audio y la mezcla variante en frecuencia no es posible.
Por consiguiente, sería altamente apreciado si se proporcionaran conceptos mejorados para codificación de objeto de audio.
El objeto de la presente invención es proveer conceptos mejorados para codificación de objeto de audio. El objeto de la presente invención es resuelto por un descodificador de acuerdo con la reivindicación 1, mediante un método de acuerdo con la reivindicación 16 y mediante un programa de computadora de acuerdo con la reivindicación 17.
Se provee un descodificador para generar una señal de salida de audio que comprende uno o más canales de salida de audio de una señal de mezcla descendente que comprende tres o más canales de mezcla descendente, en donde la señal de mezcla descendente codifica tres o más señales de objeto de audio.
El descodificador comprende un ruteador de canal de entrada para recibir los tres o más canales de mezcla descendente y para recibir información lateral y por lo menos dos unidades de procesamiento de canal para generar por lo menos dos canales procesados para obtener el uno o más canales de salida de audio.
El ruteador de canal de entrada está configurado para alimentar cada uno de por lo menos dos de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal, de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal recibe uno o más de los tres o más canales de mezcla descendente y de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal recibe menos del número total de los tres o más canales de mezcla descendente.
Cada unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal está configurada para generar uno o más de los por lo menos dos canales procesados, dependiendo de la información lateral y dependiendo del uno o más de los por lo menos dos de los tres o más canales de mezcla descendente recibidos por la unidad de procesamiento de canal del ruteador de canal de entrada.
Más flexibilidad en el proceso de mezcla permite un aprovechamiento óptimo de características del objeto de señal. Una mezcla descendente puede ser producida que es optimizada para la separación paramétrica en el lado del descodificador con respecto a la calidad percibida.
Las modalidades se extienden a la parte paramétrica del esquema de SAOC a un número arbitrario de canales de mezcla descendente/mezcla ascendente. El método de la invención permite además la mezcla plenamente flexible de los objetos de audio.
De acuerdo con una modalidad, el ruteador de canal de entrada puede estar configurado para alimentar cada uno de los por lo menos dos de los tres o más canales de mezcla descendente a exactamente una de las por lo menos dos unidades de procesamiento de canal.
En una modalidad, el ruteador de canal de entrada puede estar configurado para alimentar cada uno de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal, de tal manera que cada uno de los tres o más canales de mezcla descendente es recibido por una o más de las por lo menos dos unidades de procesamiento de canal.
De acuerdo con una modalidad, cada una de las por lo menos dos unidades de procesamiento de canal pueden estar configuradas para generar el uno o más de los por lo menos dos canales procesados, independiente de por lo menos uno de tres o más canales de mezcla descendente.
En una modalidad, cada una de las por lo menos dos unidades de procesamiento de canal pueden ser ya sea una unidad de procesamiento mono o una unidad de procesamiento estéreo, en donde tal unidad de procesamiento mono puede estar configurada para recibir exactamente uno de los tres o más canales de mezcla descendente y estar configurada para recibir exactamente uno o exactamente dos de los por lo menos dos canales procesados, dependiendo del exactamente uno de los tres o más canales de mezcla descendente y dependiendo de la información lateral, y en donde la unidad de procesamiento estéreo puede estar configurada para recibir exactamente dos de los tres o más canales de mezcla descendente y estar configurada para generar exactamente uno o exactamente dos de los por lo menos dos canales procesados, dependiendo del exactamente dos de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
Por lo menos una de las por lo menos dos unidades de procesamiento de canal pueden estar configuradas para recibir exactamente uno de los tres o más canales de mezcla descendente y estar configuradas para recibir exactamente dos de los por lo menos dos canales procesados, dependiendo de exactamente uno de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
De acuerdo con una modalidad, por lo menos una de las por lo menos dos unidades de procesamiento de canal pueden estar configuradas para recibir exactamente dos de los tres o más canales de mezcla descendente y estar configuradas para generar exactamente uno de los por lo menos dos canales procesados dependiendo de exactamente dos de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
En una modalidad, el ruteador de canal de entrada puede estar configurado para recibir cuatro o más canales de mezcla descendente y por lo menos una de las por lo menos dos unidades de procesamiento de canal pueden estar configuradas para recibir por lo menos tres de los cuatro o más canales de mezcla descendente y pueden estar configuradas para generar por lo menos tres de los canales procesados, dependiendo de los por lo menos tres de los cuatro o más canales de mezcla descendente y dependiendo de la información lateral.
De acuerdo con una modalidad, por lo menos una de las por lo menos dos unidades de procesamiento de canal pueden estar configuradas para recibir exactamente tres de los cuatro o más canales de mezcla descendente y pueden estar configuradas para generar exactamente tres de los canales procesados dependiendo de los exactamente tres de los cuatro o más canales de mezcla descendente y dependiendo de la información lateral.
En una modalidad, el ruteador de canal de entrada puede estar configurado para recibir seis o más canales de mezcla descendente y en donde por lo menos una de las por lo menos dos unidades de procesamiento de canal pueden estar configuradas para recibir exactamente cinco de los seis o más canales de mezcla descendente y estar configuradas para generar exactamente cinco de los canales procesados dependiendo de los exactamente cinco de los seis o más canales de mezcla descendente y dependiendo de la información lateral.
En una modalidad, el ruteador de canal de entrada está configurado para no alimentar por lo menos uno de los tres o más canales de mezcla descendente a cualquiera de las por lo menos dos unidades de procesamiento de canal, de tal manera que el por lo menos uno de los tres o más canales de mezcla descendente no es recibido por cualquiera de las por lo menos dos unidades de procesamiento de canal.
De acuerdo con una modalidad, el descodificador puede comprender además un ruteador de canal de salida para combinar los por lo menos dos canales procesados para obtener el uno o más canales de salida de audio.
En una modalidad, el descodificador puede comprender además un presentador, en donde el presentador puede estar configurado para recibir información de presentación y en donde el presentador está configurado para generar el uno o más canales de salida de audio dependiendo de los por lo menos dos canales procesados y dependiendo de la información de presentación.
De acuerdo con una modalidad, las por lo menos dos unidades de procesamiento de canal pueden estar configuradas para generar los por lo menos dos canales procesados en paralelo.
De acuerdo con una modalidad, una primera unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal puede estar configurada para alimentar un primer canal procesado de los por lo menos dos canales procesados a una segunda unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal. La segunda unidad de procesamiento de canal puede estar configurada para generar un segundo canal procesado de los por lo menos dos canales procesados, dependiendo del primer canal procesado.
Además, se provee un metodo para generar una señal de salida de audio que comprende uno o más canales de salida de audio de una señal de mezcla descendente que comprende tres o más canales de mezcla descendente. La señal de mezcla descendente codifica tres o más señales de objeto de audio. El método comprende: - recibir los tres o más canales de mezcla descendente y para recibir información lateral por un ruteador de canal de entrada, - alimentar cada uno de por lo menos dos de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal y - generar por lo menos dos canales procesados por al menos dos unidades de procesamiento de canal para obtener el uno o más canales de salida de audio, La alimentación de cada uno de por lo menos dos de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal por el ruteador de canal de entrada se lleva a cabo, de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal recibe uno o más de los tres o más canales de mezcla descendente y de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal recibe menos del número total de los tres o más canales de mezcla descendente.
La generación de los por lo menos dos canales procesados se lleva a cabo al generar uno o más de los por lo menos dos canales procesados por cada unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal, dependiendo de la información lateral y dependiendo del uno o más de los por lo menos dos de los tres o más canales de mezcla descendente recibidos por la unidad de procesamiento de canal del ruteador de canal de entrada.
Además, se provee un programa de computadora para implementar el método descrito anteriormente, cuando es ejecutado en una computadora o procesador de señales.
En lo siguiente, se describen en más detalle modalidades de la presente invención con referencia a las figuras, en las cuales: La figura 1 es un descodificador para generar una señal de salida de audio de acuerdo con una modalidad, La figura 2 es una vista general del sistema de SAOC que ilustra el principio de tales sistemas, utilizando el ejemplo de SAOC de MPEG, La figura 3 muestra una ilustración esquemática que muestra el principio de combinar múltiples instancias de descodificador/transcodificador mono y estéreo de SAOC en paralelo, para descodificar paramétricamente una mezcla de señales de multicanal de acuerdo con una modalidad y La figura 4 muestra un diagrama esquemático que ilustra el principio de una estructura de descodificador/transcodificador mono y estéreo de SAOC en cascada para procesar una mezcla de señales de multicanal de acuerdo con una modalidad.
Antes de describir modalidades de la presente invención, se proveen más antecedentes en cuanto a los sistemas de SAOC del estado de la téenica.
La figura 2 muestra un arreglo general de un codificador de SAOC 10 y un descodificador de SAOC 12. El codificador de SAOC 10 recibe N objetos de entrada, esto es, señales de audio Si a sN. En particular, el codificador 10 comprende un mezclador descendente 16 que recibe las señales de audio Si a sN y mezcla de manera descendente las mismas a una señal de mezcla descendente 18. Alternativamente, la mezcla descendente puede ser provista externamente ("mezcla descendente artística") y el sistema estima la información lateral adicional para hacer que la mezcla descendente provista coincida con la mezcla descendente calculada. En la figura 2, se muestra que la señal de mezcla descendente es una señal de canal P. Así, cualquier configuración de señal de mezcla descendente mono (P = 1), estéreo (P = 2) o de multicanal (P > 2) es concebible.
En el caso de una mezcla descendente estéreo, los canales de la señal de mezcla descendente 18 son denotados LO y R0, en caso de una mezcla descendente mono los mismos son denotados simplemente como LO. Con el fin de permitir que el descodificador de SAOC 12 recupere los objetos individuales Si a sN, el estimador de información lateral 17 provee al descodificador de SAOC 12 con información lateral que incluye parámetros de SAOC. Por ejemplo, en el caso de una mezcla descendente estéreo, los parámetros de SAOC comprenden diferencias a nivel de objeto (OLD), correlaciones de inter objeto (IOC) (parámetros de correlación cruzada de inter objeto), valores de ganancia de mezcla descendente (DMG) y diferencias a nivel de canal de mezcla descendente (DCLD). La información lateral 20, que incluye los parámetros de SAOC, junto con la señal de mezcla descendente 18, forma el flujo de datos de salida de SAOC recibido por el descodificador de SAOC 12.
El descodificador de SAOC 12 comprende un mezclador ascendente que recibe la señal de mezcla descendente 18 también como la información lateral 20 con el fin de recuperar y presentar las señales de audio s2 y sN sobre cualquier conjunto de canales seleccionados por el usuario a yM, con la presentación siendo prescrita por información de presentación 26 introducida al descodificador SAOC 12.
Las señales de audio S1 a SN pueden ser introducidas al codificador 10 en cualquier dominio de codificación, tal como en dominio de tiempo o dominio espectral. En caso de que las señales de audio Si a SN sean alimentadas al codificador 10 en el dominio de tiempo, tal como PCM codificadas, el codificador 10 puede usar un banco de filtros, tal como un banco de QMF híbrido, con el fin de transferir las señales a un dominio espectral, en el cual las señales de audio son representadas en varias sub-bandas asociadas con diferentes porciones espectrales, a una resolución de banco de filtros específica. Si las señales de audio Si a SN ya están en la representación esperada por el codificador 10, el mismo no tiene que efectuar la descomposición espectral.
La figura 1 ilustra un descodificador para generar una señal de salida de audio que comprende uno o más canales de salida de audio de una señal de mezcla descendente que comprende tres o más canales de mezcla descendente de acuerdo con una modalidad. La señal de mezcla descendente codifica tres o más señales de objeto de audio.
El descodificador comprende un ruteador de canal de entrada 110 para recibir los tres o más canales de mezcla descendente DMX1, DMX2, DMX3 y para recibir información lateral SI y por lo menos dos unidades de procesamiento de canal 121, 122 para generar por lo menos dos canales procesados para obtener el uno o más canales de salida de audio.
El ruteador de canal de entrada 110 está configurado para alimentar a cada uno de por lo menos dos de los tres o más canales de mezcla descendente DMX1, DMX2, DMX2 a por lo menos una de las por lo menos dos unidades de procesamiento de canal 121, 122, de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal 121, 122 recibe uno o más de los tres o más canales de mezcla descendente y de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal 121, 122 recibe menos del número total de los tres o más canales de mezcla descendente D X1, DMX2, DMX3.
En particular, en la modalidad de la figura 1, cada uno de los tres canales de mezcla descendente DMX1, DMX2, DMX2 son alimentados a exactamente una unidad de procesamiento de canal. Sin embargo, en otras modalidades, no todos de los tres o más canales de mezcla descendente recibidos por el ruteador de canal de entrada 110 pueden ser alimentados a una unidad de procesamiento. Sin embargo, en cualquier caso, cada uno de por lo menos dos canales de mezcla descendente de los tres o más canales de mezcla descendente será alimentado a por lo menos una de las unidades de procesamiento de canal.
Cada unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal 121, 122 está configurada para generar uno o más de los por lo menos dos canales procesados dependiendo de la información lateral SI y dependiendo del uno o más de los por lo menos dos de los tres o más canales de mezcla descendente (DMX1, DMX2, DMX3) recibidos por la unidad de procesamiento de canal 121, 122, del ruteador de canal de entrada 110.
En el ejemplo de la figura 1, la unidad de procesamiento de canal 121 recibe dos canales de mezcla descendente (DMX1, DMX2) para generar dos canales procesados (PCH1, PCH2). Así, la unidad de procesamiento 121 puede ser considerada como una unidad de procesamiento estéreo a estéreo.
Además, en el ejemplo de la figura 1, la unidad de procesamiento de canal 122 recibe el canal de mezcla descendente DMX3 para generar dos canales procesados (PCH3, PCH4).
En el ejemplo de la figura 1, los canales procesados PCH1, PCH2, PCH3, PCH4 son los canales de salida de audio generados por el descodificador. Sin embargo, en otras modalidades, los canales de salida de audio son generados dependiendo de los canales procesados, por ejemplo al emplear información de presentación.
La generación de los canales procesados a partir de los canales de mezcla descendente se hace al emplear información lateral. La información lateral puede comprender por ejemplo información de mezcla descendente que indica como los objetos de audio han sido mezclados descendentemente para obtener los tres o más canales de mezcla descendente. Además, la información lateral puede también comprender información en cuanto a una matriz de covarianza de tamaño N x N, que puede indicar para N objetos de audio o N señales de objeto de audio, que son codificadas, los parámetros de OLD e IOC de estos N objetos de audio.
Una unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento 121, 122 puede por ejemplo ser una unidad de procesamiento mono a mono, que implementa un modo de procesamiento mono a mono "x-1-1". O una unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento 121, 122 puede por ejemplo estar configurada para implementar un modo de procesamiento mono a estéreo "x-1-2". O una unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento 121, 122 puede por ejemplo ser configurada para implementar un modo de procesamiento estéreo a mono "x-2-1". O una unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento 121, 122 puede ser por ejemplo una unidad de procesamiento estéreo a estéreo que implementa un modo de procesamiento estéreo a estéreo "x-2-2".
El modo de procesamiento mono a mono "x-1-1", el modo de procesamiento mono a estéreo "x-1-2", el modo de procesamiento estéreo a mono "x-2-1" y el modo de procesamiento estéreo a estéreo "s-2-2" son descritos en el estándar SAOC (véase [SAOC]), como modos de descodificación del estándar SAOC.
En particular, véase por ejemplo: ISO/IEC, "Teenologías de audio MPEG - Parte 2: Codificación de objeto de audio especial (SAOC)"; ISO/IEC JTC1/SC29/WG11 (MPEG) Estándar Internacional 23003-2:2010, en particular, véase capítulo "Procesamiento SAOC", más en particular, véase subcapítulo "Modos de descodificación".
En una modalidad, cada una de las por lo menos dos unidades de procesamiento de canal 121, 122 puede ser ya sea una unidad de procesamiento mono o una unidad de procesamiento estéreo, en donde la unidad de procesamiento mono está configurada para recibir exactamente uno de los tres o más canales de mezcla descendente y está configurada para recibir exactamente uno o exactamente dos de los por lo menos dos canales procesados, dependiendo del exactamente uno de los tres o más canales de mezcla descendente y dependiendo de la información lateral y en donde la unidad de procesamiento estéreo está configurada para recibir exactamente dos de los tres o más canales de mezcla descendente y está configurada para generar exactamente uno o exactamente dos de los por lo menos dos canales procesados, dependiendo exactamente de los dos de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
Por lo menos una de las por lo menos dos unidades de procesamiento de canal 121, 122 puede estar configurada para recibir exactamente uno de los tres o más canales de mezcla descendente y está configurada para generar exactamente dos de los por lo menos dos canales procesados, dependiendo exactamente de uno de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
De acuerdo con una modalidad, por lo menos una de las por lo menos dos unidades de procesamiento de canal 121, 122 puede estar configurada para recibir exactamente dos de los tres o más canales de mezcla descendente y está configurada para generar exactamente uno de los por lo menos dos canales procesados, dependiendo de exactamente dos de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
Una unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento 121, 122 puede implementar por ejemplo un modo de procesamiento de mezcla descendente mono ("x-1-5") para generar cinco canales procesados de un canal de mezcla descendente mono. De otra manera, una unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento 121, 122 puede por ejemplo implementar un modo de procesamiento de mezcla descendente estéreo ("x-2-5") para generar cinco canales procesados de dos canales de mezcla descendente.
El modo de procesamiento de mezcla descendente mono ("x-1-5") y el modo de procesamiento de mezcla descendente estéreo ("x-2-5") son descritos en el estándar SAOC (véase [SAOC]), como modos de transcodificación del estándar SAOC.
En particular, véase por ejemplo: ISO/IEC, "Teenologías de audio MPEG - Parte 2: Codificación de objeto de audio especial (SAOC)", ISO/IEC JTC1/SC29/WG11 (MPEG) Estándar internacional 23003-2:2010, en particular, véase capítulo "Procesamiento SAOC", más en particular, véase sub-capítulo "Modos de trans-codificación".
Sin embargo, en algunas modalidades, uno, algunas o todas las unidades de procesamiento de canal 121, 122 pueden ser configuradas diferentemente.
En una modalidad, el ruteador de canal de entrada 110 puede estar configurado para recibir cuatro o más canales de mezcla descendente y por lo menos una de las por lo menos dos unidades de procesamiento de canal 121, 122 puede estar configurada para recibir por lo menos tres de los cuatro o más canales de mezcla descendente y puede estar configurada para generar por lo menos tres de los canales procesados dependiendo de los por lo menos tres de los cuatro o más canales de mezcla descendente y dependiendo de la información lateral.
De acuerdo con una modalidad, por lo menos una de las por lo menos dos unidades de procesamiento de canal 121, 122 puede estar configurada para recibir exactamente tres de los cuatro o más canales de mezcla descendente y puede estar configurada para generar exactamente tres de los canales procesados, dependiendo de los exactamente tres de los cuatro o más canales de mezcla descendente y dependiendo de la información lateral.
En una modalidad, el ruteador de canal de entrada 110 puede estar configurado para recibir seis o más canales de mezcla descendente y en donde por lo menos una de las por lo menos dos unidades de procesamiento de canal 121, 122 puede estar configurada para recibir exactamente cinco de los seis o más canales de mezcla descendente y está configurada para generar exactamente cinco de los canales procesados, dependiendo de los exactamente cinco de los seis o más canales de mezcla descendente y dependiendo de la información lateral.
De acuerdo con una modalidad, el ruteador de canal de entrada puede estar configurado para alimentar a cada uno de los por lo menos dos de los tres o más canales de mezcla descendente a exactamente una de las por lo menos dos unidades de procesamiento de canal 121, 122. Así, ninguno de los canales de mezcla descendente DMX1, DMX2, DMX3 es alimentado a dos o más de las unidades de procesamiento de canal 121, 122, como en el ejemplo de la figura. Sin embargo, en otras modalidades, uno o más de los canales de mezcla descendente pueden ser alimentados a más de una unidad de procesamiento de canal.
En una modalidad, el ruteador de canal de entrada 110 puede estar configurado para alimentar cada uno de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal 121, 122, de tal manera que cada uno de los tres o más canales de mezcla descendente es recibido por una o más de las por lo menos dos unidades de procesamiento de canal 121, 122. Sin embargo, en otras modalidades, el ruteador de canal de entrada 110 está configurado para no alimentar por lo menos no de los tres o más canales de mezcla descendente a cualquiera de las por lo menos dos unidades de procesamiento de canal 121, 122, de tal manera que el por lo menos uno de los tres o más canales de mezcla descendente no es recibido por cualquiera de las por lo menos dos unidades de procesamiento de canal.
De acuerdo con una modalidad, cada una de las por lo menos dos unidades de procesamiento de canal 121, 122 puede estar configurada para generar el uno o más de los por lo menos dos canales procesados independientemente de por lo menos uno de los tres o más canales de mezcla descendente. En otras palabras, ninguna unidad de procesamiento de canal recibe todos los canales de mezcla descendente SMX1, DMX2, DMX3, como se ilustra por la figura 1.
De acuerdo con modalidades, la funcionalidad de procesamiento de mezcla descendente de multicanal puede ser realizada por la aplicación (en cascada y/o en paralelo) de múltiples instancias de descodificador/transcodificador de SAOC (o sus partes).
La figura 3 es una ilustración esquemática que muestra el principio de combinar múltiples instancias de descodificador/transcodificador mono y estereo de SAOC en paralelo para descodificar paramétricamente una mezcla de señal de multicanal de acuerdo con una modalidad.
En particular, en la figura 3, las múltiples instancias de descodificador/transcodificador mono y estéreo de SAOC son impulsadas en paralelo para procesar la mezcla descendente de multicanal.
Por ejemplo, las unidades de procesamiento de canal 121, 122, 123, 124, 125, 126 de la figura 3 pueden estar configuradas para generar los por lo menos dos canales procesados en paralelo. Por ejemplo, las unidades de procesamiento de canal 121, 122, 123, 124, 125, 126 pueden estar configuradas para generar los por lo menos dos canales procesados en paralelo, de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal, de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal empieza a generar uno de los por lo menos dos canales procesados, antes de que cualquier otra unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal termine de generar otro de los por lo menos dos canales procesados.
El ruteador de canal de entrada 110 de la figura 3 enruta los canales de entrada a los varios descodificadores/transcodificadores. Se debe notar que los descodificadores/transcodificadores pueden ser impulsados con cualquier número arbitrario de canales de entrada y no restringidos a señales mono o estéreo solamente, como se ilustra en la figura 3 por claridad visual.
De acuerdo con la modalidad de la figura 3, el descodificador comprende además un ruteador de canal de salida 130 para combinar los por lo menos dos canales procesados para obtener el uno o más canales de salida de audio. Las señales (procesadas) procesadas de las unidades de descodificador/transcodificador son alimentadas al ruteador de canal de salida 130. El ruteador de canal de salida 130 combina los varios flujos de entrada y produce una estimación final de las señales de objeto de audio al presentador 140.
En la modalidad ilustrada por la figura 3, el descodificador comprende además un presentador 140. El presentador 140 está configurado para recibir información de presentación, en donde el presentador está configurado para generar el uno o más canales de audio dependiendo de los por lo menos dos canales procesados y dependiendo de la información de presentación.
Se debe notar que el procesamiento paramétrico solamente necesita ser aplicado a los canales de mezcla descendente de interés. La complejidad computacional puede así ser reducida. Las señales de mezcla descendente pueden ser omitidas completamente del procesamiento si no son necesarias (por ejemplo, los canales envolventes ( "surround") pueden ser omitidos si solamente se manipula la escena frontal). En aquellas modalidades, no todos los tres o más canales de mezcla descendente recibidos por el ruteador de canal de entrada 110 son alimentados a la unidad de procesamiento de canal, sino solamente un subconjunto de estos canales de mezcla descendente recibidos. En cualquier caso, sin embargo, por lo menos dos canales de mezcla descendente de los tres o más canales de mezcla descendente recibidos son provistos a las unidades de procesamiento de canal.
La figura 4 muestra un diagrama esquemático que ilustra el principio de una estructura de descodificador/transcodificador mono y estéreo de SAOC en cascada para procesar una mezcla de señales de multi-canal de acuerdo con una modalidad.
De acuerdo con tal modalidad ilustrada por la figura 4, una primera unidad de procesamiento de canal 121 de las por lo menos dos unidades de procesamiento de canal pueden estar configuradas para alimentar un primer canal procesado PCH11 de los por lo menos dos canales procesados a una segunda unidad de procesamiento de canal 126 de las por lo menos dos unidades de procesamiento de canal. La segunda unidad de procesamiento 126 puede estar configurada para generar un segundo canal procesado PCH22 de los por lo menos dos canales procesados, dependiendo del primer canal procesado PCH11.
La combinación de varios descodificadores/transcodificadores puede ser estática y dada a priori pero también ser adaptada dinámicamente.
Este procedimiento presenta un método de extensión plenamente compatible hacia atrás con SAOC de manejo de sistemas de mezcla descendente de multicanal.
Las modalidades de la invención presentadas pueden ser aplicadas en un número arbitrario de canales de mezcla descendente/mezcla ascendente. Pueden ser combinados con cualesquier formatos de audio actuales y también futuros.
La flexibilidad del método de la invención permite la omisión de los canales sin alterar para reducir la complejidad de cálculo, reducir la carga de flujo de bits/cantidad de datos reducida.
Algunas modalidades son concernientes con un codificador de audio, método o programa de computadora para codificación. Además, algunas modalidades son concernientes con un descodificador de audio, método o programa de computadora para descodificación como se describe anteriormente. Además, algunas modalidades son concernientes con una señal codificada.
Aunque algunos aspectos han sido descritos en el contexto de un aparato, es claro que estos aspectos también representan una descripción del método correspondiente, en donde un bloque o dispositivo corresponde a una etapa de método o un aspecto de una etapa de método. Análogamente, aspectos descritos en el contexto de una etapa de método también representan una descripción de un bloque o ítem o aspecto correspondiente de un aparato correspondiente.
La señal descompuesta de la invención puede ser almacenada en un medio de almacenamiento digital o puede ser transmitida en un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión alámbrico tal como Internet.
Dependiendo de ciertos requerimientos de implementación, modalidades de la invención pueden ser implementadas en elementos físicos o en elementos de programación. La implementación puede ser efectuada usando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un CD, una ROM, una PROM, una EPROM o una EEPROM o una memoria instantánea (FLASH), que tiene señales de control que se pueden leer electrónicamente almacenadas en el mismo que cooperan (o son aptas de cooperar) con un sistema de computadora programable de tal manera que el método respectivo es efectuado.
Algunas modalidades de acuerdo con la invención comprenden un portador de datos no transitorio que tienen señales de control que se pueden leer electrónicamente, que son aptas para cooperar con un sistema de computadora programable, de tal manera que uno de los métodos descritos en la presente es efectuado.
En general, las modalidades de la presente invención pueden ser implementadas como un producto de programa de computadora con códigos de programa, los códigos de programa son operativos para efectuar uno de los métodos, cuando el producto de programa de computadora se ejecuta en una computadora. Los códigos de programa pueden por ejemplo ser almacenados en un portador que se puede leer por la máquina.
Otras modalidades comprenden el programa de computadora para efectuar uno de los métodos descritos en la presente, almacenado en un medio que se puede leer por la máquina.
En otras palabras, una modalidad del método de la invención es por consiguiente un programa de computadora que tiene códigos de programa para efectuar uno de los métodos descritos en la presente, cuando el programa de computadora se ejecuta en una computadora.
Una modalidad adicional de los métodos de la invención es por consiguiente un portador de datos (o medio de almacenamiento digital o medio que se puede leer por computadora) que comprende, grabado en el mismo, el programa de computadora para efectuar uno de los métodos descritos en la presente.
Una modalidad adicional del método de la invención es por consiguiente un flujo de datos o una secuencia de señales que representan el programa de computadora para efectuar uno de los métodos descritos en la presente. El flujo de datos o la secuencia de señales pueden por ejemplo estar configurados para ser transferidos vía una conexión de comunicación de datos, por ejemplo vía Internet.
Una modalidad adicional comprende un medio de procesamiento, por ejemplo una computadora o un dispositivo lógico programable configurado para o apto para efectuar uno de los métodos descritos en la presente.
Una modalidad adicional comprende una computadora que tiene instalado en la misma el programa de computadora para efectuar uno de los métodos descritos en la presente.
En algunas modalidades, se puede usar un dispositivo lógico programable (por ejemplo, una matriz de compuertas programable en el campo) para efectuar algunas o todas las funcionalidades de los métodos descritos en la presente. En algunas modalidades, una matriz de compuertas programable en el campo puede cooperar con un microprocesador con el fin de efectuar uno de los métodos descritos en la presente. En general, los métodos son efectuados preferiblemente por cualquier aparato de elementos físicos.
Las modalidades descritas anteriormente son solamente ilustrativas para los principios de la presente invención. Se entiende que modificaciones y variaciones de los arreglos y los detalles descritos en la presente serán evidentes para otros experimentados en la téenica. Se pretende, por consiguiente, estar limitados solamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a manera de descripción y explicación de las modalidades de la presente.
Referencias [MPS] ISO/IEC 23003-1:2007, MPEG-D (Tecnologías de audio MPEG), Parte 1: MPEG Surround, 2007.
[BCC] C. Faller y F. Baumgarte, "Binaural Cue Coding -Part II: Schemes and applications, " IEEE Trans. on Speech and Audio Proc., vol.11, no.6, Nov.2003.
[JSC] C. Faller, "Parametric Joint-Coding of Audio Sources", 120th AES Convention, París, 2006.
[SAOC1] J. Herre, S. Disch, J. Hilpert, 0. Hellmuth: Frotn SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio", 22nd Regional UK AES Conference, Cambridge, UK, Abril 2007.
[SA0C2] J. Engdegárd, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Hólzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers y W. Oomen: " Spatial Audio Object Coding (SAOC) - The Upcoming MPEG Standard on Parametric Object Based Audio Coding", 124th AES Convention, Amsterdam 2008.
[SAOC] ISO/IEC, "MPEG audio technologies - Part 2: Spatial Audio Object Coding (SAOC)," ISO/IEC JTC1/SC29/WG11 (MPEG) International Standard 23003-2.
[ISS1] M. Parvaix y L. Girin: "Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding", IEEE ICASSP, 2010.
[ISS2] M. Parvaix, L. Girin, J.-M. Brossier: "A watermarking-based method for informed source separation of audio signáis with a single sensor", IEEE Transactions on Audio, Speech and Language Processing, 2010.
[ISS3] A. Liutkus, J. Pinel, R. Badeau, L. Girin y G. Richard: "Informed source separation through spectrogram coding and data embedding", Signal Processing Journal, 2011.
[ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: "Informed source separation: source coding meets source separation", IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2011.
[ISS5] Shuhua Zhang y Laurent Girin: "An Informed Source Separation System for Speech Signáis", INTERSPEECH, 2011.
[ISS6] L. Girin y J. Pinel: "Informed Audio Source Separation from Compressed Linear Stereo Mixtures", AES 42nd International Conference: Semantic Audio, 2011.

Claims (17)

REIVINDICACIONES
1. Un descodificador para generar una señal de salida de audio que comprende uno o más canales de salida de audio de una señal de mezcla descendente que comprende tres o más canales de mezcla descendente, en donde la señal de mezcla descendente codifica tres o más señales de objeto de audio, en donde el descodificador comprende: un ruteador de canal de entrada (110) para recibir los tres o más canales de mezcla descendente y para recibir información lateral y por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) para generar por lo menos dos canales procesados para obtener el uno o más canales de salida de audio, en donde el ruteador de canal de entrada (110) está configurado para alimentar cada uno de por lo menos dos de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126), de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) recibe el uno o más de los tres más canales de mezcla descendente y de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) recibe menos del número total de los tres o más canales de mezcla descendente, en donde cada unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) está configurada para generar uno o más de los por lo menos dos canales procesados dependiendo de la información lateral y dependiendo del uno o más de los por lo menos dos de los tres o más canales de mezcla descendente recibidos por la unidad de procesamiento de canal del ruteador de canal de entrada (110).
2. El descodificador de acuerdo con la reivindicación 1, en donde el ruteador de canal de entrada (110) está configurado para alimentar cada uno de los por lo menos dos de los tres o más canales de mezcla descendente a exactamente una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126).
3. El descodificador de acuerdo con la reivindicación 1 o 2, en donde el ruteador de canal de entrada (110) está configurado para alimentar cada uno de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126), de tal manera que cada uno de los tres o más canales de mezcla descendente es recibido por uno o más de los por lo menos dos unidades de procesamiento de canal.
4. El descodificador de acuerdo con la reivindicación 1 o 2, en donde el ruteador de canal de entrada (110) está configurado para no alimentar por lo menos uno de los tres o más canales de mezcla descendente a cualquiera de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126), de tal manera que tal por lo menos uno de los tres o más canales de mezcla descendente no es recibido por cualquiera de las por lo menos dos unidades de procesamiento de canal.
5. El descodificador de acuerdo con cualquiera de las reivindicaciones precedentes, en donde cada una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) está configurada para generar tal uno o más de los por lo menos dos canales procesados independiente de por lo menos uno de los tres o más canales de mezcla descendente.
6. El descodificador de acuerdo con una de las reivindicaciones precedentes, en donde cada una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) es ya sea una unidad de procesamiento mono o una unidad de procesamiento estéreo, en donde la unidad de procesamiento mono está configurada para recibir exactamente uno de los tres o más canales de mezcla descendente y está configurada para generar exactamente uno o exactamente dos de los por lo menos dos canales procesados, dependiendo de exactamente uno de los tres o más canales de mezcla descendente y dependiendo de la información lateral y en donde la unidad de procesamiento estéreo está configurada para recibir exactamente dos de los tres o más canales de mezcla descendente y está configurada para generar exactamente uno o exactamente dos de los por lo menos dos canales procesados dependiendo de los exactamente dos de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
7. El descodificador de acuerdo con una de las reivindicaciones precedentes, en donde por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) está configurada para recibir exactamente uno de los tres o más canales de mezcla descendente y está configurada para generar exactamente dos de los por lo menos dos canales procesados, dependiendo de exactamente uno de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
8. El descodificador de acuerdo con una de las reivindicaciones precedentes, en donde por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) está configurada para recibir exactamente dos de los tres o más canales de mezcla descendente y está configurada para generar exactamente uno de los por lo menos dos canales procesados, dependiendo de exactamente dos de los tres o más canales de mezcla descendente y dependiendo de la información lateral.
9. El descodificador de acuerdo con cualquiera de las reivindicaciones precedentes, en donde el ruteador de canal de entrada (110) está configurado para recibir cuatro o más canales de mezcla descendente y en donde por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) está configurada para recibir por lo menos tres de los cuatro o más canales de mezcla descendente y está configurada para generar por lo menos tres de los canales procesados, dependiendo de los por lo menos tres de los cuatro o más canales de mezcla descendente y dependiendo de la información lateral.
10. El descodificador de acuerdo con la reivindicación 9, en donde por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) está configurada para recibir exactamente tres de los cuatro o más canales de mezcla descendente y está configurada para generar exactamente tres de los canales procesados, dependiendo de exactamente tres de los cuatro o más canales de mezcla descendente y dependiendo de la información lateral.
11. El descodificador de acuerdo con la reivindicación 9 o 10, en donde el ruteador de canal de entrada (110) está configurado para recibir seis o más canales de mezcla descendente y en donde por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) está configurada para recibir exactamente cinco de los seis o más canales de mezcla descendente y está configurada para generar exactamente cinco de los canales procesados, dependiendo de exactamente cinco de los seis o más canales de mezcla descendente y dependiendo de la información lateral.
12. El descodificador de acuerdo con cualquiera de las reivindicaciones precedentes, en donde el descodificador comprende además un ruteador de canal de salida (130) para combinar los por lo menos dos canales procesados para obtener el uno o más canales de salida de audio.
13. El descodificador de acuerdo con cualquiera de las reivindicaciones precedentes, en donde el descodificador comprende además un presentador (140), en donde el presentador (140) está configurado para recibir información de presentación y en donde el presentador (140) está configurado para generar el uno o más canales de salida de audio, dependiendo de los por lo menos dos canales procesados y dependiendo de la información de presentación.
14. El descodificador de acuerdo con cualquiera de las reivindicaciones precedentes, en donde las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) están configuradas para generar los por lo menos dos canales procesados en paralelo.
15. El descodificador de acuerdo con una de las reivindicaciones precedentes, en donde una primera unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) está configurada para alimentar un primer canal procesado de los por lo menos dos canales procesados a una segunda unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) y en donde la segunda unidad de procesamiento está configurada para generar un segundo canal procesado de los por lo menos dos canales procesados, dependiendo del primer canal procesado.
16. Un método para generar una señal de salida de audio que comprende uno o más canales de salida de audio de una señal de mezcla descendente que comprende tres o más canales de mezcla descendente, en donde la señal de mezcla descendente codifica tres o más señales de objeto de audio, en donde el método comprende: recibir los tres o más canales de mezcla descendente y para recibir información lateral por un ruteador de canal de entrada (110), alimentar cada uno de por lo menos dos de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) y generar por lo menos dos canales procesados por al menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) para obtener el uno o más canales de salida de audio, en donde la alimentación de cada uno de por lo menos dos de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) por el ruteador de canal de entrada (110) se lleva a cabo de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) recibe uno o más de los tres o más canales de mezcla descendente y de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) recibe menos que el número total de los tres o más canales de mezcla descendente, en donde la generación de los por lo menos dos canales procesados se lleva a cabo al generar uno o más de los por lo menos dos canales procesados por cada unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal (121, 122, 123, 124, 125, 126) dependiendo de la información lateral y dependiendo del uno o más de los por lo menos dos de los tres o más canales de mezcla descendente recibidos por la unidad de procesamiento de canal del ruteador de canal de entrada (110).
17. Un programa de computadora para iplementar el método de la reivindicación 16 cuando es ejecutado en una computadora o procesador de señales. RESUMEN DE LA INVENCIÓN Se provee un descodificador para generar una señal de salida de audio que comprende uno o más canales de salida de audio de una señal de mezcla descendente que comprende tres o más canales de mezcla descendente, en donde la señal de mezcla descendente codifica tres o más señales de objeto de audio. El descodificador comprende un ruteador de canal de entrada (110) para recibir los tres o más canales de mezcla descendente y para recibir información lateral y por lo menos dos unidades de procesamiento de canal (121, 122) para generar por lo menos dos canales procesados para obtener el uno o más canales de salida de audio. El ruteador de canal de entrada (110) está configurado para alimentar cada uno de por lo menos dos de los tres o más canales de mezcla descendente a por lo menos una de las por lo menos dos unidades de procesamiento de canal (121, 122), de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal recibe uno o más de los tres o más canales de mezcla descendente y de tal manera que cada una de las por lo menos dos unidades de procesamiento de canal (121, 122) recibe menos que el número total de los tres o más canales de mezcla descendente. Cada unidad de procesamiento de canal de las por lo menos dos unidades de procesamiento de canal (121, 122) está configurada para generar uno o más de los por lo menos dos canales procesados dependiendo de la información lateral y dependiendo del uno o más de los por lo menos dos de los tres o más canales de mezcla descendente recibidos por la unidad de procesamiento de canal del ruteador de canal de entrada.
MX2015001514A 2012-08-03 2013-08-05 Método y descodificador para codificación de objeto de audio especial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal. MX351687B (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261679412P 2012-08-03 2012-08-03
PCT/EP2013/066374 WO2014020181A1 (en) 2012-08-03 2013-08-05 Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases

Publications (2)

Publication Number Publication Date
MX2015001514A true MX2015001514A (es) 2015-07-06
MX351687B MX351687B (es) 2017-10-25

Family

ID=48916076

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2015001514A MX351687B (es) 2012-08-03 2013-08-05 Método y descodificador para codificación de objeto de audio especial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal.

Country Status (12)

Country Link
US (1) US10176812B2 (es)
EP (1) EP2880653B1 (es)
JP (1) JP6141978B2 (es)
KR (1) KR101660004B1 (es)
CN (1) CN104756186B (es)
AU (1) AU2013298462B2 (es)
BR (1) BR112015002367B1 (es)
CA (1) CA2880891C (es)
ES (1) ES2654792T3 (es)
MX (1) MX351687B (es)
RU (1) RU2604337C2 (es)
WO (1) WO2014020181A1 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2654792T3 (es) * 2012-08-03 2018-02-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Procedimiento y decodificador para codificación de objeto de audio espacial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal
EP3668125B1 (en) 2014-03-28 2023-04-26 Samsung Electronics Co., Ltd. Method and apparatus for rendering acoustic signal
CN107211227B (zh) 2015-02-06 2020-07-07 杜比实验室特许公司 用于自适应音频的混合型基于优先度的渲染系统和方法
US9854375B2 (en) * 2015-12-01 2017-12-26 Qualcomm Incorporated Selection of coded next generation audio data for transport
JP7093841B2 (ja) 2018-04-11 2022-06-30 ドルビー・インターナショナル・アーベー 6dofオーディオ・レンダリングのための方法、装置およびシステムならびに6dofオーディオ・レンダリングのためのデータ表現およびビットストリーム構造
CN110808054B (zh) * 2019-11-04 2022-05-06 思必驰科技股份有限公司 多路音频的压缩与解压缩方法及系统
GB202002900D0 (en) * 2020-02-28 2020-04-15 Nokia Technologies Oy Audio repersentation and associated rendering

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2208297T3 (es) * 1999-04-07 2004-06-16 Dolby Laboratories Licensing Corporation Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal.
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
CN101371298A (zh) * 2006-01-19 2009-02-18 Lg电子株式会社 用于解码信号的方法和装置
KR20090013178A (ko) * 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
WO2008069596A1 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
RU2417549C2 (ru) * 2006-12-07 2011-04-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки аудиосигнала
CN101542596B (zh) * 2007-02-14 2016-05-18 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
BRPI0809760B1 (pt) * 2007-04-26 2020-12-01 Dolby International Ab aparelho e método para sintetizar um sinal de saída
BRPI0820488A2 (pt) * 2007-11-21 2017-05-23 Lg Electronics Inc método e equipamento para processar um sinal
EP2250821A1 (en) * 2008-03-03 2010-11-17 Nokia Corporation Apparatus for capturing and rendering a plurality of audio channels
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2010090019A1 (ja) * 2009-02-04 2010-08-12 パナソニック株式会社 結合装置、遠隔通信システム及び結合方法
US8112168B2 (en) 2009-07-29 2012-02-07 Texas Instruments Incorporated Process and method for a decoupled multi-parameter run-to-run controller
KR101615262B1 (ko) * 2009-08-12 2016-04-26 삼성전자주식회사 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
EP2609589B1 (en) * 2010-09-28 2016-05-04 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
BR112014017457A8 (pt) * 2012-01-19 2017-07-04 Koninklijke Philips Nv aparelho de transmissão de áudio espacial; aparelho de codificação de áudio espacial; método de geração de sinais de saída de áudio espacial; e método de codificação de áudio espacial
EP2863657B1 (en) * 2012-07-31 2019-09-18 Intellectual Discovery Co., Ltd. Method and device for processing audio signal
ES2654792T3 (es) * 2012-08-03 2018-02-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Procedimiento y decodificador para codificación de objeto de audio espacial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal
MY176406A (en) * 2012-08-10 2020-08-06 Fraunhofer Ges Forschung Encoder, decoder, system and method employing a residual concept for parametric audio object coding
EP2830046A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal to obtain modified output signals

Also Published As

Publication number Publication date
AU2013298462A1 (en) 2015-02-19
WO2014020181A1 (en) 2014-02-06
AU2013298462B2 (en) 2016-10-20
RU2015107245A (ru) 2016-09-27
CN104756186A (zh) 2015-07-01
CN104756186B (zh) 2018-01-02
US20150149187A1 (en) 2015-05-28
MX351687B (es) 2017-10-25
BR112015002367A2 (pt) 2018-09-11
KR20150040997A (ko) 2015-04-15
ES2654792T3 (es) 2018-02-15
JP2015527611A (ja) 2015-09-17
EP2880653B1 (en) 2017-11-01
US10176812B2 (en) 2019-01-08
BR112015002367B1 (pt) 2021-12-14
EP2880653A1 (en) 2015-06-10
CA2880891C (en) 2017-10-17
JP6141978B2 (ja) 2017-06-07
CA2880891A1 (en) 2014-02-06
RU2604337C2 (ru) 2016-12-10
KR101660004B1 (ko) 2016-09-27

Similar Documents

Publication Publication Date Title
KR101785187B1 (ko) 객체 특정 시간/주파수 분해능들을 이용한 혼합 신호로부터의 오디오 객체 분리
US10176812B2 (en) Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases
JP6133422B2 (ja) マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法
US10497375B2 (en) Apparatus and methods for adapting audio information in spatial audio object coding

Legal Events

Date Code Title Description
FG Grant or registration