ES2327158T3 - Codificacion y decodificacion de audio. - Google Patents

Codificacion y decodificacion de audio. Download PDF

Info

Publication number
ES2327158T3
ES2327158T3 ES06766049T ES06766049T ES2327158T3 ES 2327158 T3 ES2327158 T3 ES 2327158T3 ES 06766049 T ES06766049 T ES 06766049T ES 06766049 T ES06766049 T ES 06766049T ES 2327158 T3 ES2327158 T3 ES 2327158T3
Authority
ES
Spain
Prior art keywords
data
decoder
hierarchical
channel
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06766049T
Other languages
English (en)
Inventor
Erik G. P. Schuijers
Gerard H. Hotho
Heiko Purnhagen
Wolfgang A. Schildbach
Holger Hoerich
Hans M. Kjoerling
Karl J. Roden
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby Sweden AB
Original Assignee
Koninklijke Philips Electronics NV
Dolby Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV, Dolby Sweden AB filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2327158T3 publication Critical patent/ES2327158T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Amplifiers (AREA)

Abstract

Aparato para generar un número de canales de salida de audio; comprendiendo el aparato: medios para recibir (401) un flujo de datos que comprende un número de canales de entrada de audio, siendo el número uno o mayor que uno, y datos paramétricos de audio que describen propiedades espaciales; comprendiendo además el flujo de datos datos de estructura de árbol de decodificador para una estructura de decodificador jerárquica, comprendiendo los datos de estructura de árbol de decodificador al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica; medios para generar (405) la estructura de decodificador jerárquica en respuesta a los datos de estructura de árbol de decodificador; y medios para generar (403) el número de canales de salida de audio a partir del flujo de datos utilizando la estructura de decodificador jerárquica.

Description

Codificación y decodificación de audio.
La invención se refiere a los procesos de codificación y/o decodificación de audio que utilizan estructuras jerárquicas de codificación y/o estructuras jerárquicas de decodificador.
En el campo del procesamiento de audio, es bien conocida la conversión de un número de canales de audio en otro número más grande de canales de audio. Esta conversión puede realizarse por diferentes razones. Por ejemplo, una señal de audio puede convertirse en otro formato para proporcionar una experiencia mejorada de usuario. Por ejemplo, las grabaciones tradicionales de estéreo sólo comprenden dos canales mientras que los sistemas avanzados modernos de audio normalmente utilizan cinco o seis canales, como los populares sistemas de sonido envolvente 5.1. En consecuencia, los dos canales de estéreo pueden convertirse en cinco o seis canales con el fin de aprovechar completamente los sistemas avanzados de audio.
Otra razón para la conversión de un canal es la eficiencia de la codificación. Se ha encontrado que por ejemplo, las señales de audio de estéreo pueden codificarse como señales de audio de canal único combinadas con un flujo de bits de parámetro que describen las propiedades espaciales de la señal de audio. El decodificador puede reproducir las señales de audio de estéreo con un grado muy satisfactorio de exactitud. De este modo, pueden obtenerse ahorros sustanciales de la tasa de transmisión de bits.
Existen varios parámetros que pueden utilizarse para describir las propiedades espaciales de las señales de audio. Uno de estos parámetros es la correlación cruzada entre canales, tal como la correlación cruzada entre el canal izquierdo y el canal derecho para las señales de estéreo. Otro parámetro es la proporción de potencia de los canales. En los denominados codificadores (paramétricos) de audio espacial, estos y otros parámetros se extraen de la señal original de audio para producir una señal de audio que tiene un número reducido de canales, por ejemplo, sólo un canal único, más un conjunto de parámetros que describen las propiedades espaciales de la señal original de audio. En los denominados decodificadores (paramétricos) de audio espacial, es reconstruida la señal original de audio.
La codificación de audio espacial es una técnica recientemente introducida que codifica de manera eficaz el material de audio de múltiples canales. En la codificación de audio espacial, una señal de audio de M canales se describe como una señal de audio de N canales más un conjunto de parámetros espaciales correspondientes, en la que N es normalmente más pequeño que M. Por lo tanto, la señal de M canales del codificador de audio espacial se mezcla de forma descendente en una señal de N canales y los parámetros espaciales se extraen. En el decodificador, la señal de N canales y los parámetros espaciales se emplean para reconstruir (de manera perceptible) la señal de M canales.
Preferiblemente, esta codificación de audio espacial, según se conoce por ejemplo a partir de Herre et al: "The reference model architecture for MPEG spatial audio coding", Audio Engineering Society Convention Paper, 28 de mayo de 2005, páginas 1 a 13, emplea una estructura jerárquica en cascada o basada en árbol que comprende unidades convencionales en el codificador y el decodificador. En el codificador, estas unidades convencionales pueden ser mezcladores descendentes que combinan canales en un número más bajo de canales, tales como los mezcladores descendentes de 2-a-1, 3-a-1, 3-a-2, etc., mientras en las correspondientes unidades convencionales del decodificador pueden estar los canales divisores mezcladores ascendentes en un número más alto de canales tales como los mezcladores ascendentes de 1-a-2, 2-a-3.
No obstante, un problema con un enfoque de este tipo es que la estructura del decodificador debe coincidir con la estructura del codificador. Aunque esto puede conseguirse mediante el uso de una estructura normalizada de codificador y
decodificador, un enfoque de este tipo carece de flexibilidad y tenderá a originar un rendimiento por debajo del óptimo.
Por lo tanto, sería ventajoso un sistema mejorado y, en particular, un sistema que permita el incremento en la flexibilidad, la reducción en la complejidad y/o la mejora del rendimiento.
En consecuencia, la invención busca preferiblemente mitigar, aliviar o eliminar una o más de las desventajas mencionadas con anterioridad, solas o en combinación.
Según un primer aspecto de la invención, se proporciona un aparato según la reivindicación 1.
La invención puede permitir una generación flexible de canales de audio y puede permitir en particular una funcionalidad del decodificador para adaptarse a una estructura de codificador utilizada para la generación del flujo de datos. La invención puede permitir, por ejemplo, a un codificador seleccionar un enfoque adecuado de codificación para una señal de múltiples canales a la vez que permite que el aparato se adapte de manera automática a la misma. La invención puede permitir un flujo de datos que tiene una calidad mejorada de la proporción de tasa de transmisión de bits. En particular, la invención puede permitir la adaptación automática y/o un alto grado de flexibilidad a la vez que proporciona la calidad mejorada de audio que puede conseguirse a partir de las estructuras jerárquicas de codificación/decodificación. Además, la invención puede permitir una comunicación eficaz de la información de la estructura de decodificador jerárquica. De manera específica, la invención puede permitir una baja sobrecarga para los datos de estructura de árbol de decodificador. La invención puede proporcionar un aparato que se adapte de manera automática al flujo recibido de bits y que pueda utilizarse con cualquier estructura jerárquica conveniente de codificación.
Cada canal de audio puede soportar una señal individual de audio. El flujo de datos puede ser un único flujo de bits o por ejemplo, puede ser una combinación de una pluralidad de un subflujos de bits distribuidos, por ejemplo, a través de diferentes canales de distribución. El flujo de datos puede tener una duración limitada tal como una duración fija que corresponda con un archivo de datos de un tamaño dado. La característica de división de canal puede ser una característica indicativa de en cuántos canales se divide un canal de audio dado en una capa jerárquica. Por ejemplo, la característica de división de canal puede reflejar si un canal dado de audio no se divide o si se divide en dos canales de audio.
Los datos de estructura de árbol de decodificador pueden comprender datos para la estructura de decodificador jerárquica de una pluralidad de canales de audio. De manera específica, los datos de estructura de árbol de decodificador pueden comprender un conjunto de datos para cada uno del número de canales de entrada de audio. Por ejemplo, los datos de estructura de árbol de decodificador pueden comprender datos para una estructura de árbol de decodificador para cada señal de entrada.
Según una característica opcional de la invención, los datos de estructura de árbol de decodificador comprenden una pluralidad de valores de datos, siendo cada valor de datos indicativo de una característica de división de canal para un canal en una capa jerárquica de la estructura de decodificador jerárquica.
Esto puede proporcionar una comunicación eficaz de los datos que permite que el aparato se adapte a la codificación utilizada para el flujo de datos. Los datos de estructura de árbol de decodificador pueden comprender, de manera específica, un valor de datos para cada función de división de canal en la estructura de decodificador jerárquica. Los datos de estructura de árbol de decodificador también pueden comprender un valor de datos para cada canal de salida que indica que no se producirán divisiones adicionales de canal para una señal de capa jerárquica dada.
Según una característica opcional de la invención, un valor predeterminado de datos es indicativo de la falta de división de canal para el canal en la capa jerárquica.
Esto puede proporcionar una comunicación eficaz de los datos que permite que el aparato se adapte, de forma efectiva y fiable, a la codificación utilizada para el flujo de datos.
Según una característica opcional de la invención, un valor predeterminado de datos es indicativo de una división de uno-a-dos canales para el canal en la capa jerárquica.
Esto puede proporcionar una comunicación eficaz de los datos que permite que el aparato se adapte, de forma efectiva y fiable, a la codificación utilizada para el flujo de datos. En particular, esto puede permitir una transferencia muy eficaz de la información para muchos sistemas jerárquicos que utilizan funciones de división de canal convencionales de baja complejidad.
Según una característica opcional de la invención, la pluralidad de valores de datos son valores de datos binarios.
Esto puede proporcionar una comunicación eficaz de los datos que permite que el aparato se adapte, de forma efectiva y fiable, a la codificación utilizada para el flujo de datos. En particular, esto puede permitir una transferencia muy eficaz de la información para sistemas que utilizan principalmente una funcionalidad de división de canal específica, tal como la funcionalidad de división de uno-a-dos canales.
Según una característica opcional de la invención, un valor de datos binarios predeterminado es indicativo de una división de uno-a-dos canales y otro valor de datos binarios predeterminado es indicativo de una falta de división de canal.
Esto puede proporcionar una comunicación eficaz de los datos que permite que el aparato se adapte, de forma efectiva y fiable, a la codificación utilizada para el flujo de datos. En particular, esto puede permitir una transferencia muy eficaz de la información para muchos sistemas basados en torno a una funcionalidad de división de uno-a-dos canales de baja complejidad. Una decodificación eficaz puede conseguirse a través de una estructura de decodificador jerárquica de baja complejidad que puede generarse en respuesta a datos de baja complejidad. La característica puede permitir una baja sobrecarga para la comunicación de datos de estructura de árbol de decodificador y puede ser particularmente adecuada para los flujos de datos codificados a través de una simple función de codificación.
Según una característica opcional de la invención, el flujo de datos comprende además una indicación del número de canales de entrada.
Esto puede facilitar la decodificación y la generación de la estructura de decodificación y/o codificación más eficaz de la información de la estructura de decodificador jerárquica en los datos de estructura de árbol de decodificador. En particular, los medios para generar la estructura de decodificador jerárquica pueden hacer esto en respuesta a la indicación del número de canales de entrada. Por ejemplo, en muchas situaciones prácticas, el número de canales de entrada puede deducirse a partir del flujo de datos, no obstante, en algunos casos especiales los datos de audio y los datos de los parámetros pueden separarse. En estos casos, puede ser beneficioso si el número de canales de entrada fuera conocido puesto que los datos del flujo de datos pueden haberse manipulado (por ejemplo, de mezclado descendente a partir de estéreo a mono).
Según una característica opcional de la invención, el flujo de datos comprende además una indicación del número de canales de salida.
Esto puede facilitar la decodificación y la generación de la estructura de decodificación y/o puede permitir una codificación más eficaz de la información de la estructura de decodificador jerárquica en los datos de estructura de árbol de decodificador. En particular, los medios para generar la estructura de decodificador jerárquica pueden hacerlo de este modo en respuesta a la indicación del número de canales de salida. Asimismo, la indicación puede utilizarse como una comprobación de errores de los datos de estructura de árbol de decodificador.
Según una característica opcional de la invención, el flujo de datos comprende una indicación de un número de funciones de división de uno-a-dos canales en la estructura de decodificador jerárquica.
Esto puede facilitar la decodificación y la generación de la estructura de decodificación y/o puede permitir una codificación más eficaz de información de la estructura de decodificador jerárquica en los datos de estructura de árbol de decodificador. En particular, los medios para generar la estructura de decodificador jerárquica pueden hacer esto en respuesta a la indicación del número de funciones de división de uno-a-dos canales en la estructura de decodificador jerárquica.
Según una característica opcional de la invención, el flujo de datos comprende además una indicación del número de funciones de división de de dos-a-tres canales en la estructura de decodificador jerárquica.
Esto puede facilitar la decodificación y la generación de la estructura de decodificación y/o puede permitir una codificación más eficaz de información de la estructura de decodificador jerárquica en los datos de estructura de árbol de decodificador. En particular, los medios para generar la estructura de decodificador jerárquica pueden hacer esto en respuesta la indicación del número de funciones de división de dos-a-tres canales en la estructura de decodificador jerárquica.
Según una característica opcional de la invención, los datos de estructura de árbol de decodificador comprenden unos datos para una pluralidad de estructuras de árbol de decodificador ordenadas en respuesta a la presencia de una de una funcionalidad de división de dos-a-tres canales.
Esto puede facilitar la decodificación y la generación de la estructura de decodificación y/o puede permitir una codificación más eficaz de información de la estructura de decodificador jerárquica en los datos de estructura de árbol de decodificador. En particular, la característica puede permitir un rendimiento ventajoso en sistemas en los que las divisiones de dos-a-tres canales sólo pueden producirse en la capa raíz. Por ejemplo, los medios para generar la estructura de decodificador jerárquica pueden en primer lugar generar la funcionalidad de división de dos-a-tres canales para los dos canales de entrada seguida por la creación de la estructura restante utilizando sólo la funcionalidad de división de uno-a-dos canales. La estructura restante puede generarse, de manera específica, en respuesta a los datos binarios de la estructura de árbol de decodificador, por lo tanto, se reduce la tasa de transmisión requerida de bits. El flujo de datos además puede contener información del ordenamiento de la pluralidad de estructuras de árbol de decodificador.
Según una característica opcional de la invención, los datos de estructura de árbol de decodificador para al menos un canal de entrada comprenden una indicación de una función de división de dos-a-tres canales que está presente en la capa raíz seguida por datos binarios, en el que cada valor de los datos binarios es indicativo de que o bien no existe funcionalidad de división o bien existe una funcionalidad de división de uno-a-dos canales para las capas dependientes de la funcionalidad de división de dos-a-tres canales.
Esto puede facilitar la decodificación y la generación de la estructura de decodificación y/o puede permitir una codificación más eficaz de información de la estructura de decodificador jerárquica en los datos de estructura de árbol de decodificador. En particular, la característica puede permitir un rendimiento ventajoso en sistemas en los que las divisiones de dos-a-tres canales sólo pueden producirse en la capa raíz. Por ejemplo, los medios para generar la estructura de decodificador jerárquica pueden en primer lugar generar la funcionalidad de división de dos-a-tres canales para un canal de entrada, seguida por la generación de la estructura restante, utilizando sólo la funcionalidad de división de uno-a-dos canales. La estructura restante puede generarse, de manera específica, en respuesta a los datos binarios de la estructura de árbol de decodificador, por lo tanto, se reduce la tasa de transmisión requerida de bits.
Según una característica opcional de la invención, el flujo de datos comprende una indicación de la posición del altavoz para al menos uno de los canales de salida.
Esto puede permitir una decodificación facilitada y puede permitir un rendimiento y/o adaptación mejorada del aparato, por lo tanto, se proporciona un incremento en la flexibilidad.
Según una característica opcional de la invención, los medios para generar la estructura de decodificador jerárquica se disponen para determinar parámetros de multiplicación para las funciones de división de canal de las capas jerárquicas en respuesta a los datos de estructura de árbol de decodificador.
\newpage
Esto puede permitir un rendimiento mejorado y/o una adaptación/flexibilidad mejorada. En particular, la característica puede permitir no sólo la estructura de decodificador jerárquica sino también la operación de las funciones de división de canal para adaptar el flujo recibido de datos. Los parámetros de multiplicación pueden ser parámetros de multiplicación matricial.
Según una característica opcional de la invención, la estructura de árbol de decodificador comprende al menos una funcionalidad de división de canal en al menos una capa jerárquica, comprendiendo la al menos una funcionalidad de división de un canal: medios de decorrelación para generar una señal decorrelacionada directamente a partir de un canal de entrada de audio del flujo de datos; al menos una unidad de división de canal que genera una pluralidad de canales de salida de capa jerárquica de un canal de audio a partir de una capa jerárquica y la señal decorrelacionada; y medios para determinar al menos una característica del filtro de decorrelación o la unidad de división de canal en respuesta a los datos de estructura de árbol de decodificador.
Esto puede permitir un rendimiento mejorado y/o la adaptación/flexibilidad mejorada. En particular, la característica puede permitir una estructura de decodificador jerárquica que tiene un rendimiento mejorado de decodificación y que pueda generar canales de salida que tienen un aumento en la calidad del audio. En particular, una estructura de decodificador jerárquica en la que no existen señales de decorrelación son generadas por los filtros de decorrelación en cascada pueden conseguirse y adaptarse, dinámica y automáticamente, al flujo recibido de datos.
El filtro de decorrelación recibe el canal de entrada de audio del flujo de datos sin modificaciones, y de manera específica, sin ningún filtrado anterior de la señal (tal como mediante otro filtro de decorrelación). La ganancia del filtro de decorrelación puede determinarse, de manera específica, en respuesta a los datos de estructura de árbol de decodificador.
Según una característica opcional de la invención, los medios de decorrelación comprenden unos medios de compensación de nivel que realizan la compensación del nivel de audio en el canal de entrada de audio para generar una señal de audio compensada en nivel; y un filtro de decorrelación para filtrar la señal de audio compensada en nivel para generar la señal decorrelacionada.
Esto puede permitir una calidad mejorada y/o una implementación facilitada.
Según una característica opcional de la invención, los medios de compensación de nivel comprenden una multiplicación matricial por una matriz previa. Esto puede permitir una implementación eficaz.
Según una característica opcional de la invención, los coeficientes de la matriz previa tienen al menos un valor unidad para una estructura de decodificador jerárquica que comprende sólo una funcionalidad de división de uno-a-dos canales.
Esto puede reducir la complejidad y permitir una implementación eficaz. La estructura de decodificador jerárquica puede comprender otra funcionalidad diferente de la funcionalidad de división de uno-a-dos canales aunque según esta característica no comprenderá ninguna otra funcionalidad de división de canal.
Según una característica opcional de la invención, el aparato comprende además medios para determinar la matriz previa para la al menos una funcionalidad de división de un canal en la al menos una capa jerárquica en respuesta a parámetros de una funcionalidad de división de canal en una capa jerárquica más alta.
Esto puede permitir una implementación eficaz y/o un rendimiento mejorado. La funcionalidad de división de canal en una capa jerárquica más alta puede incluir una funcionalidad de división de dos-a-tres canales, por ejemplo, dispuesta en la capa raíz de la estructura de árbol de decodificador.
Según una característica opcional de la invención, el aparato comprende medios para determinar la matriz de división de canal para la al menos una funcionalidad de división de canal en respuesta a parámetros por lo menos a la funcionalidad de división de canal en la al menos una capa jerárquica.
Esto puede permitir una implementación eficaz y/o rendimiento mejorado. Esto puede ser particularmente ventajoso para las estructuras jerárquicas de árbol de decodificador que comprenden sólo la funcionalidad de división de uno-a-dos canales.
Según una característica opcional de la invención, el aparato comprende además medios para determinar la matriz previa para la al menos una funcionalidad de división de canal en la al menos una capa jerárquica en respuesta a parámetros de un mezclador ascendente de dos-a-tres de una capa jerárquica más alta.
Esto puede permitir una implementación eficaz y/o un rendimiento mejorado. Esto puede ser particularmente ventajoso para las estructuras jerárquicas de árbol de decodificador que comprenden una funcionalidad de división de dos-a-tres canales en la capa raíz de una estructura de árbol de decodificador.
Según una característica opcional de la invención, los medios para determinar la matriz previa se disponen para determinar la matriz previa para la al menos una funcionalidad de división de canal en respuesta a la determinación de una primera sub-matriz previa que corresponde a una primera entrada del mezclador ascendente de dos-a-tres y una segunda sub-matriz previa que corresponde a una segunda entrada del mezclador ascendente de dos-a-tres.
Esto puede permitir una implementación eficaz y/o rendimiento mejorado. Esto puede ser particularmente ventajoso para las estructuras jerárquicas de árbol de decodificador que comprenden una funcionalidad de división de dos-a-tres canales en la capa raíz de la estructura de árbol de decodificador.
Esto puede permitir una implementación eficaz y/o rendimiento mejorado. Esto puede ser particularmente ventajoso para las estructuras jerárquicas de árbol de decodificador que comprenden una funcionalidad de división de dos-a-tres canales en la capa raíz de la estructura de árbol de decodificador.
Según otro aspecto de la invención, se proporciona un aparato según la reivindicación 23.
Según otro aspecto de la invención, se proporciona un flujo de datos según la reivindicación 24.
Según otro aspecto de la invención, se proporciona un medio de almacenamiento que tiene guardado en el mismo una señal según se describió con anterioridad.
Según otro aspecto de la invención, se proporciona un método según la reivindicación 26.
Según otro aspecto de la invención, se proporciona un método según la reivindicación 27.
Según otro aspecto de la invención, se proporciona un receptor según la reivindicación 28.
Según otro aspecto de la invención, se proporciona un transmisor según la reivindicación 29.
Según otro aspecto de la invención, se proporciona un sistema de transmisión según la reivindicación 30.
Según otro aspecto de la invención, se proporciona un método según la reivindicación 31
Según otro aspecto de la invención, se proporciona un método según la reivindicación 32.
Según otro aspecto de la invención, se proporciona un método según la reivindicación 33.
Según otro aspecto de la invención, se proporcionan un producto de programa informático, un dispositivo de reproducción de audio y un dispositivo de grabación de audio según se definen en las reivindicaciones 24, 35 y 36, respectivamente.
Estos y otros aspectos, características y ventajas de la invención serán evidentes y se aclararán con referencia a la(s)
realización(es) descrita(s) a continuación en el presente documento.
Las realizaciones de la invención se describirán, sólo a modo de ejemplo, con referencia a las figuras, en las que:
\vskip1.000000\baselineskip
la figura 1 ilustra un sistema de transmisión para la comunicación de una señal de audio según algunas realizaciones de la invención;
la figura 2 ilustra un ejemplo de una estructura de codificador jerárquica que puede emplearse en algunas realizaciones de la invención;
la figura 3 ilustra un ejemplo de un codificador según algunas realizaciones de la invención;
la figura 4 ilustra un ejemplo de un decodificador según algunas realizaciones de la invención;
la figura 5 ilustra un ejemplo de algunas estructuras jerárquicas de decodificador que pueden emplearse en algunas realizaciones de la invención;
la figura 6 ilustra las estructuras jerárquicas de decodificador de ejemplo que tienen mezcladores ascendentes de dos-a-tres en la raíz;
la figura 7 ilustra un ejemplo de la estructura de decodificador jerárquica que comprende una pluralidad de estructuras de árbol de decodificador;
la figura 8 ilustra un ejemplo de un mezclador ascendente de uno-a-dos;
la figura 9 ilustra un ejemplo de algunas estructuras jerárquicas de decodificador que pueden emplearse en algunas realizaciones de la invención;
la figura 10 ilustra un ejemplo de algunas estructuras jerárquicas de decodificador que pueden emplearse en algunas realizaciones de la invención;
la figura 11 ilustra un diagrama de flujo de ejemplo para un método de decodificación según algunas realizaciones de la invención;
la figura 12 ilustra un ejemplo de una estructura matricial de decodificador según algunas realizaciones de la invención;
la figura 13 ilustra un ejemplo de una estructura de decodificador jerárquica que puede emplearse en algunas realizaciones de la invención;
la figura 14 ilustra un ejemplo de una estructura de decodificador jerárquica que puede emplearse en algunas realizaciones de la invención; y
la figura 15 ilustra un método de transmisión y recepción de una señal de audio según algunas realizaciones de la invención.
\vskip1.000000\baselineskip
La siguiente descripción se centra en las realizaciones de la invención que pueden aplicarse a la codificación y la decodificación de una señal de audio de múltiples canales que utiliza un número de mezcladores descendentes y mezcladores ascendentes de canal de baja complejidad. Sin embargo, se apreciará que la invención no se limita a esta aplicación. El experto en la técnica entenderá que se dispone un mezclador descendente para combinar un número de canales de audio en un número inferior de datos paramétricos y de canales de audio adicionales, y que se dispone un mezclador ascendente para generar un número de canales de audio a partir de un número más bajo de datos paramétricos y de canales de audio. Por lo tanto, el mezclador ascendente proporciona una funcionalidad de división de canal.
La figura 1 ilustra un sistema 100 de transmisión para la comunicación de una señal de audio según algunas realizaciones de la invención. El sistema 100 de transmisión comprende un transmisor 101 que se acopla a un receptor 103 a través de una red 105, que puede ser, de manera específica, Internet.
En el ejemplo específico, el transmisor 101 es un dispositivo de grabación de señal y el receptor es un dispositivo de reproducción de señal 103 aunque se apreciará que en otras realizaciones el transmisor y el receptor pueden utilizarse en otras aplicaciones y para otros propósitos. Por ejemplo, el transmisor 101 y/o el receptor 103 pueden ser parte de una funcionalidad de transcodificación y pueden proporcionar, por ejemplo, la interconexión con otras fuentes o destinos de señal.
En el ejemplo específico en el que se soporta una función de grabación de señal, el transmisor 101 comprende un digitalizador 107 que recibe una señal analógica que se convierte en una señal PCM digital mediante muestreo y conversión de analógica a digital.
El transmisor 101 se acopla al codificador 109 de la figura 1, que codifica la señal PCM según un algoritmo de codificación. El codificador 100 se acopla a un transmisor 111 de red que recibe la señal codificada y se interconecta a Internet 105. El transmisor de red puede enviar la señal codificada al receptor 103 a través de Internet 105.
El receptor 103 comprende un receptor 113 de red que se interconecta a Internet 105 y que se dispone para recibir la señal codificada del transmisor 101.
El receptor 111 de red se acopla a un decodificador 115. El decodificador 115 recibe la señal codificada y la decodifica según un algoritmo de decodificación.
En el ejemplo específico en el que se soporta una función de reproducción de señal, el receptor 103 comprende además un reproductor 117 de señal que recibe la señal decodificada de audio del decodificador 115 y la presenta al usuario. De manera específica, el reproductor de señal 113 puede comprender un convertidor de digital a analógico, amplificadores y altavoces según se requiera para dar salida a la señal decodificada de audio.
En el ejemplo de la figura 1, el codificador 109 y el decodificador 115 utilizan una estructura en cascada o basada en árbol que consiste en pequeños bloques de construcción. Por lo tanto, el codificador 109 utiliza una estructura jerárquica de codificación en la que los canales de audio se procesan de forma progresiva en diferentes capas de la estructura jerárquica. Una estructura de este tipo puede conducir a una codificación particularmente ventajosa con una alta calidad de audio, aunque relativamente una complejidad baja y una implementación sencilla del codificador 109.
La figura 2 ilustra un ejemplo de una estructura de codificador jerárquica que puede emplearse en algunas realizaciones de la invención.
En el ejemplo, el codificador 109 codifica una señal de entrada de sonido envolvente de 5.1 canales que consisten en un canal frontal izquierdo (l_{f}), un canal envolvente izquierdo (l_{s}), un canal frontal derecho (r_{f}), un canal central envolvente derecho (c_{o}) y un subaltavoz para graves ("subwoofer") o canal de mejora de bajas frecuencias (lfe). En primer lugar, los canales se dividen y transforman al dominio de frecuencia en los bloques 201 de segmentación. Las señales resultantes del dominio de frecuencia se alimentan en pares a los mezcladores 203 descendentes de dos-a-uno (TTO), que realizan el mezclado descendente de dos señales de entrada hacia un canal único de salida y extraen los parámetros correspondientes. Por lo tanto, los tres mezcladores 203 descendentes TTO mezclan de forma descendente los seis canales de entrada en tres parámetros y canales de audio.
Según se ilustra en la figura 2, las salidas de los mezcladores 203 descendentes TTO se utilizan como entrada para otros mezcladores 205, 207 descendentes TTO. De manera específica, dos de los mezcladores 203 descendentes TTO se acoplan a un cuarto mezclador 205 descendente TTO, que combina los correspondientes canales en un canal único. El tercero de los mezcladores 203 descendentes TTO se acopla junto con el cuarto mezclador 205 descendente TTO a un quinto mezclador 207 descendente TTO que combina los dos canales restantes en un canal único (M). Esta señal se transforma finalmente de vuelta al dominio de tiempo, dando como resultado un flujo m de bits de audio codificados de múltiples canales.
Los mezcladores 203 descendentes TTO pueden considerarse como que comprenden la primera capa de la estructura de codificación, con una segunda capa que comprende el cuarto mezclador 205 descendente TTO y comprendiendo la tercera capa el quinto mezclador 207 descendente TTO. Por lo tanto, tiene lugar una combinación de un número de canales de audio en un número más bajo de canales de audio en cada capa de la estructura de codificador jerárquica.
La estructura jerárquica de codificación del codificador 109 puede originar una codificación muy eficaz y de alta calidad de baja complejidad. Además, la estructura jerárquica de codificación puede modificarse en función de la naturaleza de la señal que se codifica. Por ejemplo, si se codifica una señal de estéreo simple, esto puede conseguirse a través de la estructura jerárquica de codificación que sólo comprende un mezclador descendente TTO único y una capa única.
Con el fin de que el decodificador 115 maneje las señales codificadas utilizando diferentes estructuras jerárquicas de codificación, éste debe poder adaptarse a la estructura jerárquica de codificación utilizada para la señal específica. De manera específica, el decodificador 115 comprende la funcionalidad para la configuración por sí mismo de manera que tiene una estructura de decodificador jerárquica que coincide con la estructura jerárquica de codificación del codificador 109. No obstante, con el fin de hacer esto, debe dotarse al decodificador 115 de información de la estructura jerárquica de codificación utilizada para la codificación del flujo recibido de bits.
La figura 3 ilustra un ejemplo del codificador 109 según algunas realizaciones de la invención.
El codificador 109 comprende un procesador 301 de recepción que recibe un número de canales de entrada de audio. Para el ejemplo específico de la figura 2, el codificador 109 recibe seis canales de entrada. El procesador 301 de recepción se acopla a un procesador 303 de codificación que tiene una estructura jerárquica de codificación. Como ejemplo, la estructura jerárquica de codificación del procesador 303 de codificación puede corresponder a la que se ilustra en la figura 2.
El procesador 303 de codificación se acopla además a un procesador 305 de estructura de codificación que se dispone para determinar la estructura jerárquica de codificación utilizada por el procesador 303 de codificación. El procesador 303 de codificación puede alimentar, de manera específica, los datos de estructura al procesador 305 de estructura de codificación. Como respuesta, el procesador 305 de estructura de codificación genera los datos de estructura de árbol de decodificador que son indicativos de la estructura de decodificador jerárquica que debe utilizar el decodificador para decodificar la señal codificada que generada el procesador 303 de codificación.
Se apreciará que los datos de estructura de árbol de decodificador pueden determinarse directamente como datos que describen la estructura jerárquica de codificación o por ejemplo, pueden ser los datos que describen directamente la estructura de decodificador jerárquica que debe utilizarse (por ejemplo, pueden describir la estructura complementaria a la del procesador 303 de codificación).
Los datos de estructura de árbol de decodificador comprenden, de manera específica, al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en las capas jerárquicas de la estructura de decodificador jerárquica. Por lo tanto, los datos de estructura de árbol de decodificador pueden comprender al menos una indicación de dónde tiene que dividirse un canal de audio en el decodificador. Esta indicación puede ser, por ejemplo, una indicación de una capa en la que la estructura de codificación comprende un mezclador descendente o puede ser, de manera equivalente, una indicación de una capa de una estructura de árbol de decodificador que debe comprender un mezclador ascendente.
El procesador 303 de codificación y el procesador 305 de estructura de codificación se acoplan al generador 307 de flujo de datos, que crea un flujo de bits que comprende el audio codificado del procesador de estructura 303 de codificación y los datos de estructura de árbol de decodificador que provienen del procesador 305 de estructura de codificación. A continuación, el flujo de datos se alimenta al transmisor 111 de red para su comunicación con el receptor 103.
La figura 4 ilustra un ejemplo del decodificador 115 según algunas realizaciones de la invención.
El decodificador 115 comprende un receptor 401 que recibe el flujo de datos transmitido desde el receptor 113 de red. El decodificador 115 comprende además un procesador 403 de decodificación y un procesador 405 de estructura de decodificador acoplado al receptor 401.
El receptor 401 extrae los datos de estructura de árbol de decodificador y los alimenta al procesador 405 de estructura de decodificador mientras que los datos de codificación de audio que comprenden un número de canales de audio y los datos paramétricos de audio se alimentan al procesador 403 de decodificación.
El procesador 405 de estructura de decodificador se dispone para determinar la estructura de decodificador jerárquica en respuesta a los datos recibidos de estructura de árbol de decodificador. De manera específica, el procesador 405 de estructura de decodificador puede extraer los valores de datos que especifican las divisiones de datos y puede generar la información de la estructura de decodificador jerárquica que complementa la estructura jerárquica de codificación del procesador 303 de codificación. Esta información se alimenta al procesador 403 de decodificación haciendo que se configure para una estructura de decodificador jerárquica específica.
De manera subsiguiente, el procesador 405 de estructura de decodificador continúa generando los canales de salida que corresponden a las entradas originales al codificador 109 utilizando la estructura de decodificador jerárquica.
Por lo tanto, el sistema puede permitir una codificación, decodificación y distribución eficaz y de alta calidad de las señales de audio y de manera específica, de las señales de audio de múltiples canales. Se permite un sistema muy flexible, en el que los decodificadores pueden adaptarse, de manera automática, a los codificadores y los mismos decodificadores pueden utilizarse de este modo con un número de codificadores diferentes.
Los datos de estructura de árbol de decodificador se comunican de manera efectiva utilizando valores de datos que son indicativos de las características de división de canal para los canales de audio en diferentes capas jerárquicas de la estructura de decodificador jerárquica. Por lo tanto, los datos de estructura de árbol de decodificador se optimizan para estructuras flexibles y de alto rendimiento de codificación y decodificación jerárquica.
Por ejemplo, una señal de 5.1 canales (es decir, una señal de seis canales) puede codificarse como una señal de estéreo más un conjunto de parámetros espaciales. Esta codificación puede conseguirse a través de muchas estructuras jerárquicas de codificación diferentes que utilizan mezcladores descendentes TTO o de dos-a-tres (TTT) simples y por lo tanto, muchas estructuras jerárquicas de decodificador diferentes son posibles utilizando mezcladores ascendentes de uno-a-dos (OTT) o de dos-a-tres (TTT). Por lo tanto, con el fin de decodificar el correspondiente flujo de bits espacial, el decodificador debe tener conocimiento de la estructura jerárquica de codificación que ha sido empleada en el codificador. Un enfoque directo es entonces señalar el árbol en el flujo de bits por medio de un índice en una tabla de consulta. Un ejemplo de una tabla de consulta adecuada puede ser:
1
Sin embargo, la utilización de esta tabla de consulta tiene la desventaja que todas las estructuras jerárquicas de codificación que posiblemente pueden utilizarse deben especificarse de manera explícita en la tabla de consulta. Sin embargo, esto requiere que todos los decodificadores/codificadores reciban tablas actualizadas de consulta con el fin de introducir una nueva estructura jerárquica de codificación al sistema. Esto en gran medida es indeseable y da como resultado una operación compleja y un sistema carente de flexibilidad.
En contraste, el uso de los datos de estructura de árbol de decodificador en los que los valores de datos indican las divisiones de canal en las diferentes capas de la estructura de decodificador jerárquica permite una comunicación general simple de los datos de estructura de árbol de decodificador que pueden describir cualquier estructura de decodificador jerárquica. Por lo tanto, pueden utilizarse con facilidad nuevas estructuras de codificación sin requerir ninguna notificación anterior de los decodificadores correspondientes.
Por lo tanto, en contraste con el enfoque basado en la consulta, el sistema de la figura 1 puede manejar un número arbitrario de canales de entrada y salida, a la vez que mantiene una total flexibilidad. Esto se consigue mediante la especificación de una descripción del árbol de codificador/decodificador en el flujo de bits. A partir de esta descripción, el decodificador puede deducir en dónde y cómo aplicar los subsiguientes parámetros codificados en el flujo de bits.
Los datos de estructura de árbol de decodificador pueden comprender, de manera específica, una pluralidad de valores de datos, en los que cada valor de datos es indicativo de una característica de división de canal para un canal en una capa jerárquica de la estructura de decodificador jerárquica. De manera específica, los datos de estructura de árbol de decodificador pueden comprender un valor de datos para cada mezclador ascendente que será incluido en la estructura de decodificador jerárquica. Además, un valor de datos puede ser incluido para cada canal, que no será dividido. Por lo tanto, si un valor de datos de los datos de estructura de árbol de decodificador tuviera un valor que corresponde a un valor predeterminado específico de datos, esto puede indicar que el canal correspondiente no será dividido aunque de hecho es un canal de salida del decodificador 115.
En algunas realizaciones, el sistema sólo puede incorporar codificadores que utilizan, de manera exclusiva, mezcladores descendentes TTO y el decodificador puede implementarse en consecuencia utilizando sólo mezcladores ascendentes OTT. En esta realización, un valor de datos puede ser incluido para cada canal del decodificador. Además, el valor de datos puede tomar uno de dos posibles valores indicando un valor que el canal no se divide e indicando el otro valor que el canal se divide en dos canales por un mezclador ascendente OTT. Además, el orden de los valores de datos en los datos de estructura de árbol de decodificador puede indicar qué canales se dividirán y por lo tanto, la ubicación de los mezcladores ascendentes OTT en la estructura de decodificador jerárquica. Por lo tanto, pueden conseguirse los datos de estructura de árbol de decodificador que comprenden valores binarios simples, que describen completamente la estructura de decodificador jerárquica requerida.
Como ejemplo específico, se describirá la deducción de la descripción de la secuencia de bits de la estructura de decodificador jerárquica del decodificador de la figura 5.
En el ejemplo, se supone que los codificadores sólo pueden utilizar mezcladores descendentes TTO y por lo tanto, el árbol de decodificador puede describirse mediante una secuencia binaria. En el ejemplo de la figura 5, un canal único de entrada de audio se expande a una señal de salida de cinco canales que utiliza mezcladores ascendentes OTT. En el ejemplo, pueden discernirse cuatro capas de profundidad, la primera, denotada con 0, se encuentra en la capa de la señal de entrada, la última, denotada con 3, se encuentra en la capa de las señales de salida. Se apreciará que en esta descripción, las capas se caracterizan por los canales de audio con los mezcladores ascendentes que forman los límites de capa, las capas pueden igualmente considerarse como que comprenden o están formadas por los mezcladores ascendentes.
En el ejemplo, la estructura de decodificador jerárquica de la figura 5 puede describirse mediante la secuencia de bits "111001000" deducida de las siguientes etapas.
\vskip1.000000\baselineskip
1 - La señal de entrada en la capa 0, t_{0}, se divide (mezclador ascendente OTT), como resultado, todas las señales en la capa 0 se tienen en cuenta, continúese con la capa 1.
1 - La primera señal en la capa 1 (que proviene de la parte superior del mezclador ascendente OTT A) se divide (mezclador ascendente OTT B).
1 - La segunda señal en la capa 1 (que proviene de la parte inferior del mezclador ascendente OTT A) se divide (mezclador ascendente OTT C), todas las señales en la capa 1 se describen, y continúese con la capa 2.
0 - La primera señal en la capa 2 (parte superior del mezclador ascendente OTT B) no se divide más.
0 - La segunda señal en la capa 2 (parte inferior del mezclador ascendente OTT B) no se divide más.
1 - La tercera señal en la capa 2 (parte superior del mezclador ascendente OTT C) se divide de nuevo.
0 - La cuarta señal en la capa 2 (parte inferior del mezclador ascendente OTT D) no se divide más, todas las señales en la capa 2 se describen, continúese con la capa 3.
0 - La primera señal en la capa 3 (parte superior del mezclador ascendente OTT D) no se divide más.
0 - La segunda señal en la capa 3 (parte inferior del mezclador ascendente OTT D) no se divide más, todas las señales se han descrito.
\vskip1.000000\baselineskip
En algunas realizaciones, la codificación puede limitarse sólo a la utilización de los mezcladores descendentes TTO y TTT y por lo tanto, la decodificación puede limitarse sólo a la utilización de los mezcladores ascendentes OTT y TTT. Aunque los mezcladores ascendentes TTT pueden utilizarse en muchas configuraciones diferentes, es particularmente ventajosa su utilización en un modo en el que la predicción (forma de onda) se utilizase para estimar con exactitud las tres señales de salida que provienen de las dos señales de entrada. Debido a esta naturaleza predictiva de los mezcladores ascendentes TTT, la posición lógica para estos mezcladores ascendentes se encuentra en la raíz del árbol. Esto es una consecuencia de que los mezcladores ascendentes OTT destruyen la forma de onda original, con lo que hacen inadecuada la predicción. Por lo tanto, en algunas realizaciones, los únicos mezcladores ascendentes que se utilizan en la estructura de decodificador son los mezcladores ascendentes OTT o los mezcladores ascendentes TTT en la capa raíz.
Por lo tanto, para estos sistemas, pueden discernirse tres diferentes situaciones que juntas permiten una descripción universal del árbol:
1) árboles que tienen un mezclador ascendente TTT como raíz.
2) árboles que consisten sólo en mezcladores ascendentes OTT.
3) "árboles vacíos", es decir, un mapeo directo de el (los) canal(es) de entrada a el (los) de salida.
\vskip1.000000\baselineskip
La figura 6 ilustra las estructuras jerárquicas de decodificador de ejemplo que tienen mezcladores ascendentes TTT en la raíz, y la figura 7 ilustra una estructura de decodificador jerárquica de ejemplo que comprende una pluralidad de estructuras de árbol de decodificador. La estructura de decodificador jerárquica de la figura 7 comprende estructuras de árbol de decodificador según todos los tres ejemplos presentados con anterioridad.
En algunas realizaciones, los datos de estructura de árbol de decodificador se ordenan con el fin de saber si el canal de entrada comprende un mezclador ascendente TTT o no. Los datos de estructura de árbol de decodificador pueden comprender una indicación de que un mezclador ascendente TTT está presente en la capa raíz seguido por datos binarios indicativos de si los canales de las capas inferiores se dividen por el mezclador ascendente OTT o no se dividen más. Esto puede mejorar el rendimiento en términos de tasa de transmisión de bits y bajos costes de señalización.
Por ejemplo, los datos de estructura de árbol de decodificador pueden indicar cuántos mezcladores ascendentes TTT están incluidos en la estructura de decodificador jerárquica. Puesto que cada estructura de árbol sólo puede incluir un mezclador ascendente TTT que esté dispuesto en el nivel de raíz, el resto del árbol puede describirse mediante una secuencia binaria según se describió con anterioridad (es decir, puesto que el árbol es un árbol mezclador ascendente OTT sólo para las capas inferiores, puede aplicarse el mismo enfoque según se describió para la estructura de decodificador jerárquica sólo de mezclador ascendente OTT).
Asimismo, las estructuras restantes de árbol son, o bien árboles sólo de mezclador ascendente OTT o bien árboles vacíos que también pueden describirse mediante secuencias binarias. Por lo tanto, todos los árboles pueden describirse mediante valores de datos binarios y la interpretación de la secuencia binaria puede depender de la categoría a la que pertenece el árbol. Esta información puede proporcionarse mediante la ubicación del árbol en los datos de estructura de árbol de decodificador. Por ejemplo, todos los árboles que comprenden un mezclador ascendente TTT pueden ubicarse en primer lugar en los datos de estructura de árbol de decodificador, seguidos por los árboles sólo de mezclador ascendente OTT, seguido por los árboles vacíos. Si el número de mezcladores ascendentes TTT y mezcladores ascendentes OTT en la estructura de decodificador jerárquica se incluye en los datos de estructura de árbol de decodificador, el decodificador puede configurarse sin requerir ningún dato adicional. Por lo tanto, se consigue una comunicación altamente eficaz de la información de la estructura requerida del decodificador. La sobrecarga de la comunicación de los datos de estructura de árbol de decodificador puede mantenerse muy baja, proporcionando no obstante un sistema flexible en gran medida, que puede describir una amplia variedad de estructuras jerárquicas de decodificador.
Como ejemplo específico, las estructuras jerárquicas de decodificador del decodificador de la figura 7 pueden deducirse a partir de los datos de estructura de árbol de decodificador a través de los siguientes procesos:
-
El número de señales de entrada se deduce del mezclado descendente (posiblemente codificado).
-
El número de mezcladores ascendentes OTT y el número de mezcladores ascendentes TTT de la totalidad del árbol se señalizan en los datos de estructura de árbol de decodificador y pueden extraerse de los mismos. El número de señales de salida puede deducirse como: #señales de salida = #señales de entrada +#mezcladores ascendentes TTT + #mezcladores ascendentes OTT.
-
Los canales de entrada pueden mapearse nuevamente en los datos de estructura de árbol de decodificador de manera que después de un nuevo mapeo los árboles según la situación 1) se encuentran en primer lugar, seguidos por los árboles según la situación 2) y posteriormente, 3). Para el ejemplo de la figura 7 esto daría como resultado el orden 3, 0, 1, 2, 4, es decir, la señal 0 es la señal 3 después del nuevo mapeo, la señal 1 es la señal 0 después del nuevo mapeo, etcétera.
-
Para cada mezclador ascendente TTT, tres descripciones de árbol sólo de OTT se dan utilizando el método descrito con anterioridad, un árbol sólo de OTT por canal de salida TTT.
-
Para todas las señales restantes de entrada se dan descripciones sólo de OTT.
\vskip1.000000\baselineskip
En algunas realizaciones, se incluye una indicación de la posición del altavoz para los canales de salida en los datos de estructura de árbol de decodificador. Por ejemplo, puede utilizarse una tabla de consulta de las ubicaciones predeterminadas de altavoz, tal como por ejemplo:
2
De forma alterna, las ubicaciones de altavoz pueden representarse utilizando un enfoque jerárquico. Por ejemplo, unos primeros pocos bits especifican el eje-x, por ejemplo, L, R, C, después, otros pocos bits especifican el eje-y, por ejemplo, frontal, lateral y envolvente, y otros pocos bits especifican el eje-z (elevación).
Como ejemplo específico, lo siguiente proporciona una sintaxis de ejemplo de flujo de bits para un flujo de bits seguido por los principios descritos con anterioridad. En el ejemplo, el número de señales de entrada y de salida se codifica, de manera explícita, en el flujo de bits. Tal información puede utilizarse para validar parte del flujo de bits.
3
En este ejemplo, cada árbol OttTree se maneja en la OttTreeDescription() que se ilustra más adelante.
4
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
En la sintaxis anterior, el formato de letras en negrita se utiliza para indicar los elementos leídos del flujo de bits.
Se apreciará que el concepto de las capas jerárquicas no es necesario en esta descripción. Por ejemplo, también puede aplicarse una descripción basada en un principio de "con la condición de que existan extremos abiertos, existirán más bits por llegar". Con el fin de decodificar los datos, este concepto puede volverse útil.
Aparte de los bits únicos que denotan si un mezclador ascendente OTT está presente o no, se incluyen los siguientes datos para el mezclador ascendente OTT:
-
la diferencia de nivel de canal por defecto.
-
Si el mezclador ascendente OTT es un mezclador ascendente OTT LFE (mejora de bajas frecuencias), es decir, si los parámetros están limitados sólo por banda y no contienen ningún tipo de datos de correlación/coherencia.
\vskip1.000000\baselineskip
Además, los datos pueden detallar las propiedades específicas de los mezcladores ascendentes, tal como en el ejemplo del mezclador ascendente TTT, qué modo va a utilizarse (predicción basada en la forma de onda, descripción basada en la energía, etc.).
Como sabe un experto en la técnica, un mezclador ascendente OTT utiliza una señal decorrelacionada para dividir un canal único en dos canales. Además, la señal decorrelacionada se deduce de la señal única de canal de entrada. La figura 8 ilustra un ejemplo de un mezclador ascendente OTT según este enfoque. Por lo tanto, el decodificador de ejemplo de la figura 5 puede representarse por el diagrama de la figura 9, en el que los bloques de decorrelacionador que generan las señales decorrelacionadas se muestran de manera explícita.
Sin embargo, como puede observarse, este enfoque conduce a la colocación en cascada de los bloques de decorrelacionador, de manera que la señal decorrelacionada para el mezclador ascendente OTT de capa más baja se genera a partir de una señal de entrada que se ha creado a partir de otra señal decorrelacionada. Por lo tanto, más que generarse a partir de la señal de entrada original en el nivel de raíz, las señales decorrelacionadas de las capas más bajas se habrán procesado a través de varios bloques de decorrelación. Puesto que cada bloque de decorrelación comprende un filtro de decorrelación, este enfoque puede resultar en una "borrosidad" de la señal decorrelacionada (por ejemplo, los transitorios pueden distorsionarse de manera significativa). Esto da como resultado la degradación de la calidad del audio para la señal de salida.
Por lo tanto, con el fin de mejorar la calidad del audio, los decorrelacionadores aplicados en el mezclador ascendente del decodificador pueden moverse en algunas realizaciones, de manera que se evite la colocación en cascada de las señales decorrelacionadas. La figura 10 ilustra un ejemplo de una estructura de decodificador que corresponde a la de la figura 9, aunque con los decorrelacionadores acoplados directamente al canal de entrada. Por lo tanto, en lugar de tomar la salida del mezclador ascendente OTT antecesor como la entrada al decorrelacionador, los mezcladores ascendentes de decorrelacionador toman directamente la señal t_{0} de entrada original, previamente procesada por los mezcladores G_{B}, G_{C} y G_{D} ascendentes de ganancia. Estas ganancias garantizan que la potencia a la entrada del decorrelacionador sea idéntica a la potencia que se hubiera conseguido en la entrada del decorrelacionador en la estructura de la figura 9. La estructura conseguida de este modo no contiene una cascada de decorrelacionadores, con lo que se origina una calidad mejorada del audio.
A continuación, se describirá un ejemplo de la manera en que se determinan los parámetros de multiplicación matricial para los mezcladores ascendentes de las capas jerárquicas en respuesta a los datos de estructura de árbol de decodificador. De manera particular, la descripción se centrará en las realizaciones en las que los filtros de decorrelación para la generación de las señales decorrelacionadas de los mezcladores ascendentes se conectan directamente a los canales de entrada de audio de la estructura de decodificación. Por lo tanto, la descripción se centrará en las realizaciones de los codificadores tal como se ilustra en la figura 10.
La figura 11 ilustra un diagrama de flujo de ejemplo de un método de decodificación según algunas realizaciones de la invención.
En la etapa 1101, los parámetros cuantificados y codificados se decodifican a partir del flujo recibido de bis. Como apreciará el experto en la técnica, esto puede originar un número de vectores de parámetros convencionales de codificación de audio paramétrico, tal como:
\vskip1.000000\baselineskip
5
\vskip1.000000\baselineskip
Cada vector representa los parámetros a lo largo del eje de frecuencia.
A la etapa 1101 la sigue la etapa 1103, en la que las matrices para los mezcladores ascendentes individuales se determinan a partir de los datos paramétricos decodificados.
Las matrices generalizadas OTT y TTT (independientes de la frecuencia) pueden darse, de manera respectiva, como:
7
6
Las señales x_{i}, d_{i} e y_{i} representan las señales de entrada, las señales decorrelacionadas deducidas a partir de las señales x_{i} y las señales de salida, de manera respectiva. Las entradas H_{if} y M_{if} matriciales son funciones de los parámetros deducidos en la etapa 1103.
A continuación, el método se divide en dos trayectorias paralelas, en las que una trayectoria tiene como objetivo la deducción de los valores de matriz previa del árbol (etapa 1105) y una trayectoria tiene como objetivo la deducción de los valores de matriz de mezclado de árbol (etapa 1107).
Las matrices previas corresponden a las multiplicaciones matriciales aplicadas a la señal de entrada antes de la decorrelación y la aplicación matricial. De manera específica, las matrices previas corresponden a los mezcladores ascendentes de ganancia aplicados en la señal de entrada antes de los filtros de decorrelación.
En mayor detalle, una implementación de decodificador directa conducirá en general hacia una cascada de filtros de decorrelación, como por ejemplo, como, por ejemplo, se aplica en la figura 9. Como se explicó con anterioridad, es preferible evitar esta cascada. Con el fin de hacer esto, todos los filtros de decorrelación se mueven al mismo nivel jerárquico, según se muestra en la figura 10. Con el fin de garantizar que las señales decorrelacionadas tienen el nivel adecuado de energía, es decir, idéntico al nivel de la señal decorrelacionada en el caso directo de la figura 9, las matrices previas se aplican antes de la decorrelación.
Como ejemplo, el G_{B} de ganancia en la figura 10 se deduce como sigue. En primer lugar, es importante observar que el mezclador ascendente de 1-a-2 divide la potencia de la señal de entrada hacia las salidas superior e inferior del mezclador ascendente de 1-a-2. Esta propiedad es reflejada en los parámetros de diferencia de intensidad entre canales (IID) o diferencia de nivel entre canales (ICLD). Por lo tanto, el G_{B} de ganancia se calcula como la proporción de energía de la salida superior dividida entre la suma de las salidas superior e inferior del mezclador ascendente de 1-a-2. Se apreciará que debido a que los parámetros IID o ICLD pueden ser variables con el tiempo y la frecuencia, la ganancia también puede variar tanto frente al tiempo como frente a la frecuencia.
Las matrices de mezclado son las matrices aplicadas a la señal de entrada por los mezcladores ascendentes con el fin de generar los canales adicionales.
Las ecuaciones finales de matriz previa y de mezclado son el resultado de una cascada de los mezcladores ascendentes OTT y TTT. Puesto que la estructura del decodificador ha sido enmendada para evitar la cascada de los decorrelacionadores, esto debe tenerse en cuenta cuando se determinen las ecuaciones finales.
En las realizaciones, en las que sólo se utilizan configuraciones predeterminadas, la relación entre las entradas H_{if} y M_{if} matriciales y las ecuaciones finales matriciales es constante y puede aplicarse una modificación convencional.
Sin embargo, para el enfoque más flexible y dinámico descrito con anterioridad, la determinación de los valores de matriz previa y mezclado puede determinarse a través de enfoques más complejos como se describirá más adelante.
A la etapa 1105 la sigue la etapa 1109, en la que las matrices previas deducidas en la etapa 1105 se mapean al plan de frecuencias real que se aplica para transformar la señal de dominio de tiempo al dominio de frecuencia (en la etapa 1113).
A la etapa 1109 la sigue la etapa 1111, en la que puede interpolarse la interpolación de los parámetros matriciales de frecuencia. De manera específica, puede aplicarse interpolación en función de si la actualización temporal de los parámetros corresponde o no a la actualización de la transformación de tiempo a frecuencia de la etapa 1113.
En la etapa 1113, las señales de entrada se convierten al dominio de frecuencia con el fin de aplicar las matrices previas mapeadas y opcionalmente interpoladas.
La etapa 1115 sigue a la etapa 1111 y la etapa 1113 y comprende la aplicación de las matrices previas a las señales de entrada del dominio de frecuencia. La aplicación real de la matriz es un conjunto de multiplicaciones matriciales.
A la etapa 1115 la sigue la etapa 1117 en la que parte de las señales que se originan a partir de la aplicación matricial de la etapa 1115 se alimenta al filtro de decorrelación para generar las señales decorrelacionadas.
El mismo enfoque se aplica para deducir las ecuaciones de matriz de mezclado.
De manera específica, a la etapa 1107 la sigue la etapa 1119, en la que las ecuaciones determinadas en la etapa 1107 se mapean al plan de frecuencias de la transformación de tiempo a frecuencia de la etapa 1113.
A la etapa 1119 la sigue la etapa 1121, en la que los valores de matriz de mezclado se interpolan, de manera opcional, dependiendo de nuevo de la actualización temporal de los parámetros y la transformación.
Los valores generados en las etapas 1115, 1117 y 1121 forman, por lo tanto, los parámetros requeridos para la multiplicación matricial de mezclado ascendente y esta se realiza en la etapa 1123.
A la etapa 1123 la sigue la etapa 1125, en la que la salida resultante se transforma de vuelta al dominio de tiempo.
Las etapas que corresponden a las etapas 1115, 1117 y 1123 en la figura 11 pueden ilustrarse adicionalmente mediante la figura 12. La figura 12 ilustra un ejemplo de una estructura de decodificador matricial según algunas realizaciones de la invención.
La figura 12 ilustra cómo pueden utilizarse los canales de mezclado descendente de entrada para reconstruir la salida de múltiples canales. Como se perfiló con anterioridad, el proceso puede describirse por las multiplicaciones matriciales con unidades intermedias de decorrelación.
Por lo tanto, el procesamiento de los canales de entrada para formar los canales de salida puede describirse según:
8
en donde
\quad
M_{1}^{n,k} es una matriz de dos dimensiones que mapea un cierto número de canales de entrada en un cierto número de canales que van hacia los decorrelacionadores, y se define por cada ranura de tiempo n, y cada subbanda k; y
\quad
M_{2}^{n,k} es una matriz de dos dimensiones que mapea un cierto número de canales previamente procesados en un cierto número de canales de salida, y se define para cada ranura de tiempo n, y cada subbanda híbrida k.
\vskip1.000000\baselineskip
A continuación, se describirá un ejemplo de la manera en que pueden generarse las ecuaciones de matriz previa y mezclado de las etapas 1105 y 1107 a partir de los datos de estructura de árbol de decodificador.
En primer lugar, se considerarán las estructuras de árbol de decodificador, que sólo tienen mezcladores ascendentes OTT, con referencia al árbol de ejemplo de la figura 13.
Para este tipo de árboles es beneficioso definir un número de variables auxiliares:
9
\quad
describe los índices del mezclador ascendente OTT que se encuentran para cada mezclador ascendente OTT (es decir, en el ejemplo la señal que está haciéndose entrar en el cuarto mezclador ascendente OTT ha pasado través del 0-ésimo y el primer mezclador ascendente OTT, según proporciona la quinta columna en la matriz Tree^{1}. De forma similar, la señal que está haciéndose entrar en el segundo mezclador ascendente OTT ha pasado a través del 0-ésimo bloque OTT, según proporciona la tercera columna en la matriz Tree^{1}, etc.).
10
describe si se persigue la trayectoria superior o inferior para cada mezclador ascendente OTT. El signo positivo indica la trayectoria superior y el signo negativo indica la trayectoria inferior.
\vskip1.000000\baselineskip
La matriz corresponde a la matriz Tree^{1}, y por lo tanto, cuando una cierta columna y fila en la matriz Tree^{1} señala a un cierto mezclador ascendente OTT, la misma columna y fila en la matriz Tree^{1} indica si la parte inferior o superior de este mezclador ascendente específico OTT se utiliza para alcanzar el mezclador ascendente OTT dado en la primera fila de la columna específica (es decir, en el ejemplo, la señal que está haciéndose entrar en el cuarto mezclador ascendente OTT ha pasado a través de la trayectoria superior del 0-ésimo mezclador ascendente OTT (según se indica mediante la tercera fila, la quinta columna en la matriz Tree^{1}_{sign}), y la trayectoria inferior del primer mezclador ascendente OTT (como se indica mediante la segunda fila, quinta columna en la matriz Tree^{1}_{sign}).
Tree^{1}_{depth} = [1 2 2 3 3 ]
describe la profundidad del árbol para cada mezclador ascendente OTT (es decir, en el ejemplo el mezclador 0 ascendente se encuentra en la capa 1, los mezcladores ascendentes 1 y 2 se encuentran en la capa 2 y los mezcladores ascendentes 3 y 4 se encuentran en la capa 3); y
Tree_{elements} = [5]
denota el número de elementos en el árbol (es decir, en el ejemplo el árbol comprende cinco mezcladores ascendentes).
\vskip1.000000\baselineskip
Entonces, se define una matriz temporal K_{1} que describe la matriz previa sólo para las señales decorrelacionadas según:
11
en donde
12
es el valor de ganancia para el mezclador ascendente OTT indicado por Tree^{1}(i,p) dependiendo de si se utiliza la salida superior o la inferior del bloque OTT, y en donde
13
Los valores IID son los valores de diferencia de intensidad entre canales obtenidos a partir del flujo de bits.
La matriz final de mezclado previo M_{1} se construye entonces como:
14
Recordando que el objetivo de la matriz de mezclado previo es poder mover los decorrelacionadores incluidos en el mezclador ascendente OTT en la figura 13, antes que los bloques OTT. Por lo tanto, la matriz de mezclado previo necesita suministrar una señal de entrada "seca" para todos los decorrelacionadores en el mezclador ascendente OTT, en donde las señales de entrada tienen el nivel que pudieron haber tenido en el punto específico en el árbol en el que el decorrelacionador se dispuso antes de moverlo delante del árbol.
También, recordando que la matriz previa sólo aplica una ganancia previa para las señales que se dirigen hacia los decorrelacionadores y el mezclado de las señales de decorrelacionador y la señal "seca" de mezclado descendente se realiza en la matriz M_{2} de mezclado, que se explicará en detalle más adelante, el primer elemento de la matriz de mezclado previo proporciona una salida que se acopla acoplada a la matriz M_{2} (véase la figura 12, en la que la línea m/c ilustra esto).
Dado que actualmente está observándose un árbol sólo de mezclador ascendente OTT, es obvio que también el segundo elemento del vector M_{1} de mezclado previo será uno, debido a que la señal que se dirige hacia el decorrelacionador en el mezclador ascendente OTT cero es exactamente la señal de salida de mezclado descendente, y que para este mezclador ascendente OTT no existe diferencia en mover el decorrelacionador delante de todo el árbol debido a que ya se encuentra en primer lugar en el árbol.
Además, dado que el vector de entrada a los decorrelacionadores viene dado por v^{n,k} = M_{1}^{n,k} x^{n,k} y observando la figura 13 y la figura 12, y el modo en el que fueron deducidos los elementos en la matriz M_{1}^{n,k}, es obvio que la primera fila de M_{1} corresponde a la señal m en la figura 12, las filas subsiguientes corresponden a la señal de entrada de decorrelacionador del bloque 0,..., 4 OTT. Por lo tanto, el vector W^{n,k} será como sigue:
15
donde e_{n} denota la salida del decorrelacionador del n-ésimo bloque OTT en la figura 13.
\vskip1.000000\baselineskip
Ahora, observando la matriz M_{2} de mezclado, los elementos de esta matriz pueden deducirse de forma similar. Sin embargo, para esta matriz el objetivo es ajustar en ganancia la señal seca y mezclarla con las salidas de decorrelacionador relevantes. Recordando que cada mezclador ascendente OTT en el árbol puede describirse mediante lo siguiente:
16
donde Y_{1} es la salida superior del bloque OTT, e Y_{2} es la entrada inferior y X es la señal de entrada seca y Q es la señal de decorrelacionador.
\vskip1.000000\baselineskip
Debido a que los canales de salida están formados por la multiplicación matricial y^{n,k} = M_{2}^{n,k} w^{n,k} y el vector w^{n,k} se forma como una combinación de la señal de mezclado descendente y la salida de los decorrelacionadores según se indica en la figura 12, cada fila de la matriz M_{2} corresponde a un canal de salida, y cada elemento en la fila específica, indica cuánto de la señal de mezclado descendente y de los diferentes decorrelacionadores deberían mezclarse para formar el canal específico de salida.
Como ejemplo, puede observarse la primera fila de la matriz M_{2} de mezclado.
17
El primer elemento de la primera fila en M_{2} corresponde a la contribución de la señal "m", y es la contribución a la salida dada por las salidas superiores del mezclador 0, 1 y 3 ascendente OTT. Dada la matriz anterior H, esto corresponde a H11_{0}, H11_{1}, y H11_{3}, debido a que la cantidad de la señal seca de la salida superior del bloque OTT es dada por el elemento H11 del mezclador ascendente OTT.
El segundo elemento corresponde a la contribución del decorrelacionador D1, que según lo anterior se dispone en el mezclador 0 ascendente OTT. Por lo tanto, la contribución de éste es H11_{0}, H11_{3} y H12_{0}. Esto es evidente, debido a que el elemento H12_{0} proporciona al decorrelacionador la salida del mezclador 0 ascendente OTT, y que la señal se pasa de forma subsiguiente a través de los mezcladores 1 y 3 ascendentes OTT, como parte de la señal seca, y por lo tanto la ganancia se ajusta según los elementos H11_{0} y H11_{3}.
De forma similar, el tercer elemento corresponde a la contribución del decorrelacionador D2, que según lo anterior se dispone en el mezclador 1 ascendente OTT. Por lo tanto, la contribución de éste es H12_{0} y H11_{3}.
El quinto elemento corresponde a la contribución del decorrelacionador D3, que según la notación anterior se dispone en el mezclador 3 ascendente OTT. Por lo tanto, la contribución de éste es H12_{3}.
El cuarto y el sexto elementos de la primera fila es de cero debido a que ninguna contribución del decorrelacionador D4 o D6 es parte del canal de salida que corresponde a la primera fila en la matriz.
El ejemplo anterior superficial, hace evidente que los elementos matriciales pueden deducirse como productos de los elementos de matriz de mezclador H ascendente OTT.
Con el fin de deducir la matriz M_{2} de mezclado para un árbol general, puede deducirse un enfoque similar al de la matriz M_{1}. En primer lugar, se deducen las siguientes variables auxiliares:
La matriz Tree, mantiene una columna para cada canal de salida, describiendo los índices de los mezcladores ascendentes OTT que debe pasar que la señal para alcanzar cada canal de salida.
\vskip1.000000\baselineskip
18
\vskip1.000000\baselineskip
La matriz Tree_{sign} mantiene un indicador para cada mezclador ascendente en el árbol para señalar si debe utilizarse la trayectoria (1) superior o (-1) inferior para alcanzar el canal de salida actual.
\vskip1.000000\baselineskip
19
\vskip1.000000\baselineskip
El vector Tree_{depth} mantiene el número de mezcladores ascendentes que deben pasarse para conseguir un canal específico de salida.
20
El vector Tree_{element} mantiene el número de mezcladores ascendentes en cada sub-árbol del árbol completo
21
Con la condición que la notación definida con anterioridad sea suficiente para describir todos los árboles que pueden señalizarse, puede definirse la matriz M_{2}. La matriz para un sub-árbol k, que crea los N canales de salida a partir de 1 canal de entrada, se define según:
\vskip1.000000\baselineskip
22
\vskip1.000000\baselineskip
23
\vskip1.000000\baselineskip
donde
\vskip1.000000\baselineskip
24
\vskip1.000000\baselineskip
en donde los elementos H se definen mediante los parámetros que corresponden al mezclador ascendente OTT con índice Tree(p,j).
A continuación, se supone un árbol más general que involucra mezcladores ascendentes TTT en el nivel de raíz, tal como por ejemplo, la estructura de decodificador de la figura 14. Los mezcladores ascendentes que contienen las dos variables M1_{i} y M2_{i} denotan los árboles OTT y por lo tanto, no contienen necesariamente mezcladores ascendentes OTT únicos. Además, al principio se supone que los mezcladores ascendentes TTT no emplean una señal decorrelacionada, es decir, la matriz TTT puede describirse como una matriz 3x2:
\vskip1.000000\baselineskip
25
\vskip1.000000\baselineskip
Según estas suposiciones y con el fin de deducir las matrices previa y de mezclado finales para el primer mezclador ascendente TTT, se deducen para cada árbol OTT dos conjuntos de matrices de mezclado previo, una que describe la combinación matricial previa para la primera señal de salida del mezclador ascendente TTT y otra que describe la combinación matricial previa para la segunda señal de salida del mezclador ascendente TTT. Después de la aplicación de ambos bloques de combinación matricial previa y de decorrelación, pueden sumarse las señales.
\newpage
Por lo tanto, las señales de salida pueden deducirse como lo siguiente:
26
Finalmente, en el caso de que el mezclador ascendente TTT pueda emplear la decorrelación, la contribución de la señal decorrelacionada puede agregarse en forma de un proceso posterior. Una vez que se ha deducido la señal decorrelacionada del mezclador ascendente TTT, la contribución a cada señal de salida es simplemente la contribución dada por el vector [M_{13}, M_{23}, M_{33}] expandido por las IDD de cada mezcladores ascendentes OTT siguiente.
La figura 15 ilustra un método de transmisión y recepción de una señal de audio según algunas realizaciones de la invención.
El método se inicia en la etapa 1501, en la que un transmisor recibe un número de canales de entrada de audio.
A la etapa 1501 la sigue la etapa 1503, en la que el transmisor codifica de forma paramétrica el número de canales de entrada de audio para generar el flujo de datos que comprende el número de canales de audio y datos paramétricos de audio.
A la etapa 1503 la sigue la etapa 1505, en la que se determina la estructura de decodificador jerárquica que corresponde a los medios de codificación jerárquica.
A la etapa 1505 la sigue la etapa 1507, en la que el transmisor incluye los datos de estructura de árbol de decodificador, que comprenden al menos un valor de datos indicativo de una característica de división de canal para un canal de audio, en una capa jerárquica de la estructura de decodificador jerárquica en el flujo de datos.
A la etapa 1507 la sigue la etapa 1509, en la que el transmisor envía el flujo de datos al receptor.
A la etapa 1509 la sigue la etapa 1511, en la que el receptor recibe el flujo de datos.
A la etapa 1511 la sigue la etapa 1513, en la que la estructura de decodificador jerárquica que utilizará el receptor se determina en respuesta a los datos de estructura de árbol de decodificador.
A la etapa 1513 la sigue la etapa 1515, en la que el receptor genera el número de canales de salida de audio a partir del flujo de datos, utilizando la estructura de decodificador jerárquica.
Se apreciará que, por motivos de claridad, la descripción anterior ha descrito las realizaciones de la invención con referencia a las diferentes unidades y procesadores funcionales. Sin embargo, será evidente que cualquier distribución adecuada de funcionalidad entre las diferentes unidades o procesadores funcionales puede utilizarse sin apartarse de la invención. Por ejemplo, la funcionalidad ilustrada, que se realizará a través de procesadores o controladores separados, puede efectuarse por el mismo procesador o controladores. Por lo tanto, las referencias a las unidades específicas funcionales sólo han de contemplarse como referencias a los medios adecuados que proporcionan la funcionalidad descrita más que indicativas de una estructura u organización física o lógica estricta.
La invención puede implementarse en cualquier forma adecuada que incluye hardware, software, firmware o cualquier combinación de éstos. De manera opcional, la invención puede implementarse, por lo menos parcialmente, como un software informático que se ejecuta en uno o más procesadores de datos y/o procesadores de señal digital. Los elementos y componentes de una realización de la invención pueden implementarse física, funcional y lógicamente, en cualquier forma adecuada. La funcionalidad puede, de hecho, implementarse en una unidad única, en una pluralidad de unidades o como parte de otras unidades funcionales. Como tal, la invención puede implementarse en una unidad única o puede estar distribuida física y funcionalmente entre diferentes unidades y procesadores.
Aunque la presente invención sidote ha descrito en conexión con algunas realizaciones, no se pretende que esté limitada a la forma específica señalada en la presente. Más bien, el alcance de la presente invención sólo está limitado por las reivindicaciones que la acompañan. Además, aunque puede parecer que una característica se describe en conexión con realizaciones particulares, un experto en la técnica reconocerá que pueden combinarse varias características de las realizaciones descritas según la invención. En las reivindicaciones, el término comprendiendo/que comprende no excluye la presencia de otros elementos o etapas.
Además, aunque se enumeran de forma individual, pueden implementarse una pluralidad de medios, elementos o etapas de método, por ejemplo, por medio de una unidad o procesador único. Además, aunque pueden incluirse características individuales en reivindicaciones diferentes, éstas pueden combinarse posiblemente de manera ventajosa, y la inclusión en reivindicaciones diferentes no implica que una combinación de características no sea factible ni/o ventajosa. También, la inclusión de una característica en una categoría de reivindicaciones no implica una limitación a esta categoría, sino que más bien indica que la característica es aplicable por igual a otras categorías de reivindicación, según proceda. Además, el orden de las características en las reivindicaciones no implica ningún orden específico en el que las características deben efectuarse y, en particular, el orden de las etapas individuales en una reivindicación de método no implica que las etapas deban realizarse en este orden. Más bien, las etapas pueden realizarse en cualquier orden adecuado. Además, las referencias en singular no excluyen una pluralidad. Por lo tanto, las referencias a "un", "una", "primero", "segundo", etc., no impiden una pluralidad. Los signos de referencia en las reivindicaciones se proporcionan simplemente como ejemplo aclarativo que no debe interpretarse como limitativo en modo alguno del alcance de las reivindicaciones.

Claims (36)

1. Aparato para generar un número de canales de salida de audio; comprendiendo el aparato:
\quad
medios para recibir (401) un flujo de datos que comprende un número de canales de entrada de audio, siendo el número uno o mayor que uno, y datos paramétricos de audio que describen propiedades espaciales; comprendiendo además el flujo de datos datos de estructura de árbol de decodificador para una estructura de decodificador jerárquica, comprendiendo los datos de estructura de árbol de decodificador al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica;
\quad
medios para generar (405) la estructura de decodificador jerárquica en respuesta a los datos de estructura de árbol de decodificador; y
\quad
medios para generar (403) el número de canales de salida de audio a partir del flujo de datos utilizando la estructura de decodificador jerárquica.
2. Aparato según la reivindicación 1, en el que los datos de estructura de árbol de decodificador comprenden una pluralidad de valores de datos, siendo cada valor de datos indicativo de una característica de división de canal para un canal en una capa jerárquica de la estructura de decodificador jerárquica.
3. Aparato según la reivindicación 2, en el que un valor predeterminado de datos es indicativo de la falta de división de canal para el canal en la capa jerárquica.
4. Aparato según la reivindicación 2, en el que un valor predeterminado de datos es indicativo de una división de canal de uno-a-dos para el canal en la capa jerárquica.
5. Aparato según la reivindicación 2, en el que la pluralidad de valores de datos son valores de datos binarios.
6. Aparato según la reivindicación 5, en el que un valor de datos binarios predeterminado es indicativo de una división de canal de uno-a-dos y otro valor de datos binarios predeterminado es indicativo de la falta de división de canal.
7. Aparato según la reivindicación 1, en el que el flujo de datos comprende además una indicación del número de canales de entrada.
8. Aparato según la reivindicación 1, en el que el flujo de datos comprende además una indicación del número de canales de salida.
9. Aparato según la reivindicación 1, en el que el flujo de datos comprende además una indicación de un número de funciones de división de canal de uno-a-dos en la estructura de decodificador jerárquica.
10. Aparato según la reivindicación 1, en el que el flujo de datos comprende además una indicación de un número de funciones de división de canal de dos-a-tres en la estructura de decodificador jerárquica.
11. Aparato según la reivindicación 1, en el que los datos de estructura de árbol de decodificador comprenden unos datos para una pluralidad de estructuras de árbol de decodificador ordenadas en respuesta a la presencia de una funcionalidad de división de canal de dos-a-tres.
12. Aparato según la reivindicación 1, en el que los datos de estructura de árbol de decodificador para al menos un canal de entrada comprenden una indicación de una función de división de canal de dos-a-tres que está presente en la capa raíz seguida por datos binarios, en el que cada valor de datos binarios es indicativo o bien de una falta de funcionalidad de división o una funcionalidad de división de canal de uno-a-dos para las capas dependientes de la funcionalidad de división de dos-a-tres.
13. Aparato según la reivindicación 1, en el que el flujo de datos comprende además una indicación de una posición de altavoz para al menos uno de los canales de salida.
14. Aparato según la reivindicación 1, en el que los medios para generar (405) la estructura de decodificador jerárquica se disponen para determinar parámetros de multiplicación para las funciones de división de canal de las capas jerárquicas en respuesta a los datos de estructura de árbol de decodificador.
15. Aparato según la reivindicación 1, en el que la estructura de árbol de decodificador comprende al menos una funcionalidad de división de canal en al menos una capa jerárquica, comprendiendo la al menos una funcionalidad de división de canal:
\quad
medios de decorrelación para generar una señal decorrelacionada directamente a partir de un canal de entrada de audio del flujo de datos; al menos una unidad de división de canal para generar una pluralidad de canales de salida de capa jerárquica a partir de un canal de audio de una capa jerárquica más alta y la señal decorrelacionada; y medios para determinar al menos una característica del filtro de decorrelación o la unidad de división de canal en respuesta a los datos de estructura de árbol de decodificador.
16. Aparato según la reivindicación 15, en el que los medios de decorrelación comprenden unos medios de compensación de nivel para realizar una compensación de nivel de audio en el canal de entrada de audio para generar una señal de audio compensada en nivel; y un filtro de decorrelación para filtrar la señal de audio compensada en nivel para generar la señal decorrelacionada.
17. Aparato según la reivindicación 16, en el que los medios de compensación de nivel comprenden una multiplicación matricial por una matriz previa.
18. Aparato según la reivindicación 17, en el que los coeficientes de la matriz previa tienen al menos un valor unidad para una estructura de decodificador jerárquica que comprende sólo una funcionalidad de división de canal de uno-a-dos.
19. Aparato según la reivindicación 17, que además comprende medios para determinar la matriz previa para la al menos una funcionalidad de división de canal en la al menos una capa jerárquica en respuesta a parámetros de una funcionalidad de división de canal en una capa jerárquica más alta.
20. Aparato según la reivindicación 17, en el que el aparato comprende medios para determinar una matriz de división de canal para la al menos una funcionalidad de división de canal en respuesta a parámetros de la al menos una funcionalidad de división de canal en la al menos una capa jerárquica.
21. Aparato según la reivindicación 17, que además comprende medios para determinar la matriz previa para la al menos una funcionalidad de división de canal en la al menos una capa jerárquica en respuesta a parámetros de una funcionalidad de división de canal de dos-a-tres de una capa jerárquica más alta.
22. Aparato según la reivindicación 21, en el que los medios para determinar la matriz previa se disponen para determinar la matriz previa para la al menos una funcionalidad de división de canal en respuesta a determinar una primera sub-matriz previa que corresponde a una primera entrada del mezclador ascendente de dos-a-tres y una segunda sub-matriz previa que corresponde a una segunda entrada de un mezclador ascendente de dos-a-tres.
23. Aparato para generar un flujo de datos que comprende un número de canales de salida de audio, siendo el número uno o mayor que uno, comprendiendo el aparato:
\quad
medios para recibir (301) un número de canales de entrada de audio;
\quad
medios (303) de codificación jerárquica para codificar de forma paramétrica el número de canales de entrada de audio para generar el flujo de datos que comprende el número de canales de salida de audio y datos paramétricos de audio que describen propiedades espaciales;
\quad
medios para determinar (305) una estructura de decodificador jerárquica que corresponde a los medios de codificación jerárquica; y
\quad
medios para incluir (307) datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica en el flujo de datos.
24. Flujo de datos que comprende:
\quad
un número de canales codificados de audio, siendo el número uno o mayor que uno;
\quad
datos paramétricos de audio que describen propiedades espaciales; y
\quad
datos de estructura de árbol de decodificador para una estructura de decodificador jerárquica, comprendiendo los datos de estructura de árbol de decodificador al menos un valor de datos indicativo de características de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica.
25. Medio de almacenamiento que tiene almacenado en el mismo una señal según la reivindicación 24.
26. Método de generación de un número de canales de salida de audio; comprendiendo el método:
\quad
recibir un flujo (1511) de datos que comprende un número de canales de entrada de audio, siendo el número uno o mayor que uno, y datos paramétricos de audio que describen propiedades espaciales; comprendiendo además el flujo de datos los datos de estructura de árbol de decodificador para una estructura de decodificador jerárquica, comprendiendo los datos de estructura de árbol de decodificador al menos un valor de datos indicativo de características de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica;
\quad
generar la estructura (1513) de decodificador jerárquica en respuesta a los datos de estructura de árbol de decodificador; y
\quad
generar el número de canales (1515) de salida de audio a partir del flujo de datos utilizando la estructura de decodificador jerárquica.
27. Método de generación de un flujo de datos que comprende un número de canales de salida de audio, siendo el número uno o mayor que uno, comprendiendo el método:
\quad
recibir (1501) un número de canales de entrada de audio;
\quad
codificar (1503) de forma paramétrica el número de canales de entrada de audio para generar el flujo de datos que comprende el número de canales de salida de audio y datos paramétricos de audio que describen propiedades espaciales;
\quad
determinar una estructura (1505) de decodificador jerárquica que corresponde a los medios de codificación jerárquica; e
\quad
incluir datos (1507) de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en una capa jerárquica de la estructura de decodificador jerárquica en el flujo de datos.
28. Receptor (103) para generar un número de canales de salida de audio; comprendiendo el receptor (103) un aparato según la reivindicación 1.
29. Transmisor (101) para generar un flujo de datos que comprende un número de canales de salida de audio, comprendiendo el transmisor un aparato según la reivindicación 23.
30. Sistema de transmisión que comprende un transmisor (101) según la reivindicación 29 y un receptor (103) según la reivindicación 28.
31. Método de recepción de un flujo de datos, comprendiendo el método un método según la reivindicación 26.
32. Método de transmisión de un flujo de datos que comprende un número de canales de salida de audio, comprendiendo el método un método según la reivindicación 27.
33. Método de transmisión y recepción de un flujo de datos, comprendiendo el método:
\quad
realizar en un transmisor (101) el método según la reivindicación 32; y
\quad
realizar en un receptor (103) el método según la reivindicación 31.
34. Producto de programa informático adaptado para ejecutar el método según cualquiera de las reivindicaciones 26, 27, 31, 32 y 33.
35. Dispositivo de reproducción de audio que comprende un aparato según la reivindicación 1.
36. Dispositivo de grabación de audio que comprende un aparato según la reivindicación 23.
ES06766049T 2005-07-14 2006-07-07 Codificacion y decodificacion de audio. Active ES2327158T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05106466 2005-07-14
EP05106466 2005-07-14

Publications (1)

Publication Number Publication Date
ES2327158T3 true ES2327158T3 (es) 2009-10-26

Family

ID=37467582

Family Applications (2)

Application Number Title Priority Date Filing Date
ES09005485T Active ES2374309T3 (es) 2005-07-14 2006-07-07 Decodificación de audio.
ES06766049T Active ES2327158T3 (es) 2005-07-14 2006-07-07 Codificacion y decodificacion de audio.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES09005485T Active ES2374309T3 (es) 2005-07-14 2006-07-07 Decodificación de audio.

Country Status (14)

Country Link
US (1) US7966191B2 (es)
EP (2) EP1902443B1 (es)
JP (2) JP5097702B2 (es)
KR (2) KR101496193B1 (es)
CN (2) CN101223575B (es)
AT (2) ATE433182T1 (es)
BR (1) BRPI0613469A2 (es)
DE (1) DE602006007139D1 (es)
ES (2) ES2374309T3 (es)
HK (1) HK1154984A1 (es)
MX (1) MX2008000504A (es)
PL (2) PL1902443T3 (es)
RU (2) RU2418385C2 (es)
WO (1) WO2007007263A2 (es)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE433182T1 (de) * 2005-07-14 2009-06-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
US7706905B2 (en) * 2005-07-29 2010-04-27 Lg Electronics Inc. Method for processing audio signal
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
CN101361122B (zh) 2006-04-03 2012-12-19 Lg电子株式会社 处理媒体信号的装置及其方法
MX2009007412A (es) * 2007-01-10 2009-07-17 Koninkl Philips Electronics Nv Decodificador de audio.
US20100241434A1 (en) * 2007-02-20 2010-09-23 Kojiro Ono Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit
KR101100213B1 (ko) * 2007-03-16 2011-12-28 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
CN102968994B (zh) * 2007-10-22 2015-07-15 韩国电子通信研究院 多对象音频解码方法和设备
EP4293665A3 (en) * 2008-10-29 2024-01-10 Dolby International AB Signal clipping protection using pre-existing audio gain metadata
KR20110022251A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
WO2011048099A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
WO2011073201A2 (en) * 2009-12-16 2011-06-23 Dolby International Ab Sbr bitstream parameter downmix
CN102142924B (zh) * 2010-02-03 2014-04-09 中兴通讯股份有限公司 一种多用途语音频编码传输方法和装置
SG193237A1 (en) 2011-03-28 2013-10-30 Dolby Lab Licensing Corp Reduced complexity transform for a low-frequency-effects channel
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
EP2956935B1 (en) * 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
US9818412B2 (en) 2013-05-24 2017-11-14 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
TWI634547B (zh) * 2013-09-12 2018-09-01 瑞典商杜比國際公司 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品
KR102244379B1 (ko) * 2013-10-21 2021-04-26 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
CN105637581B (zh) 2013-10-21 2019-09-20 杜比国际公司 用于音频信号的参数重建的去相关器结构
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
EP3540732B1 (en) * 2014-10-31 2023-07-26 Dolby International AB Parametric decoding of multichannel audio signals
RU2019138260A (ru) * 2015-06-24 2019-12-05 Сони Корпорейшн Устройство, способ и программа аудиообработки
US10416954B2 (en) 2017-04-28 2019-09-17 Microsoft Technology Licensing, Llc Streaming of augmented/virtual reality spatial audio/video

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3298478B2 (ja) * 1997-11-10 2002-07-02 日本電気株式会社 Mpeg復号装置
JPH11330980A (ja) * 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
JP2001268697A (ja) * 2000-03-22 2001-09-28 Sony Corp データ伝送システム、データ伝送装置、データ伝送方法
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US6996523B1 (en) * 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1500084B1 (en) * 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
AU2003244932A1 (en) * 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
US7613306B2 (en) * 2004-02-25 2009-11-03 Panasonic Corporation Audio encoder and audio decoder
KR101183862B1 (ko) * 2004-04-05 2012-09-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템
ATE403217T1 (de) * 2004-04-28 2008-08-15 Matsushita Electric Ind Co Ltd Hierarchische kodierungsanordnung und hierarchisches kodierungsverfahren
ATE433182T1 (de) * 2005-07-14 2009-06-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
JP5321820B2 (ja) * 2009-04-23 2013-10-23 セイコーエプソン株式会社 用紙搬送装置

Also Published As

Publication number Publication date
KR20100134084A (ko) 2010-12-22
JP2011059711A (ja) 2011-03-24
MX2008000504A (es) 2008-03-07
DE602006007139D1 (de) 2009-07-16
CN102013256A (zh) 2011-04-13
CN102013256B (zh) 2013-12-18
ATE433182T1 (de) 2009-06-15
ATE523877T1 (de) 2011-09-15
PL2088580T3 (pl) 2012-07-31
PL1902443T3 (pl) 2009-12-31
RU2010137467A (ru) 2012-03-20
EP2088580A2 (en) 2009-08-12
RU2008105556A (ru) 2009-08-20
CN101223575B (zh) 2011-09-21
KR20080037672A (ko) 2008-04-30
KR101492826B1 (ko) 2015-02-13
EP2088580A3 (en) 2009-08-19
RU2461078C2 (ru) 2012-09-10
KR101496193B1 (ko) 2015-02-26
JP2009501354A (ja) 2009-01-15
JP5269039B2 (ja) 2013-08-21
EP1902443A2 (en) 2008-03-26
EP2088580B1 (en) 2011-09-07
CN101223575A (zh) 2008-07-16
RU2418385C2 (ru) 2011-05-10
BRPI0613469A2 (pt) 2012-11-06
HK1154984A1 (en) 2012-05-04
EP1902443B1 (en) 2009-06-03
JP5097702B2 (ja) 2012-12-12
US20080255856A1 (en) 2008-10-16
ES2374309T3 (es) 2012-02-15
WO2007007263A3 (en) 2007-03-29
WO2007007263A2 (en) 2007-01-18
US7966191B2 (en) 2011-06-21

Similar Documents

Publication Publication Date Title
ES2327158T3 (es) Codificacion y decodificacion de audio.
US20200304913A1 (en) Audio decoder for audio channel reconstruction
ES2609449T3 (es) Decodificación de audio
ES2339888T3 (es) Codificacion y decodificacion de audio.
ES2312025T3 (es) Esquema de codificador/descodificador de multicanal casi transparente o transparente.
ES2278348T3 (es) Codificacion/decodificacion multicanal compatible.
ES2376889T3 (es) Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal
ES2636808T3 (es) Codificación de escenas de audio
ES2587999T3 (es) Procedimiento, aparato y soporte de registro legible por ordenador para decodificar una señal de audio multicanal
ES2899286T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
ES2306076T3 (es) Aparato y metodo para construir una señal de salida multicanal o para generar una señal de downmix.
ES2649194T3 (es) Decodificador de audio, codificador de audio, procedimiento para proporcionar al menos cuatro señales de canales de audio sobre la base de una representación codificada, procedimiento para proporcionar una representación codificada sobre la base de al menos cuatro señales de canales de audio y programa informático que utiliza una extensión de ancho de banda
CN101406073B (zh) 用于多声道音频重构中的信号成形的增强的方法
ES2313646T3 (es) Codificacion y descodificacion de audio.
ES2426917T3 (es) Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado
ES2496571T3 (es) Método y aparato para procesar una señal de medios
ES2709117T3 (es) Codificador y decodificador de audio
US8626503B2 (en) Audio encoding and decoding
ES2624668T3 (es) Codificación y descodificación de objetos de audio
BR112017006278B1 (pt) Método para aprimorar o diálogo num decodificador em um sistema de áudio e decodificador
MX2008010631A (es) Codificacion y decodificacion de audio