ES2387574T3 - Método y aparato para decodificar una señal de audio - Google Patents
Método y aparato para decodificar una señal de audio Download PDFInfo
- Publication number
- ES2387574T3 ES2387574T3 ES06757755T ES06757755T ES2387574T3 ES 2387574 T3 ES2387574 T3 ES 2387574T3 ES 06757755 T ES06757755 T ES 06757755T ES 06757755 T ES06757755 T ES 06757755T ES 2387574 T3 ES2387574 T3 ES 2387574T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- information
- audio signal
- header
- spatial information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Stereophonic System (AREA)
- Error Detection And Correction (AREA)
Abstract
Método de decodificación de una señal de audio, que comprende:recibir (S501) una señal de audio que incluye una señal de submezcla, una señal de información espacialclasificada en un caso que incluye un encabezamiento e información espacial y un caso que incluye solamente lainformación espacial sin el encabezamiento, y un descriptor de audio,reconocer que la señal de audio incluye la señal de submezcla y la señal de información espacial usando eldescriptor de audio; yobtener (S503), a partir de la señal de audio, información de identificación de encabezamiento que indica si unatrama de la señal de información espacial incluye o no el encabezamiento;si la información de identificación de encabezamiento indica que la trama de la señal de información espacialincluye el encabezamiento:- extraer (S505) información de configuración a partir del encabezamiento, estando incluida por lo menos unainformación de alineación temporal en la información de configuración;- decodificar (S507) la información espacial a partir de la señal de información espacial usando la informaciónde configuración extraída;- discriminar una diferencia de retardo de tiempo entre dos señales en la generación de una señal multicanalusando la señal de submezcla y la señal de información espacial basándose en la información de alineacióntemporal incluida en la información de configuración extraída; y- convertir la señal de submezcla en la señal multicanal usando la información de configuración y lainformación espacial.
Description
Método y aparato para decodificar una señal de audio.
La presente invención se refiere al procesado de una señal de audio, y más particularmente, a un aparato para codificar y decodificar una señal de audio y a un método correspondiente.
En general, un aparato de codificación de señales de audio comprime una señal de audio en una señal de submezcla de tipo monofónico o estereofónico, en lugar de comprimir cada uno de los canales de una señal de audio multicanal. El aparato de codificación de señales de audio transfiere la señal de submezcla comprimida a un aparato de codificación junto con una señal de información espacial (o, señal de datos auxiliar) o almacena la señal de submezcla comprimida y la señal de información espacial en un soporte de almacenamiento.
En este caso, la señal de información espacial, que se extrae en el submezclado de una señal de audio multicanal, se usa en la restauración de una señal de audio multicanal original a partir de una señal de submezcla comprimida.
La señal de información espacial incluye un encabezamiento e información espacial. Además, en el encabezamiento se incluye información de configuración. El encabezamiento es la información para interpretar la información espacial.
Un aparato de decodificación de señales de audio decodifica la información espacial usando la información de configuración incluida en el encabezamiento. La información de configuración, que está incluida en el encabezamiento, se transfiere a un aparato de decodificación o se almacena en un soporte de almacenamiento junto con la información espacial.
Un aparato de codificación de señales de audio multiplexa una señal de submezcla codificada y la señal de información espacial juntas en forma de un flujo continuo de bits, y a continuación transfiere la señal multiplexada a un aparato de codificación. Puesto que en general la información de configuración es invariable, un encabezamiento que incluye información de configuración se inserta una vez en un flujo continuo de bits. Puesto que la información de configuración se transmite insertándola inicialmente una vez en una señal de audio, un aparato de decodificación de señales de audio padece un problema en la decodificación de la información espacial debido a la no existencia de información de configuración en caso de que la señal de audio se reproduzca a partir de un punto de temporización aleatorio. A saber, puesto que una señal de audio se reproduce a partir de un punto de temporización específico solicitado por un usuario, en lugar de reproducirse desde una parte inicial en el caso de una emisión de radiodifusión, VOD (vídeo bajo demanda) o similar, no se puede usar la información de configuración que se transfiere al ser incluida en una señal de audio. Por lo tanto, no se puede decodificar la información espacial.
“Der MPEG-2-Standard: Generische Codierung für Bewegtbilder und zugehörige Audio-Information, Audio-Codierung” (Teil 4), Schröder E F et al, Fernseh -und Kino -Technik, vol. 48, nº 7/08, 30 de agosto de 1994, páginas 364 a 368, y 370 a 373, da a conocer el uso de encabezamientos que incluyen información espacial los cuales se incorporan en una capa multicanal de mejora.
Se puede considerar que “Proposed changes in MPEG-4 BSAC multi-channel audio coding”, Eunmi L. Oh et al., ISO/IEC JTC1/SC29/WG11 MPEG2004/M11018, 19 de Julio de 2004, páginas 1 a 7, da a conocer una técnica referente al multicanal BSAC, que conlleva modificaciones de sintaxis que mejorarían el multicanal BSAC proporcionando compatibilidad retroactiva.
Se puede considerar que “Low complexity parametric stereo coding”, Schuijers E. et al., CONVENTION OF THE AUDIO ENGINEERING SOCIETY, 8 de Mayo de 2004, páginas 1 a 11, da a conocer una técnica de codificación estereofónica paramétrica para codificar eficazmente una señal de audio estereofónica en forma de una señal monoaural más una pequeña cantidad de parámetros estereofónicos. La señal monoaural se puede codificar usando cualquier codificador de audio. Los parámetros estereofónicos se pueden integrar en la parte auxiliar del flujo continuo de bits monofónico creando una compatibilidad monofónica retroactiva. En el decodificador, en primer lugar se decodifica la señal monoaural tras lo cual se reconstruye la señal estereofónica a partir de los parámetros estereofónicos.
Se proporcionan un método y un aparato según las reivindicaciones independientes.
En las reivindicaciones dependientes se exponen evoluciones.
Es un objetivo de la presente invención proporcionar un método y un aparato para decodificar una señal de audio, que permite decodificar la señal de audio, incluso si la señal de audio se reproduce a partir de un punto aleatorio por medio del aparato de decodificación de señales de audio, haciendo que el encabezamiento se incluya selectivamente en una trama en la señal de información espacial.
Preferentemente, un método de decodificación de una señal de audio incluye preferentemente recibir una señal de audio que incluye un descriptor de audio, reconocer que la señal de audio incluye una señal de submezcla y una señal de información espacial usando el descriptor de audio, y convertir la señal de submezcla en una señal multicanal usando la señal de información espacial, en donde la señal de información espacial incluye un encabezamiento por cada intervalo temporal o espacial prestablecido.
La figura 1 es un diagrama de configuración de una señal de audio de acuerdo con una forma de realización de la presente invención.
La figura 2 es un diagrama de configuración de una señal de audio de acuerdo con otra forma de realización de la presente invención.
La figura 3 es un diagrama de bloques de un aparato para decodificar una señal de audio de acuerdo con una forma de realización de la presente invención.
La figura 4 es un diagrama de bloques de un aparato para decodificar una señal de audio de acuerdo con otra forma de realización de la presente invención.
La figura 5 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización de la presente invención.
La figura 6 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con otra forma de realización de la presente invención.
La figura 7 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización adicional de la presente invención.
La figura 8 es un diagrama de flujo de un método de obtención de una cantidad que representa información de posición de acuerdo con una forma de realización de la presente invención.
La figura 9 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con otra forma de realización adicional de la presente invención.
A continuación se hará referencia detalladamente a las formas de realización preferidas de la presente invención, cuyos ejemplos se ilustran en los dibujos adjuntos.
Para entender la presente invención, se explican un aparato y un método de codificación de una señal de audio antes que un aparato y un método de decodificación de una señal de audio. Sin embargo, el aparato y el método de decodificación según la presente invención no se limitan al aparato y el método de codificación siguientes. Además, la presente invención es aplicable a un esquema de codificación de audio para generar un multicanal usando información espacial así como MP3 (MPEG 1/2 capa III) y AAC (codificación de audio avanzada).
La figura 1 es un diagrama de configuración de una señal de audio transferida a un aparato de decodificación de señales de audio desde un aparato de codificación de señales de audio, de acuerdo con una forma de realización de la presente invención.
En referencia a la figura 1, una señal de audio incluye un descriptor de audio 101, una señal de sub-mezcla 103 y una señal de información espacial 105.
En caso de usar un esquema de codificación para reproducir una señal de audio para radiodifusión o similar, la señal de audio puede incluir datos auxiliares así como el descriptor de audio 101 y la señal de submezcla 103. La presente invención puede incluir la señal de información espacial 105 en calidad de datos auxiliares. Para que un aparato de decodificación de señales de audio tenga conocimiento de información básica del códec de audio sin analizar la señal de audio, la señal de audio puede incluir selectivamente el descriptor de audio 101. El descriptor de audio 101 está compuesto por un número reducido de informaciones básicas necesarias para la decodificación de audio, tales como una velocidad de transmisión de una señal de audio transmitida, un número de canales, una frecuencia de muestreo de datos comprimidos, un identificador que indica un códec usado actualmente y similares.
Un aparato de decodificación de señales de audio puede tener conocimiento de un tipo de un códec usado por una señal de audio usando el descriptor de audio 101. En particular, usando el descriptor de audio 101, el aparato de decodificación de señales de audio puede saber si una señal de audio recibida es la señal que restaura un multicanal usando la señal de información espacial 105 y la señal de submezcla 103. En este caso, el multicanal puede incluir un sonido envolvente tri-dimensional virtual así como un multicanal real. Por medio de la tecnología de sonido envolvente tri-dimensional virtual, se consigue que una señal de audio que tiene la señal de información espacial 105 y la señal de submezcla 103 combinadas entre sí resulte audible a través de uno o dos canales.
El descriptor de audio 101 se ubica independientemente con respecto a la señal de submezcla o la de información espacial 103 ó 105 incluida en la señal de audio. Por ejemplo, el descriptor de audio 101 se ubica dentro de un campo independiente que indica una señal de audio.
En el caso de que no se proporcione un encabezamiento para la señal de submezcla 103, el aparato de decodificación de señales de audio puede decodificar la señal de submezcla 103 usando el descriptor de audio 101.
La señal de submezcla 103 es una señal generada a partir del submezclado de un multicanal. La señal de submezcla 103 se puede generar a partir de una unidad submezcladora (no mostrada en el dibujo) incluida en un aparato de decodificación de señales de audio (no mostrado en el dibujo) o se puede generar de manera artificial.
La señal de submezcla 103 se puede clasificar en un caso que incluya la señal de información espacial 105 y un caso que no incluya el encabezamiento.
En caso de que la señal de submezcla 103 incluya el encabezamiento, el encabezamiento se incluye en cada trama por medio de una unidad de tramas. En caso de que la señal de submezcla 103 no incluya el encabezamiento, tal como se ha mencionado en la descripción anterior, la señal de submezcla 103 se puede decodificar usando el descriptor de audio 101 por medio de un aparato de decodificación de señales de audio. La señal de submezcla 103 adopta o bien una forma que incluye el encabezamiento para cada trama o bien una forma que no incluye el encabezamiento. Además, la señal de submezcla 103 se incluye en una señal de audio de una misma manera hasta el fin del contenido.
La señal de información espacial 105 se clasifica también en un caso que incluye el encabezamiento e información espacial y un caso que incluye la información espacial únicamente sin incluir el encabezamiento. El encabezamiento de la señal de información espacial 105 difiere con respecto al de la señal de submezcla 103 en que no es necesario insertarlo en cada trama de manera idéntica. En particular, la señal de información espacial 105 puede usar juntas una trama que incluya el encabezamiento y una trama que no incluya el encabezamiento. La mayoría de la información incluida en el encabezamiento de la señal de información espacial 105 es información de configuración que decodifica la información espacial mediante interpretación de la información espacial.
La figura 2 es un diagrama de configuración de una señal de audio transferida a un aparato de decodificación de señales de audio desde un aparato de decodificación de señales de audio de acuerdo con otra forma de realización de la presente invención.
En referencia a la figura 2, una señal de audio incluye la señal de submezcla 103 y la señal de información espacial
105. Además, la señal de audio existe en forma de un ES (flujo continuo elemental) en el que están dispuestas las tramas.
Cada una de entre la señal de submezcla 103 y la señal de información espacial 105 se transfiere ocasionalmente en forma de un ES independiente hacia un aparato de decodificación de señales de audio. Además, la señal de submezcla 103 y la señal de información espacial 105, tal como se muestra en la figura 2, se pueden combinar en forma de un ES para ser transferidas al aparato de decodificación de señales de audio.
En caso de que la señal de submezcla 103 y la señal de información espacial 105, que se combinan en forma de un ES, se transfieran al aparato de decodificación de señales de audio, la señal de información espacial 105 se puede incluir en una posición de datos auxiliares (datos auxiliares) o datos adicionales (ampliación de datos) de la señal de submezcla 103.
Además, la señal de audio puede incluir información de identificación de señal que indica si la señal de información espacial 105 está combinada con la señal de submezcla 103.
Una trama de la señal de información espacial 105 se puede clasificar en un caso en el que incluye el encabezamiento 201 y la información espacial 203 y un caso en el que incluye solamente la información espacial
203. En particular, la señal de información espacial 105 puede usar juntas una trama que incluya el encabezamiento 201 y una trama que no incluya el encabezamiento 201.
En la presente invención, el encabezamiento 201 se inserta en la señal de información espacial 105 por lo menos una vez. En particular, un aparato de codificación de señales de audio puede insertar el encabezamiento 201 en cada trama en la señal de información espacial 105, insertar periódicamente el encabezamiento 201 en cada intervalo fijo de tramas en la señal de información espacial 105 ó insertar de manera no periódica el encabezamiento 201 en cada intervalo aleatorio de tramas en la señal de información espacial 105.
La señal de audio puede incluir información (denominada en lo sucesivo, en la presente, “información de identificación de encabezamiento”) que indiquen si el encabezamiento 201 está incluido en una trama 201.
En caso de que el encabezamiento 201 esté incluido en la señal de información espacial 105, el aparato de decodificación de señales de audio extrae la información de configuración 205 del encabezamiento 201, y a continuación decodifica la información espacial 203 transferida después (detrás) del encabezamiento 201 de acuerdo con la información de configuración 205. Puesto que el encabezamiento 201 es información para decodificar mediante la interpretación de la información espacial 203, el encabezamiento 201 se transfiere en la primera fase de transferencia de la señal de audio.
En caso de que el encabezamiento 201 no esté incluido en la señal de información espacial 105, el aparato de decodificación de señales de audio decodifica la información espacial 203 usando el encabezamiento 201 transferido en la primera fase.
En caso de que el encabezamiento 201 se pierda, mientras que la señal de audio se transfiere al aparato de decodificación de señales de audio desde el aparato de codificación de señales de audio o en caso de que la señal de audio transferida en un formato de flujo continuo se decodifique desde su parte de en medio para ser usada para radiodifusión o similares, no se puede usar el encabezamiento 201 que se transfirió previamente. En este caso, el aparato de decodificación de señales de audio extrae la información de configuración 205 del encabezamiento 201 diferente del primer encabezamiento 201 insertado en primer lugar en la señal de audio, y a continuación puede decodificar la señal de audio usando la información de configuración extraída 205. En este caso, la información de configuración 205 extraída del encabezamiento 201 insertado en la señal de audio puede ser idéntica a la primera información de configuración 205 extraída del encabezamiento 201 que se había transferido en la primera fase o puede no serlo.
Si el encabezamiento 201 es variable, la información de configuración 205 se extrae de un nuevo encabezamiento 201, la información de configuración extraída 205 se decodifica y a continuación se decodifica la información espacial 203 detrás del encabezamiento 201. Si el encabezamiento 201 es invariable, se decide si el encabezamiento nuevo 201 es idéntico al encabezamiento antiguo 201 que se transfirió previamente. Si estos dos encabezamientos 201 son diferentes entre sí, puede detectarse que se produce un error en una señal de audio sobre un trayecto de transferencia de la señal de audio.
La información de configuración 205 extraída del encabezamiento 201 de la señal de información espacial 105 es la información para interpretar la información espacial 203.
La señal de información espacial 105 puede incluir información (denominada en lo sucesivo en la presente “información de alineación temporal”) para discriminar una diferencia de retardo de tiempo entre dos señales en la generación de un multicanal usando la señal de submezcla 103 y la señal de información espacial 105 por parte del aparato de decodificación de señales de audio.
Una señal de audio transferida al aparato de decodificación de señales de audio desde el aparato de codificación de señales de audio es analizada sintácticamente por una unidad de demultiplexado (no mostrada en el dibujo) y a continuación la misma se separa en la señal de submezcla 103 y la señal de información espacial 105.
La señal de submezcla 103 separada por la unidad de demultiplexado se decodifica. Una señal de submezcla decodificada 103 genera un multicanal usando la señal de información espacial 105. En la generación del multicanal mediante la combinación de la señal de submezcla 103 y la señal de información espacial 105, el aparato de decodificación de señales de audio puede ajustar la sincronización entre dos señales, una posición de un punto de inicio de combinación de dos señales y similares, usando la información de alineación temporal (no mostrada en el dibujo) incluida en la información de configuración 205 extraída a partir del encabezamiento 201 de la señal de información espacial 105.
La información de posición 207 de un espacio de tiempo al cual se aplicará un parámetro se incluye en la información espacial 203 incluida en la señal de información espacial 105. Como parámetro espacial (indicio espacial), existen CLD (diferencias de nivel de canal) que indican una diferencia de energía entre señales de audio, ICC (correlaciones entre canales) que indican la proximidad o similitud entre señales de audio, CPC (coeficiente de predicción de canales) que indican un coeficiente que predice un valor de una señal de audio usando otras señales. En lo sucesivo en la presente, a cada indicio espacial o grupo de indicios espaciales se le denominará “parámetro”.
En caso de que existan N parámetros en una trama incluida en la señal de información espacial 105, los N parámetros se aplican a posiciones de espacio de tiempo específicas de tramas, respectivamente. Si a la información que indica que se aplicará un parámetro a uno determinado de los espacios de tiempo incluidos en una trama se le denomina información de posición 207 del espacio de tiempo, el aparato de decodificación de señales de audio decodifica la información espacial 203 usando la información de posición 207 del espacio de tiempo en el cual se aplicará el parámetro. En este caso, el parámetro se incluye en la información espacial 203.
La figura 3 es un diagrama de bloques esquemático de un aparato para decodificar una señal de audio de acuerdo con una forma de realización de la presente invención.
En referencia a la figura 3, un aparato para decodificar una señal de audio de acuerdo con una forma de realización de la presente invención incluye una unidad de recepción 301 y una unidad de extracción 303.
La unidad de recepción 301 del aparato de decodificación de señales de audio recibe una señal de audio transferida en forma de un ES por un aparato de codificación de señales de audio a través de un terminal de entrada ENTRADA1.
La señal de audio recibida por el aparato de decodificación de señales de audio incluye un descriptor de audio 101 y la señal de submezcla 103 que puede incluir además la señal de información espacial 105 como datos auxiliares (datos auxiliares) o datos adicionales (ampliación de datos).
La unidad de extracción 303 del aparato de decodificación de señales de audio extrae la información de configuración 205 del encabezamiento 201 incluido en la señal de audio recibida, y a continuación da salida a la información de configuración extraída 205 a través de un terminal de salida SALIDA1.
La señal de audio puede incluir la información de identificación de encabezamiento para identificar si el encabezamiento 201 está incluido en una trama.
El aparato de decodificación de señales de audio identifica si el encabezamiento 201 está incluido en la trama usando la información de identificación de encabezamiento incluida en la señal de audio. Si el encabezamiento 201 está incluido, el aparato de decodificación de señales de audio extrae la información de configuración 205 a partir del encabezamiento 201. En la presente invención, en la señal de información espacial 105 se incluye por lo menos un encabezamiento 201.
La figura 4 es un diagrama de bloques de un aparato para decodificar una señal de audio de acuerdo con otra forma de realización de la presente invención.
En referencia a la figura 4, un aparato para decodificar una señal de audio de acuerdo con otra forma de realización de la presente invención incluye la unidad de recepción 301, la unidad de demultiplexado 401, una unidad de decodificación central 403, una unidad de generación multicanal 405, una unidad de decodificación de información espacial 407 y la unidad de extracción 303.
La unidad de recepción 301 del aparato de decodificación de señales de audio recibe una señal de audio transferida en forma de un flujo continuo de bits desde un aparato de codificación de señales de audio a través de un terminal de entrada ENTRADA2. Además, la unidad de recepción 301 envía la señal de audio recibida a la unidad de demultiplexado 401.
La unidad de demultiplexado 401 separa la señal de audio enviada por la unidad de recepción 301 en una señal de submezcla codificada 103 y una señal de información espacial codificada 105. La unidad de demultiplexado 401 transfiere la señal de submezcla codificada 103 separada de un flujo continuo de bits hacia la unidad de decodificación central 403 y transfiere la señal de información espacial codificada 105 separada a partir del flujo continuo de bits hacia la unidad de extracción 303.
La señal de submezcla codificada 103 es decodificada por la unidad de decodificación central 403 y a continuación es transferida a la unidad de generación multicanal 405. La señal de información espacial codificada 105 incluye el encabezamiento 201 y la información espacial 203.
Si el encabezamiento 201 está incluido en la señal de información espacial codificada 105, la unidad de extracción 303 extrae la información de configuración 205 a partir del encabezamiento 201. La unidad de extracción 303 puede discriminar la presencia del encabezamiento 201 usando la información de identificación de encabezamiento incluida en la señal de audio. En particular, la información de identificación de encabezamiento puede representar si el encabezamiento 201 está incluido en una trama incluida en la señal de información espacial 105. La información de identificación de encabezamiento puede indicar un orden de una secuencia de tramas o de bits de la señal de audio, en la cual está incluida la información de configuración 205 extraída del encabezamiento 201 si el encabezamiento 201 está incluido en la trama.
En caso de decidir que el encabezamiento 201 está incluido en la trama a través de la información de identificación de encabezamiento, la unidad de extracción 303 extrae la información de configuración 205 a partir del encabezamiento 201 incluido en la trama. A continuación, la información de configuración extraída 205 se decodifica.
La unidad de decodificación de información espacial 407 decodifica la información espacial 203 incluida en la trama de acuerdo con información de configuración decodificada 205.
Además, la unidad de generación multicanal 405 genera una señal multicanal usando la señal de submezcla decodificada 103 e información espacial decodificada 203, y a continuación da salida a la señal multicanal generada a través de un terminal de salida SALIDA2.
La figura 5 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización de la presente invención.
En referencia a la figura 5, un aparato de decodificación de señales de audio recibe la señal de información espacial 105 transferida en forma de un flujo continuo de bits por un aparato de codificación de señales de audio (S501).
Tal como se ha mencionado en la descripción anterior, la señal de información espacial 105 se puede clasificar en un caso en el que se transfiere como un ES separado con respecto a la señal de submezcla 103 y un caso en el que se transfiere combinándose con la señal de submezcla 103.
La unidad de demultiplexado 401 de una señal de audio separa la señal de audio recibida en la señal de submezcla codificada 103 y la señal de información espacial codificada 105. La señal de información espacial codificada 105 incluye el encabezamiento 201 y la información espacial 203. Si el encabezamiento 201 está incluido en una trama de la señal de información espacial 105, el aparato de decodificación de señales de audio identifica el encabezamiento 201 (S503).
El aparato de decodificación de señales de audio extrae la información de configuración 205 a partir del encabezamiento 201 (S505).
Además, el aparato de decodificación de señales de audio decodifica la información espacial 203 usando la información de configuración extraída 205 (S507).
La figura 6 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con otra forma de realización de la presente invención.
En referencia a la figura 6, un aparato de decodificación de señales de audio recibe la señal de información espacial 105 transferida en forma de un flujo continuo de bits por un aparato de codificación de señales de audio (S501).
Tal como se ha mencionado en la descripción anterior, la señal de información espacial 105 se puede clasificar en un caso en el que se transfiere en forma de un ES separado con respecto a la señal de submezcla 103 y un caso en el que se transfiere incluyéndola en datos auxiliares o una ampliación de datos de la señal de submezcla 103.
La unidad de demultiplexado 401 de una señal de audio separa la señal de audio recibida en la señal de submezcla codificada 103 y la señal de información espacial codificada 105. La señal de información espacial codificada 105 incluye el encabezamiento 201 y la información espacial 203. El aparato de decodificación de señales de audio decide si el encabezamiento 201 está incluido en una trama (S601).
Si el encabezamiento 201 está incluido en la trama, el aparato de decodificación de señales de audio identifica el encabezamiento 201 (S503).
A continuación, el aparato de decodificación de señales de audio extrae la información de configuración 205 a partir del encabezamiento 201 (S505).
El aparato de decodificación de señales de audio decide si la información de configuración 205 extraída a partir del encabezamiento 201 es la información de configuración 205 extraída a partir de un primer encabezamiento 201 incluido en la señal de información espacial 105 (S603).
Si la información de configuración 205 se extrae a partir del encabezamiento 201 extraído primero a partir de la señal de audio, el aparato de decodificación de señales de audio decodifica la información de configuración 205 (S611) y decodifica la información espacial 203 transferida detrás de la información de configuración 205 de acuerdo con la información de configuración decodificada 205.
Si el encabezamiento 201 extraído de la señal de audio no es el encabezamiento 201 extraído primero de la señal de información espacial 105, el aparato de decodificación de señales de audio decide si la información de configuración 205 extraída del encabezamiento 201 es idéntica a la información de configuración 205 extraída del primer encabezamiento 201 (S605).
Si la información de configuración 205 es idéntica a la información de configuración 205 extraída del primer encabezamiento 201, el aparato de decodificación de señales de audio decodifica la información espacial 203 usando la información de configuración decodificada 205 extraída del primer encabezamiento 201.
Si la información de configuración extraída 205 no es idéntica a la información de configuración 205 extraída del primer encabezamiento 201, el aparato de decodificación de señales de audio decide si se produce un error en la señal de audio sobre un trayecto de transferencia desde el aparato de codificación de señales de audio al aparato de decodificación de señales de audio (S607).
Si la información de configuración 205 es variable, el error no se produce ni siquiera si la información de configuración 205 no es idéntica a la información de configuración 205 extraída del primer encabezamiento 201. Por tanto, el aparato de decodificación de señales de audio actualiza el encabezamiento 201 al nuevo encabezamiento 201 (S609). A continuación, el aparato de decodificación de señales de audio decodifica la información de configuración 205 extraída del encabezamiento actualizado 201 (S611).
El aparato de decodificación de señales de audio decodifica la información espacial 203 transferida detrás de la información de configuración 205 de acuerdo con la información de configuración decodificada 205.
Si la información de configuración 205, que es invariable, no es idéntica a la información de configuración 205 extraída del primer encabezamiento 201, esto significa que se produce un error sobre el trayecto de transferencia de la señal de audio. Por tanto, el aparato de decodificación de señales de audio elimina la información espacial 203 incluida en la trama que incluye la información de configuración errónea 205 o corrige el error de la información espacial 203 (S613).
La figura 7 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización adicional de la presente invención.
En referencia a la figura 7, un aparato de decodificación de señales de audio recibe la señal de información espacial 105 transferida en forma de un flujo continuo de bits por un aparato de codificación de señales de audio (S501).
La unidad de demultiplexado 401 de una señal de audio separa la señal de audio recibida en la señal de submezcla codificada 103 y la señal de información espacial codificada 105. En este caso, la información de posición 207 del espacio de tiempo en el cual se aplicará un parámetro se incluye en la señal de información espacial 105.
El aparato de decodificación de señales de audio extrae la información de posición 207 del espacio de tiempo a partir de la información espacial 203 (S701).
El aparato de decodificación de señales de audio aplica un parámetro al espacio de tiempo correspondiente ajustando una posición del espacio de tiempo, en el cual se aplicará el parámetro, usando la información de posición extraída del espacio de tiempo (S703).
La figura 8 es un diagrama de flujo de un método de obtención de una cantidad que representa información de posición de acuerdo con una forma de realización de la presente invención. Una cantidad que representa información de posición de un espacio de tiempo es el número de bits asignados para representar la información de posición 207 del espacio de tiempo.
La cantidad que representa información de posición del espacio de tiempo, en el cual se aplica un primer parámetro se puede hallar restando el número de parámetros del número de espacios de tiempo, sumando 1 al resultado de la resta, aplicando un logaritmo base 2 sobre el valor sumado y aplicando una función techo al valor del logaritmo. En particular, la cantidad que representa información de posición del espacio de tiempo, en el cual se aplicará el primer parámetro, se puede hallar mediante techo(log2(k-i+1)), donde “k” e “i” son respectivamente el número de espacios de tiempo y el número de parámetros.
Suponiendo que “N” es un número natural, la cantidad que representa información de posición del espacio de tiempo, en el cual se aplicará un parámetro (N+1)ésimo, se representa como la información de posición 207 del espacio de tiempo en el cual se aplica un parámetro Nésimo. En este caso, la información de posición 207 del espacio de tiempo, en el cual se aplica un parámetro Nésimo, se puede hallar sumando el número de espacios de tiempo existentes entre el espacio de tiempo en el cual se aplica el parámetro Nésimo y un espacio de tiempo en el cual se aplica un parámetro (N-1)ésimo a la información de posición del espacio de tiempo en el cual se aplica el parámetro (N-1)ésimo y sumando 1 al valor sumado (S801). En particular, la información de posición del intervalo de tiempo en el cual se aplicará el parámetro (N+1)ésimo se puede hallar mediante j(N)+r(N+1)+1, donde r(N+1) indica el número de espacios de tiempo existentes entre el espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo y el espacio de tiempo en el cual se aplica el parámetro Nésimo .
Si se halla la información de posición 207 del espacio de tiempo en el cual se aplica el parámetro Nésimo, puede obtenerse la cantidad representativa de información de posición del espacio de tiempo que representa la posición del espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo. En particular, la cantidad representativa de información de posición del espacio de tiempo, que representa la posición del espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo, se puede hallar restando el número de parámetros aplicados a una trama y la información de posición del espacio de tiempo en el cual se aplica el parámetro Nésimo del número de espacios de tiempo y sumando (N+1) al valor de la resta (S803). En particular, la cantidad representativa de información de posición del espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo se puede hallar mediante función (log2(k-i+N+1-j(N))), donde “k”, “i” y “j(N)” son respectivamente el número de espacios de tiempo, el número de parámetros y la información de posición 205 del espacio de tiempo en el cual se aplica un parámetro Nésimo .
En caso de obtener la cantidad que representa información de posición del espacio de tiempo según la manera antes explicada, la cantidad que representa información de posición del espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo tiene el número de bits asignados inversamente proporcional a “N”. A saber, la cantidad que representa información de posición del espacio de tiempo en el cual se aplica el parámetro es un valor variable que depende de “N”.
La figura 9 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización adicional de la presente invención.
Un aparato de decodificación de señales de audio recibe una señal de audio desde un aparato de codificación de señales de audio (S901). La señal de audio incluye el descriptor de audio 101, la señal de submezcla 103 y la señal de información espacial 105.
El aparato de decodificación de señales de audio extrae el descriptor de audio 101 incluido en la señal de audio (S903). En el descriptor de audio 101 se incluye un identificador que indica un códec de audio.
El aparato de decodificación de señales de audio reconoce que la señal de audio incluye la señal de submezcla 103 y la señal de información espacial 105 usando el descriptor de audio 101. En particular, el aparato de decodificación de señales de audio puede discriminar que la señal de audio transferida es una señal para generar un multicanal, usando la señal de información espacial 105 (S905).
Además, el aparato de decodificación de señales de audio convierte la señal de submezcla 103 en una señal multicanal usando la señal de información espacial 105. Tal como se ha mencionado en la descripción anterior, el encabezamiento 201 se puede incluir en la información de información espacial 105 por cada intervalo predeterminado.
Tal como se ha mencionado en la descripción anterior, un método y un aparato para decodificar una señal de audio de acuerdo con la presente invención pueden conseguir que un encabezamiento se incluya selectivamente en una señal de información espacial.
Además, en caso de que en la señal de información espacial se incluya una pluralidad de encabezamientos, se puede decodificar la información espacial incluso si la señal de audio se reproduce a partir de un punto aleatorio por medio del aparato de decodificación de señales de audio.
Aunque la presente invención se ha descrito e ilustrado en la presente memoria en referencia a las formas de realización preferidas de la misma, resultará evidente para los expertos en la materia que se pueden realizar varias modificaciones y variaciones en ella, sin apartarse, por ello del alcance de la invención. Así, se pretende que la presente invención abarque las modificaciones y variaciones de la misma que se sitúen dentro del alcance de las reivindicaciones adjuntas.
Claims (4)
- REIVINDICACIONES1. Método de decodificación de una señal de audio, que comprende:recibir (S501) una señal de audio que incluye una señal de submezcla, una señal de información espacial clasificada en un caso que incluye un encabezamiento e información espacial y un caso que incluye solamente la información espacial sin el encabezamiento, y un descriptor de audio,reconocer que la señal de audio incluye la señal de submezcla y la señal de información espacial usando el descriptor de audio; yobtener (S503), a partir de la señal de audio, información de identificación de encabezamiento que indica si una trama de la señal de información espacial incluye o no el encabezamiento;si la información de identificación de encabezamiento indica que la trama de la señal de información espacial incluye el encabezamiento:
- -
- extraer (S505) información de configuración a partir del encabezamiento, estando incluida por lo menos una información de alineación temporal en la información de configuración;
- -
- decodificar (S507) la información espacial a partir de la señal de información espacial usando la información de configuración extraída;
- -
- discriminar una diferencia de retardo de tiempo entre dos señales en la generación de una señal multicanal usando la señal de submezcla y la señal de información espacial basándose en la información de alineación temporal incluida en la información de configuración extraída; y
- -
- convertir la señal de submezcla en la señal multicanal usando la información de configuración y la información espacial.
-
- 2.
- Método según la reivindicación 1, en el que la señal de información espacial incluye además información de posición de un espacio de tiempo.
-
- 3.
- Método según la reivindicación 2, que comprende además:
-
- 4.
- Aparato adaptado para realizar el método según cualquiera de las reivindicaciones 1 a 3.
aplicar (S703) un parámetro incluido en la señal de información espacial a un espacio de tiempo correspondiente usando información de posición del espacio de tiempo correspondiente incluida en la señal de información espacial.
Applications Claiming Priority (29)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US69500705P | 2005-06-30 | 2005-06-30 | |
US695007P | 2005-06-30 | ||
US71211905P | 2005-08-30 | 2005-08-30 | |
US712119P | 2005-08-30 | ||
US71920205P | 2005-09-22 | 2005-09-22 | |
US719202P | 2005-09-22 | ||
US72300705P | 2005-10-04 | 2005-10-04 | |
US723007P | 2005-10-04 | ||
US72622805P | 2005-10-14 | 2005-10-14 | |
US726228P | 2005-10-14 | ||
US72922505P | 2005-10-24 | 2005-10-24 | |
US729225P | 2005-10-24 | ||
US73562805P | 2005-11-12 | 2005-11-12 | |
US735628P | 2005-11-12 | ||
KR20060004065 | 2006-01-13 | ||
KR20060004055 | 2006-01-13 | ||
KR20060004055 | 2006-01-13 | ||
KR20060004056 | 2006-01-13 | ||
KR20060004056 | 2006-01-13 | ||
KR20060004065 | 2006-01-13 | ||
US78674006P | 2006-03-29 | 2006-03-29 | |
US786740P | 2006-03-29 | ||
US79232906P | 2006-04-17 | 2006-04-17 | |
US792329P | 2006-04-17 | ||
US80382506P | 2006-06-02 | 2006-06-02 | |
US803825P | 2006-06-02 | ||
KR20060056480 | 2006-06-22 | ||
KR1020060056480A KR20070003574A (ko) | 2005-06-30 | 2006-06-22 | 오디오 신호 인코딩 및 디코딩 방법 및 장치 |
PCT/KR2006/002583 WO2007004833A2 (en) | 2005-06-30 | 2006-06-30 | Method and apparatus for encoding and decoding an audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2387574T3 true ES2387574T3 (es) | 2012-09-26 |
Family
ID=44259564
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES06757754T Active ES2389130T3 (es) | 2005-06-30 | 2006-06-30 | Método y aparato para codificar y decodificar una señal de audio |
ES06757755T Active ES2387574T3 (es) | 2005-06-30 | 2006-06-30 | Método y aparato para decodificar una señal de audio |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES06757754T Active ES2389130T3 (es) | 2005-06-30 | 2006-06-30 | Método y aparato para codificar y decodificar una señal de audio |
Country Status (2)
Country | Link |
---|---|
ES (2) | ES2389130T3 (es) |
MY (2) | MY146180A (es) |
-
2006
- 2006-06-30 MY MYPI20063143 patent/MY146180A/en unknown
- 2006-06-30 ES ES06757754T patent/ES2389130T3/es active Active
- 2006-06-30 MY MYPI20063142 patent/MY142534A/en unknown
- 2006-06-30 ES ES06757755T patent/ES2387574T3/es active Active
Also Published As
Publication number | Publication date |
---|---|
ES2389130T3 (es) | 2012-10-23 |
MY146180A (en) | 2012-07-13 |
MY142534A (en) | 2010-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1913578B1 (en) | Method and apparatus for decoding an audio signal | |
CN101243490B (zh) | 编码和解码音频信号的方法和装置 | |
KR100891688B1 (ko) | 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치 | |
US7680451B2 (en) | Method and apparatus for providing a motion signal with a sound signal using an existing sound signal encoding format | |
KR100880643B1 (ko) | 오디오 신호의 디코딩 방법 및 장치 | |
US20080288263A1 (en) | Method and Apparatus for Encoding/Decoding | |
TW201503109A (zh) | 編碼裝置及方法、解碼裝置及方法、以及程式 | |
ES2387574T3 (es) | Método y aparato para decodificar una señal de audio | |
CN1826635B (zh) | 音频文件格式转换 | |
KR20070003574A (ko) | 오디오 신호 인코딩 및 디코딩 방법 및 장치 | |
RU2802677C2 (ru) | Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы | |
BRPI0613076A2 (pt) | método e aparelho para codificar e decodificar um sinal de audio | |
RU2023121109A (ru) | Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы | |
JP3856330B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP3865254B2 (ja) | 音声符号化方法及び音声復号方法 | |
JP3865253B2 (ja) | 音声符号化方法及び音声復号方法 | |
KR20190031460A (ko) | 오디오 객체 전송 장치 및 방법 |