ES2389130T3 - Método y aparato para codificar y decodificar una señal de audio - Google Patents

Método y aparato para codificar y decodificar una señal de audio Download PDF

Info

Publication number
ES2389130T3
ES2389130T3 ES06757754T ES06757754T ES2389130T3 ES 2389130 T3 ES2389130 T3 ES 2389130T3 ES 06757754 T ES06757754 T ES 06757754T ES 06757754 T ES06757754 T ES 06757754T ES 2389130 T3 ES2389130 T3 ES 2389130T3
Authority
ES
Spain
Prior art keywords
signal
information
audio signal
header
spatial information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06757754T
Other languages
English (en)
Inventor
Hee Suk Pang
Hyen O Oh
Dong Soo Kim
Jae Hyun Lim
Yang Won Jung
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060056480A external-priority patent/KR20070003574A/ko
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority claimed from PCT/KR2006/002581 external-priority patent/WO2007004831A1/en
Application granted granted Critical
Publication of ES2389130T3 publication Critical patent/ES2389130T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stereophonic System (AREA)
  • Error Detection And Correction (AREA)

Abstract

Método de decodificación de una señal de audio, que comprende:recibir (S501) una señal de audio que incluye una señal de submezcla y una señal de información espacial, endonde la señal de información espacial se clasifica en un caso que incluye un encabezamiento e informaciónespacial y un caso que incluye solamente la información espacial sin el encabezamiento; yobtener (S503), a partir de la señal de audio, información de identificación de encabezamiento que indica si unatrama de la señal de información espacial incluye o no el encabezamiento;si la información de identificación de encabezamiento indica que la trama de la señal de información espacialincluye el encabezamiento:- decodificar (S505) información de configuración a partir del encabezamiento;- extraer (S507) información espacial a partir de la señal de información espacial, incluyendo la informaciónespacial información de posición y parámetros espaciales; y- generar una señal multi-canal a partir de la señal de submezcla basándose en la información deconfiguración y la información espacial, en donde la información de posición identifica un espacio detiempo en el cual se aplicará un parámetro espacial correspondiente para la generación de la señal multicanal.

Description

Método y aparato para codificar y decodificar una señal de audio.
5 Campo técnico
La presente invención se refiere al procesado de una señal de audio, y más particularmente, a un aparato para codificar y decodificar una señal de audio y a un método para ello.
10 Antecedentes de la técnica
En general, un aparato de codificación de señales de audio comprime una señal de audio en una señal de submezcla de tipo monofónico o estereofónico, en lugar de comprimir cada uno de los canales de una señal de audio multi-canal. El aparato de codificación de señales de audio transfiere la señal de submezcla comprimida a un
15 aparato de decodificación junto con una señal de información espacial (o, señal de datos auxiliar) o almacena la señal de submezcla comprimida y la señal de información espacial en un soporte de almacenamiento.
En este caso, la señal de información espacial, que se extrae en el submezclado de una señal de audio multi-canal, se usa en la restauración de una señal de audio multi-canal, original, a partir de una señal de submezcla 20 comprimida.
La señal de información espacial incluye un encabezamiento e información espacial. Además, en el encabezamiento se incluye información de configuración. El encabezamiento es la información para interpretar la información espacial.
25 Un aparato de decodificación de señales de audio decodifica la información espacial usando la información de configuración incluida en el encabezamiento. La información de configuración, que está incluida en el encabezamiento, se transfiere a un aparato de decodificación o se almacena en un soporte de almacenamiento junto con la información espacial.
30 Un aparato de codificación de señales de audio multiplexa una señal de submezcla codificada y la señal de información espacial juntas en forma de un flujo continuo de bits, y a continuación transfiere la señal multiplexada a un aparato de decodificación. Puesto que en general la información de configuración es invariable, un encabezamiento que incluye información de configuración se inserta una vez en un flujo continuo de bits. Puesto que
35 la información de configuración se transmite insertándola inicialmente una vez en una señal de audio, un aparato de decodificación de señales de audio padece un problema en la decodificación de la información espacial debido a la no existencia de información de configuración en caso de que la señal de audio se reproduzca a partir de un punto de temporización aleatorio. A saber, puesto que una señal de audio se reproduce a partir de un punto de temporización específico solicitado por un usuario, en lugar de reproducirse desde una parte inicial en el caso de
40 una emisión de radiodifusión, VOD (vídeo bajo demanda) o similar, no se puede usar la información de configuración que se transfiere al ser incluida en una señal de audio. Por lo tanto, no se puede decodificar la información espacial.
“Der MPEG-2-Standard: Generische Codierung für Bewegtbilder und zugehörige Audio-Information, Audio-Codierung” (Teil 4), Schröder E F et al, Fernseh – und Kino – Technik, vol. 48, n.º 7/08, 30 de agosto de 1994, 45 páginas 364 a 368, y 370 a 373, da a conocer el uso de encabezamientos que incluyen información espacial los cuales se incorporan en una capa multicanal de mejora.
Se puede considerar que “Proposed changes in MPEG-4 BSAC multi-channel audio coding”, Eunmi L. Oh et al., ISO/IEC JTC1/SC29/WG11 MPEG2004/M11018, 19 de Julio de 2004, páginas 1 a 7, da a conocer una técnica 50 referente al multi-canal BSAC, que conlleva modificaciones de sintaxis que mejorarían un multi-canal BSAC proporcionando compatibilidad retroactiva.
Se puede considerar que “Low complexity parametric stereo coding”, Schuijers E. et al., CONVENTION OF THE AUDIO ENGINEERING SOCIETY, 8 de Mayo de 2004, páginas 1 a 11, da a conocer una técnica de codificación 55 estereofónica paramétrica para codificar eficazmente una señal de audio estereofónica en forma de una señal monoaural más una pequeña cantidad de parámetros estereofónicos. La señal monoaural se puede codificar usando cualquier codificador de audio. Los parámetros estereofónicos se pueden integrar en la parte auxiliar del flujo continuo de bits monofónico creando una compatibilidad monofónica retroactiva. En el decodificador, en primer lugar se decodifica la señal monoaural tras lo cual se reconstruye la señal estereofónica a partir de los parámetros
60 estereofónicos.
Se proporcionan un método y un aparato según las reivindicaciones independientes.
En las reivindicaciones subordinadas se exponen evoluciones. 65
Exposición de la invención
Es un objetivo de la presente invención proporcionar un método y un aparato para decodificar una señal de audio, que permite decodificar la señal de audio, incluso si la señal de audio se reproduce a partir de un punto aleatorio, haciendo que un encabezamiento se incluya selectivamente en una trama en la señal de información espacial.
Preferentemente, un método de decodificación de una señal de audio incluye preferentemente recibir la señal de audio que incluye una señal de submezcla y una señal de información espacial, si en la señal de información espacial se incluye un encabezamiento, extraer información de configuración a partir del encabezamiento, extraer información espacial incluida en la señal de información espacial, y convertir la señal de submezcla en una señal multi-canal usando la información de configuración y la información espacial.
Breve descripción de los dibujos
La figura 1 es un diagrama de configuración de una señal de audio de acuerdo con una forma de realización de la presente invención.
La figura 2 es un diagrama de configuración de una señal de audio de acuerdo con otra forma de realización de la presente invención.
La figura 3 es un diagrama de bloques de un aparato para decodificar una señal de audio de acuerdo con una forma de realización de la presente invención.
La figura 4 es un diagrama de bloques de un aparato para decodificar una señal de audio de acuerdo con otra forma de realización de la presente invención.
La figura 5 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización de la presente invención.
La figura 6 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con otra forma de realización de la presente invención.
La figura 7 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización adicional de la presente invención.
La figura 8 es un diagrama de flujo de un método de obtención de una cantidad que representa información de posición de acuerdo con una forma de realización de la presente invención.
La figura 9 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con otra forma de realización adicional de la presente invención.
Mejor modo para poner en práctica la invención
A continuación se hará referencia detalladamente a las formas de realización preferidas de la presente invención, cuyos ejemplos se ilustran en los dibujos adjuntos.
Para entender la presente invención, se explican un aparato y un método de codificación de una señal de audio antes que un aparato y un método de decodificación de una señal de audio. Sin embargo, el aparato y el método de decodificación según la presente invención no se limitan al aparato y el método de codificación siguientes. Además, la presente invención es aplicable a un esquema de codificación de audio para generar un multi-canal usando información espacial así como MP3 (MPEG ½-capa III) y AAC (codificación de audio avanzada).
La figura 1 es un diagrama de configuración de una señal de audio transferida a un aparato de decodificación de señales de audio desde un aparato de codificación de señales de audio, de acuerdo con una forma de realización de la presente invención.
En referencia a la figura 1, una señal de audio incluye un descriptor de audio 101, una señal de sub-mezcla 103 y una señal de información espacial 105.
En caso de usar un esquema de codificación para reproducir una señal de audio para radiodifusión o similar, la señal de audio puede incluir datos auxiliares así como el descriptor de audio 101 y la señal de submezcla 103. La presente invención puede incluir la señal de información espacial 105 en calidad de datos auxiliares. Para que un aparato de decodificación de señales de audio tenga conocimiento de información básica del códec de audio sin analizar la señal de audio, la señal de audio puede incluir selectivamente el descriptor de audio 101. El descriptor de audio 101 está compuesto por un número reducido de informaciones básicas necesarias para la decodificación de audio, tales como una velocidad de transmisión de una señal de audio transmitida, un número de canales, una frecuencia de
muestreo de datos comprimidos, un identificador que indica un códec usado actualmente y similares.
Un aparato de decodificación de señales de audio puede tener conocimiento de un tipo de un códec usado por una señal de audio utilizando el descriptor de audio 101. En particular, usando el descriptor de audio 101, el aparato de decodificación de señales de audio puede saber si una señal de audio recibida es la señal que restaura un multicanal usando la señal de información espacial 105 y la señal de submezcla 103. En este caso, el multi-canal puede incluir un sonido envolvente tri-dimensional virtual así como un multi-canal real. Por medio de la tecnología de sonido envolvente tri-dimensional virtual, se consigue que una señal de audio que tiene la señal de información espacial 105 y la señal de submezcla 103 combinadas entre sí resulte audible a través de uno o dos canales.
El descriptor de audio 101 se ubica independientemente con respecto a la señal de submezcla o la de información espacial 103 ó 105 incluida en la señal de audio. Por ejemplo, el descriptor de audio 101 se ubica dentro de un campo independiente que indica una señal de audio.
En caso de que no se proporcione un encabezamiento para la señal de submezcla 103, el aparato de decodificación de señales de audio puede decodificar la señal de submezcla 103 usando el descriptor de audio 101.
La señal de submezcla 103 es una señal generada a partir del submezclado de un multi-canal. La señal de submezcla 103 se puede generar a partir de una unidad submezcladora (no mostrada en el dibujo) incluida en un aparato de codificación de señales de audio (no mostrado en el dibujo) o se puede generar de manera artificial.
La señal de submezcla 103 se puede clasificar en un caso que incluya la señal de información espacial 105 y un caso que no incluya el encabezamiento.
En caso de que la señal de submezcla 103 incluya el encabezamiento, el encabezamiento se incluye en cada trama por medio de una unidad de tramas. En caso de que la señal de submezcla 103 no incluya el encabezamiento, tal como se ha mencionado en la descripción anterior, la señal de submezcla 103 se puede decodificar usando el descriptor de audio 101 por medio de un aparato de decodificación de señales de audio. La señal de submezcla 103 adopta o bien una forma que incluye el encabezamiento para cada trama o bien una forma que no incluye el encabezamiento. Además, la señal de submezcla 103 se incluye en una señal de audio de una misma manera hasta el fin del contenido.
La señal de información espacial 105 se clasifica también en un caso que incluye el encabezamiento e información espacial y un caso que incluye la información espacial únicamente sin incluir el encabezamiento. El encabezamiento de la señal de información espacial 105 difiere con respecto al de la señal de submezcla 103 en que no es necesario insertarlo en cada trama de manera idéntica. En particular, la señal de información espacial 105 puede usar juntas una trama que incluya el encabezamiento y una trama que no incluya el encabezamiento. La mayoría de la información incluida en el encabezamiento de la señal de información espacial 105 es información de configuración que decodifica la información espacial mediante interpretación de la información espacial.
La figura 2 es un diagrama de configuración de una señal de audio transferida a un aparato de decodificación de señales de audio desde un aparato de codificación de señales de audio de acuerdo con otra forma de realización de la presente invención.
En referencia a la figura 2, una señal de audio incluye la señal de submezcla 103 y la señal de información espacial
105. Además, la señal de audio existe en forma de un ES (flujo continuo elemental) en el que están dispuestas las tramas.
Cada una de entre la señal de submezcla 103 y la señal de información espacial 105 se transfiere ocasionalmente en forma de un ES independiente hacia un aparato de decodificación de señales de audio. Además, la señal de submezcla 103 y la señal de información espacial 105, tal como se muestra en la figura 2, se pueden combinar en forma de un ES para ser transferidas al aparato de decodificación de señales de audio.
En caso de que la señal de submezcla 103 y la señal de información espacial 105, que se combinan en forma de un ES, se transfieran al aparato de decodificación de señales de audio, la señal de información espacial 105 se puede incluir en una posición de datos auxiliares (datos auxiliares) o datos adicionales (ampliación de datos) de la señal de submezcla 103.
Además, la señal de audio puede incluir información de identificación de señal que indica si la señal de información espacial 105 está combinada con la señal de submezcla 103.
Una trama de la señal de información espacial 105 se puede clasificar en un caso en el que incluye el encabezamiento 201 y la información espacial 203 y un caso en el que incluye solamente la información espacial
203. En particular, la señal de información espacial 105 puede usar juntas una trama que incluya el encabezamiento 201 y una trama que no incluya el encabezamiento 201.
En la presente invención, el encabezamiento 201 se inserta en la señal de información espacial 105 por lo menos una vez. En particular, un aparato de codificación de señales de audio puede insertar el encabezamiento 201 en cada trama en la señal de información espacial 105, insertar periódicamente el encabezamiento 201 en cada intervalo fijo de tramas en la señal de información espacial 105 ó insertar de manera no periódica el encabezamiento 201 en cada intervalo aleatorio de tramas en la señal de información espacial 105.
La señal de audio puede incluir información (denominada en lo sucesivo, en la presente, “información de identificación de encabezamiento”) que indique si el encabezamiento 201 está incluido en una trama 201.
En caso de que el encabezamiento 201 esté incluido en la señal de información espacial 105, el aparato de decodificación de señales de audio extrae la información de configuración 205 del encabezamiento 201, y a continuación decodifica la información espacial 203 transferida después (detrás) del encabezamiento 201 de acuerdo con la información de configuración 205. Puesto que el encabezamiento 201 es información para decodificar mediante interpretación de la información espacial 203, el encabezamiento 201 se transfiere en la primera fase de transferencia de la señal de audio.
En caso de que el encabezamiento 201 no esté incluido en la señal de información espacial 105, el aparato de decodificación de señales de audio decodifica la información espacial 203 usando el encabezamiento 201 transferido en la primera fase.
En caso de que el encabezamiento 201 se pierda mientras la señal de audio se transfiere al aparato de decodificación de señales de audio desde el aparato de codificación de señales de audio o en caso de que la señal de audio transferida en un formato de flujo continuo se decodifique desde su parte de en medio para ser usada para radiodifusión o similares, no se puede usar el encabezamiento 201 que se transfirió previamente. En este caso, el aparato de decodificación de señales de audio extrae la información de configuración 205 del encabezamiento 201 diferente del primer encabezamiento 201 insertado en primer lugar en la señal de audio, y a continuación puede decodificar la señal de audio usando la información de configuración extraída 205. En este caso, la información de configuración 205 extraída del encabezamiento 201 insertado en la señal de audio puede ser idéntica o no a la primera información de configuración 205 extraída del encabezamiento 201 que se había transferido en la primera fase.
Si el encabezamiento 201 es variable, la información de configuración 205 se extrae de un nuevo encabezamiento 201, la información de configuración extraída 205 se decodifica y a continuación se decodifica la información espacial 203 transmitida detrás del encabezamiento 201. Si el encabezamiento 201 es invariable, se decide si el encabezamiento nuevo 201 es idéntico al encabezamiento antiguo 201 que se transfirió previamente. Si estos dos encabezamientos 201 son diferentes entre sí, puede detectarse que se produce un error en una señal de audio sobre un trayecto de transferencia de la señal de audio.
La información de configuración 205 extraída del encabezamiento 201 de la señal de información espacial 105 es la información para interpretar la información espacial 203.
La señal de información espacial 105 puede incluir información (denominada en lo sucesivo en la presente “información de alineación temporal”) para discriminar una diferencia de retardo de tiempo entre dos señales en la generación de un multi-canal usando la señal de submezcla 103 y la señal de información espacial 105 por parte del aparato de decodificación de señales de audio.
Una señal de audio transferida al aparato de decodificación de señales de audio desde el aparato de codificación de señales de audio es analizada sintácticamente por una unidad de demultiplexado (no mostrada en el dibujo) y a continuación la misma se separa en la señal de submezcla 103 y la señal de información espacial 105.
La señal de submezcla 103 separada por la unidad de demultiplexado se decodifica. Una señal de submezcla decodificada 103 genera un multi-canal usando la señal de información espacial 105. En la generación del multicanal mediante la combinación de la señal de submezcla 103 y la señal de información espacial 105, el aparato de decodificación de señales de audio puede ajustar la sincronización entre dos señales, una posición de un punto de inicio de combinación de dos señales y similares, usando la información de alineación temporal (no mostrada en el dibujo) incluida en la información de configuración 205 extraída a partir del encabezamiento 201 de la señal de información espacial 105.
La información de posición 207 de un espacio (slot) de tiempo al cual se aplicará un parámetro se incluye en la información espacial 203 incluida en la señal de información espacial 105. Como parámetro espacial (indicio espacial), existen CLDs (diferencias de nivel de canal) que indican una diferencia de energía entre señales de audio, ICCs (correlaciones entre canales) que indican la proximidad o similitud entre señales de audio, CPCs (coeficientes de predicción de canales) que indican un coeficiente que predice un valor de una señal de audio usando otras señales. En lo sucesivo en la presente, a cada indicio espacial o grupo de indicios espaciales se le denominará “parámetro”.
En caso de que existan N parámetros en una trama incluida en la señal de información espacial 105, los N parámetros se aplican a posiciones de espacio (slot) de tiempo específicas de tramas, respectivamente. Si a la información que indica que se aplicará un parámetro a uno determinado de los espacios de tiempo incluidos en una trama se le denomina información de posición 207 del espacio de tiempo, el aparato de decodificación de señales de audio decodifica la información espacial 203 usando la información de posición 207 del espacio de tiempo en el cual se aplicará el parámetro. En este caso, el parámetro se incluye en la información espacial 203.
La figura 3 es un diagrama de bloques esquemático de un aparato para decodificar una señal de audio de acuerdo con una forma de realización de la presente invención.
En referencia a la figura 3, un aparato para decodificar una señal de audio de acuerdo con una forma de realización de la presente invención incluye una unidad de recepción 301 y una unidad de extracción 303.
La unidad de recepción 301 del aparato de decodificación de señales de audio recibe una señal de audio transferida en forma de un ES por un aparato de codificación de señales de audio a través de un terminal de entrada ENTRADA1.
La señal de audio recibida por el aparato de decodificación de señales de audio incluye un descriptor de audio 101 y la señal de submezcla 103 y puede incluir además la señal de información espacial 105 como datos auxiliares (datos auxiliares) o datos adicionales (ampliación de datos).
La unidad de extracción 303 del aparato de decodificación de señales de audio extrae la información de configuración 205 del encabezamiento 201 incluido en la señal de audio recibida, y a continuación da salida a la información de configuración extraída 205 a través de un terminal de salida SALIDA1.
La señal de audio puede incluir la información de identificación de encabezamiento para identificar si el encabezamiento 201 está incluido en una trama.
El aparato de decodificación de señales de audio identifica si el encabezamiento 201 está incluido en la trama usando la información de identificación de encabezamiento incluida en la señal de audio. Si el encabezamiento 201 está incluido, el aparato de decodificación de señales de audio extrae la información de configuración 205 a partir del encabezamiento 201. En la presente invención, en la señal de información espacial 105 se incluye por lo menos un encabezamiento 201.
La figura 4 es un diagrama de bloques de un aparato para decodificar una señal de audio de acuerdo con otra forma de realización de la presente invención.
En referencia a la figura 4, un aparato para decodificar una señal de audio de acuerdo con otra forma de realización de la presente invención incluye la unidad de recepción 301, la unidad de demultiplexado 401, una unidad de decodificación central 403, una unidad de generación multi-canal 405, una unidad de decodificación de información espacial 407 y la unidad de extracción 303.
La unidad de recepción 301 del aparato de decodificación de señales de audio recibe una señal de audio transferida en forma de un flujo continuo de bits desde un aparato de codificación de señales de audio a través de un terminal de entrada ENTRADA2. Además, la unidad de recepción 301 envía la señal de audio recibida a la unidad de demultiplexado 401.
La unidad de demultiplexado 401 separa la señal de audio enviada por la unidad de recepción 301 en una señal de submezcla codificada 103 y una señal de información espacial codificada 105. La unidad de demultiplexado 401 transfiere la señal de submezcla codificada 103 separada de un flujo continuo de bits hacia la unidad de decodificación central 403 y transfiere la señal de información espacial codificada 105 separada del flujo continuo de bits hacia la unidad de extracción 303.
La señal de submezcla codificada 103 es decodificada por la unidad de decodificación central 403 y a continuación es transferida a la unidad de generación multi-canal 405. La señal de información espacial codificada 105 incluye el encabezamiento 201 y la información espacial 203.
Si el encabezamiento 201 está incluido en la señal de información espacial codificada 105, la unidad de extracción 303 extrae la información de configuración 205 a partir del encabezamiento 201. La unidad de extracción 303 puede discriminar la presencia del encabezamiento 201 usando la información de identificación de encabezamiento incluida en la señal de audio. En particular, la información de identificación de encabezamiento puede representar si el encabezamiento 201 está incluido en una trama incluida en la señal de información espacial 105. La información de identificación de encabezamiento puede indicar un orden de una secuencia de tramas o de bits de la señal de audio, en la cual está incluida la información de configuración 205 extraída del encabezamiento 201 si el encabezamiento 201 está incluido en la trama.
En caso de decidir que el encabezamiento 201 está incluido en la trama a través de la información de identificación de encabezamiento, la unidad de extracción 303 extrae la información de configuración 205 a partir del encabezamiento 201 incluido en la trama. A continuación, se decodifica la información de configuración extraída
205.
La unidad de decodificación de información espacial 407 decodifica la información espacial 203 incluida en la trama de acuerdo con información de configuración decodificada 205.
Además, la unidad de generación multi-canal 405 genera una señal multi-canal usando la señal de submezcla decodificada 103 e información espacial decodificada 203, y a continuación da salida a la señal multi-canal generada a través de un terminal de salida SALIDA2.
La figura 5 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización de la presente invención.
En referencia a la figura 5, un aparato de decodificación de señales de audio recibe la señal de información espacial 105 transferida en forma de un flujo continuo de bits por un aparato de codificación de señales de audio (S501).
Tal como se ha mencionado en la descripción anterior, la señal de información espacial 105 se puede clasificar en un caso en el que se transfiere como un ES separado con respecto a la señal de submezcla 103 y un caso en el que se transfiere combinándose con la señal de submezcla 103.
La unidad de demultiplexado 401 de una señal de audio separa la señal de audio recibida en la señal de submezcla codificada 103 y la señal de información espacial codificada 105. La señal de información espacial codificada 105 incluye el encabezamiento 201 y la información espacial 203. Si el encabezamiento 201 está incluido en una trama de la señal de información espacial 105, el aparato de decodificación de señales de audio identifica el encabezamiento 201 (S503).
El aparato de decodificación de señales de audio extrae la información de configuración 205 a partir del encabezamiento 201 (S505).
Además, el aparato de decodificación de señales de audio decodifica la información espacial 203 usando la información de configuración extraída 205 (S507).
La figura 6 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con otra forma de realización de la presente invención.
En referencia a la figura 6, un aparato de decodificación de señales de audio recibe la señal de información espacial 105 transferida en forma de un flujo continuo de bits por un aparato de codificación de señales de audio (S501).
Tal como se ha mencionado en la descripción anterior, la señal de información espacial 105 se puede clasificar en un caso en el que se transfiere en forma de un ES separado con respecto a la señal de submezcla 103 y un caso en el que se transfiere incluyéndola en datos auxiliares o en una ampliación de datos de la señal de submezcla 103.
La unidad de demultiplexado 401 de una señal de audio separa la señal de audio recibida en la señal de submezcla codificada 103 y la señal de información espacial codificada 105. La señal de información espacial codificada 105 incluye el encabezamiento 201 y la información espacial 203. El aparato de decodificación de señales de audio decide si el encabezamiento 201 está incluido en una trama (S601).
Si el encabezamiento 201 está incluido en la trama, el aparato de decodificación de señales de audio identifica el encabezamiento 201 (S503).
A continuación, el aparato de decodificación de señales de audio extrae la información de configuración 205 a partir del encabezamiento 201 (S505).
El aparato de decodificación de señales de audio decide si la información de configuración 205 extraída a partir del encabezamiento 201 es la información de configuración 205 extraída a partir de un primer encabezamiento 201 incluido en la señal de información espacial 105 (S603).
Si la información de configuración 205 se extrae a partir del encabezamiento 201 extraído primero a partir de la señal de audio, el aparato de decodificación de señales de audio decodifica la información de configuración 205 (S611) y decodifica la información espacial 203 transferida detrás de la información de configuración 205 de acuerdo con la información de configuración decodificada 205.
Si el encabezamiento 201 extraído de la señal de audio no es el encabezamiento 201 extraído primero de la señal de información espacial 105, el aparato de decodificación de señales de audio decide si la información de
configuración 205 extraída del encabezamiento 201 es idéntica a la información de configuración 205 extraída del primer encabezamiento 201 (S605).
Si la información de configuración 205 es idéntica a la información de configuración 205 extraída del primer encabezamiento 201, el aparato de decodificación de señales de audio decodifica la información espacial 203 usando la información de configuración decodificada 205 extraída del primer encabezamiento 201.
Si la información de configuración extraída 205 no es idéntica a la información de configuración 205 extraída del primer encabezamiento 201, el aparato de decodificación de señales de audio decide si se produce un error en la señal de audio sobre un trayecto de transferencia desde el aparato de codificación de señales de audio al aparato de decodificación de señales de audio (S607).
Si la información de configuración 205 es variable, el error no se produce ni siquiera si la información de configuración 205 no es idéntica a la información de configuración 205 extraída del primer encabezamiento 201. Por tanto, el aparato de decodificación de señales de audio actualiza el encabezamiento 201 al nuevo encabezamiento 201 (S609). A continuación, el aparato de decodificación de señales de audio decodifica la información de configuración 205 extraída del encabezamiento actualizado 201 (S611).
El aparato de decodificación de señales de audio decodifica la información espacial 203 transferida detrás de la información de configuración 205 de acuerdo con la información de configuración decodificada 205.
Si la información de configuración 205, que es invariable, no es idéntica a la información de configuración 205 extraída del primer encabezamiento 201, esto significa que se produce un error sobre el trayecto de transferencia de la señal de audio. Por tanto, el aparato de decodificación de señales de audio elimina la información espacial 203 incluida en la trama que incluye la información de configuración errónea 205 ó corrige el error de la información espacial 203 (S613).
La figura 7 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización adicional de la presente invención.
En referencia a la figura 7, un aparato de decodificación de señales de audio recibe la señal de información espacial 105 transferida en forma de un flujo continuo de bits por un aparato de codificación de señales de audio (S501).
La unidad de demultiplexado 401 de una señal de audio separa la señal de audio recibida en la señal de submezcla codificada 103 y la señal de información espacial codificada 105. En este caso, la información de posición 207 del espacio de tiempo en el cual se aplicará un parámetro se incluye en la señal de información espacial 105.
El aparato de decodificación de señales de audio extrae la información de posición 207 del espacio de tiempo a partir de la información espacial 203 (S701).
El aparato de decodificación de señales de audio aplica un parámetro al espacio de tiempo correspondiente ajustando una posición del espacio de tiempo, en el cual se aplicará el parámetro, usando la información de posición extraída del espacio de tiempo (S703).
La figura 8 es un diagrama de flujo de un método de obtención de una cantidad que representa información de posición de acuerdo con una forma de realización de la presente invención. Una cantidad que representa información de posición de un espacio de tiempo es el número de bits asignados para representar la información de posición 207 del espacio de tiempo.
La cantidad que representa información de posición del espacio de tiempo, en el cual se aplica un primer parámetro se puede hallar restando el número de parámetros del número de espacios de tiempo, sumando 1 al resultado de la resta, aplicando un logaritmo base 2 sobre el valor sumado y aplicando una función techo al valor del logaritmo. En particular, la cantidad que representa información de posición del espacio de tiempo, en el cual se aplicará el primer parámetro, se puede hallar mediante techo(log2(k-i+1)), donde “k” e “i” son respectivamente el número de espacios de tiempo y el número de parámetros.
Suponiendo que “N” es un número natural, la cantidad que representa información de posición del espacio de tiempo, en el cual se aplicará un parámetro (N+1)ésimo, se representa como la información de posición 207 del espacio de tiempo en el cual se aplica un parámetro Nésimo. En este caso, la información de posición 207 del espacio de tiempo, en el cual se aplica un parámetro Nésimo, se puede hallar sumando el número de espacios de tiempo existentes entre el espacio de tiempo en el cual se aplica el parámetro Nésimo y un espacio de tiempo en el cual se aplica un parámetro (N-1)ésimo a la información de posición del espacio de tiempo en el cual se aplica el parámetro (N-1)ésimo y sumando 1 al valor sumado (S801). En particular, la información de posición del espacio de tiempo en el cual se aplicará el parámetro (N+1)ésimo se puede hallar mediante j(N)+r(N+1)+1, donde r(N+1) indica el número de espacios de tiempo existentes entre el espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo y el espacio de tiempo en el cual se aplica el parámetro Nésimo .
Si se halla la información de posición 207 del espacio de tiempo en el cual se aplica el parámetro Nésimo, puede obtenerse la cantidad representativa de información de posición del espacio de tiempo que representa la posición del espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo. En particular, la cantidad representativa de información de posición del espacio de tiempo, que representa la posición del espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo, se puede hallar restando el número de parámetros aplicados a una trama y la información de posición del espacio de tiempo en el cual se aplica el parámetro Nésimo del número de espacios de tiempo y sumando (N+1) al valor de la resta (S803). En particular, la cantidad representativa de información de posición del espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo se puede hallar mediante techo(log2(k-i+N+1-j(N))), donde “k”, “i” y “j(N)” son respectivamente el número de espacios de tiempo, el número de parámetros y la información de posición 205 del espacio de tiempo en el cual se aplica un parámetro Nésimo .
En caso de obtener la cantidad que representa información de posición del espacio de tiempo según la manera antes explicada, la cantidad que representa información de posición del espacio de tiempo en el cual se aplica el parámetro (N+1)ésimo tiene el número de bits asignados inversamente proporcional a “N”. A saber, la cantidad que representa información de posición del espacio de tiempo en el cual se aplica el parámetro es un valor variable que depende de “N”.
La figura 9 es un diagrama de flujo de un método de decodificación de una señal de audio de acuerdo con una forma de realización adicional de la presente invención.
Un aparato de decodificación de señales de audio recibe una señal de audio desde un aparato de codificación de señales de audio (S901). La señal de audio incluye el descriptor de audio 101, la señal de submezcla 103 y la señal de información espacial 105.
El aparato de decodificación de señales de audio extrae el descriptor de audio 101 incluido en la señal de audio (S903). En el descriptor de audio 101 se incluye un identificador que indica un códec de audio.
El aparato de decodificación de señales de audio reconoce que la señal de audio incluye la señal de submezcla 103 y la señal de información espacial 105 usando el descriptor de audio 101. En particular, el aparato de decodificación de señales de audio puede discriminar que la señal de audio transferida es una señal para generar un multi-canal, usando la señal de información espacial 105 (S905).
Además, el aparato de decodificación de señales de audio convierte la señal de submezcla 103 en una señal multicanal usando la señal de información espacial 105. Tal como se ha mencionado en la descripción anterior, el encabezamiento 201 se puede incluir en la señal de información espacial 105 cada intervalo predeterminado.
Aplicabilidad industrial
Tal como se ha mencionado en la descripción anterior, un método y un aparato para decodificar una señal de audio de acuerdo con la presente invención pueden conseguir que un encabezamiento se incluya selectivamente en una señal de información espacial.
Además, en caso de que en la señal de información espacial se incluya una pluralidad de encabezamientos, se puede decodificar información espacial incluso si la señal de audio se reproduce a partir de un punto aleatorio por medio del aparato de decodificación de señales de audio.
Aunque la presente invención se ha descrito e ilustrado en la presente memoria haciendo referencia a las formas de realización preferidas de la misma, resultará evidente para los expertos en la materia que se pueden realizar varias modificaciones y variaciones en ella sin apartarse por ello del alcance de la invención. Así, se pretende que la presente invención abarque las modificaciones y variaciones de la misma que se encuentren dentro del alcance de las reivindicaciones adjuntas.

Claims (3)

  1. REIVINDICACIONES
    1. Método de decodificación de una señal de audio, que comprende:
    5 recibir (S501) una señal de audio que incluye una señal de submezcla y una señal de información espacial, en donde la señal de información espacial se clasifica en un caso que incluye un encabezamiento e información espacial y un caso que incluye solamente la información espacial sin el encabezamiento; y
    obtener (S503), a partir de la señal de audio, información de identificación de encabezamiento que indica si una 10 trama de la señal de información espacial incluye o no el encabezamiento;
    si la información de identificación de encabezamiento indica que la trama de la señal de información espacial incluye el encabezamiento:
    15 - decodificar (S505) información de configuración a partir del encabezamiento;
    -
    extraer (S507) información espacial a partir de la señal de información espacial, incluyendo la información espacial información de posición y parámetros espaciales; y
    20 - generar una señal multi-canal a partir de la señal de submezcla basándose en la información de configuración y la información espacial, en donde la información de posición identifica un espacio de tiempo en el cual se aplicará un parámetro espacial correspondiente para la generación de la señal multicanal.
    25 2. Método según la reivindicación 1, en el que la señal de audio incluye además información de identificación de la señal que indica si la señal de información espacial está combinada con la señal de submezcla.
  2. 3. Método según la reivindicación 1, que comprende además ajustar una posición de un punto de inicio de combinación de dos señales en la generación de la señal multi-canal mediante la combinación de la señal de
    30 submezcla y la señal de información espacial usando información de alineación temporal incluida en la información de configuración extraída, sirviendo la información de alineación temporal para discriminar una diferencia de retardo de tiempo entre las dos señales.
  3. 4. Aparato adaptado para realizar el método según cualquiera de las reivindicaciones 1 a 3.
ES06757754T 2005-06-30 2006-06-30 Método y aparato para codificar y decodificar una señal de audio Active ES2389130T3 (es)

Applications Claiming Priority (29)

Application Number Priority Date Filing Date Title
US69500705P 2005-06-30 2005-06-30
US695007P 2005-06-30
US71211905P 2005-08-30 2005-08-30
US712119P 2005-08-30
US71920205P 2005-09-22 2005-09-22
US719202P 2005-09-22
US72300705P 2005-10-04 2005-10-04
US723007P 2005-10-04
US72622805P 2005-10-14 2005-10-14
US726228P 2005-10-14
US72922505P 2005-10-24 2005-10-24
US729225P 2005-10-24
US73562805P 2005-11-12 2005-11-12
US735628P 2005-11-12
KR20060004056 2006-01-13
KR20060004065 2006-01-13
KR20060004056 2006-01-13
KR20060004065 2006-01-13
KR20060004055 2006-01-13
KR20060004055 2006-01-13
US78674006P 2006-03-29 2006-03-29
US786740P 2006-03-29
US79232906P 2006-04-17 2006-04-17
US792329P 2006-04-17
US80382506P 2006-06-02 2006-06-02
US803825P 2006-06-02
KR1020060056480A KR20070003574A (ko) 2005-06-30 2006-06-22 오디오 신호 인코딩 및 디코딩 방법 및 장치
KR20060056480 2006-06-22
PCT/KR2006/002581 WO2007004831A1 (en) 2005-06-30 2006-06-30 Method and apparatus for encoding and decoding an audio signal

Publications (1)

Publication Number Publication Date
ES2389130T3 true ES2389130T3 (es) 2012-10-23

Family

ID=44259564

Family Applications (2)

Application Number Title Priority Date Filing Date
ES06757755T Active ES2387574T3 (es) 2005-06-30 2006-06-30 Método y aparato para decodificar una señal de audio
ES06757754T Active ES2389130T3 (es) 2005-06-30 2006-06-30 Método y aparato para codificar y decodificar una señal de audio

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES06757755T Active ES2387574T3 (es) 2005-06-30 2006-06-30 Método y aparato para decodificar una señal de audio

Country Status (2)

Country Link
ES (2) ES2387574T3 (es)
MY (2) MY146180A (es)

Also Published As

Publication number Publication date
ES2387574T3 (es) 2012-09-26
MY142534A (en) 2010-12-15
MY146180A (en) 2012-07-13

Similar Documents

Publication Publication Date Title
EP1913578B1 (en) Method and apparatus for decoding an audio signal
CN101243490B (zh) 编码和解码音频信号的方法和装置
KR100891688B1 (ko) 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
KR100880643B1 (ko) 오디오 신호의 디코딩 방법 및 장치
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
ES2389130T3 (es) Método y aparato para codificar y decodificar una señal de audio
CN1826635B (zh) 音频文件格式转换
KR20070003574A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치
BRPI0613076A2 (pt) método e aparelho para codificar e decodificar um sinal de audio
JP3856330B2 (ja) 音声符号化方法及び音声復号方法
JP3865253B2 (ja) 音声符号化方法及び音声復号方法
JP3856333B2 (ja) 音声符号化方法及び音声復号方法
RU2023121109A (ru) Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы
KR20070098726A (ko) 미디어 신호를 부호화/복호화하는 방법 및 장치
JP2006011472A (ja) 音声符号化方法及び音声復号方法
KR20070108314A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
JP2006011474A (ja) 音声符号化方法及び音声復号方法
JP2006178480A (ja) 音声符号化方法及び音声復号方法
JP2006053553A (ja) 音声符号化方法及び音声復号方法
JP2006171775A (ja) 音声符号化方法及び音声復号方法
JP2006178481A (ja) 音声符号化方法及び音声復号方法