MX2008002713A - Aparato y metodo para codificar y decodificar senales de audio. - Google Patents

Aparato y metodo para codificar y decodificar senales de audio.

Info

Publication number
MX2008002713A
MX2008002713A MX2008002713A MX2008002713A MX2008002713A MX 2008002713 A MX2008002713 A MX 2008002713A MX 2008002713 A MX2008002713 A MX 2008002713A MX 2008002713 A MX2008002713 A MX 2008002713A MX 2008002713 A MX2008002713 A MX 2008002713A
Authority
MX
Mexico
Prior art keywords
bits
parameters
group
represented
time
Prior art date
Application number
MX2008002713A
Other languages
English (en)
Inventor
Hee Suk Pang
Dong Soo Kim
Jae Hyun Lim
Yang Won Jung
Hyeon O Oh
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060004051A external-priority patent/KR20070025903A/ko
Priority claimed from KR1020060004062A external-priority patent/KR20070037974A/ko
Priority claimed from KR1020060004063A external-priority patent/KR20070025907A/ko
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Priority claimed from PCT/KR2006/003420 external-priority patent/WO2007027050A1/en
Publication of MX2008002713A publication Critical patent/MX2008002713A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/26Systems using multi-frequency codes
    • H04L27/2601Multicarrier modulation systems
    • H04L27/2602Signal structure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

Una informacion espacial asociada con una senal de audio es codificada en una corriente de bits que puede ser transmitida a un decodificador o registrada en un medio de almacenamiento. La corriente de bits puede incluir una sintaxis diferente relacionada con dominios de tiempo, de frecuencia y espaciales. En ciertas modalidades, la corriente de bits incluye una o varias estructuras de datos (por ejemplo, cuadros) que contienen grupos ordenados de segmentos para los cuales se pueden aplicar parametros. Las estructuras de datos pueden estar fijas o variables. Un indicador de tipo de estructura de dato puede insertarse en la corriente de bits para permitir a un decodificador determinar el tipo de estructura de datos y para invocar un proceso de decodificacion apropiado. La estructura de datos puede incluir informacion positiva que puede ser utilizada por un decodificador para identificar el segmento correcto al cual se aplica un grupo dado de parametros. La informacion de posicion de segmento puede estar codificada ya sea con un numero fijo de bits o bien con un numero variable de bits con base en el tipo de estructura de datos segun lo indicado por el indicador de tipo de estructura de datos. En el caso de tipos de estructura de datos variable, la informacion de posicion de segmento puede estar codificada con un numero variable de bits con base en la posicion del segmento en el grupo ordenado de segmentos.

Description

APARATO Y MÉTODO PARA CODIFICAR Y DECODIFICAR SEÑALES DE AUDIO CAMPO TÉCNICO La materia de esta solicitud se relaciona en términos generales al procesamiento de señales de audio. ANTECEDENTES DE LA TÉCNICA Se han estado efectuando esfuerzos para investigar y desarrollar nuevos enfoques con relación a la codificación perceptual de audio de canales múltiples, que se conoce comúnmente como Codificación Espacial de Audio (SAC) . SAC permite la transmisión de audio en canales múltiples a bajas frecuencias de bits, haciendo que SAC sea adecuada para muchas aplicaciones de audio populares (por ejemplo, corrientes de Internet, descargas de música) . En lugar de efectuar una codificación discreta de canales individuales de entrada de audio, SAC captura la imagen espacial de una señal de audio de canales múltiples en un grupo compacto de parámetros. Los parámetros pueden ser transmitidos a un decodificador en donde los parámetros son utilizados para sintetizar o reconstruir las propiedades espaciales de la señal de audio. En algunas aplicaciones SAC, los parámetros espaciales son transmitidos a un decodificador como parte de una corriente de bits. La corriente de bits incluye cuadros espaciales que contienen grupos ordenados de segmentos de tiempo para los cuales se pueden aplicar grupos de parámetros espaciales. La corriente de bits incluye también información de posición que puede ser utilizada por un decodificador para identificar el segmento de tiempo correcto al cual se aplica un grupo dado de parámetros. Ciertas aplicaciones SAC utilizan elementos conceptuales en trayectorias de codificación/decodificación. Un elemento se conoce comúnmente como Uno-A-Uno (OTT, por sus siglas en inglés) y otro elemento se conoce comúnmente como Dos-A-Dos (TTT, por sus siglas en inglés) , en donde los nombres implican el número de canales de entrada y de salida de un elemento de decodificador correspondiente, respectivamente. El elemento de codificador OTT extrae dos parámetros espaciales y crea una señal sometida a mezcla reductora y una señal residual. El elemento TTT efectúa una mezcla reductora de tres señales de audio a una señal estéreo sometida a mezcla reductora más una señal residual. Estos elementos pueden ser combinados con el objeto de proporcionar varias configuraciones de un entorno de audio espacial (por ejemplo, sonido aledaño) . Ciertas aplicaciones de SAC pueden operar en un modo de operación no guiado, en donde solamente una señal sometida a mezcla reductora estéreo es transmitida desde un codificador a un decodificado sin necesidad de transmisión de parámetros espaciales. El decodificador sintetiza parámetros espaciales de la señal sometida a mezcla reductora y utiliza estos parámetros para producir una señal de audio de canales múltiples. DIVULGACIÓN DE LA INVENCIÓN La información espacial asociada con una señal de audio es codificada en una corriente de bits, que puede ser transmitida a un decodificador o grabada en un medio de almacenamiento. La corriente de bits puede incluir sintaxis diferentes relacionadas con dominio de tiempo, de frecuencia y espaciales. En algunas modalidades, la corriente de bits incluye una o varias estructuras de datos (por ejemplo, cuadros) que contienen grupos ordenados de segmentos para los cuales pueden aplicar parámetros. Las estructuras de datos pueden ser fijas o variables. Un indicador de tipo de estructura de datos puede insertarse en la corriente de bits con el objeto de permitir que un decodificador determine el tipo de estructura de datos e invoque un proceso de decodificación apropiado. La estructura de datos puede incluir información de posición que puede ser utilizada por parte de un decodificador para identificar el segmento correcto para el cual se aplica un conjunto dado de parámetros. La información de posición de segmento puede estar codificada ya sea con un número fijo de bits o un número variable de bits con base en el tipo de estructura de datos según lo indicado por el indicador de tipo de estructura de datos. En el caso de tipos de estructura de datos variables, la información de posición de segmento puede estar codificada con un número variable de bits con base en la posición del segmento en el grupo ordenado de segmentos. En algunas implementaciones, un método de codificación de una señal de audio incluye: determinar el número de segmentos de tiempo y el número de grupos de parámetros, los grupos de parámetros incluyen uno o varios parámetros; generar información que indica una posición de por lo menos un segmento de tiempo en un grupo ordenado de segmentos de tiempo al cual se aplica un grupo de parámetros; codificar la señal de audio como una corriente de bits que incluye un cuadro, el cuadro incluye el grupo ordenado de segmentos de tiempo; e insertar un número variable de bits en la corriente de bits que representa la posición del segmento de tiempo en el grupo ordenado de segmentos de tiempo, por lo que se determina el número variable de bits por la posición de segmento de tiempo. En algunas modalidades, un método de decodificación de una señal de audio incluye: recibir una corriente de bits que representa una señal de audio, la corriente de bits tiene un cuadro; determinar un número de segmentos de tiempo y un número de grupos de parámetros a partir de la corriente de bits, los grupos de parámetros incluyen uno o varios parámetros; determinar información de posición a partir de la corriente de bits, la información de posición indica una posición de u segmento de tiempo en un grupo ordenado de segmentos de tiempo a los cuales aplica el grupo de parámetros, en donde el grupo ordenados de segmento de tiempo está incluido en el cuadro; y decodificar la señal de audio con base en el número de segmentos de tiempo, el número de grupos de parámetros y la información de posición, en donde la información de posición está representada por un número variable de bits con base en la posición de segmento de tiempo. Otras modalidades de codificación de posición de segmentos de tiempo se divulgan las cuales están enfocadas a sistemas, métodos, aparatos, estructuras de datos y medios legibles en computadora . Se entenderá que tanto la descripción general anterior como la descripción detallada siguiente de las modalidades se ofrecen como ejemplos y para propósito ilustrativo y pretenden ofrecer una explicación adicional de la invención reclamada . BREVE DESCRIPCIÓN DE LOS DIBUJOS Los dibujos adjuntos, que están incluidos para proporcionar una comprensión adicional de la invención y están incorporados en esta solicitud y forman parte de ella, ilustran modalidad (es) de la invención y juntos con la descripción sirven para explicar el principio de la invención. En los dibujos: La figura 1 es un diagrama que ilustra un principio de generación de información espacial de conformidad con una modalidad de la presente invención; La figura 2 es un diagrama de bloques de un codificador para codificar una señal de audio de conformidad con una modalidad de la presente invención; La figura 3 es un diagrama de bloques de un decodificador para decodificar una señal de audio de conformidad con una modalidad de la presente invención; La figura 4 es un diagrama de bloques de un módulo de conversión de canal incluido en una unidad de mezcla incrementadora de un decodificador de conformidad con una modalidad de la presente invención; La figura 5 es un diagrama para explicar un método de configuración de una corriente de bits de una señal de audio de conformidad con una modalidad de la presente invención; Las Figuras 6A y 6B son un diagrama y una gráfica de tiempo/frecuencia, respectivamente, para explicar las relaciones entre un grupo de parámetros, segmento de tiempo y bandas de parámetros de conformidad con una modalidad de la presente invención; La Figura 7A ilustra una sintaxis para representar información de configuración de una señal de información espacial de conformidad con una modalidad de la presente invención; La Figura 7B es una tabla para un número de bandas de parámetros de una señal de información espacial de conformidad con una modalidad de la presente invención; La Figura 8A ilustra una sintaxis para representar un número de bandas de parámetros aplicadas a una caja OTT por un número fijo de bits de conformidad con una modalidad de la presente invención; La Figura 8B ilustra una sintaxis para representar un número de bandas de parámetros aplicadas a una caja OTT por un número variable de bits de conformidad con una modalidad de la presente invención; La Figura 9A ilustra una sintaxis para representar un número de bandas de parámetros aplicadas a una caja TTT por un número fijo de bits de conformidad con una modalidad de la presente invención; La Figura 9B ilustra una sintaxis para representar un número de bandas de parámetros aplicadas a una caja TTT por un número variable de bits de conformidad con una modalidad de la presente invención; La Figura 10A ilustra una sintaxis de una información de configuración de extensión espacial para un cuadro de extensión espacial de conformidad con una modalidad de la presente invención; La Figuras 10B y 10C ilustran una sintaxis de una información de configuración de extensión espacial para una señal residual en el caso en el cual las señal residual esté incluida en un cuadro de extensión espacial de conformidad con una modalidad de la presente invención; La Figura 10D ilustra una sintaxis para un método para representar un número de bandas de parámetros para una señal residual de conformidad con una modalidad de la presente invención; La Figura HA es un diagrama de bloques de un aparato de decodificación para la utilización de una codificación no guiada de conformidad con una modalidad de la presente invención; La Figura 11B es un diagrama para un método de representación de un número de bandas de parámetros como grupo de conformidad con una modalidad de la presente invención; La Figura 12 ilustra una sintaxis de información de configuración de un cuadro espacial de conformidad con una modalidad de la presente invención; La Figura 13A ilustra una sintaxis de información de posición de un segmento de tiempo al cual se aplica un grupo de parámetros de conformidad con una modalidad de la presente invención; La Figura 13B ilustra una sintaxis para representar información de posición de un segmento de tiempo al cual se aplica un grupo de parámetros como valor absoluto y un valor de diferencia de conformidad con una modalidad de la presente invención. La figura 13C es un diagrama para representar varias informaciones de posición de segmentos de tiempo a los cuales se aplican grupos de parámetros como un conjunto de conformidad con una modalidad de la presente invención; La Figura 14 es un diagrama de flujo de un método de codificación de conformidad con una modalidad de la presente invención; y La Figura 15 es un diagrama de flujo de un método de decodificación de conformidad con una modalidad de la presente invención; La Figura 16 es un diagrama de bloques de una arquitectura de dispositivo para implementar los procesos de codificación y decodificación descritos con referencia a las Figuras 1-15. MODALIDAD PREFERIDA DE LA INVENCIÓN La Figura 1 es un diagrama que ilustra un principio de generar información espacial de conformidad con una modalidad de la presente invención. Esquemas de codificación perceptuales para señales de audio de canales múltiples se basan en el hecho que los seres humanos pueden percibir señales de audio a través de tres espacios dimensionales. Los tres espacios dimensionales de una señal de audio pueden ser representados utilizando información espacial, incluyendo, sin limitarse a ellos, los siguientes parámetros espaciales conocidos: Diferencias de Niveles de Canales (CLD) , Correlación/Coherencia entre Canales (ICC) , Diferencia de Tiempo de Canal (CTD) , Coeficientes de Predicción de Canal (CPC), etc. El parámetro CLD describe las diferencias de energía (nivel) entre dos canales de audio, el parámetro ICC describe la cantidad de correlación o coherencia entre dos canales de audio y el parámetro CTD describe la diferencia de tiempo entre dos canales de audio. La generación de parámetros CTD y CLD se ilustra en la Figura 1. Una primera onda sonora directa 103 proveniente de una fuente 101 de sonido remota llega en el oído humano izquierdo 107 y una segunda onda sonora directa 102 es sometida a difracción alrededor de la cabeza de un ser humano para alcanzar el oído humano derecho 106. Las ondas sonoras directas 101 y 103 difieren entre ellas en cuanto a tiempo de llegada y nivel de energía. Los parámetros CTD y CLD pueden ser generados con base en las diferencias con relación a tiempo de llegado y nivel de energía de las ondas sonoras 102 y 103, respectivamente. Además, ondas sonoras reflejadas 104 y 105 llegan a los oídos 106 y 107, respectivamente, y no tienen correlaciones mutuas. Un parámetro ICC puede ser generado con base en la correlación entre las ondas sonoras 104 y 105. En el codificador, informaciones espaciales (por ejemplo, parámetros espaciales) son extraídos de una señal de entrada de audio de canales múltiples y se genera una señal sometida a mezcla reductora. La señal sometida a mezcla reductora y los parámetros espaciales son transferidos a un decodificador. Se puede utilizar cualquier número de canales de audio para la señal sometida a mezcla reductora, incluyendo, sin limitarse a estos: una señal mono, una señal estéreo, o una señal de audio de canales múltiples. En el decodificador, se crea una señal de sometida a mezcla incrementadora de canales múltiples a partir de la señal sometida a mezcla reductora y los parámetros espaciales. La Figura 2 es un diagrama de bloques ' de un codificador para codificar una señal de audio de conformidad con una modalidad de la presente invención. El codificador incluye una unidad de mezcla reductora 202, una unidad 203 de generación de información espacial, una unidad 207 de codificación de señal sometida a mezcla reductora y una unidad de multiplexión 209. Se pueden utilizar otras configuraciones de codificador. Los codificadores pueden implementarse en hardware, software, o en una combinación de hardware y software. Los codificadores pueden ser implementados en chips de circuitos integrados, conjuntos de chips, sistema en un chip (SoC) , procesadores de señales digitales, procesadores para propósitos generales y varios dispositivos digitales y analógicos. La unidad de mezcla reductora 202 genera una señal sometida a mezcla reductora 204 a partir de la señal de audio de canales múltiples 201. En la Figura 2, x?,...,xn indican canales de audio de entrada. Como se mencionó previamente, la señal sometida a mezcla reductora 204 puede ser una señal mono, una señal estéreo, o una señal de audio de canales múltiples. En el ejemplo mostrado, x?,...,xn indican números de canales de la señal sometida a mezcla reductora 204. En ciertas modalidades, el codificador procesa una señal sometida a mezcla reductora 205 proporcionada externamente (por ejemplo, una mezcla reductora artística) en lugar de señal 204 sometida a mezcla reductora. La unidad generadora de información espacial 203 extrae información espacial de la señal de audio de canales múltiples 201. En este caso, la "información espacial" se refiera a una información relacionada con los canales de señal de audio utilizados en mezcla incrementadora de la señal sometida a mezcla reductora 204 a una señal de audio de canales múltiples en el decodificador. La señal sometida a mezcla reductora 204 es generada mediante la mezcla reductora de la señal de audio de canales múltiples. La información espacial es codificada para proporcionar una señal de información espacial codificada 206. La unidad de codificación de señal sometida a mezcla reductora 207 genera una señal sometida a mezcla reductora codificado 208 mediante la codificación de la señal sometida a mezcla reductora 204 generada a partir de la unidad de mezcla reductora 202. La unidad de multiplexión 209 genera una corriente de bits 210 que incluye la señal sometida a mezcla reductora 208 codificada y la señal de información espacial codificada 206. La corriente de bits 210 puede ser transferida a un decodificador corriente abajo y/o grabada en un medio de almacenamiento . La Figura 3 es un diagrama de bloques de un decodificador para decodificar una señal de audio codificada de conformidad con una modalidad de la presente invención. El decodificador incluye' una unidad de desmultiplexión 302, una unidad de decodificación 305 de señal sometida a mezcla reductora, una unidad de decodificación de información espacial 307 y una unidad de mezcla incrementadora. Decodificadores pueden ser implementados en hardware, software o una combinación de hardware y software. Decodificadores pueden ser implementados con chips de circuitos integrados, conjuntos de chips, sistema en un chip (SoC) , procesadores de señales digitales, procesadores para propósitos generales y varios dispositivos digitales y analógicos. En ciertas modalidades, la unidad de desmultiplexión 302 recibe una corriente de bits 301 que representa una señal de audio y después separa una señal sometida a mezcla reductora 303 codificada y una señal de información espacial codificada 304 de la corriente de bits 301. En la Figura 3, x'?,...,x'm indica canales de la señal sometida a mezcla reductora 303. La unidad decodificadora 305 de señal sometida a mezcla reductora produce una señal 3306 con mezcla reductora decodificada mediante la decodificación de la señal 303 con mezcla reductora codificada. Si el decodificador no puede producir una señal de audio de canales múltiples, la unidad decodificadora 305 de señal sometida a mezcla reductora puede producir directamente la señal sometida a mezcla reductora 306. En la Figura 3, y'?,...,y'm indica canales de salida directo de la unidad decodificadora 305 de señal sometida a mezcla reductora. La unidad decodificadora 307 de señal de información espacial extrae información de configuración de la señal de información espacial a partir de la señal de información espacial codificada 304 y después decodifica la señal de información 304 utilizando la información de configuración extraída . La unidad 309 de mezcla incrementadora puede someter a mezcla incrementadota la señal 306 sometida a mezcla reductora en una señal de audio de canales múltiples 310 utilizando la información espacial extraída 308. En la Figura 3 y?,...,yn indica un número de canales de salida de la unidad 309 de mezcla incrementadora. La Figura 4 es un diagrama de bloques de un módulo de conversión de canal que puede estar incluido en la unidad de mezcla incrementadora 309 del decodificador mostrado en la Figura 3. En ciertas modalidades, la unidad de mezcla incrementadora 309 puede incluir varios módulos convertidores de canales. El módulo convertidor de canales es un dispositivo conceptual que puede diferenciar un número de canales de entrada y un número de canales de salida entre ellos empleando información específica. En ciertas modalidades, el módulo convertidor de canales puede incluir una caja OTT (uno-a-dos) para convertir un canal en dos canales y viceversa, y una caja TTT (dos-a-tres) para convertir dos canales a tres canales y viceversa. Las cajas OTT y/o TTT pueden colocarse en varias configuraciones útiles. Por ejemplo, la unidad de mezcla incrementadora 309 mostrado en la Figura 3 puede incluir una configuración 5-1-5, una configuración 5-2-5, una configuración 7-2-7, una configuración 7-5-7, etc. En una configuración 5-1-5, una señal sometida a mezcla reductora que tiene un canal es generada mediante la mezcla reductora de cinco canales a un canal, que puede entonces ser sometido a mezcla incrementadora a cinco canales. Otras configuraciones pueden ser creadas de la misma manera empleando varias combinaciones de cajas OTT y TTT. Con referencia a la Figura 4, se muestra una configuración 5-2-5 de ejemplo para una unidad de mezcla incrementadora 400. En una configuración 5-2-5, una señal sometida a mezcla reductora 401 que tiene dos canales es ingresada a la unidad de mezcla incrementadora 400. En el ejemplo mostrado, un canal izquierdo (L) y un canal derecho (R) se proporcionan como entrada a la unidad de mezcla incrementadora 400. En esta modalidad, la unidad de mezcla incrementadora 400 incluye una caja TTT 402 y tres cajas OTT 406, 407 y 408. La señal sometida a mezcla reductora 401 que tiene dos canales se proporciona como entrada a la caja TTT (TTTo) 402, que procesa la señal sometida a mezcla reductora 401 y proporciona como salida tres canales 403, 404, y 405. Uno o varios parámetros espaciales (por ejemplo, CPC, CLD, ICC) pueden proporcionarse como entrada a la caja TTT 402 y se utilizan para procesar la señal sometida a mezcla reductora 401, de conformidad con lo descrito abajo. En algunas modalidades, una señal residual puede ser proporcionada selectivamente como entrada a la caja TTT 402. En este caso, el CPC puede ser descrito como coeficiente de predicción para generar tres canales a partir de dos canales. El canal 403 proporcionado como salida de la Caja TTT 402 se proporciona como entrada a la caja OTT 406 que genera dos canales de salida utilizando uno o varios parámetros espaciales. En el ejemplo mostrado, los dos canales de salida representan posiciones de bocina de lado frontal izquierdo (FL) y lado posterior izquierdo (BL) por ejemplo en un entorno sonoro. El canal 404 se proporciona como entrada a la caja OTT 402, que genera dos canales de Salida utilizando uno o más parámetros espaciales. En el ejemplo mostrado, los dos canales de salida representan posiciones de bocina de lado frontal derecho (FR) y lado posterior derecho (BR) . El canal 405 se proporciona como entrada a la caja OTT 408 que genera dos canales de salida. En el ejemplo mostrado, los dos canales de salida representan una posición de bocina central (C) y canal de realzamiento de baja frecuencia (LFE) . En este caso, se puede proporcionar una información espacial (por ejemplo, CLD, ICC) como entrada a cada una de las cajas OTT. En ciertas modalidades, señales residuales (Resl, Res2) pueden proporcionarse como entradas a las cajas OTT 406 y 407. En una modalidad de este tipo, una señal residual no puede proporcionarse como entrada a la caja OTT 406 que produce un canal central y un canal LFE. La configuración mostrada en la Figura 4 es un ejemplo de una configuración para un módulo de conversión de canales. Otras configuraciones para un módulo de conversión de canales son posibles, incluyendo varias combinaciones de cajas OTT y TTT. Puesto que cada uno de los módulos convertidores de canales puede operar en un dominio de frecuencia, se puede definir un número de bandas de parámetros aplicadas a cada uno de los módulos convertidores de canales. Una banda de parámetros se refiere por lo menos a una banda de frecuencia aplicable a un parámetro. El número de bandas de parámetros se describe con referencia a la Figura 6B. La Figura 5 es un diagrama que ilustra un método para configurar una corriente de bits de una señal de audio de conformidad con una modalidad de la presente invención. La Figura 5 (a) ilustra una corriente de bits de una señal de audio que incluye una señal de información espacial solamente, y las Figuras 5(b) y 5(c) ilustran una corriente de bits de una señal de audio que ilustra una señal sometida a mezcla reductora y una señal de información espacial. Con referencia a la Figura 5 (a), una corriente de bits de una señal de audio puede incluir información de configuración 501 y cuadro 503. El cuadro 503 puede ser repetido en la corriente de bits y en ciertas modalidades incluye un solo cuadro espacial 502 que contiene información de audio espacial. En ciertas modalidades, la información de configuración 501 incluye información que describe un número total de segmento de tiempo dentro de un cuadro espacial 502, un número total de bandas de parámetros que abarcan un rango de frecuencia de la señal de audio, un número de bandas de parámetros en una caja OTT, un número de bandas de parámetros en la caja TTT y u número de bandas de parámetros en una señal residual. Se puede incluir otra información en la información de configuración 501 según lo deseado. En ciertas modalidades, el cuadro espacial 502 incluye uno o varios parámetros espaciales (por ejemplo, CLD, ICC), un tipo de cuadro, un número de grupos de parámetros dentro de un cuadro y segmento de tiempo a los cuales se pueden aplicar los grupos de parámetros. Otra información puede estar incluida en el cuadro espacial 502 según lo deseado. El significado y uso de la información de configuración 501 y la información contenida en el cuadro espacial 502 se explicarán con referencia a las Figuras 6 a 10. Con referencia a la Figura 5(b), una corriente de bits de una señal de audio puede incluir información de configuración 504, una señal sometida a mezcla reductora 505 y un cuadro espacial 506. En este caso, un cuadro 507 puede incluir la señal sometida a mezcla reductora 505 y el cuadro espacial, 506, y el cuadro 507 puede ser repetido en la corriente de bits. Con referencia a la Figura 5(c), una corriente de bits de una señal de audio puede incluir una señal sometida a mezcla reductora 508, información de configuración 509 y un cuadro espacial 510. En este caso, un cuadro 511 puede incluir la información de configuración 509 y el cuadro espacial 510, y el cuadro 511 puede ser repetido en la corriente de bits. Si la información de configuración 509 es insertada en cada cuadro 511, la señal de audio puede ser reproducida por un dispositivo de reproducción en una posición arbitraria. Aun cuando la Figura 5 (c) ilustra que la información de configuración 509 está insertada en la corriente de bits por cuadro 511, será aparente que la información de configuración 509 puede estar insertada en la corriente de bits por una pluralidad de cuadros que se repiten periódica o no periódicamente. Las Figuras 6A ,y 6B son diagramas que ilustran las relaciones entre un grupo de parámetros, segmento de tiempo y bandas de parámetros de conformidad con una modalidad de la presente invención. Un grupo de parámetros se refiere a uno o varios parámetros espaciales aplicados aun segmento de tiempo. Los parámetros espaciales pueden incluir información espacial, como por ejemplo CDL, ICC, CPC, etc. Un segmento de tiempo se refiere a un intervalo de tiempo de una señal de audio a la cual - se puede aplicar parámetros espaciales. Un cuadro espacial puede incluir uno o varios segmentos de tiempo. Con referencia a la Figura 6A, se pueden utilizar varios grupos de parámetros 1,...,P en cuadro espacial, y cada grupo de parámetros puede incluir uno o varios campos de datos 1,...Q-1. Un grupo de parámetros puede ser aplicado a un rango entero de frecuencias de una señal de audio, y cada parámetro espacial en el grupo de parámetros puede ser aplicado a una o varias porciones de la banda de frecuencias. Por ejemplo, si un grupo de parámetros incluye 20 parámetros espaciales, toda la banda de frecuencias de una señal de audio puede dividirse en 20 zonas (se conocen a continuación como "bandas de parámetros" y los 20 parámetros espaciales del grupo de parámetros pueden ser aplicados a las 20 bandas de parámetros. Los parámetros pueden ser aplicados a las bandas de parámetros según lo deseado. Por ejemplo, los parámetros espaciales pueden ser aplicados densamente a bandas de parámetros de baja frecuencia y pueden ser aplicados escasamente a bandas de parámetros de alta frecuencia. Con referencia a la Figura 6B, una gráfica de tiempo/frecuencia muestra la relación entre grupos de parámetros y segmentos de tiempo. En el ejemplo mostrado, tres grupos de parámetros (grupo de parámetros 1, grupo de parámetros 2, grupo de parámetros 3) se aplican a un conjunto ordenado de 12 segmentos de tiempo en un solo cuadro espacial. En este caso, un rango de frecuencias entero de una señal de audio es dividido en 9 bandas de parámetros. Por consiguiente, el eje horizontal indica el número de segmentos de tiempo y el eje vertical indica el número de bandas de parámetros. Cada uno de los tres grupos de parámetros se aplica a un segmento de tiempo específico. Por ejemplo, un primer grupo de parámetros (grupo de parámetros 1) se aplica a un segmento de tiempo #1, un segundo grupo de parámetros (grupo de parámetros 2) se aplica a un segmento de tiempo #5, y un tercer grupo de parámetros (grupo de parámetros 3) se aplica a un segmento de tiempo #9. Los grupos de parámetros pueden ser aplicados a otros segmentos de tiempo mediante interconexión y/o copiado de los grupos de parámetros a estos segmentos de tiempo. En general, el número de grupos de parámetros puede ser igual o inferior al número de segmentos de tiempo, y el número de bandas de parámetros puede ser igual o inferior al número de bandas de frecuencia de la señal de audio. Mediante la codificación de información espacial para porciones del dominio tiempo-frecuencia de una señal de audio en lugar de todo el dominio tiempo-frecuencia de la señal de audio, es posible reducir la cantidad de información espacial enviada desde un codificador hacia un decodificador. Esta reducción de datos es posible puesto que una información escasa en el dominio tiempo-frecuencia es frecuentemente suficiente para percepción auditiva humana de conformidad con principios conocidos de codificación de audio perceptual. Una característica importante de las divulgaciones presentadas es la codificación y decodificación de las posiciones de segmento de tiempo a los cuales se aplican grupos de parámetros utilizando un número fijo o variable de bits. El número de bandas de parámetros puede también ser representado con un número fijo de bits o un número variable de bits. El esquema de codificación de bits variable puede también aplicarse a otra información utilizada en codificación de audio espacial, incluyendo sin limitarse a esto, información asociada con dominios de tiempo, espaciales y/o de frecuencia (por ejemplo, aplicados a un número de subbandas de frecuencia producidas a partir de un banco de filtros) . La Figura 7A ilustra una sintaxis para representar información de configuración de una señal de información espacial de conformidad con una modalidad de la presente invención. La información de configuración incluye varios campos 701 a 718 a los cuales se puede asignar un número de bits. Un campo "bsSamplingFrequencylndex" 701 indica una frecuencia de muestreo obtenida a partir de un proceso de muestreo de una señal de audio. Para representar la frecuencia de muestreo, se asignan 4 bits al campo "bsSamplingFrequencylndex" 701. Si el valor del campo "bsSamplingFrequencylndex" 701 es 15, es decir, un número binario de llll, a un campo "bsSamplingFrequency" 702 es agregado para representar la frecuencia de muestreo. En este caso, se asignan 24 bits al campo ""bsSamplingFrequency" 702. Un campo "bsFrameLength" 703 indica un número total de segmentos de tiempo (se conocen a continuación como "numSlots") dentro de un cuadro espacial, y una relación de numSlots = bsFrameLength + 1 puede existir entre "numSlots" y el campo "bsFrameLength" 703. Un campo "bsFreqRes" 704 indica un número total de bandas de parámetros que abarcan un dominio de frecuencia entero de una señal de audio. El campo "bsFreqRes" 704 se explicará en la Figura 7B. Un campo "bsTreeConfig" 705 indica información para una configuración de árbol que incluye una pluralidad de módulos de conversión de canales, de conformidad con lo descrito con referencia a la Figura 4. La información para la configuración de árbol incluye información como por ejemplo tipo de módulo de conversión de canal, número de módulos de conversión de canal, tipo de información espacial utilizada en el módulo de conversión de canal, número de canales de entrada/salida de una señal de audio, etc. La configuración de árbol puede tener una de las configuraciones siguientes: una configuración 5-1-5, una configuración 5-2-5, una configuración 7-2-7, una configuración 7-5-7, y similares, según el tipo de módulo de conversión de canal o número de canales. En la Figura 4 se muestra la configuración 5-2-5 de la configuración de árbol. Un campo "bsQuantMode" 706 indica información de modo de cuantificación de información espacial. Un campo "bsOnelcc" 707 indica si un subconjunto de parámetros ICC se utiliza para todas las cajas OTT. En este caso, el subconjunto de parámetros se refiere a un grupo de parámetros aplicado a un segmento de tiempo específico y un módulo de conversión de canal específico. Un campo "bsArbitraryDownmix" 708 indica la presencia o no presencia de una ganancia arbitraria de mezcla reductora. Un campo "bsFixedGainSur" 709 indica una ganancia aplicada a un canal aledaño, por ejemplo, LS (aledaño izquierdo) y RS (aledaño derecho) . Un campo "bsFixedgainLF" 710 indica una ganancia aplicada a un canal LFE. Un campo "bsFixedGainDM" 711 indica una ganancia aplicada a una señal sometida a mezcla reductora. Un campo "bsMatrixMode" 712 indica si o no una señal sometida a mezcla reductora estéreo compatible con matriz es generada a partir de un codificador. Un campo "bsTempShapeConfig" 713 indica un modo de operación de conformación temporal (por ejemplo, TES (conformación de envoltura temporal) y/o TP (conformación temporal) ) en un decodificador. El campo "bsDecorrConfig" 714 indica un modo de operación de un decorrelacionador de un decodificador. Y, el campo "bs3DaudioMode" 715 indica si o no una señal sometida a mezcla reductora está codificada en una señal 3D y si o no se utiliza un procesamiento HRTF inverso. Después de la determinación/extracción de la información de cada uno de los campos en un codificador/decodificador, la información para un número de bandas de parámetros aplicadas a un módulo de conversión de canales es determinada/extraída en el codificador/decodificador. Un número de bandas de parámetros aplicadas a una caja OTT se determina/extrae (716) primero y se determina/extrae entonces (717) un número de bandas de parámetros aplicadas a una caja TTT. El número de bandas de parámetros a la caja OTT y/o caja TTT se describirá con detalles con referencia a las figuras 8A a 9B. En el caso en el cual existe un cuadro de extensión, un bloque "spatialExtensionConfig" 718 incluye información de configuración para el cuadro de extensión. La información incluirá en el bloque "spatialExtensionConfig" 718 se describirá con referencia a las figuras 10A a 10D. La figura 7B es una tabla para un número de bandas de parámetros de una señal de información espacial de conformidad con una modalidad de la presente invención. Un "numBands" indica un número de bandas de parámetros para un dominio de frecuencia entero de una señal de audio y "bsFreqRes" indica una información de índice para el número de bandas de parámetros. Por ejemplo, todo el dominio de frecuencia de una señal de audio puede dividirse entre un número de bandas de parámetros según lo deseado (por ejemplo, 4, 5, 7, 10, 14, 20, 28, etc.). En ciertas modalidades, un parámetro puede ser aplicado a cada banda de parámetros. Por ejemplo, si el "numBands" es 28, entonces el dominio de frecuencia entero de una señal de audio está dividido entre 28 bandas de parámetros y cada uno de los 28 parámetros puede aplicarse a cada una de las 28 bandas de parámetros. En otro ejemplo, si "numBands" es 4, entonces el dominio de frecuencia entero de una señal de audio dada se divide entre 4 bandas de parámetros y cada uno de los cuatro parámetros puede aplicarse a cada una de las 4 bandas de parámetros. En la figura 7B, el término "Reservado" significa que un número de bandas de parámetros para el dominio de frecuencia entero de una señal de audio dada no es determinado. Se observará que un órgano auditivo humano no es sensible al número de bandas de parámetros que se utiliza en el esquema de codificación. Por consiguiente, utilizando un pequeño número de bandas de parámetros se puede obtener un efecto de audio espacial similar a una persona que está escuchando que si se utiliza un gran número de bandas de parámetros. A diferencia de "numBands", "numSlots" representado por el campo "bsFramelength" 703 mostrado en la figura 7A puede representar todos los valores. Los valores de "numSlots" pueden ser limitados, sin embargo, si el número de muestras dentro de un cuadro espacial es exactamente divisible entre "numSlots". Por consiguiente, si un valor máximo de "numSlots" a representar sustancialmente es "b", cada valor del campo "bsFramelength" 703 puede ser representado por ceil{ log2 (b) } bit(s). En este caso, "ceil (x) " se refiere a un número entero mínimo superior o igual al valor "x". Por ejemplo, si un cuadro espacial incluye 72 segmentos de tiempo, entonces ceil{ log2 (72) } = 7 bits puede asignarse al campo "bsFrameLength" 703, y el número de bandas de parámetros aplicadas a un módulo de conversión de canal puede decidirse dentro de "numBands". La figura 8A ilustra una sintaxis para representar un número de bandas de parámetros aplicadas a una caja OTT por un número fijo de bits de conformidad con una modalidad de la presente invención. Con referencia a las figuras 7A y 8A, un valor de "i" tiene un valor de cero a numOttBoxes-1, en donde "numOttBoxes" es el número total de cajas OTT. Específicamente, el valor de "i" indica cada caja OTT, y un número de bandas de parámetros aplicadas a cada caja OTT es representado de conformidad con el valor de "i". Si una caja OTT tiene un modo de canal LFE, el número de bandas de parámetros (se conoce a continuación "bsOttBands") aplicadas al canal LFE de la caja OTT puede ser representado utilizando un número fijo de bits. En el ejemplo mostrado en la figura 8A, se asignan 5 bits al campo "bsOttBands" 801. Si una caja OTT no tiene un modo de canal LFE, el número total de bandas de parámetros (numBands) puede aplicarse a un canal de caja OTT. La figura 8B ilustra una sintaxis para representar un número de bandas de parámetros aplicadas a una caja OTT por un número variable de bits de conformidad con una modalidad de la presente invención. La figura 8B, que es similar a la figura 8A, difiere de la figura 8A en la medida en que el campo "bsOttBands" 802 mostrada en la figura 8B es representado por un número variable de bits. En particular, el campo "bsOttBands" 802 que tiene un valor igual o inferior a "numBands" puede estar representado por un número variable de bits utilizando "numBands". Si "numBands" se encuentra dentro de un rango igual o mayor que 2?(n-l) e inferior a 2? (n) , el campo "bsOttBands" 802 puede estar representado por n bits variables. Por ejemplo: (a) si "numBands" es 40, el campo "bsOttBands" 802 es representado por 6 bits; (b) si "numBands" es 28 ó 20, el campo "bsOttBands" 802 está representado por 5 bits; (c) si "numBands" es 14 ó 10, el campo "bsOttBands" 802 está representado por 4 bits; y (d) si "numBands" es 7, 5 ó 4, el campo "bsOttBands" 802 está representado por 3 bits. Si "numBands" se encuentra dentro de un rango mayor que 2 (n-1) e igual o inferior a 2A (n) , el campo "bsOttBands" 802 puede estar representado por n bits variables. Por ejemplo: (a) si "numBands" es 40, el campo "bsOttBands" 802 está representado por 6 bits; (b) si "numBands" es 28 ó 20, el campo "bsOttBands" 802 está representado por 5 bits; (c) si "numBands" es 14 ó 10, el campo "bsOttBands" 802 está representado por 4 bits; (d) si "numBands" es 7 ó 5, el campo "bsOttBands" 802 está representado por 3 bits; y (e) si "numBands" es 4, el campo "bsOttBands" 802 está representado por 2 bits. El campo "bsOttBands" 802 puede estar representado por un número variable de bits a través de una función (se conoce a continuación como "función ceil") de redondeo hasta un número entero más cercano tomando "numBands" como variable. En particular, i) en el caso de 0<bsOttBands=numBands o 0=bsOttBands<numBands, el campo "bsOttBands" 802 está representado por un número de bits que corresponde a un valor de ceil (log2 (numBands) ) o ii) en caso de O=bsOttBands=numBands, el campo "bsOttBands" 802 puede estar representado por ceil (log2 (numBands+1) its . Si un valor igual o inferior a "numBands" (se conoce a continuación como "numberBands") es determinado de manera arbitraria, el campo "bsOttBands" 802 puede estar representado un número variable de bits a través de la función ceil tomando "numberBands" como variable. En particular, i) en el caso de 0<bsOttBands=numberBands o 0=bsOttBands<numberBands, el campo "bsOttBands" 802 está representado por ceil (log2 (numberBands) ) bits o ii) en caso de O=bsOttBands=numberBands, el campo "bsOttBands" 802 puede estar representado por ceil (log2 (numberBands+1) bits. Si se utiliza más de una caja OTT, una combinación de "bsOttBands" puede expresarse por la fórmula 1 abajo N ^ num Band¿~1 • bsOtBandsi , 0 =bsOttBandsi < num Bands, í=1 en donde, bsOttBands indica una i-ava "bsOttBands". Por ejemplo, vamos a considerar que existen tres cajas OTT y tres valores (N=3) para el campo "bsOttBands" 802. En este ejemplo, los tres valores del campo "bsOttBands" 802 (se conocen a continuación como al, a2 y a3, respectivamente) aplicados a las tres cajas OTT, respectivamente, pueden estar representados por 2 bits cada uno. Por consiguiente, se requiere de un total de 6 bits para expresar los valores al, a2 y a3. Sin embargo, si los valores al, a2 y a3 están representados como grupo, entonces pueden ocurrir 27 (= 3*3*3) casos, que pueden estar representados por 5 bits, ahorrándose un bit. Si "numBands" es 3 y un valor de grupo representado por 5 bits es 15, el valor de grupo puede ser representado como 15=lx (3?2) +2* (3?1) +0* (3?0) . Por consiguiente, un decodificador puede determinar a partir del valor de grupo 15 que los tres valores al, a2 y a3 del campo "bsOttBands" 801 son 1, 2 y 0, respectivamente, mediante la aplicación de la inversa de la fórmula 1. En el caso de múltiples cajas OTT, la combinación de "bsOttBands" puede representarse como una de las fórmulas 2 a 4 (definidas abajo) utilizando "numberBands". Puesto que la representación de "bsOttBands" utilizando "numberBands" es similar a la representación utilizando "numBands" en la fórmula 1, se omitirá una explicación detallada y solamente las fórmulas se presentan abajo.
[ Fórmula 2 ] N T (numberBan? + ?)i • bsOftBands. , O =bsCMBands. = numberBan?, í=l [ Fórmula 3 ] • bsOttBandsi , O <bsOtBandsi < numberBan?, [ Fórmula 4 ] .^ numberBan?*'1 • bsOttBands¿ , O <bsOttBandsi = numberBan?, í=l La figura 9A ilustra una sintaxis para representar un número de bandas de parámetros aplicadas una caja TTT por número fijo de bits de conformidad con una modalidad de la presente invención. Con referencia a las figuras 7A y 9A, un valor de "i" tiene un valor de cero a numTttBoxes-1, en donde "numTttBoxes" es un número de todas las cajas TTT. Específicamente, el valor de "i" indica a cada caja TTT. Un número de bandas de parámetros aplicadas a cada caja TTT es representado de conformidad con el valor de "i". En ciertas modalidades, la caja TTT puede estar dividida en un rango de bandas de baja frecuencia y un rango de bandas de alta frecuencia, y procesos diferentes pueden ser aplicados a los rangos de bandas de baja frecuencia y bandas de altas frecuencias. Otras divisiones son posibles. Un campo "bsTttDualMode" 901 indica si o no una caja TTT dada opera en modos diferentes (se conoce a continuación como "modo doble") para un rango de banda de baja frecuencia y un rango de banda de alta frecuencia, respectivamente. Por ejemplo, si un valor del campo "bsTttDualMode" 901 es cero, entonces se utiliza un modo para todo el rango de banda sin discriminar entre rango de banda de baja frecuencia y rango de banda de alta frecuencia. Si un valor del campo "bsTttDualMode" 901 es 1, entonces se pueden utilizar modos diferentes para el rango de banda de baja frecuencia y el rango de banda de alta frecuencia. Un campo "bsTttModeLow" 902 indica un modo de operación de una caja TTT dada, que puede tener varios modos de operación. Por ejemplo la caja TTT puede tener un modo de predicción que utiliza, por ejemplo parámetros CPC e ICC, un modo basado en energía que utiliza, por ejemplo, parámetros CLD, etc. Si una caja TTT tiene un modo doble, información adicional para un rango de banda de alta frecuencia puede ser necesaria. Un campo "bsTttModeHigh" 903 indica un modo de operación del rango de banda de alta frecuencia, en el caso en el cual la caja TTT tiene un modo doble. Un campo "bsTttBandsLow" 904 indica un número de bandas de parámetros aplicadas a la caja TTT. Un campo "bsTttBandsHigh" 905 tiene "numBands". Si una caja TTT tiene un modo doble, un rango de banda de baja frecuencia puede ser igual o superior a cero e inferior a "bsTttBandsLow", mientras que un rango de banda de alta frecuencia puede ser igual o superior a "bsTttBandsLow" e inferior a "bsTttBandsHigh". Si una caja TTT no tiene un modo doble, un número de bandas de parámetros aplicadas a la caja TTT puede ser igual o mayor que cero e inferior a "numBands" (907). El campo "bsTttBandsLow" 904 puede estar representado por un número fijo de bits. Por ejemplo, como se muestra en la figura 9A, 5 bits pueden ser asignados para representar el campo "bsTttBandsLow" 904. La figura 9B ilustra una sintaxis para representar un número de bandas de parámetros aplicadas a una caja TTT por un número variable de bits de conformidad con una modalidad de la presente invención. La figura 9B es similar a la figura 9A pero difiere de la figura 9A en la representación de un campo "bsTttBandsLow" 907 de la figura 9B por un número variable de bits mientras que representa un campo "bsTttBandsLow" 904 de la figura 9A por un número fijo de bits. En particular, puesto que el campo "bsTttBandsLow" 907 tiene un valor igual o inferior a "numBands", el campo "bsTttBands" 907 puede estar representado por un número variable de bits utilizando "numBands" . En particular, en el caso en el cual "numBands" es igual o superior a 2A(n-l), e inferior a 2 (n), el campo "bsTttBandsLow" 907 puede estar representado por n bits. Por ejemplo: (i) si "numBands" es 40, el campo "bsTttBandsLow" 907 está representado 6 bits; (ii) si el "numBands" es 28 ó 20, el campo "bsTttBandsLow" 907 está representado por 5 bits; (iii) si "numBands" es 14 ó 10, el campo "bsTttBandsLow" 907 está representado por 4 bits; y (iv) si "numBands" es 7, 5 ó 4, el campo "bsTttBandsLow" 907 está representado por 3 bits. Si "numBands" se encuentra dentro de un rango mayor que 2A (n-1) e igual o inferior a 2 (n) , entonces el campo "bsTttBandsLow" 907 puede estar representado por n bits. Por ejemplo: (i) si "numBands" es 40, el campo "bsTttBandsLow" 907 está representado por 6 bits; (ii) si "numBands" es 28 ó 20, el campo "bsTttBandsLow" 907 está representado por 5 bits;' (iii) si "numBands" es 14 ó 10, el campo "bsTttBandsLow" 907 está representado por 4 bits; (iv) si "numBands" es 7 ó 5, el campo "bsTttBandsLow" 907 está representado por 3 bits; y (v) si "numBands" es 4, el campo "bsTttBandsLow" 907 está representado por 2 bits. El campo "bsTttBandsLow" 907 puede estar representado por un número de bits determinado por una función ceil tomando "numBands" como variable. Por ejemplo: i) en caso de 0<bsTttBandsLow numBands o 0=bsTttBandsLow<numBands, el campo "bsTttBandsLow" 907 está representado por un valor de bits que corresponde a un valor de ceil (log2 (numBands) ) o ii) en caso de O=bsTttBandsLow=numBands, el campo "bsTttBandsLow" 907 puede estar representado por ceil (log2 (numBands+1) bits. Si un valor igual o inferior a "numBands", es decir, "numberBands" es determinado de manera arbitraria, el campo "bsTttBandsLow" 907 puede estar representado por un número variable de bits utilizando "numberBands". En particular, i) en caso de 0<bsTttBandsLow=numberBands o 0=bsTttBandsLow<numberBands, el campo "bsTttBandsLow" 907 está representado por un número de bits que corresponde a un valor de ceil (log2 (numberBands) ) o ii) en caso de O=bsTttBandsLow=numberBands, el campo "bsTttBandsLow" 907 puede estar representado por un número de bits que corresponde a un valor de ceil (log2 (numberBands+1) . En caso de múltiples cajas TTT, una combinación de "bsTttBandsLow" puede expresarse como fórmula 5 definida abajo. [Fórmula 5] N ? i m Banda • bsTttBandsLow. , 0 =bsTttBandsLowj < num Bands- En este caso, bsTttBandsLowi indica una i-ava "bsTttBandsLow". Puesto que el significado de la Fórmula 5 es idéntico al significado de la fórmula 1, se omitirá en la descripción siguiente una explicación detallada de la Fórmula . En el caso de múltiples cajas TTT, la combinación de "bsTttBandsLow" puede representarse como una de las fórmulas 6 a 8 utilizando "numberBands". Puesto que el significado de las fórmulas 6 a 8 es idéntico al significado de las fórmulas 2 a A , - en la descripción siguiente se omitirá una explicación detallada de las fórmulas 6 a 8. [Fórmula 6] • bsTttBandsLowit 0 =bsTttBandsLow. = numberBan?, [Fórmula 7] ?numberBaná^1 - bsTttBandsLow- , 0 =bsTttBandsLow - < numberBan?. M [Fórmula 8] SnwnberBan?i • bsTttBandsLow- , 0 <bs7ÜBandsLow- = numberBan?, «-1 Un número de bandas de parámetros aplicadas al módulo de conversión de canales (por ejemplo, caja OTT y/o caja TTT) puede representarse como un valor de división de "numBands".
En este caso, el valor de división utiliza un valor medio de "numBands" o un valor que resulta de la división de "numBands" por un valor específico. Una vez determinado un número de bandas de parámetros aplicadas a la caja OTT y/o caja TTT, grupos de parámetros pueden ser determinados los cuales pueden ser aplicados a cada caja OTT y/o cada caja TTT dentro de un rango del número de bandas de parámetros. Cada uno de los grupos de parámetros puede ser aplicado a cada caja OTT y/o cada caja TTT por unidad de segmento de tiempo. Específicamente, un grupo de parámetros puede ser aplicado a un segmento de tiempo. Como se mencionó en la descripción anterior, un cuadro espacial puede incluir varios segmentos de tiempo. Si el cuadro espacial es un tipo de cuadro fijo, entonces un grupo de parámetros puede aplicado a una pluralidad de los segmentos de tiempo con un intervalo igual. Si el cuadro es un tipo de cuadro variable, se requiere de información de posición del segmento de tiempo al cual se aplica el grupo de parámetros. Esto se explicará con detalles a continuación con referencia a las figuras 13A a 13C. La figura 10A ilustra la sintaxis para información de configuración de extensión espacial para un cuadro de extensión espacial de conformidad con una modalidad de la presente invención. Una información de configuración de extensión espacial puede incluir un campo "bsSacExtType" 1001, un campo "bsSacExtLen" 1002, un campo "bsSacExtLenAdd" 1003, un campo "bsSacExtLenAddAdd" 1004 y un campo "bsFillBits" 1007. Otros campos son posibles. El campo "bsSacExtType" 1001 indica un tipo de datos de un cuadro de extensión espacial. Por ejemplo, el cuadro de extensión espacial puede estar llenado con ceros, datos de señales residuales, datos de señales residuales sometidos a mezcla reductora arbitrarios o datos de árbol arbitrarios. El campo "bsSacExtLen" 1002 indica un número de bytes de la información de configuración de extensión espacial. El campo "bsSacExtLenAdd" 1003 indica un número adicional de bytes de información de configuración de extensión espacial si un número de bytes de la información de configuración de extensión espacial se vuelve igual o mayor a 15, por ejemplo. El campo "bsSacExtLenAddAdd" 1004 indica un número adicional de bytes de información de configuración de extensión espacial si un número de bytes de la información de configuración de extensión espacial se vuelve igual o superior a 270, por ejemplo. Después de la determinación/extracción de los campos respectivos en un codificador/decodificador, la información de configuración para un tipo de datos incluido en el cuadro de extensión espacial es determinada (1005). Como se mencionó en la descripción anterior, datos de señales residuales, datos de señales residuales sometidos a mezcla reductora arbitrarios, datos de configuración de árbol o similares pueden incluirse en el cuadro de extensión espacial . Subsiguientemente, un número de bits no utilizados de una longitud de la información de configuración de extensión espacial se calcula 1006. El campo "bsFillBits" 1007 indica el número de bits de datos o que pueden ser pasados por alto para llenar los bits no utilizados.
Las figuras 10B y 10C ilustran sintaxis par información de configuración de extensión espacial para una señal residual en el caso en el cual la señal residual está incluida en un cuadro de extensión espacial de conformidad con una modalidad de la presente invención. Con referencia a la figura 10B, un campo "bsResidualSamplingFrequencylndex" 1008 indica una frecuencia de muestreo de una señal residual. Un campo "bsResidualFramePerSpatialFrame" 1009 indica un número de cuadros residuales por cuadro espacial. Por ejemplo, 1, 2, 3 ó 4 cuadros residuales pueden estar incluidos en un cuadro espacial. Un bloque "ResidualConfig" 1010 indica un número de bandas de parámetros para una señal residual aplicada a cada caja OTT y/o caja TTT. Con referencia a la figura 10C, un campo "bsResidualPresent" 1011 indica si o no una señal residual es aplicada a cada caja OTT y/o caja TTT. Un campo "bsResidualBands" 1012 indica un número de bandas de parámetros de la señal residual existente en cada caja OTT y/o caja TTT si la señal residual existe en cada caja OTT y/o caja TTT. Un número de bandas de parámetros de la señal residual puede ser representado por un número fijo de bits o un número variable de bits. En el caso en el cual el número de bandas de parámetros está representada por un número fijo de bits, la señal residual puede tener un valor igual o inferior a un número total de bandas de parámetros de una señal de audio. Así, un número de bits (por ejemplo 5 bits en la figura 10C) necesario para representar un número de todas las bandas de parámetros puede ser asignado. La figura 10D ilustra una sintaxis para representar un número de bandas de parámetros de una señal residual por un número variable de bits de conformidad con una modalidad de la presente invención. Un campo "bsResidualBands" 1014 puede ser representado por un número variable de bits utilizando "numBands". Si numBands es igual o mayor a 2A(n-l) e inferior a 2A (n) , el campo "bsResidualBands" 1014 puede ser representado por n bits. Por ejemplo: (i) si "numBands" es 40, el campo "bsResidualBands" 1014 está representado por 6 bits; (ii) si "numBands" es 28 ó 20, el campo "bsResidualBands" 1014 está representado por 5 bits; (iii) si "numBands" es 14 ó 10, el campo "bsResidualBands" 1014 está representado por 4 bits; y (iv) si "numBands" es 7, 5 ó 4, el campo "bsResidualBands" 1014 está representado por 3 bits. Si numBands es mayor que 2A (n-l) e igual o inferior a 2 (n) , entonces el número de bandas de parámetros de la señal residual puede estar representado por n bits. Por ejemplo: (i) si "numBands" es 40, el campo "bsResidualBands" 1014 se representa por 6 bits; (ii) si"numBands" es 28 ó 20, el campo "bsResidualBands" 1014 está representada por 5 bits; (iii) si "numBands" es 14 ó 10, el campo "bsResidualBands" 1014 está representado por 4 bits; (iv) si "numBands" es 7 ó 5, el campo "bsResidualBands" 1014 está representado por 3 bits; y (v) si "numBands" es 4, el campo "bsResidualBands" 1014 está representado por 2 bits. Además, el campo "bsResidualBands" 1014 puede estar representado por un número de bits determinado por una función ceil de redondeo a un número entero más cercano tomando "numBands" como variable. En particular, i) en caso de 0<bsResídualBands=numBands o 0=bsResidualBands<numBands, el campo "bsResidualBands" 1014 está representado por ceil (log2 (numBands) ) bits o ii) en caso de O=bsResidualBandsz=numBAnds, el campo "bsResidualBands" 1014 puede estar representado por ceil (log2 (numBands+1) ) bits . En ciertas modalidades, el campo "bsResidualBands" 1014 puede estar representado utilizando un valor (numberBands) igual o inferior a numBands . En particular, i) en caso de 0<bsresidualBands=numberBands o 0=bsresídualBands<numberBands, el campo "bsResidualBands" 1014 está representado por ceil{ log2 (numberBands) } bits o ii) en caso de O=bsresidualBands=numberBands, el campo "bsResidualBands" 1014 puede estar representado por ceil{log2 (numberBands+1) }bits.
Si existen varias señales residuales (N) , una combinación de "bsResidualBands" puede ser expresada como se muestra en la fórmula 9 abajo. [Fórmula 9] N ?numBand?'1 • bsResidualBands- , 0 =bsFesidualBandsi < numBands, En este caso, bsResidualBandsi indica una i-ava "bsResidualBands". Puesto que el significado de la fórmula 9 es idéntico al significado de la fórmula 1, se omitirá en la descripción siguiente una explicación detallada de la Fórmula 9. Si existen múltiples señales residuales, una combinación de "bsresidualBands" puede ser representada como una de las fórmulas 10 a 12 utilizando "numberBands". Puesto que la representación de "bsresidualBands" empleando "numberbands" es idéntica a la representación de las fórmulas 2 a 4, su explicación detallada será omitida en la descripción siguiente . [Fórmula 10] tt (numberBan? + 1)M • bsResidualBands- , 0 =bsí^sidualBandsi = numberBan?, [ Fórmula 11 ] < numberBan?, [ Fórmula 12 ] N S YnumberBan?i • bs ssidualBandsj , O KbsRssidualBands. = numberBan?, Un número de bandas de parámetros de la señal residual puede representarse como un valor de división de "numBands". En este caso, el valor de división puede utilizar un valor de la mitad de "numBands" o valor que resulte de la división de "numBands" entre un valor específico. La señal residual puede estar incluida en una corriente de bits de una señal de audio junto con una señal sometida a mezcla reductora y una señal de información espacial, y la corriente de bits puede ser transferida a un decodificador. El decodificador puede extraer la señal sometida a mezcla reductora, la señal de información espacial y la señal residual de la corriente de bits. Subsiguientemente, la señal sometida a mezcla reductora es sometida a mezcla incrementadora utilizando la información espacial. Mientras tanto, la señal residual es aplicada a la señal sometida a mezcla reductora en el transcurso del mezclado incrementador. En particular, la señal sometida a mezcla reductora es sometida a mezcla incrementadora en varios módulos de conversión de canales utilizando la información espacial. De esta manera, la señal residual es aplicada al módulo de conversión de canal. Como se mencionó en la descripción anterior, el módulo de conversión de canal tiene un número de bandas de parámetros y un grupo de parámetros es aplicado al módulo de conversión de canales por una unidad de segmento de tiempo. Cuando la señal residual es aplicada al módulo de conversión de canales, la señal residual puede ser necesaria para actualizar la información de correlación entre canales de la señal de audio a la cual se aplica la señal residual. Entonces, se utiliza la información de correlación entre canales actualizada en un proceso de mezclado incrementador. La Figura HA es un diagrama de bloques de un decodificador para codificación no guiada de conformidad con una modalidad de la presente invención. Una codificación no guiada significa que la información espacial no está incluida en una corriente de bits de una señal de audio. En ciertas modalidades, el decodificador incluye un banco de filtro de análisis 1102, una unidad de análisis 1104, una unidad de síntesis espacial 1106 y un banco de filtros de síntesis 1108. Aun cuando en la Figura HA se muestra una señal sometida a mezcla reductora en un tipo de señal estéreo, otros tipos de señales sometidas a mezcla reductora pueden utilizarse. En operación, el decodificador recibe una señal sometida a mezcla reductora 1101 y el banco de filtro de análisis 1102 convierte la señal sometida a mezcla reductora recibida 1101 a una señal de dominio de frecuencia 1103. La unidad de análisis 1104 genera una información espacial a partir de la señal sometida a mezcla reductora 1103 convertida. La unidad de análisis 1104 efectúa un procesamiento a través de una unidad de segmentos y la información espacial 1105 puede ser generada para una pluralidad de segmentos. En este caso, el segmento incluye un segmento de tiempo. La información espacial puede ser generada en dos etapas. Primero, un parámetro de mezcla reductora es generado a partir de la señal sometida a mezcla reductora. Segundo, el parámetro de mezcla reductora es convertido en información espacial como por ejemplo un parámetro espacial. En ciertas modalidades, el parámetro de mezcla reductora puede ser generado a través de un cálculo de matriz de la señal sometida a mezcla reductora. La unidad de síntesis espacial 1106 genera una señal de audio de canales múltiples 1107 mediante la síntesis de la información espacial generada 1105 con la señal sometida a mezcla reductora 1103. La señal de audio 1107 de canales múltiples generada pasa a través del banco de filtros de síntesis 1108 para ser convertida en una señal de audio de dominio de tiempo 1109. La información espacial puede ser generada en posiciones de segmentos predeterminadas. La distancia entre las posiciones puede ser igual (es decir, equidistante) . Por ejemplo, la información espacial puede ser generada por cuatro segmentos. La información espacial puede también ser generada en posiciones variables de segmento. En este caso, la información de posición de segmento a partir de la cual se genera la información espacial puede ser extraída de la corriente de bits. La información de posición puede ser representada por un número variable de bits. La información de posición puede ser representada como un valor absoluto y un valor de diferencia a partir de una información de posición de segmento previo. En el caso de la utilización de codificación no guiada, un número de bandas de parámetros (se conocen a continuación como "bsNumguidedBlindBands") para cada canal de una señal de audio puede ser representado por un número fijo de bits. El "bsNumguidedBlindBands" puede ser representado por un número variable de bits utilizando "numBands". Por ejemplo, si numBands" es igual o mayor que 2 (n-l) e inferior a 2 (n) , el "bsNumguidedBlindBands" puede estar representado por n bits variables . En particular, (a) si "numBands" es 40, "bsNumguidedBlindBands" está representado por 6 bits, (b) si "numBands" es 28 ó 20, "bsNumguidedBlindBands" está representado por 5 bits, (c) si "numBands" es 14 ó 10, "bsNumguidedBlindBands" está representado por 4 bits, y (d) si "numBands" es 7, 5 ó 4, "bsNumguidedBlindBands" está representado por 3 bits. si "numBands" es mayor que 2 (n-l) e igual o inferior a 2A (n), entonces "bsNumguidedBlindBands" puede estar representado por n bits variables. Por ejemplo: (a) si "numBands" es 40, "bsNumguidedBlindBands" está representado por 6 bits; (b) si "numBands" es 28 ó 20, "bsNumguidedBlindBands" está representado por 5 bits; (c) si "numBands" es 14 ó 10, "bsNumguidedBlindBands" está representado por 4 bits; (d) si "numBands" es 7có 5, "bsNumguidedBlindBands" está representado por 3 bits; y (e) si "numBands" es 4, "bsNumguidedBlindBands" está representado por 2 bits. Además, "bsNumguidedBlindBands" puede estar representado por un número variable de bits utilizando la función ceil tomando "numBands" como variable. Por ejemplo, i) en el caso de 0<bsNumguídedBlindBands=numBands ó 0=bsNumguídedBlindBands<numBands, el "bsNumguidedBlindBands" está representado por ceil { log2 (numBands) } bits ó ii) en el caso de 0<bsNumguidedBlíndBands=numBands, "bsNumguidedBlindBands" puede estar representado por ceil{ log2 (numBands+1) } bits. Si un valor igual o inferior a "numBands", es decir, "numBands" es determinada de manera arbitraria, "bsNumguidedBlindBands" puede estar representada de la manera siguiente . En particular, i) en el caso de 0<bsNumguidedBlíndBands=numberBands ó 0=bsNumguidedBlíndBands<numberBands, el "bsNumguidedBlindBands" está representado por ceil {log2 (numberBands) } bits ó ii) en el caso de 0<bsNumguidedBlindBands=numberBands, "bsNumguidedBlindBands" puede estar representado por ceil{log2 (numberBands+1) } bits.
Si existe un número de canales (N) , una combinación de "bsNumguidedBlindBands" puede expresarse como Fórmula 13. [Fórmula 13] N T numBand?-1 • bsNumGuidedBliridBan?-, 0 =bsMimGuidedBlindBaná- < numBands, í-l En este caso, "bsNumguidedBlindBandSj." indica una i-ava "bsNumguidedBlindBands". Puesto que el significado de la Fórmula 13 es idéntico al significado de la Fórmula 1, una explicación detallada de la Fórmula 13 se omite en la descripción siguiente. Si existen múltiples canales, "bsNumguidedBlindBands" puede estar representado como uno de las Fórmulas 14 a 16 utilizando "numberBands". Puesto que la representación de "bsNumguidedBlindBands" utiliza "numberbands" es idéntica a las representaciones de las Fórmulas 2 a 4, una explicación detallada de las Fórmulas 14 a 16 será omitida en la descripción siguiente. [Fórmula 14] 0 =bsN mGuidedBlindBandsi = numberBands, [ Fórmula 15 ] numberBandé'1 bs imCk?dedBhndBaxdSi, Q=bsNumGuidedBIindBandSi <numberBands, i-1 [Fórmula 16] ?T numberBands1'1 -bsNúmG idedBlindBands¡ , 0 <bsNumGt?dedBhndBand s¡ =mtmbßrBands, i-1 La Figura 11B es un diagrama para un método para representar un número de bandas de parámetros como un grupo de conformidad con una modalidad de la presente invención. Un número de bandas de parámetros incluye información de número de bandas de parámetros aplicadas a un módulo de conversión de canales, información de número de bandas de parámetros aplicadas a una señal residual e información de número de bandas de parámetros para cada canal de una señal de audio en caso de utilizar una codificación no guiada. En el caso en el cual existe una pluralidad de información de número de bandas de parámetros, la pluralidad en información de números (por ejemplo "bsOttBands", "bsTttBands", "bsResidualBand" y/o "bsNumguidedBlindBands") puede representarse como por lo menos uno o varios grupos. Con referencia a la Figura 11B, si existen (kN+L) informaciones de número de bandas de parámetros y si se requieren de Q bits para representar cada información de número de bandas de parámetros, una pluralidad de informaciones de números de banda de parámetros puede ser representada como un grupo siguiente. En este caso, "k" y "N" son números enteros arbitrarios no cero y "L" es un número entero arbitrario que cumple 0=L<N. Un método de agrupamiento incluye los pasos de generar k grupos mediante la unión de N informaciones de número de bandas de parámetros y mediante la generación de un último grupo mediante la unión de la última información de número L de bandas de parámetro. Cada grupo k puede estar representado como M bits y el último grupo puede estar representado como p bits. En este caso, los M bits son preferentemente inferiores a N*Q bits utilizados en el caso de la representación de cada información de número de bandas de parámetros sin agruparlos. Los p bits son preferentemente iguales o inferiores a L*Q bits utilizados en caso de representar cada información de número de las bandas de parámetros sin agruparlos. Por ejemplo, vamos a considerar que dos informaciones de números de bandas de parámetros son bl y b2, respectivamente. Si cada uno de bl y b2 puede tener 5 valores, se requieren de 3 bits para representar cada uno de bl y b2. En este caso, aun si los 3 bits pueden representar 8 valores, se requieren sustancialmente de 5 valores. Así, cada uno de bl y b2 tiene 3 redundancias. Sin embargo, en caso de representar el bl y b2 como grupo mediante la unión de bl y b2 juntos, 5 bits pueden ser utilizados en lugar de 6 bits (= 3 bits + 3 bits) . En particular, puesto que todas las combinaciones de bl y b2 incluyen 25 (=5*5) tipos, un grupo dé bl y b2 puede estar representado como 5 bits. Puesto que los 5 bits son capaces de representar 32 valores, 7 redundancias son generadas en el caso de la representación de agrupamiento. Sin embargo, en caso de una representación mediante agrupamiento bl y b2, la redundancia es inferior a la redundancia de un caso en el cual se representa cada uno de bl y b2 como 3 bits. Un método para representar una pluralidad de información de números de bandas de parámetros como grupos puede implementarse de varias formas como se muestra a continuación. Si varias informaciones de números de bandas de parámetros tienen 40 tipos de valores cada una k grupos son generados utilizando 2, 3, 4, 5 ó 6 como N. Los k grupos pueden estar representados como 11, 16, 22, 27 y 32 bits, respectivamente. Alternativamente, los k grupos están representados mediante la combinación de los casos respectivos. Si varias informaciones de números de bandas de parámetros tienen 28 tipos de valores cada una, k grupos son generados utilizando 6 como N y los k grupos pueden estar representados como 29 bits. Si varias informaciones de números de bandas de parámetros tienen 20 tipos de valores cada uno k grupos son generados utilizando 2, 3, 4, 5, 6 ó 7 como N. Los k grupos pueden estar representados como 9, 13, 18, 22, 26 y 31 bits, respectivamente. Alternativamente, los k grupos pueden estar representados mediante la combinación de los casos respectivos . Si varias informaciones de números de bandas de parámetros tienen 14 tipos de valores cada uno, k grupos pueden ser generados utilizando 6 como N. Los k grupos pueden estar representados como 23 bits. Si varias informaciones de números de bandas de parámetros tienen 10 tipos de valores cada una, k grupos son generados utilizando 2, 3, 4, 5, 6, 7, 8 ó 9 como el N. Los k grupos pueden estar representados como 7, 10, 14, 17, 20, 24, 27 y 30 bits, respectivamente. Alternativamente, los k grupos pueden estar representados mediante la combinación de los casos respectivos. Si varias informaciones de números de bandas de parámetros tienen 7 tipos de valores cada uno, k grupos son generados utilizando 6, 7, 8, 9, 10 u 11 como N. Los k grupos están representados como 17, 20, 23, 26, 29 y 31 bits, respectivamente. Alternativamente, los k grupos están representados mediante la combinación de los casos respectivos. Si varias informaciones de números de bandas de parámetros tiene, por ejemplo, 5 tipos de valores cada uno, k grupos pueden ser generados utilizando 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, ó 13 como el N. Los k grupos pueden estar representados como 5, 7, 10, 12, 14, 17, 19, 21, 24, 26, 28 y 31 bits, respectivamente. Alternativamente, los k grupos están representados mediante la combinación de los casos respectivos . Además, varias informaciones de números de bandas de parámetros pueden estar configuradas para ser representadas como los grupos descritos arriba, o bien para ser representadas consecutivamente mediante la formación de cada información de número de bandas de parámetros en una secuencia de bits independiente. La figura 12 ilustra la sintaxis que representa la información de configuración de un cuadro espacial de conformidad con una modalidad de la presente invención. Un cuadro espacial incluye un bloque "Framinglnfo" 1201, un campo "bsIndependencyFlag" 1202, un bloque "OttData" 1203, un bloque "TttData" 1204, un bloque "SmgData" 1205 y un bloque "tempShapeData" 1206. El bloque "Framinglnfo" 1201 incluye información para un número de grupos de parámetros e información para segmento de tiempo al cual aplica cada grupo de parámetros. El bloque "Framinglnfo" 1201 se describe con detalles en la Figura 13A. El campo "bsIndependencyFlag" indica si o no un cuadro actual puede ser decodificado sin conocimiento de un cuadro previo. El bloque "OttData" 1203 incluye toda la información de parámetro espacial para todos los cuadros OTT. El bloque "TttData" 1204 incluye toda la información de parámetro espacial para todas las cajas TTT. El bloque "SmgData" 1205 incluye información para suavización temporal aplicada a un parámetro espacial de cuantificado. El bloque "tempShapeData" 1206 incluye información para formación de envoltura temporal aplicada a una señal de correlacionada . La Figura 13A ilustra una sintaxis para representar información de posición de segmento de tiempo al cual aplica un grupo de parámetros, de conformidad con una modalidad de la presente invención. Un campo "bsFramingType" 1301 indica si o no un mapa espacial de una señal de audio es un tipo de cuadro fijo o un tipo de cuadro variable. Un cuadro fijo significa un cuadro en el cual un grupo de parámetros es aplicado a un segmento de tiempo preestablecido. Por ejemplo, un grupo de parámetros es aplicado a un segmento de tiempo preestablecido con un intervalo igual. Un cuadro variable significa un cuadro que recibe separadamente información de posición de un segmento de tiempo al cual se aplica un grupo de parámetros . Un campo "bsNumParamSets" 1302 indica un número de grupo de parámetros dentro de un cuadro espacial (a continuación nombrado "numParamSets") y una relación de "numParamSets = bsNumparamSets + 1" existe entre "numParamSets". Puesto que se asignan, por ejemplo, 3 bits al campo "bsNumParamSets" 1302 en la Figura 13A, un máximo de 8 grupos de parámetros puede proporcionarse dentro de un cuadro espacial. Puesto que no existe límite en cuanto al número de bits asignados más grupos de parámetros pueden proporcionarse dentro de un cuadro espacial. Si el cuadro espacial es un tipo de cuadro fijo, la información de posición de un segmento de tiempo al cual aplica un grupo de parámetros puede determinarse de conformidad con una regla preestablecida, e información de posición adicional de un segmento de tiempo al cual el parámetro establecido es aplicado es innecesaria. Sin embrago, si el cuadro espacial es un tipo de cuadro variable, se requiere de información de posición de un segmento de tiempo al cual aplica un grupo de parámetros. Un Campo "bsParamSlot" 1303 indica información de posición de un segmento de tiempo al cual es aplicado un grupo de parámetros. El campo "bsParamSlot" 1303 puede estar representado por un número variable de bits utilizando el número de segmentos de tiempo dentro de un cuadro espacial, es decir, "numSlots". En particular, en el caso en el cual "numSlots" es igual o mayor a 2 (n-l) e inferior a 2 (n), el campo "bsParamSlot" 1103 puede estar representado por n bits. Por ejemplo: (i) si el "numSlots" se encuentra dentro de un rango comprendido entre 64 y 127, el campo "bsParamSlot" 1303 puede estar representado por 7 bits; (ii) si el "numSlots" se encuentra dentro de un rango comprendido entre 32 y 63, el campo "bsParamSlot" 1303 puede estar representado por 6 bits; (iii) si el "numSlots" se encuentra dentro de un rango comprendido entre 16 y 31, el campo "bsParamSlot" 1303 puede estar representado por 5 bits; (iv) si el "numSlots" se encuentra dentro de un rango comprendido entre 8 y 15, el campo "bsParamSlot" 1303 puede estar representado por 4 bits; (v) si el "numSlots" se encuentra dentro de un rango comprendido entre 4 y 7, el campo "bsParamSlot" 1303 puede estar representado por 3 bits; (vi) si el "numSlots" se encuentra dentro de un rango comprendido entre 2 y 3, el campo "bsParamSlot" 1303 puede estar representado por 2 bits; (vii) si el "numSlots" es 1 el campo "bsParamSlot" 1303 puede estar representado por 1 bit; y (viii) si el "numSlots" es 0, el campo "bsParamSlot" 1303 puede estar representado por 0 bits. De la misma manera, si "numSlots" se encuentra dentro de un rango comprendido entre 64 y 127, el campo "bsParamSlot" 1303 puede estar representado por 7 bits. Si existen múltiples grupos de parámetros (N) , una combinación de "bsParamSlot" puede estar representada de conformidad con la Fórmula 9. [Fórmula 9] N umSlot *"1 -bsParamSlot., 0 =bsParamSlct- < nwnSlots, En este caso, "bsParamSloti" indica un segmento de tiempo al cual se aplica un i-avo grupo de parámetros . Por ej emplo, vamos a considerar que "numSlots" es 3 y que el campo "bsParamSlot" 1303 puede tener 10 valores. En este caso, se requieren de 3 informaciones (se conocen a continuación como cl, c2 y c3, respectivamente) para el campo "bsParamSlot" 1303. Puesto que se requieren de 4 bits para representar cada uno de cl,c2 y c3, se requiere de un total de 12 (= 4*3) bits. En el caso de representar cl, c2 y c3 como un grupo mediante su unión juntos, pueden ocurrir 1,000 casos (= 10*10*10) que pueden estar representados como 10 bits, ahorrando por consiguiente 2 bits. Si "numSlots" es 3 y si el valor leído como 5 bits es 31, el valor puede estar representado como 31=lx (3A2) +5* (3A1) +7* (3A0) . Un aparato de codificador puede determinar que cl, c2 y c3 son 1, 5 y 7, respectivamente, mediante la aplicación de la inversa de la fórmula 9. La Figura 13B ilustra una sintaxis para representar información de posición de un segmento de tiempo al cual se aplica un grupo de parámetros como un valor absoluto y un valor de diferencia de conformidad con una modalidad de la presente invención. Si un cuadro espacial es un cuadro de tipo variable, el campo "bsParamSlot" 1303 en la Figura 13A puede estar representado como un valor absoluto y un valor de diferencia utilizando el hecho que la información "bsParamSlot" se incrementa de manera monótona. Por ejemplo: (i) una posición de un segmento de tiempo al cual se aplica un primer grupo de parámetros puede ser generada en un valor absoluto, es decir, "bsParamSlot [0] "; y (ii) una posición de un segmento de tiempo al cual se aplica un segundo grupo de parámetros más alto puede ser generada como un valor de diferencia, es decir, "valor de diferencia" entre "bsParamSlot [ps] " y "bsParamSlot" [ps-1] " o "valor de diferencia - 1" (se conoce a continuación como "bsDiffParamSlot [ps] ") . En este caso, "ps" se refiere a un grupo de parámetros. El campo "bsParamSlot [0] " 1304 puede estar representado por un número de bits (se conoce a continuación como "nBitsParamSlot (0) ") calculados utilizando "numSlots", y "numParamSets" . El campo "bsParamSlot [ps] " 1305 puede estar representado por un número de bits (se conoce a continuación como "nBitsParamSlot (ps) ") calculados utilizando "numSlots", "numParamSets". Y una posición de n segmento de tiempo al cual se aplica un grupo previo de parámetros, es decir, "bsParamSlot [ps-1] ". En particular, para representar "bsParamSlot [ps] " por un número mínimo de bits, un número de bits para representar "bsParamSlot [ps] " puede ser determinado con base en las reglas siguientes: (i) varios de los "bsParamSlot [ps] " se elevan en una serie ascendente (bsParamSlot [ps] > bsParamSlot [ps-1] ) ; (ii) un valor máximo de "bsParamSlot [0] " es "numSlots NumParamSets"; y (iii) en el caso de 0 < ps < numParamSets, "bsParamSlot [ps] " puede tener un valor entre "bsParamSlot [ps-1] ) + 1" y "numSlots - numParamSets + ps" solamente. Por ejemplo, si "numSlots" es 10 y si "numParamSets" es 3, puesto que "bsParamSlot [ps] " se eleva en una serie ascendente, un valor máximo de "bsParamSlot [ ] " se vuelve "10-3=7". Específicamente, "bsParamSlot [0] " debe seleccionarse entre valores de 0 a 7. Esto se debe al hecho que un número de segmentos de tiempo para el resto de los grupos de parámetros (por ejemplo, ps es 1 ó 2) es insuficiente si "bsParamSlot [0] " tiene un valor mayor que 7. Si "bsParamSlot [0] " es 5, una posición de segmento de tiempo bsParamSlot [1] para un segundo grupo de parámetros debe seleccionarse entre valores comprendidos entre "5+1=6" y "10-3+1=8". Si "bsParamSlot [1] " es 7, "bsParamSlot [2] " puede volverse 8 ó 9. Si "bsParamSlot [1] " es 8, "bsParamSlot [2] " puede volverse 9. Por consiguiente, "bsParamSlot [ps] " puede estar representado como un número de bits variable utilizando las características mencionadas arriba en lugar de ser representado como bits fijos. En la configuración de "bsParamSlot [ps] " en una corriente de bits, si "ps" es 0, "bsParamSlot [0] " puede estar representado como un valor absoluto por un número de bits que corresponde a "nBitsParamSlot (0) ". Si "ps" es mayor que 0, "bsParamSlot [ps] " puede estar representado como un valor de diferencia por un número de bits que corresponde a "nBitsParamSlot (ps) ". En la lectura de "bsParamSlot [ps] " configurado como arriba a partir de una corriente de bits, una longitud de corriente de bits para cada dato, es decir, "nBitsParamSlot [ps] " puede encontrase utilizando la Fórmula 10. [Fórmula 10] En particular, se puede encontrar "nBitsParamSlot [ps] " como nBitsParamSlot [0] = fb (numSlots - numParamSets) + 1). Si 0<ps<numParamsets, el "nBitsParamSlot [ps] " puede encontrase como nBitsParamSlot [ps] = fb (numSlots - numParamSets + ps -bsParamSlot [ps-1] . "nBitsParamSlot [ps] " puede determinarse utilizando la Fórmula 11 que' extiende la fórmula 10 hasta 7 bits. [Fórmula 11] Un ejemplo de la función fb(x) se explica a continuación. Si "numSlots" es 15 y si "numParamSets" es 3, la función puede ser evaluada como nBitsParamSlot [0] = fb(15-3+l) = 4 bits. Si "bsParamSlot [0] " representado por 4 bits es 7, la función puede ser evaluada como nBitsParamSlot [1] = fb (15-3+1-7) = 3 bits. En este caso, el campo "bsDiffParamSlot [1] " 1305 puede estar representado por 3 bits. Si el valor representado por los 3 bits es 3, "bsParamSlot [1] " se vuelve 7+3 = 10. Por consiguiente, se vuelve nBitsParamSlot [2] = fb (15-3+2-10) = 2 bits. En este caso, el campo "bsDiffParamSlot [2] " 1305 puede estar representado por 2 bits. Si el número de segmentos de tiempo restantes es igual a un número de grupos de parámetros restantes, 0 bits pueden ser asignados al campo "bsDiffParamSlot [ps] ". En otras palabras, ninguna información adicional se requiere para representar la posición del segmento de tiempo al cual se aplica el grupo de parámetros. Por consiguiente, un número de bits para "bsParamSlot [ps] puede decidirse de manera variable. El número de bits para "bsParamSlot [ps] " puede leerse a partir dé una corriente de bits utilizando la función fb(x) en un decodificador. En ciertas modalidades, la función fb(x) puede incluir la función ceil (log2 (x) ) . Al leer información para "bsParamSlot [ps] " representado como un valor absoluto y un valor de diferencia a partir de una corr de bits en un decodificador, se puede leer primero "bsParamSlot [0] " a partir de la corriente de bits y después se puede leer "bsDiffParamSlot [ps] " para 0<ps<numParamSets . Se puede encontrar "bsParamSlot [ps] " para un intervalo 0=ps<numParamSets utilizando "bsParamSlot [0] " y "bsDiffParamSlot [ps] ". Por ejemplo, como se muestra en la figura 13B, se puede encontrar un "bsParamSlot [ps] " mediante adición de un "bsParamSlot [ps-1] " con un "bsDiffParamSlot [ps]+l". La figura 13C ilustra una sintaxis para representar información de posición de un segmento de tiempo al cual se aplica un grupo de parámetros como un grupo de conformidad con una modalidad de la presente invención. En el caso en el cual existen varios grupos de parámetros, varios "bsParamSlots" 1307 para varios grupos de parámetros pueden estar representados como por lo menos uno o varios grupos. Si un número de "bsParamSlots" 1307 es (kN+L) y si Q bits son necesarios para representar cada uno de "bsParamSlots" 1307, "bsParamSlots" 1307 puede ser representado como un grupo siguiente. En este caso "k" y "N" son números enteros arbitrarios no cero y "L" es un número entero arbitrario que cumple con 0=L<N. Un método para agrupa puede incluir los pasos de generar k grupos mediante la unión de N "bsParamSlots" 1307 cada uno y generando un último grupo mediante la unión de los últimos L "bsParamSlots" 1307. Los k grupos pueden estar representados por M bits y el último grupo puede estar representado por p bits. En este caso, los M bits son preferentemente inferiores a N*Q bits utilizados en el caso de la representación de cada uno de los "bsParamSlots" 1307 sin agruparlos. Los p bits son preferentemente iguales o inferiores a L*Q bits utilizados en el caso de la representación de cada uno de los "bsParamSlots" 1307 sin agruparlos. Por ejemplo, vamos a considerar que un par de "bsParamSlots" 1307 para dos grupos de parámetros son di y d2, respectivamente. Si cada uno de di y d2 puede tener cinco valores, se requieren de 3 bits para representar cada uno de di y d2. En este caso, aún si los 3 bits pueden representar 8 valores, se requieren sustancialmente de cinco valores. Así, cada uno de di y d2 tiene tres redundancias. Sin embargo, en caso representar el di y d2 como un grupo mediante la unión de di y d2, se utilizan 5 bits en lugar de 6 bits (= 3 bits + 3 bits). En particular, puesto que todas las combinaciones de di y d2 incluyen 25 (= 5*5) tipos, un grupo de di y d2 puede estar representado como 5 bits solamente. Puesto que los 5 bits pueden representar 32 valores, se generan siete redundancias en el caso de representación agrupada. Sin embargo, en el caso de representación mediante agrupamiento de di y d2, la redundancia es menor que en el caso de representar cada uno de di y d2 como 3 bits. Al configurar el grupo, datos para el grupo pueden ser configurados empleando "bsParamSlot [0] " para un valor inicial y un valor de diferencia entre pares de "bsParamSlot [ps] " para un segundo valor o valor más alto. En la configuración del grupo, bits pueden directamente asignados sin agrupamiento si un número de grupo de parámetros es 1 y bits pueden ser asignados después de terminar el agrupamiento si un número de grupos de parámetros es igual o mayor a 2. La figura 14 es un diagrama de flujo de un método de codificación de conformidad con una modalidad de la presente invención. Un método para codificar una señal de audio y una operación de un codificador de conformidad con la presente invención se explicarán a continuación.
Primero, un número total de segmentos de tiempo (numSlots) en un cuadro espacial y un número total de bandas de parámetros (numBands) de una señal de audio se determina (S1401) . Después, se determinan un número de bandas de parámetros aplicadas a un módulo de conversión de canales (caja OTT y/o caja TTT) y/o una señal residual (S1402) . Si la caja OTT tiene un modo de canal LFE, el número de bandas de parámetros aplicadas a la caja OTT se determina de manera separada. Si la caja OTT no tiene el modo de canal LFE, "numBands" se utiliza como número de los parámetros aplicados a la caja OTT. Subsiguientemente, se determina un tipo de cuadro espacial. En este caso, el cuadro espacial puede clasificarse en tipo de cuadro fijo y tipo de cuadro variable. Si el cuadro espacial es de tipo de cuadro variable (S1403) , se determina un número de grupos de parámetros utilizados dentro de un cuadro espacial (S1406) . En este caso, el grupo de parámetros puede ser aplicado al módulo de conversión de canales por una unidad de segmento de tiempo. Subsiguientemente, se determina una posición de segmento de tiempo al cual se aplica el grupo de parámetros (S1407). En este caso, la posición de segmento de tiempo a la cual se aplica el conjunto de parámetros puede ser representada como un valor absoluto y un valor de diferencia. Por ejemplo, una posición de un segmento de tiempo al cual se aplica un primer grupo de parámetros puede ser representada como un valor absoluto y una posición de un segmento de tiempo al cual se aplica un segundo grupo de parámetros o grupo de parámetros más alto puede ser representada como un valor de diferencia a partir de una posición de un segmento de tiempo previo. En este caso, la posición de un segmento de tiempo al cual se aplica el grupo de parámetros puede ser representada por un número variable de bits. En particular, una posición de segmento de tiempo al cual se aplica un primer grupo de parámetros puede ser representada por un número de bits calculado utilizando un número total de segmentos de tiempo y un número total de grupos de parámetros. Una posición de un segmento de tiempo al cual se aplica un segundo grupo de parámetros más alto puede representarse a través de un número de bits calculados utilizando un número total de segmentos de tiempo, un número total de grupos de parámetros y una posición de un segmento de tiempo al cual se aplica un grupo de parámetros previos. Si el cuadro espacial es un tipo de cuadro fijo, se determina (S1404) un número de grupos de parámetros utilizados en un m arco espacial. En este caso, una posición de un segmento de tiempo al cual se aplica el grupo de parámetros es determinada utilizando una regla preestableecida. Por ejemplo, una posición de un segmento de tiempo a la cual se aplica un grupo de parámetros puede ser determinada como teniendo un intervalo igual desde una posición de un segmento de tiempo al cual se aplica un grupo de parámetros previo (S1405) . Subsiguientemente, una unidad de mezcla- reductora y una unidad generadora de información espacial generan una señal sometida a mezcla' reductora e información espacial, respectivamente, utilizando el número total determinado arriba de segmentos de tiempo, un número total de bandas de parámetros, un número de bandas de parámetros a aplicar a la unidad convertidora de canales, un número total de grupos de parámetros en un cuadro espacial e información de posición del segmento de tiempo al cual se aplica un grupo de parámetros (S1408) . Finalmente, una unidad de multiplexión genera una corriente de bits que incluye la señal sometida a mezcla reductora y la información espacial (S1409) y después transfiere la corriente de bits generada a un decodificar (S1409) . La figura 15 es un diagrama de flujo de un método de decodificación de conformidad con una modalidad de la presente invención. Un método para decodificar una señal de audio y una operación de un decodificador de conformidad con la presente invención se explican a continuación. Primero, un decodificador recibe una corriente de bits de una señal de audio (S1501) . Una unidad de desmultiplexión separa una señal sometida a mezcla reductora y una señal de información espacial de la corriente de bits recibida (S1502) . Subsiguientemente, una unidad decodificadora de señal de información espacial extrae información para un número total de segmentos de tiempo en un cuadro espacial, un número total de bandas de parámetros y un número de bandas de parámetros aplicadas a un módulo de conversión de canales a partir de la información de configuración de la señal de información espacial (S1503) . Si el cuadro espacial es un tipo de cuadro variable (S1504) un número de grupos de parámetros en un cuadro espacial e información de posición de un segmento de tiempo al cual se aplica el grupo de parámetros son extraídos del cuadro espacial (S1505) . La información de posición del segmento de tiempo puede estar representada por un número fijo o variable de bits. En este caso, la información de posición del segmento de tiempo al cual se aplica el primer grupo de parámetros puede estar representada como un valor absoluto y la información de posición de segmentos de tiempo al cual se aplica un segundo grupo de parámetros o grupo de parámetros más altos puede ser representada como un valor de diferencia. La información de posición real de segmentos de tiempo al cual se aplican el segundo grupo de parámetros o grupos de parámetros más altos puede encontrarse mediante el hecho de sumar el valor de diferencia a la información de posición del segmento de tiempo al cual aplica un grupo previo de parámetros. Finalmente, la señal sometida a mezcla reductora es convertida en una señal de audio de canales múltiples utilizando la información extraída (S1506) . Las modalidades divulgadas descritas arriba proporcionan varias ventajes en comparación con los esquemas convencionales de codificación de audio. Primero, al codificar una señal de audio de canales múltiples mediante la representación de una posición de un segmento de tiempo al cual se aplica un grupo de parámetros por un número variable de bits, las modalidades divulgadas pueden reducir una cantidad de datos transferidos. Segundo, mediante la representación de una posición de un segmento de tiempo al cual se aplica un primer grupo de parámetros como un valor absoluto, y mediante la representación de posiciones de segmentos de tiempo a los cuales se aplica un segundo grupo de parámetros o grupos de parámetros más altos como un valor de diferencia, las modalidades divulgadas pueden reducir una cantidad de datos transferidos . Tercero, mediante la representación de un número de bandas de parámetros aplicadas a dicho módulo de conversión de canal como por ejemplo caja OTT y/o caja TTT por un número fijo o variable de bits, las modalidades divulgadas pueden reducir una cantidad de datos transferidos. En este caso, posiciones de segmentos de tiempo a los cuales se aplican grupos de parámetros pueden ser representadas utilizando el principio mencionado arriba en donde los grupos de parámetros pueden existir en rango de un número de bandas de parámetros. La figura 16 es un diagrama de bloques de una arquitectura de dispositivo de ejemplo 1600 para implementar el codificador/decodificador de audio de conformidad con lo descrito con referencia a las figura 1-15. La arquitectura de dispositivo 1600 es aplicable a varios dispositivos, incluyendo pero sin limitarse a: computadoras personales, computadoras de servidor, dispositivos electrónicos para consumidor, teléfonos móviles, asistentes digitales personales (PDAs), tabletas electrónicas, sistemas de televisión, cajas de decodificación de televisión, consolas para juegos, reproductores de medios, reproductores de música, sistemas de navegación, y cualquier otro dispositivo capaz de decodificar señales de audio. Algunos de estos dispositivos pueden implementar una arquitectura modificada empleando una combinación de hardware y software. La arquitectura 1600 incluye uno o varios procesadores 1602 (por ejemplo, PowerPC®, Intel Pentium® 4, etc.), uno o varios dispositivos de despliegue 1604 (por ejemplo CRT, LCD), un subsistema de audio 1606 (por ejemplo, hardware/software de audio) , una o varias interfaces de red 1608 (por ejemplo Ethernet, FireWire®, USB, etc.), dispositivos de entrada 1610 (por ejemplo, teclado, ratón, etc.), y uno o varios medios legibles en computadora 1612 (por ejemplo, RAM, ROM, SDRAM, disco duro, disco óptico, memoria instantánea, etc.). Estos componentes pueden intercambiar comunicaciones y datos a través de uno o varios buses 1614 (por ejemplo, EISA, PCI, PCI Express, etc.). El término "medio legible en computadora" se refiere a cualquier medio que participa en el suministro de instrucciones a un procesador 1602 para ejecución, incluyendo sin limitación, medios no volátiles (por ejemplo, discos ópticos o magnéticos), medios volátiles (por ejemplo, memoria) y medios de transmisión. Los medios de transmisión incluyen, sin limitación, cables coaxiales, alambres de cobre y fibra óptica. Los medios de transmisión pueden también tomar la forma de ondas acústicas, ondas luminosas u ondas de radiofrecuencia . El medio legible en computadora 1612 incluye además un sistema operativo 1616 (por ejemplo, Mac OS®, Windows®, Linux, etc.), un módulo de comunicación de red 1618, un codee de audio 1620 y una o varias aplicaciones 1622. El sistema operativo 1616 puede ser de usuarios múltiples, multiprocesamiento, multitareas, multilectura, tiempo real y similares. El sistema operativo 1616 efectúa tareas básicas, incluyendo, sin limitarse a estos ejemplos: reconocimiento de entrada proveniente de dispositivos de entrada 1610; envío de salida a los dispositivos de despliegue 1604 y al subsistema de audio 1606; rastreo de archivos y directorios en medios legibles en computadora 1612 (por ejemplo, memoria o un dispositivo de almacenamiento) ; control de dispositivos periféricos (por ejemplo, unidades de disco, impresoras, etc.); y manejo de tráfico en el bus o en los varios buses 1614. El módulo de comunicaciones de red 1618 incluye varios componentes para establecer y mantener conexiones de red (por ejemplo, software para implementar protocolos de comunicación como por ejemplo TCP/IP, http, Ethernet, etc.). El módulo de comunicaciones de red 1618 puede incluir un navegador para permitir a los operadores de la arquitectura de dispositivo 1600 buscar una red (por ejemplo, Internet) para información (por ejemplo, contenido de audio) . El codee de audio 1620 es responsable de implementar la totalidad o una parte de los procesos de codificación y/o decodificación descritos con referencia a las figuras 1-15. En ciertas modalidades, el codee de audio funciona en combinación con hardware (por ejemplo, procesador (es) 1602, subsistema de audio 1606) para procesar señales de audio, incluyendo codificación y/o decodificación de señales de audio de conformidad con la presente invención descrita aquí. Las aplicaciones 1622 pueden incluir cualquier aplicación de software relacionada con contenido de audio y/o en donde el contenido de audio está codificado y/o decodificado, incluyendo sin limitarse a estos ejemplos, reproductores de medios, reproductores de música (por ejemplo, reproductores MP3), aplicaciones de teléfono móvil, PDAs, sistemas de televisión, decodificadores, etc. En una modalidad, el codee de audio puede ser utilizado por un proveedor de servicios de aplicación con el objeto de proporcionar servicio de codificación/decodificación en una red (por ejemplo Internet) . En la descripción arriba, para propósitos de explicación, numerosos detalles específicos se plantean con el objeto de proporcionar una comprensión cabal de la invención. Será aparente sin embargo a una persona con conocimientos en la materia que la invención puede practicarse sin estos detalles específicos. En otros casos, estructuras y dispositivos se muestran en diagrama de bloques con el objeto de evitar obscurecer la invención. En particular, una persona con conocimientos en la materia reconocerá que otras arquitecturas y entornos gráficos pueden utilizarse y que la presente invención puede implementarse utilizando herramientas gráficas y productos diferentes de los descritos arriba. En particular, el enfoque de cliente/servidor es simplemente un ejemplo de una arquitectura para proporcionar la funcionalidad de tablero de la presente invención; una persona con conocimientos en la materia reconocerá que otros enfoques no cliente-servidor pueden también utilizarse. Algunas partes de la descripción detallada se presentan en términos de algoritmos y representaciones simbólicas de operaciones sobre bits de datos dentro de una memoria de computadora. Estas descripciones algorítmicas y representaciones son los medios utilizados por las personas con conocimientos en la materia del procesamiento de datos para transferir más efectivamente la sustancia de trabajo a otras personas con conocimientos en la materia. Un algoritmo se concibe, aquí y generalmente, como una secuencia auto-consistente de pasos que llevan a un resultado deseado. Los pasos son los que requieren de manipulaciones físicas de cantidades físicas. Habitualmente, aún cuando no necesariamente, estas cantidades toman la forma de señales eléctricas o magnéticas capaces de ser almacenadas, transferidas, combinadas, comparadas y manipuladas de otra forma. Se ha comprobado conveniente a veces, principalmente por razones de uso común, referirse a estas señales como bits, valores, elementos, símbolos, caracteres, términos, números o similares. Explotación Industrial Se debe tomar en cuenta, sin embargo que todos estos términos y términos similares deben asociarse con las cantidades físicas apropiadas y son simplemente etiquetas convenientes aplicadas a estas cantidades. A menos que se indique específicamente lo contrario como es aparente a partir de la discusión, se observará que a lo largo de la descripción, discusiones que utiliza términos tales como "procesamiento" o "cálculo" o "calcular" o "determinar" o "desplegar" o similares se refieren a la acción y procesos de un sistema de computadora o dispositivo de cómputo electrónico similar que manipula y transforma datos representados como cantidades físicas (electrónica) dentro de los registros y memorias del sistema de la computadora en otros datos representados similarmente como cantidades físicas dentro de las memorias o registros del sistema de computadora u otros dispositivos de almacenamiento, transmisión o despliegue de información de este tipo. La presente invención se refiere también a un aparato para efectuar las operaciones aquí. Este aparato puede estar construido especialmente para los propósitos requeridos o bien puede comprender una computadora para propósitos generales activada o reconfigurada selectivamente por un programa de computadora almacenado en la computadora. Dicho programa de computadora puede estar almacenado en un medio de almacenamiento legible en computadora como por ejemplo, sin limitarse a estos ejemplos, cualquier tipo de disco incluyendo disco blando, disco óptico, CD-ROMs, y discos magnéticos-ópticos, memorias de solo lectura (ROMs) , memorias de acceso aleatorio (RAMs) , EPROMs, EEPROMs, tarjetas magnéticas u ópticas, o cualquier tipo de medios adecuados para almacenar instrucciones electrónicas, y cada uno de ellos conectado a un bus de sistema de computadora. Los algoritmos y módulos presentados aquí no están inherentemente relacionados a ninguna computadora particular ni a ningún otro aparato particular. Varios sistemas para propósitos generales pueden utilizarse con programas de conformidad con las enseñanzas de la presente invención o bien puede ser conveniente construir aparatos más especializados para llevar a cabo los pasos del método. La estructura requerida para varios de estos sistemas aparecerá a partir de la descripción abajo. Además, la presente invención no se describe con referencia a ningún lenguaje de programación particular. Se observará que varios lenguajes de programación pueden ser utilizados para implementar las enseñanzas de la presente invención de conformidad con lo descrito aquí. Además, como será aparente a una persona con conocimientos ordinarios en la materia, los módulos, características, atributos, metodologías y otros aspectos de la invención pueden implementarse como software, hardware, firmware o cualquier combinación de los tres. Evidentemente, cuando un componente de la presente invención es implementado como software, el componente puede implementarse como un programa independiente, como parte de un programa más grande, como varios programas separados, como una biblioteca conectada estática o dinámicamente, como un módulo cargable central, como un controlador de dispositivo y/o de cualquier otra forma conocida ahora o en el futuro por parte de las personas con conocimientos en la materia de programación de computadora. Adicionalmente, la presente invención no se limita de ninguna manera a su implementación en algún sistema operativo específico o entorno específico. Será aparente a las personas con conocimientos en la materia que varias modificaciones y variaciones pueden efectuarse a las modalidades divulgadas sin salirse del espíritu o alcance de la invención. Por consiguiente, se contempla que la presente invención abarque todas las modificaciones y variaciones de las modalidades divulgadas a condición que tales modificaciones y variaciones estén dentro del alcance de las reivindicaciones adjuntas y sus equivalentes.

Claims (20)

  1. REIVINDICACIONES 1. Un método para codificar una señal de audio, el método comprende: determinar un número de segmentos de tiempo y un número de grupos de parámetros, los grupos de parámetros incluyen uno o varios parámetros; generar información que indica una posición de por lo menos un segmento de tiempo en un grupo ordenado de segmentos de tiempo a los cuales se aplica un grupo de parámetros; codificar la señal de audio como corriente de bits que incluye un cuadro, el cuadro incluye el grupo ordenado de segmentos de tiempo; e insertar un número variable de bits en la corriente de bits que representan la posición del segmento de tiempo en el grupo ordenado de segmentos de tiempo, en donde el número variable de bits es determinado por la posición de segmento de tiempo.
  2. 2. Un método para decodificar una señal de audio, que comprende: recibir una corriente de bits que representa una señal de audio, la corriente de bits tiene un cuadro; determinar un número de segmentos de tiempo y un número de grupos de parámetros a partir de la corriente de bits, los grupos de parámetros incluyen uno o varios parámetros; determinar información de posición a partir de la corriente de bits, la información de posición indica una posición de un segmento de tiempo en un grupo ordenado de segmentos de tiempo a los cuales se aplica un grupo de parámetros, en donde el grupo ordenado de segmentos de tiempo está incluido en el cuadro; decodificar la señal de audio con base en el número de segmentos de tiempo, el número de grupos de parámetros y una información de posición, en donde la información de posición está representada por un número variable de bits con base en la posición de segmento de tiempo.
  3. 3. El método de conformidad con la reivindicación 2, en donde el número variable de bits es determinado utilizando el número de segmentos de tiempo.
  4. 4. El método de conformidad con la reivindicación 2, que comprende además: si el número de segmentos de tiempo a decodificar es igual a un número de grupos de parámetros a aplicar, no determinar la información de posición del segmento de tiempo al cual se aplica un grupo de parámetros.
  5. 5. El método de conformidad con la reivindicación 4, en donde si el número de los segmentos de tiempo es igual o mayor a 2A(n-l) e inferior a 2 (n), el número variable de bits es determinado como n bits.
  6. 6. El método de conformidad con la reivindicación 4, en donde si el número de los segmentos de tiempo es mayor que 2A (n-l) e igual o inferior a 2 (n), el número variable de bits es determinado como n bits.
  7. 7. El método de conformidad con la reivindicación 3, en donde la información de posición es representada por la suma de un valor previo y un valor de diferencia, en donde el valor previo indica la información de posición del segmento de tiempo al cual se aplica un primer grupo de parámetros y el valor de diferencia indica la información de posición del segmento de tiempo al cual se aplica un segundo grupo de parámetros .
  8. 8. El método de conformidad con la reivindicación 7, en donde el valor previo está representado por un número variable de bits determinado utilizando por lo menos uno del número de segmentos de tiempo y número de grupos de parámetros .
  9. 9. El método de conformidad con la reivindicación 8, en donde el número variable de bits es determinado utilizando la diferencia entre el número de segmentos de tiempo y el número de grupos de parámetros.
  10. 10. El método de conformidad con la reivindicación 7, en donde el valor de diferencia está representado por un número variable de bits determinado utilizando por lo menos uno del número de segmentos de tiempo, número de grupos de parámetros y una información de posición del segmento de tiempo al cual se aplica un grupo de parámetros previos.
  11. 11. El método de conformidad con la reivindicación 10, en donde el número variable de bits es determinado utilizando una diferencia entre el número de segmentos de tiempo y por lo menos uno del número de grupos de parámetros e información de posición del segmento de tiempo el cual se aplica el grupo de parámetros previos.
  12. 12. El método de conformidad con la reivindicación 3, en donde si el número de grupos de parámetros es N, la información de posición del segmento de tiempo al cual se aplica el grupo de parámetros, está representado como una combinación que utiliza la fórmula siguiente: YtnümSlotshl -bsParamSlotir 0 =bsParamSld} < nwnSlots, « en donde numSlot y bsParamSlotí indican el número de segmentos de tiempo y la información de posición del segmento de tiempo al cual se aplica un i-avo grupo de parámetros, respectivamente .
  13. 13. El método de conformidad con la reivindicación 3, en donde si existen varios grupos de parámetros, varios grupos de parámetros son divididos como un grupo y la información de posición del segmento de tiempo al cual se aplica el grupo de parámetros es representada por el grupo.
  14. 14. El método de conformidad con la reivindicación 12, en donde si el número de grupos de parámetros es (kN+L), el grupo es generado mediante la unión de N de los grupos de parámetros y está representado por M bits, y un último grupo es generado mediante la unión L de los grupos de parámetros y está representado por P bits.
  15. 15. Un aparato para codificar una señal de audio, que comprende un codificador configurado para: determinar un número de segmentos de tiempo y un número de grupos de parámetros, los grupos de parámetros incluyen uno o varios parámetros; generar información que indique una posición de por lo menos un segmento de tiempo en grupo ordenado de segmentos de tiempo al cual se aplica un grupo de parámetros; codificar la señal de audio como corriente de bits que incluye un cuadro, el cuadro incluye el grupo ordenado de segmentos de tiempo; y insertar un número variable de bits en la corriente de bits que representan la posición del segmento de tiempo en el grupo ordenado de segmentos de tiempo, en donde el número variable de bits es determinado a partir de la posición de segmento de tiempo.
  16. 16. Un aparato para decodificar una señal de audio, que comprende un decodificador configurado para: recibir una corriente de bits que representa una señal de audio, la corriente de bits tiene un cuadro; determinar un número de segmentos de tiempo y un número de grupos de parámetros a partir de la corriente de bits, los grupos de parámetros incluyen uno o varios parámetros; determinar información de posición a partir de la corriente de bits, la información de posición indica una posición de un segmento de tiempo en un grupo ordenado de segmentos de tiempo incluidos en el cuadro al cual se aplica el grupo de parámetros; y decodificar la señal de audio con base en el número de segmentos de tiempo, el número de grupos de parámetros y la información de posición, en donde la información de posición está representada por un número variable de bits con base en la posición de segmento de tiempo.
  17. 17. Una estructura de datos para inclusión en una corriente de bits que representa una señal de audio, la estructura de datos comprende: un primer campo que incluye un número de secuencias de tiempo; un segundo campo que incluye un número de grupos de parámetros; y un tercer campo que incluye una información de posición para determinar una posición de un segmento de tiempo al cual se aplica un grupo de parámetros, en donde la información de posición está representado por un número variable de bits con base en la posición de segmento de tiempo.
  18. 18. Un medio legible en computadora que tiene almacenado ahí instrucciones que, cuando son ejecutadas por un procesador, provocan que el procesador efectúe las operaciones de: o recibir una corriente de bits que representa una señal de audio, la corriente de bits tiene un cuadro; determinar un número de segmentos de tiempo y un número de grupos de parámetros a partir de la corriente de bits, los grupos de parámetros incluyen uno o varios parámetros; determinar información de posición a partir de la corriente de bits, la información de posición indica una posición de un segmento de tiempo en un grupo ordenado de segmentos de tiempo incluidos en el cuadro al cual se aplica el grupo de parámetros; y decodificar la señal de audio con base en el número de segmentos de tiempo, el número de grupos de parámetros y la información de posición, en donde la información de posición está representada por un número variable de bits con base en la posición de segmento de tiempo.
  19. 19. Un sistema que comprende: un procesador; un medio legible en computadora conectado al procesador y que incluye instrucciones, que cuando son ejecutados por un procesador provocan que el procesador efectúe las operaciones de: recibir una corriente de bits que representa una señal de audio, la corriente de bits tiene un cuadro; determinar un número de segmentos de tiempo y un número de grupos de parámetros a partir de la corriente de bits, los grupos de parámetros incluyen uno o varios parámetros; determinar información de posición a partir de la corriente de bits, la información de posición indica una posición de un segmento de tiempo en un grupo ordenado de segmentos de tiempo incluidos en el cuadro al cual se aplica el grupo de parámetros; y decodificar la señal de audio con base en el número de segmentos de tiempo, el número de grupos de parámetros y la información de posición, en donde la información de posición está representada por un número variable de bits con base en la posición de segmentos de tiempo.
  20. 20. Un sistema que comprende: medios para recibir una corriente de bits que representa una señal de audio, la corriente de bits tiene un cuadro; medio para determinar un número de segmentos de tiempo y un número de grupos de parámetros a partir de la corriente de bits, los grupos de parámetros incluyen uno o varios parámetros; medios para determinar información de posición a partir de la corriente de bits, la información de posición indica una posición de un segmento de tiempo en un grupo ordenado de segmentos de tiempo incluidos en el cuadro al cual se aplica el grupo de parámetros; y medios para decodificar la señal de audio con base en el número de segmentos de tiempo, el número de grupos de parámetros y la información de posición, en donde la información de posición está representada por un número variable de bits con base en la posición de segmento de tiempo.
MX2008002713A 2005-08-30 2006-08-30 Aparato y metodo para codificar y decodificar senales de audio. MX2008002713A (es)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US71211905P 2005-08-30 2005-08-30
US71920205P 2005-09-22 2005-09-22
US72300705P 2005-10-04 2005-10-04
US72622805P 2005-10-14 2005-10-14
US72922505P 2005-10-24 2005-10-24
KR1020060004051A KR20070025903A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법
KR20060004055 2006-01-13
KR20060004065 2006-01-13
KR1020060004062A KR20070037974A (ko) 2005-10-04 2006-01-13 멀티채널 오디오 코딩에서 효과적인 넌가이디드 코딩의파라미터 밴드 수 비트스트림 구성방법
KR1020060004057A KR20070025904A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 lfe채널의 파라미터밴드 수 비트스트림 구성방법
KR1020060004063A KR20070025907A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 채널변환모듈에 적용될파라미터 밴드 수 비트스트림 구성방법
US76253606P 2006-01-27 2006-01-27
PCT/KR2006/003420 WO2007027050A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof

Publications (1)

Publication Number Publication Date
MX2008002713A true MX2008002713A (es) 2008-03-18

Family

ID=39805382

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2008002713A MX2008002713A (es) 2005-08-30 2006-08-30 Aparato y metodo para codificar y decodificar senales de audio.

Country Status (4)

Country Link
JP (1) JP5319846B2 (es)
KR (8) KR101165641B1 (es)
HK (1) HK1124681A1 (es)
MX (1) MX2008002713A (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150009474A (ko) * 2013-07-15 2015-01-26 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
KR101536855B1 (ko) * 2014-01-23 2015-07-14 재단법인 다차원 스마트 아이티 융합시스템 연구단 레지듀얼 코딩을 이용하는 인코딩 장치 및 방법
JP6797187B2 (ja) * 2015-08-25 2020-12-09 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ・デコーダおよびデコード方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5583962A (en) 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE4209544A1 (de) 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
US5481643A (en) 1993-03-18 1996-01-02 U.S. Philips Corporation Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component
EP0827312A3 (de) 1996-08-22 2003-10-01 Marconi Communications GmbH Verfahren zur Änderung der Konfiguration von Datenpaketen
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
DE60307252T2 (de) 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung
WO2004008806A1 (en) 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
SE0401408D0 (sv) * 2004-06-02 2004-06-02 Astrazeneca Ab Diameter measuring device

Also Published As

Publication number Publication date
KR100891687B1 (ko) 2009-04-03
KR20080049746A (ko) 2008-06-04
KR20080037105A (ko) 2008-04-29
KR20080086551A (ko) 2008-09-25
KR20080049747A (ko) 2008-06-04
KR100880645B1 (ko) 2009-01-30
KR100891686B1 (ko) 2009-04-03
JP2013137546A (ja) 2013-07-11
KR101165641B1 (ko) 2012-07-17
KR100880646B1 (ko) 2009-01-30
KR20080037106A (ko) 2008-04-29
KR100891685B1 (ko) 2009-04-03
KR100880644B1 (ko) 2009-01-30
JP5319846B2 (ja) 2013-10-16
KR20080036232A (ko) 2008-04-25
HK1124681A1 (en) 2009-07-17
KR100880647B1 (ko) 2009-01-30
KR20080037104A (ko) 2008-04-29
KR20080037111A (ko) 2008-04-29

Similar Documents

Publication Publication Date Title
EP1941497B1 (en) Apparatus for encoding and decoding audio signal and method thereof
CN101253806B (zh) 用于编码和解码音频信号的装置及其方法
RU2376656C1 (ru) Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
MX2008002713A (es) Aparato y metodo para codificar y decodificar senales de audio.

Legal Events

Date Code Title Description
FG Grant or registration