MX2008000504A - Codificacion y decodificacion de audio. - Google Patents
Codificacion y decodificacion de audio.Info
- Publication number
- MX2008000504A MX2008000504A MX2008000504A MX2008000504A MX2008000504A MX 2008000504 A MX2008000504 A MX 2008000504A MX 2008000504 A MX2008000504 A MX 2008000504A MX 2008000504 A MX2008000504 A MX 2008000504A MX 2008000504 A MX2008000504 A MX 2008000504A
- Authority
- MX
- Mexico
- Prior art keywords
- data
- hierarchical
- decoder
- audio
- channel
- Prior art date
Links
- 238000000547 structure data Methods 0.000 claims abstract description 102
- 230000004044 response Effects 0.000 claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims description 83
- 238000000034 method Methods 0.000 claims description 47
- 230000005236 sound signal Effects 0.000 claims description 26
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims description 2
- 239000010410 layer Substances 0.000 description 77
- 230000001174 ascending effect Effects 0.000 description 42
- 238000004891 communication Methods 0.000 description 13
- 239000013598 vector Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000009795 derivation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 101001101328 Haloarcula marismortui (strain ATCC 43049 / DSM 3752 / JCM 8966 / VKM B-1809) 50S ribosomal protein L30 Proteins 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 101000592762 Haloarcula marismortui (strain ATCC 43049 / DSM 3752 / JCM 8966 / VKM B-1809) 50S ribosomal protein L22 Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- UHZZMRAGKVHANO-UHFFFAOYSA-M chlormequat chloride Chemical compound [Cl-].C[N+](C)(C)CCCl UHZZMRAGKVHANO-UHFFFAOYSA-M 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
- Amplifiers (AREA)
Abstract
Un codificador de audio (109) tiene una estructura de codificacion jerarquica y genera un flujo de datos que comprende uno o mas canales de audio, asi como tambien los datos parametricos de audio de codificacion. El codificador (109) comprende un procesador de estructura de codificacion (305) que introducen los datos de estructura de arbol de decodificador en el flujo de datos. Los datos de estructura de arbol de decodificador comprende al menos un valor de datos indicativo de la caracteristica de division de canal para un canal de audio en una capa jerarquica de la estructura jerarquica de decodificador y podria especificar, de manera detallada, las estructuras de arbol de decodificador que seran aplicadas por el decodificador. Un decodificador (115) comprende un receptor (401) que admite el flujo de datos y un procesador de estructura de decodificador (405) y genera la estructura jerarquica de decodificador en respuesta a los datos de estructura de arbol de decodificador. Un procesador de decodificacion (403) genera entonces los canales de salida de audio a partir del flujo de datos utilizando la estructura jerarquica de decodificador.
Description
CODIFICACIÓN Y DECODIFICACION DE AUDIO
Campo de la Invención La invención se refiere a los procesos de codificación y/o decodificación de audio que utilizan estructuras jerárquicas de codificación y/o estructuras jerárquicas de decodificador. Antecedentes de la Invención En el campo del procesamiento de audio, es bien conocida la conversión de un número de canales de audio en otro número más grande de canales de audio. Esta conversión podría ser realizada por distintas razones. Por ejemplo, una señal de audio podría ser convertida en otro formato a fin de proporcionar una experiencia mejorada de usuario. Por ejemplo, las grabaciones tradicionales de estéreo sólo comprenden dos canales mientras que los sistemas avanzados modernos de audio normalmente utilizan cinco o seis canales, como los populares sistemas de sonido envolvente de 5.1 canales. En consecuencia, los dos canales de estéreo podrían ser convertidos en cinco o seis canales con el fin de tomar la ventaja total de los sistemas avanzados de audio. Otra razón para la conversión de un canal es la eficiencia de la codificación. Se ha encontrado que por ejemplo, las señales de audio de estéreo pueden ser codificadas como señales de audio de canal único combinadas REF. 188414 con un flujo de bits de parámetro que describen las propiedades espaciales de la señal de audio. El decodificador puede reproducir las señales de audio de estéreo con un grado muy satisfactorio de exactitud. De este modo, podrían obtenerse ahorros sustanciales de la velocidad de bits. Existen varios parámetros que podrían ser utilizados para describir las propiedades espaciales de las señales de audio. Uno de estos parámetros es la correlación cruzada entre canales, tal como la correlación cruzada entre el canal izquierdo y el canal derecho para las señales de estéreo. Otro parámetro es la relación de energía de los canales . En los así llamados codificadores (paramétricos) de audio espacial, estos y otros parámetros son extraídos de la señal original de audio a fin de producir una señal de audio que tenga un número reducido de canales, por ejemplo, sólo un canal único, más un conjunto de parámetros que describen las propiedades espaciales de la señal original de audio. En los así llamados decodificadores (paramétricos) de audio espacial, es reconstruida la señal original de audio. La Codificación de Audio Espacial es una técnica recientemente introducida que codifica de manera eficiente el material de audio de múltiples canales. En la Codificación de Audio Espacial, una señal de audio de canal- es descrita como una señal de audio de canal-N más un conjunto de correspondientes parámetros espaciales, en donde N es normalmente más pequeña que M. Por lo tanto, la señal de canal-M del codificador de Audio Espacial es mezclada hacia abajo hacia una señal de canal-N y los parámetros espaciales son extraídos. En el decodificador, la señal de canal-N y los parámetros espaciales son empleados para reconstruir (de manera perceptual) la señal de canal-M. De preferencia, esta codificación de audio espacial emplea una estructura jerárquica de cascada o basada en árbol que comprende unidades estándares en el codificador y el decodificador. En el codificador, estas unidades estándares pueden ser mezcladores descendentes que combinan canales en un número más bajo de canales, tales como los mezcladores descendentes de 2-a-l, 3-a-l, 3-a-2, etc., mientras en las correspondientes unidades estándares del decodificador pueden estar los canales divisores mezcladores ascendentes en un número más alto de canales tales como los mezcladores ascendentes de l-a-2, 2-a-3. No obstante, un problema con este procedimiento es que la estructura del decodificador debe coincidir con la estructura del codificador. Aunque esto podría ser conseguido mediante el uso de una estructura estandarizada de codificador y decodificador, este procedimiento es inflexible y tenderá a originar un rendimiento por debajo de lo óptimo. Por lo tanto, sería ventajoso un sistema mejorado y en particular, un sistema que permita el incremento en la flexibilidad, la reducción en la complejidad y/o la mejora del rendimiento. Breve Descripción de la Invención En consecuencia, se prefiere que la invención busque mitigar, aliviar o eliminar una o más de las desventajas mencionadas con anterioridad solas o en combinación. De acuerdo con un primer aspecto de la invención, se proporciona un aparato para la generación de un número de canales de salida de audio; el aparato comprende: el medio que recibe un flujo de datos que comprende un número de canales de entrada de audio y los datos paramétricos de audio; el flujo de datos además comprende datos de estructura de árbol de decodificador para una estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador comprenden al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador; el medio que genera la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador; y el medio que genera el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador . La invención podría permitir la generación flexible de canales de audio y podría en particular permitir la funcionalidad del decodificador a fin de adaptar una estructura de codificador utilizada para la generación del flujo de datos. La invención podría permitir, por ejemplo, un codificador que selecciona un procedimiento adecuado de codificación para una señal de múltiples canales mientras permite que el aparato se adapte de manera automática a la misma. La invención podría permitir un flujo de datos que tenga una calidad mejorada de la relación de velocidad de bits. En particular, la invención podría permitir la adaptación automática y/o un alto grado de flexibilidad mientras proporciona la calidad mejorada de audio que puede ser conseguida a partir de las estructuras jerárquicas de codificación/decodificación. Además, la invención podría permitir una comunicación eficiente de la información de la estructura jerárquica de decodificador. De manera específica, la invención podría permitir una baja sobrecarga para los datos de estructura de árbol de decodificador. La invención podría proporcionar un aparato que se adapte de manera automática al flujo recibido de bits y que pudiera ser utilizado con cualquier estructura jerárquica conveniente de codificación. Cada canal de audio podría soportar una señal individual de audio. El flujo de datos podría ser un flujo único de bits o por ejemplo, podría ser una combinación de una pluralidad de un flujo de sub-bits para que sean repartidos, por ejemplo, a través de distintos canales de distribución. El flujo de datos podría tener una duración limitada tal como una duración fija que corresponda con un archivo de datos de un tamaño dado. La característica de división de canal podría ser una característica indicativa de cuántos canales un canal de audio dado es dividido en una capa jerárquica. Por ejemplo, la característica de división de canal podría reflejar si un canal dado de audio no fuera dividido o si fuera dividido en dos canales de audio. Los datos de estructura de árbol de decodificador podrían comprender datos para la estructura jerárquica de decodificador de una pluralidad de canales de audio. De manera específica, los datos de estructura de árbol de decodificador podrían comprender un conjunto de datos para cada uno del número de canales de entrada de audio. Por ejemplo, los datos de estructura de árbol de decodificador podrían comprender datos para una estructura de árbol de decodificador para cada señal de entrada. De acuerdo con una característica opcional de la invención, los datos de estructura de árbol de decodificador comprenden una pluralidad de valores de datos, cada valor de datos es indicativo de una característica de división de canal para un canal en una capa jerárquica de la estructura jerárquica de decodificador. Esto podría proporcionar una comunicación eficiente de los datos que permita que el aparato se adapte a la codificación utilizada para el flujo de datos. Los datos de estructura de árbol de decodificador podrían comprender, de manera específica, un valor de datos para cada función de división de canal en la estructura jerárquica de decodificador. Los datos de estructura de árbol de decodificador también podrían comprender un valor de datos para cada canal de salida indicando que no sucederán divisiones adicionales de canal para una señal dada de capa jerárquica. De acuerdo con una característica opcional de la invención, un valor predeterminado de datos es indicativo de la falta de división de canal para el canal en la capa jerárquica. Esto podría proporcionar una comunicación eficiente de los datos permitiendo que el aparato se adapte, efectiva y confiablemente, a la codificación utilizada para el flujo de datos . De acuerdo con una característica opcional de la invención, un valor predeterminado de datos es indicativo de una división de uno-a-dos canales para el canal en la capa jerárquica. Esto podría proporcionar una comunicación eficiente de los datos permitiendo que el aparato se adapte, efectiva y confiablemente, a la codificación utilizada para el flujo de datos. En particular, esto podría permitir una transferencia muy eficiente de la información para muchos sistemas jerárquicos que utilizan funciones estándares de baja complejidad de división de canal. De acuerdo con una característica opcional de la invención, la pluralidad de valores de datos son valores de datos binarios . Esto podría proporcionar una comunicación eficiente de los datos permitiendo que el aparato se adapte, efectiva y confiablemente, a la codificación utilizada para el flujo de datos. En particular, esto podría permitir una transferencia muy eficiente de la información para muchos sistemas que utilizan principalmente una funcionalidad específica de división de canal, tal como la funcionalidad de división de uno-a-dos canales. De acuerdo con una característica opcional de la invención, un valor predeterminado de datos binarios es indicativo de una división de uno-a-dos canales y otro valor predeterminado de datos binarios es indicativo de una falta de división de canal . Esto podría proporcionar una comunicación eficiente de los datos permitiendo que el aparato se adapte, efectiva y confiablemente, a la codificación utilizada para el flujo de datos. En particular, esto podría permitir una transferencia muy eficiente de la información para muchos sistemas basados alrededor de una funcionalidad de división de uno-a-dos canales de baja complejidad. Un proceso eficiente de decodificación podría ser conseguido a través de una estructura jerárquica de decodificador de baja complejidad que podría ser generada en respuesta a los datos de baja complejidad. La característica podría permitir una baja sobrecarga para la comunicación de los datos de estructura de árbol de decodificador y podría ser particularmente adecuada para los flujos de datos codificados a través de una simple función de codificación. De acuerdo con una característica opcional de la invención, el flujo de datos además comprende una indicación del número de canales de entrada. Esto podría facilitar la decodificación y la generación de la estructura de decodificación y/o codificación más eficiente de la información de la estructura jerárquica de decodificador en los datos de estructura de árbol de decodificador. En particular, el medio de generación de la estructura jerárquica de decodificador podría hacerlo de éste modo en respuesta a la indicación del número de canales de entrada. Por ejemplo, en muchas situaciones prácticas, el número de canales de entrada puede ser derivado del flujo de datos, no obstante, en algunos casos especiales los datos de audio y los datos de los parámetros podrían ser separados. En estos casos, podría ser benéfico si el número de canales de entrada fuera conocido puesto que los datos del flujo de datos podrían haber sido manipulados (por ejemplo, de mezclado descendente a partir de estéreo a mono) . De acuerdo con una característica opcional de la invención, el flujo de datos además comprende una indicación del número de canales de salida. Esto podría facilitar la decodificación y la generación de la estructura de decodificación y/o podría permitir una codificación más eficiente de la información de la estructura jerárquica de decodificador en los datos de estructura de árbol de decodificador. En particular, el medio de generación de la estructura jerárquica de decodificador podría hacerlo de este modo en respuesta a la indicación del número de canales de salida. Asimismo, la indicación podría ser utilizada como una verificación de error de los datos de estructura de árbol de decodificador. De acuerdo con una característica opcional de la invención, el flujo de datos comprende una indicación de un número de funciones de división de uno-a-dos canales en la estructura jerárquica de decodificador. Esto podría facilitar la decodificación y la generación de la estructura de decodificación y/o podría permitir una codificación más eficiente de información de la estructura jerárquica de decodificador en los datos de estructura de árbol de decodificador. En particular, el medio de generación de la estructura jerárquica de decodificador podría hacerlo de éste modo en respuesta a la indicación del número de funciones de división de uno-a-dos canales en la estructura jerárquica de decodificador. De acuerdo con una característica opcional de la invención, el flujo de datos además comprende una indicación del número de funciones de división de de dos-a-tres canales en la estructura jerárquica de decodificador. Esto podría facilitar la decodificación y la generación de la estructura de decodificación y/o podría permitir una codificación más eficiente de información de la estructura jerárquica de decodificador en los datos de estructura de árbol de decodificador. En particular, el medio de generación de la estructura jerárquica de decodificador podría hacerlo de éste modo en respuesta la indicación del número de funciones de división de dos-a-tres canales en la estructura jerárquica de decodificador. De acuerdo con una característica opcional de la invención, los datos de estructura de árbol de decodificador comprenden los datos para la pluralidad de estructuras de árbol de decodificador ordenadas en respuesta a la presencia de una de una funcionalidad de división de dos-a-tres canales . Esto podría facilitar la decodificación y la generación de la estructura de decodificación y/o podría permitir una codificación más eficiente de información de la estructura jerárquica de decodificador en los datos de estructura de árbol de decodificador. En particular, la característica podría permitir un rendimiento ventajoso en sistemas en donde las divisiones de dos-a-tres canales sólo podrían presentarse en la capa de raíz. Por ejemplo, el medio que genera la estructura jerárquica de decodificador primero podría crear la funcionalidad de división de dos-a-tres canales para los dos canales de entrada seguido por la creación de la estructura restante utilizando sólo la funcionalidad de división de uno-a-dos canales. La estructura restante podría ser generada, de manera específica, en respuesta a los datos binarios de la estructura de árbol de decodificador, por lo tanto, se reduce la velocidad requerida de bits. El flujo de datos además podría contener información del ordenamiento de la pluralidad de estructuras de árbol de decodificador. De acuerdo con una característica opcional de la invención, los datos de estructura de árbol de decodificador al menos para un canal de entrada comprenden una indicación de una función de división de dos-a-tres canales que está presente en la capa de raíz seguido por los datos binarios, en donde cada valor de los datos binarios es indicativo de que no existe funcionalidad de división o existe una funcionalidad de división de uno-a-dos canales para las capas dependientes de la funcionalidad de división de dos-a-tres canales . Esto podría facilitar la decodificación y la generación de la estructura de decodificación y/o podría permitir una codificación más eficiente de información de la estructura jerárquica de decodificador en los datos de estructura de árbol de decodificador. En particular, la característica podría permitir un rendimiento ventajoso en sistemas en donde las divisiones de dos-a-tres canales sólo podrían presentarse en la capa de raíz. Por ejemplo, el medio de generación de la estructura jerárquica de decodificador primero podría crear la funcionalidad de división de dos-a-tres canales para un canal de entrada seguido por la generación de la estructura restante utilizando sólo la funcionalidad de división de uno-a-dos canales. La estructura restante podría ser generada, de manera específica, en respuesta a los datos binarios de la estructura de árbol de decodificador, de esta manera, se reduce la velocidad requerida de bits. De acuerdo con una característica opcional de la invención, el flujo de datos comprende una indicación de la posición del altavoz al menos para uno de los canales de salida. Esto podría permitir una decodificación facilitada y podría permitir un rendimiento y/o adaptación mejorada del aparato, de esta manera, se proporciona un incremento en la flexibilidad. De acuerdo con una característica opcional de la invención, el medio de generación de la estructura jerárquica de decodificador es situado para determinar los parámetros de multiplicación para las funciones de división de canal de las capas jerárquicas en respuesta a los datos de estructura de árbol de decodificador. Esto podría permitir el rendimiento mejorado y/o una adaptación/flexibilidad mejorada. En particular, la característica podría permitir no sólo la estructura jerárquica de decodificador sino también la operación de las funciones de división de canal para adaptar el flujo recibido de datos. Los parámetros de multiplicación podrían ser parámetros de multiplicación de matriz. De acuerdo con una característica opcional de la invención, la estructura de árbol de decodificador comprende al menos una funcionalidad de división de un canal al menos en una capa jerárquica, por lo menos una funcionalidad de división de un canal comprende: el medio de decorrelación que genera una señal decorrelacionada en forma directa a partir de un canal de entrada de audio del flujo de datos; al menos una unidad de división de canal que genera una pluralidad de canales de salida de capa jerárquica de un canal de audio a partir de una capa jerárquica y la señal decorrelacionada; y el medio que determina al menos una característica del filtro de decorrelación o la unidad de división de canal en respuesta a los datos de estructura de árbol de decodificador . Esto podría permitir el rendimiento mejorado y/o la adaptación/flexibilidad mejorada. En particular, la característica podría permitir una estructura jerárquica de decodificador que tenga un rendimiento mejorado de decodificación y que pudiera generar canales de salida que tengan un aumento en la calidad del audio. En particular, una estructura jerárquica de decodificador en donde no existen señales de decorrelación son generadas por los filtros de decorrelación de cascada podría ser conseguida y adaptada, dinámica y automáticamente, al flujo recibido de datos. El filtro de decorrelación recibe el canal de entrada de audio del flujo de datos sin modificaciones, y de manera específica, sin ningún filtrado anterior de la señal (tal como mediante otro filtro de decorrelación) . La ganancia del filtro de decorrelación podría ser determinada, de manera específica, en respuesta a los datos de estructura de árbol de decodificador. De acuerdo con una característica opcional de la invención, el medio de decorrelación comprende un medio de compensación de nivel que realiza la compensación del nivel de audio en el canal de entrada de audio para generar una señal de audio compensada de nivel; y un filtro de decorrelación para el filtrado de la señal de audio compensada de nivel a fin de crear la señal decorrelacionada. Esto podría permitir una calidad mejorada y/o una implementación facilitada. De acuerdo con una característica opcional de la invención, el medio de compensación de nivel comprende una multiplicación de matriz por una matriz previa. Esto podría permitir una implementación eficiente. De acuerdo con una característica opcional de la invención, los coeficientes de la matriz previa tienen al menos un valor de unidad para la estructura jerárquica de decodificador que comprende sólo una funcionalidad de división de uno-a-dos canales. Esto podría reducir la complejidad y permitiría una implementación eficiente. La estructura jerárquica de decodificador podría comprender otra funcionalidad diferente de la funcionalidad de división de uno-a-dos canales aunque de acuerdo con esta característica no comprenderá cualquier otra funcionalidad de división de canal. De acuerdo con una característica opcional de la invención, el aparato además comprende el medio que determina la matriz previa al menos para una funcionalidad de división de un canal por lo menos en una capa jerárquica en respuesta a los parámetros de la funcionalidad de división de canal en una capa jerárquica más alta. Esto podría permitir la implementación eficiente y/o el rendimiento mejorado. La funcionalidad de división de canal en una capa jerárquica más alta podría incluir una funcionalidad de división de dos-a-tres canales, por ejemplo, situada en la capa de raíz de la estructura de árbol de decodificador . De acuerdo con una característica opcional de la invención, el aparato comprende el medio que determina la matriz de división de canal al menos para una funcionalidad de división de canal en respuesta a los parámetros por lo menos a la funcionalidad de división de canal por lo menos en una capa jerárquica. Esto podría permitir una implementación eficiente y/o rendimiento mejorado. Esto podría ser particularmente ventajoso para las estructuras jerárquicas de árbol de decodificador que comprenden sólo la funcionalidad de división de uno-a-dos canales. De acuerdo con una característica opcional de la invención, el aparato además comprende el medio que determina la matriz previa por lo menos para una funcionalidad de división de canal al menos en una capa jerárquica en respuesta a los parámetros de un mezclador ascendente de dos-a-tres de una capa jerárquica más alta. Esto podría permitir la implementación eficiente y/o el rendimiento mejorado. Esto podría ser particularmente ventajoso para las estructuras jerárquicas de árbol de decodificador que comprenden una funcionalidad de división de dos-a-tres canales en la capa de raíz de una estructura de árbol de decodificador. De acuerdo con una característica opcional de la invención, el medio que determina la matriz previa es situado para establecer la matriz previa al menos para una funcionalidad de división de canal en respuesta a la determinación de una primera sub-matriz previa que corresponde con una primera entrada del mezclador ascendente de dos-a-tres y una segunda sub-matriz previa que corresponde con una segunda entrada del mezclador ascendente de dos-a-tres . Esto podría permitir la implementación eficiente y/o rendimiento mejorado. Esto podría ser particularmente ventajoso para las estructuras jerárquicas de árbol de decodificador que comprenden una funcionalidad de división de dos-a-tres canales en la capa de raíz de la estructura de árbol de decodificador. De acuerdo con otro aspecto de la invención, se proporciona un aparato que genera un flujo de datos que comprende un número de canales de salida de audio, el aparato comprende: el medio que recibe un número de canales de entrada de audio; el medio de codificación jerárquica para la codificación en forma paramétrica del número de canales de entrada de audio con el objeto de generar el flujo de datos que incluye el número de canales de salida de audio y los datos paramétricos de audio; el medio que determina una estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica; y el medio que incluye los datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos. De acuerdo con otro aspecto de la invención, se proporciona un flujo de datos que comprende: un número de canales de audio codificados; los datos paramétricos de audio; y los datos de estructura de árbol de decodificador para una estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador comprenden al menos un valor de datos indicativo de las características de división de canal para los canales de audio en las capas jerárquicas de la estructura jerárquica de decodificador. De acuerdo con otro aspecto de la invención, se proporciona un medio de almacenamiento que tiene guardado en el mismo una señal como se describió con anterioridad. De acuerdo con otro aspecto de la invención, se proporciona un método de generación de un número de canales de salida de audio; el método comprende: recibir un flujo de datos que comprende un número de canales de entrada de audio y los datos paramétricos de audio; el flujo de datos además comprende los datos de estructura de árbol de decodificador para la estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador comprenden al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador; generar la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador; y generar el número de canales de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador. De acuerdo con otro aspecto de la invención, se proporciona un método de generación de flujo de datos que comprende un número de canales de salida de audio, el método incluye: recibir un número de canales de entrada de audio; el medio de codificación jerárquica para la codificación en forma paramétrica del número de canales de entrada de audio a fin de generar el flujo de datos que comprende el número de canales de salida de audio y los datos paramétricos de audio; determinar una estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica; e incluir los datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos. De acuerdo con otro aspecto de la invención, se proporciona un receptor que genera un número de canales de salida de audio; el receptor comprende: el medio que admite un flujo de datos que incluye un número de canales de entrada de audio y los datos paramétricos de audio; el flujo de datos además comprende los datos de estructura de árbol de decodificador para la estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador comprenden al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador; el medio que genera la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador; y el medio que genera el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador. De acuerdo con otro aspecto de la invención, se proporciona un transmisor que genera un flujo de datos que comprende un número de canales de salida de audio, el transmisor comprende: el medio que admite un número de canales de entrada de audio; el medio de codificación jerárquica para la codificación en forma paramétrica del número de canales de entrada de audio para generar el flujo de datos que incluye el número de canales de salida de audio y los datos paramétricos de audio; el medio que determina la estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica; y el medio que incluye los datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos. De acuerdo con otro aspecto de la invención, se proporciona un sistema de transmisión que comprende un transmisor que genera un flujo de datos y un receptor que genera un número de canales de salida de audio; en donde el transmisor comprende: el medio que recibe un número de canales de entrada de audio; el medio de codificación jerárquica para la codificación en forma paramétrica del número de canales de entrada de audio que genera el flujo de datos que incluye el número de canales de audio y los datos paramétricos de audio, el medio que determina una estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica, el medio que incluye los datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos, y el medio que transmite el flujo de datos al receptor; y el receptor comprende el medio que admite el flujo de datos, el medio que genera la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador y el medio que genera el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador. De acuerdo con otro aspecto de la invención, se proporciona un método de recepción de un flujo de datos; el método comprende: recibir un flujo de datos que incluye un número de canales de entrada de audio y los datos paramétricos de audio; el flujo de datos además comprende los datos de estructura de árbol de decodificador para la estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador incluyen al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador; generar la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador; y generar el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador. De acuerdo con otro aspecto de la invención, se proporciona un método de transmisión de un flujo de datos que comprende un número de canales de salida de audio, el método comprende: recibir un número de canales de entrada de audio; realizar la codificación en forma paramétrica del número de canales de entrada de audio para generar el flujo de datos que incluye el número de canales de salida de audio y los datos paramétricos de audio; determinar la estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica; incluir los datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos; y transmitir el flujo de datos. De acuerdo con otro aspecto de la invención, se proporciona un método de transmisión y recepción de un flujo de datos, el método comprende: en el transmisor: recibir un número de canales de entrada de audio, realizar la codificación en forma paramétrica del número de canales de entrada de audio para generar el flujo de datos que incluye el número de canales de audio y los datos paramétricos de audio, determinar la estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica, incluir los datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos, y transmitir el flujo de datos al receptor; y en un receptor: admitir el flujo de datos, generar la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador, y generar el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador. De acuerdo con otro aspecto de la invención, se proporciona un producto de programa de computadora para la ejecución de cualquiera de los métodos descritos con anterioridad. De acuerdo con otro aspecto de la invención, se proporciona un dispositivo de reproducción de audio que comprende un aparato como se describió con anterioridad. De acuerdo con otro aspecto de la invención, se proporciona un dispositivo de grabación de audio que comprende un aparato como se describió con anterioridad. Estos y otros aspectos, características y ventajas de la invención serán aparentes y aclarados con referencia a la(s) modalidad (es) descritas de aquí en adelante. Breve Descripción de las Figuras Las modalidades de la invención serán descritas, sólo por medio de ejemplo, con referencia a las figuras, en las cuales:
La Figura 1 ilustra un sistema de transmisión para la comunicación de una señal de audio de acuerdo con algunas modalidades de la invención; La Figura 2 ilustra un ejemplo de una estructura jerárquica de codificador que podría ser empleada en algunas modalidades de la invención; La Figura 3 ilustra un ejemplo de un codificador de acuerdo con algunas modalidades de la invención; La Figura 4 ilustra un ejemplo de un decodificador de acuerdo con algunas modalidades de la invención; La Figura 5 ilustra un ejemplo de algunas estructuras jerárquicas de decodificador que podrían ser empleadas en algunas modalidades de la invención; La Figura 6 ilustra las estructuras jerárquicas de decodificador de ejemplo que tienen mezcladores ascendentes de dos-a-tres en la raíz; La Figura 7 ilustra un ejemplo de la estructura jerárquica de decodificador que comprende una pluralidad de estructuras de árbol de decodificador; La Figura 8 ilustra un ejemplo de un mezclador ascendente de uno-a-dos ; La Figura 9 ilustra un ejemplo de algunas estructuras jerárquicas de decodificador que podrían ser empleadas en algunas modalidades de la invención; La Figura 10 ilustra un ejemplo de algunas estructuras jerárquicas de decodificador que podrían ser empleadas en algunas modalidades de la invención; La Figura 11 ilustra un diagrama de flujo de ejemplo para un método de decodificación de acuerdo con algunas modalidades de la invención; La Figura 12 ilustra un ejemplo de una estructura de matriz de decodificador de acuerdo con algunas modalidades de la invención; La Figura 13 ilustra un ejemplo de una estructura jerárquica de decodificador que podría ser empleada en algunas modalidades de la invención; La Figura 14 ilustra un ejemplo de una estructura jerárquica de decodificador que podría ser empleada en algunas modalidades de la invención; y La Figura 15 ilustra un método de transmisión y recepción de una señal de audio de acuerdo con algunas modalidades de la invención. Descripción Detallada de la Invención La siguiente descripción se enfoca en las modalidades de la invención que pueden ser aplicadas a la codificación y la decodificación de una señal de audio de múltiples canales utilizando un número de mezcladores descendentes y mezcladores ascendentes de canal de baja complejidad. Sin embargo, será apreciado que la invención no se limita a esta aplicación. Se entenderá por medio de la persona experta en la técnica que un mezclador descendente es situado para combinar un número de canales de audio en un número inferior de canales de audio y datos paramétricos adicionales, y que un mezclador ascendente situado para generar un número de canales de audio a partir de un número más bajo de canales de audio y de datos paramétricos. De esta manera, el mezclador ascendente proporciona una funcionalidad de división de canal. La Figura 1 ilustra un sistema de transmisión 100 para la comunicación de una señal de audio de acuerdo con algunas modalidades de la invención. El sistema de transmisión 100 comprende un transmisor 101 que es conectado con un receptor 103 a través de una red 105, la cual podría ser, de manera específica, la Internet. En el ejemplo específico, el transmisor 101 es un dispositivo de grabación de señal y el receptor es un dispositivo de reproducción de señal 103 aunque será apreciado que en otras modalidades el transmisor y el receptor podrían ser utilizados en otras aplicaciones y para otros propósitos. Por ejemplo, el transmisor 101 y/o el receptor 103 podrían ser parte de una funcionalidad de trascodificación y podrían proporcionar, por ejemplo, la interconexión con otras fuentes o destinos de señal. En el ejemplo específico en donde una función de grabación de señal es soportada, el transmisor 101 comprende un digitalizador 107 que recibe una señal analógica que es convertida en una señal digital PCM mediante el muestreo y la conversión de analógica a digital . El transmisor 101 es conectado con el codificador 109 de la Figura 1, el cual codifica la señal PCM de acuerdo con un algoritmo de codificación. El codificador 100 es conectado con un transmisor de red 111 que recibe la señal codificada y se interconecta con la Internet 105. El transmisor de red podría enviar la señal codificada al receptor 103 a través de la Internet 105. El receptor 103 comprende un receptor de red 113 que se interconecta con la Internet 105 y que es situado para admitir la señal codificada que proviene del transmisor 101. El receptor de red 111 es conectado con un decodificador 115. El decodificador 115 recibe la señal codificada y la descifra de acuerdo con un algoritmo de decodificación. En el ejemplo específico en donde una función de reproducción de señal sea soportada, el receptor 103 además comprende un reproductor de señal 117 que recibe la señal decodificada de audio que proviene del decodificador 115 y la presenta al usuario. De manera específica, el reproductor de señal 113 podría comprender un convertidor de digital a analógico, amplificadores y altavoces según sea requerido para dar salida a la señal decodificada de audio.
En el ejemplo de la Figura 1, el codificador 109 y el decodificador 115 utilizan una estructura de cascada o basada en árbol que consiste de pequeños bloques de construcción. De esta manera, el codificador 109 utiliza una estructura jerárquica de codificación en donde los canales de audio son procesados en forma progresiva en distintas capas de la estructura jerárquica. Esta estructura podría conducir a una codificación particularmente ventajosa con una alta calidad de audio y todavía una complejidad relativamente baja y una implementación fácil del codificador 109. La Figura 2 ilustra un ejemplo de una estructura jerárquica de codificador que podría ser empleada en algunas modalidades de la invención. En el ejemplo, el codificador 109 cifra una señal de entrada de sonido envolvente de 5.1 canales que consiste de un canal frontal izquierdo (lf) , un canal envolvente izquierdo (ls) , un canal frontal derecho (rf) , un canal central envolvente derecho (cQ) y un subaltavoz para graves ( 'subwoofer' ) o canal de Mejora de Baja Frecuencia (lfe) . Los canales primero son divididos y transformados al dominio de frecuencia en los bloques de segmentación 201. Las señales resultantes del dominio de frecuencia son alimentadas en pares en forma longitudinal a los mezcladores descendentes de Dos-a-Uno (TTO) 203, los cuales realizan el mezclado hacia abajo de dos señales de entrada hacia un canal único de salida y extraen los parámetros correspondientes. De esta manera, los tres mezcladores descendentes TTO 203 combinan hacia abajo los seis canales de entrada con los tres canales de audio y los parámetros . Como se ilustra en la Figura 2, las salidas de los mezcladores descendentes TTO 203 son utilizadas como la entrada para otros mezcladores descendentes TTO 205, 207. De manera específica, dos de los mezcladores descendentes TTO 203 son conectados con un cuarto mezclador descendente TTO 205, el cual combina los correspondientes canales en un canal único. El tercero de los mezcladores descendentes TTO 203 es junto con el cuarto mezclador descendente TTO 205 conectado con un quinto mezclador descendente TTO 207 que combina los dos canales restantes en un canal único (M) . Esta señal es finalmente transformada de regreso al dominio de tiempo originando un flujo de bits de audio codificados de múltiples canales m. Los mezcladores descendentes TTO 203 podrían ser considerados de manera que comprendan la primera capa de la estructura de codificación, con una segunda capa que comprende el cuarto mezclador descendente TTO 205 y la tercera capa que comprende el quinto mezclador descendente TTO 207. De esta manera, se realiza la combinación de un número de canales de audio en un número más bajo de canales de audio en cada capa de la estructura jerárquica de codificador. La estructura jerárquica de codificación del codificador 109 podría originar una codificación muy eficiente y de alta calidad de baja complejidad. Además, la estructura jerárquica de codificación podría ser variada en función de la naturaleza de la señal que es codificada. Por ejemplo, si fuera codificada una simple señal de estéreo, esto podría ser conseguido a través de la estructura jerárquica de codificación que solo comprende un mezclador descendente único TTO y una capa única. Con el fin de que el decodificador 115 maneje las señales codificadas utilizando distintas estructuras jerárquicas de codificación, éste debe ser capaz de adaptarse a la estructura jerárquica de codificación utilizada para la señal específica. De manera específica, el decodificador 115 comprende la funcionalidad para la configuración por sí mismo de manera que tenga una estructura jerárquica de decodificador que coincida con la estructura jerárquica de codificación del codificador 109. No obstante, con el fin de hacerlo de éste modo, el decodificador 115 debe ser proporcionado con información de la estructura jerárquica de codificación utilizada para la codificación del flujo recibido de bits. La Figura 3 ilustra un ejemplo del codificador 109 de acuerdo con algunas modalidades de la invención.
El codificador 109 comprende un procesador de recepción 301 que admite un número de canales de entrada de audio. Para el ejemplo específico de la Figura 2, el codificador 109 recibe seis canales de entrada. El procesador de recepción 301 es conectado con un procesador de codificación 303 que tiene una estructura jerárquica de codificación. Como un ejemplo, la estructura jerárquica de codificación del procesador de codificación 303 podría corresponder con la que se ilustra en la Figura 2. El procesador de codificación 303 además es conectado con un procesador de estructura de codificación 305 que es situado para determinar la estructura jerárquica de codificación utilizada por el procesador de codificación 303. El procesador de codificación 303 podría alimentar, de manera específica, los datos de estructura al procesador de estructura de codificación 305. En respuesta, el procesador de estructura de codificación 305 genera los datos de estructura de árbol de decodificador que son indicativos de la estructura jerárquica de decodificador que deben ser utilizados por el decodificador para descifrar la señal codificada que es generada por el procesador de codificación 303. Será apreciado que los datos de estructura de árbol de decodificador podrían ser determinados en forma directa como los datos que describen la estructura jerárquica de codificación o por ejemplo, podrían ser los datos que describen en forma directa la estructura jerárquica de decodificador que tiene que ser utilizada (por ejemplo, podrían describir la estructura complementaria a la del procesador de codificación 303). Los datos de estructura de árbol de decodificador comprenden, de manera específica, al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en las capas jerárquicas de la estructura jerárquica de decodificador. De esta manera, los datos de estructura de árbol de decodificador podrían comprender al menos una indicación de donde tiene que ser dividido un canal de audio en el decodificador. Esta indicación podría ser, por ejemplo, una indicación de una capa en la cual la estructura de codificación comprende un mezclador descendente o podría ser, de manera equivalente, una indicación de una capa de una estructura de árbol de decodificador que tiene que comprender un mezclador ascendente. El procesador de codificación 303 y el procesador de estructura de codificación 305 son conectados con el generador de flujo de datos 307, el cual crea un flujo de bits que comprende el audio codificado que proviene del procesador de estructura de codificación 303 y los datos de estructura de árbol de decodificador que provienen del procesador de estructura de codificación 305. A continuación, el flujo de datos es alimentado al transmisor de red 111 para su comunicación con el receptor 103. La Figura 4 ilustra un ejemplo del decodificador 115 de acuerdo con algunas modalidades de la invención. El decodificador 115 comprende un receptor 401 que admite el flujo de datos transmitido desde el receptor de red 113. El decodificador 115 además comprende un procesador de decodificación 403 y un procesador de estructura de decodificador 405 conectado con el receptor 401. El receptor 401 extrae los datos de estructura de árbol de decodificador y los alimenta al procesador de estructura de decodificador 405 mientras que los datos de codificación de audio que comprenden un número de canales de audio y los datos paramétricos de audio son alimentados al procesador de decodificación 403. El procesador de estructura de decodificador 405 es situado para determinar la estructura jerárquica de decodificador en respuesta a los datos recibidos de estructura de árbol de decodificador. De manera específica, el procesador de estructura de decodificador 405 podría extraer los valores de datos que especifican las divisiones de datos y podría generar la información de la estructura jerárquica de decodificador que complementa la estructura jerárquica de codificación del procesador de codificación 303. Esta información es alimentada al procesador de 3
decodificación 403 provocando que sea configurada para la estructura jerárquica de decodificador específica. De manera subsiguiente, el procesador de estructura de decodificador 405 continúa generando los canales de salida que corresponden con las entradas originales al codificador 109 utilizando la estructura jerárquica de decodificador. De esta manera, el sistema podría permitir una codificación, decodificación eficiente y de alta calidad y la distribución de las señales de audio y de manera específica, de las señales de audio de múltiples canales. Un sistema muy flexible es permitido en donde los decodificadores pudieran adaptarse, de manera automática a los codificadores y los mismos decodificadores pudieran ser utilizados de este modo con un número de distintos codificadores. Los datos de estructura de árbol de decodificador son comunicados de manera efectiva utilizando valores de datos que sean indicativos de las características de división de canal para los canales de audio en distintas capas jerárquicas de la estructura jerárquica de decodificador. Por lo tanto, los datos de estructura de árbol de decodificador son optimizados para las estructuras flexibles y de alto rendimiento de codificación y decodificación jerárquica. Por ejemplo, una señal de 5.1 canales (es decir, una señal de seis canales) podría ser codificada como una señal de estéreo más un conjunto de parámetros espaciales. Esta codificación puede ser conseguida a través de muchas diferentes estructuras jerárquicas de codificación que utilizan mezcladores descendentes simples TTO o de dos-a-tres (TTT) y de esta manera, muchas distintas estructuras jerárquicas de decodificador son posibles utilizando mezcladores ascendentes de uno-a-dos (OTT) o de dos-a-tres (TTT) . Por lo tanto, con el fin de decodificar el correspondiente flujo de bits espacial, el decodificador debe tener conocimiento de la estructura jerárquica de codificación que ha sido empleada en el codificador. Un procedimiento directo es entonces señalar el árbol en el flujo de bits por medio de un índice en una tabla de búsqueda. Un ejemplo de una tabla de búsqueda adecuada podría ser:
Sin embargo, la utilización de esta tabla de búsqueda tiene la desventaja que todas las estructuras jerárquicas de codificación que posiblemente podrían ser utilizadas tienen que ser especificadas de manera explícita en la tabla de búsqueda. Sin embargo, esto requiere que todos los decodificadores/codificadores tengan que recibir tablas actualizadas de búsqueda con el fin de introducir una nueva estructura jerárquica de codificación al sistema. Esto es indeseable en gran medida y origina una operación compleja y un sistema inflexible. En contraste, el uso de los datos de estructura de árbol de decodificador en donde los valores de datos indican las divisiones de canal en las distintas capas de la estructura jerárquica de decodificador permite una comunicación general simple de los datos de estructura de árbol de decodificador que podrían describir cualquier estructura jerárquica de decodificador. De esta manera, podrían utilizarse con facilidad nuevas estructuras de codificación sin requerir ninguna notificación anterior de los correspondientes de codificadores. Por lo tanto, en contraste con el procedimiento basado en la búsqueda, el sistema de la Figura 1 puede manejar un número arbitrario de canales de entrada y salida mientras que mantiene la flexibilidad total. Esto es conseguido mediante la especificación de una descripción del árbol de codificador/decodificador en el flujo de bits. A partir de esta descripción, el decodificador puede derivar en donde y como aplicar los subsiguientes parámetros codificados en el flujo de bits. Los datos de estructura de árbol de decodificador podrían comprender, de manera específica, una pluralidad de valores de datos, en donde cada valor de datos es indicativo de una característica de división de canal para un canal en una capa jerárquica de la estructura jerárquica de decodificador. De manera específica, los datos de estructura de árbol de decodificador podrían comprender un valor de datos para cada mezclador ascendente que será incluido en la estructura jerárquica de decodificador. Además, un valor de datos podría ser incluido para cada canal, que no será dividido. De esta manera, si un valor de datos de los datos de estructura de árbol de decodificador tuviera un valor que corresponde con un valor predeterminado específico de datos, esto podría indicar que el canal correspondiente no será dividido aunque de hecho es un canal de salida del decodificador 115. En algunas modalidades, el sistema sólo podría incorporar codificadores que utilizan, de manera exclusiva, mezcladores descendentes TTO y el decodificador podría ser implementado en consecuencia utilizando sólo mezcladores ascendentes OTT. En esta modalidad, un valor de datos podría ser incluido para cada canal del decodificador. Además, el valor de datos podría tomar uno de dos posibles valores con un valor indicando que el canal no es dividido y el otro valor indicando que el canal es dividido en dos canales por un mezclador ascendente OTT. Además, el orden de los valores de datos en los datos de estructura de árbol de decodificador podría indicar cuales canales serán divididos y de esta manera, la ubicación de los mezcladores ascendentes OTT en la estructura jerárquica de decodificador. Por lo tanto, podrían ser conseguidos los datos de estructura de árbol de decodificador que comprenden simples valores binarios, que describen en forma completa la estructura jerárquica de decodificador requerida. Como un ejemplo específico, la derivación de la descripción de la secuencia de bits de la estructura jerárquica de decodificador del decodificador de la Figura 5 será descrita. En el ejemplo, se supone que los codificadores sólo podrían utilizar mezcladores descendentes TTO y de esta manera, el árbol de decodificador podría ser descrito por una secuencia binaria. En el ejemplo de la Figura 5, un canal único de entrada de audio es expandido a una señal de salida de cinco canales que utiliza mezcladores ascendentes OTT. En el ejemplo, cuatro capas de profundidad pueden ser discernidas, la primera, denotada con 0 se encuentra en la capa de la señal de entrada, la última denotada con 3, se encuentra en la capa de las señales de salida. Será apreciado que en esta descripción, las capas son caracterizadas por los canales de audio con los mezcladores ascendentes que forman los límites de capa, las capas podrían ser igualmente consideradas de modo que comprendan o sean formadas por los mezcladores ascendentes.
En el ejemplo, la estructura jerárquica de decodificador de la Figura 5 podría ser descrita mediante la secuencia de bits "111001000" derivada por las siguientes etapas . 1 - La señal de entrada en la capa 0, t0, es dividida (mezclador ascendente OTT) , como resultado, todas las señales en la capa 0 son tomadas en cuenta para moverse sobre la capa 1. 1 - La primera señal en la capa 1 (que se origina de la parte superior del mezclador ascendente OTT A) es dividida (mezclador ascendente OTT B) . 1 - La segunda señal en la capa 1 (que se origina de la parte inferior del mezclador ascendente OTT A) es dividida (mezclador ascendente OTT C) , todas las señales en la capa 1 son descritas, y se mueven hacia la capa 2. 0 - La primera señal en la capa 2 (la parte superior del mezclador ascendente OTT B) no es dividida. 0 - La segunda señal en la capa 2 (la parte inferior del mezclador ascendente OTT B) no es dividida. 1 - La tercera señal en la capa 2 (la parte superior del mezclador ascendente OTT C) es dividida una vez más. 0 - La cuarta señal en la capa 2 (la parte inferior del mezclador ascendente OTT D) no es dividida, todas las señales en la capa 2 son descritas, se mueven hacia la capa 3.
O - La primera señal en la capa 3 (la parte superior del mezclador ascendente OTT D) no es dividida. 0 - La segunda señal en la capa 3 (la parte inferior del mezclador ascendente OTT D) no es dividida, todas las señales han sido descritas. En algunas modalidades, la codificación podría ser limitada solo a la utilización de los mezcladores descendentes TTO y TTT y de esta manera, la decodificación podría ser limitada solo a la utilización de los mezcladores ascendentes OTT y TTT. Aunque los mezcladores ascendentes TTT podrían ser utilizados en muchas configuraciones diferentes, es particularmente ventajosa su utilización en un modo en donde la predicción (forma de onda) fuera utilizada para estimar con exactitud las tres señales de salida que provienen de las dos señales de entrada. Debido a esta naturaleza predictiva de los mezcladores ascendentes TTT, la posición lógica para estos mezcladores ascendentes se encuentra en la raíz del árbol. Esto es una consecuencia de los mezcladores ascendentes OTT que destruyen la forma de onda original, con lo cual hacen inadecuada la predicción.
Por lo tanto, en algunas modalidades, sólo los mezcladores ascendentes que son utilizados en la estructura de decodificador son los mezcladores ascendentes OTT o los mezcladores ascendentes TTT en la capa de raíz. Por lo tanto, para estos sistemas, pueden discernirse tres distintas situaciones que juntas permiten la descripción universal del árbol : 1) Los árboles que tienen un mezclador ascendente TTT como raíz. 2) Los árboles que consisten sólo de mezcladores ascendentes OTT. 3) Los "árboles vacíos" es decir, un mapeo directo del canal (es) de entrada a salida. La Figura 6 ilustra las estructuras jerárquicas de decodificador de ejemplo que tienen mezcladores ascendentes TTT en la raíz, y la Figura 7 ilustra una estructura jerárquica de decodificador de ejemplo que comprende una pluralidad de estructuras de árbol de decodificador. La estructura jerárquica de decodificador de la Figura 7 comprende las estructuras de árbol de decodificador de acuerdo con todos los tres ejemplos presentados con anterioridad. En algunas modalidades, los datos de estructura de árbol de decodificador son ordenados con el fin de saber si el canal de entrada comprende un mezclador ascendente TTT o no. Los datos de estructura de árbol de decodificador podrían comprender una indicación de que un mezclador ascendente TTT está presente en la capa de raíz seguido por datos binarios indicativos de si los canales de las capas inferiores son divididos por el mezclador ascendente OTT o ya no son divididos. Esto podría mejorar el rendimiento en términos de velocidad de bits y bajos costos de señalización. Por ejemplo, los datos de estructura de árbol de decodificador podrían indicar cuántos mezcladores ascendentes TTT están incluidos en la estructura jerárquica de decodificador. Puesto que cada estructura de árbol sólo podría incluir un mezclador ascendente TTT que sea situado en el nivel de raíz, el resto del árbol podría ser descrito por una secuencia binaria como se describió con anterioridad (es decir, puesto que el árbol es un árbol mezclador ascendente OTT solo para pocas capas, el mismo procedimiento como se describió para el mezclador ascendente OTT sólo puede ser aplicado en la estructura jerárquica de decodificador) . Asimismo, las estructuras restantes de árbol son, ya sea de mezclador ascendente OTT o árboles vacíos que también pueden ser descritos por secuencias binarias. De esta manera, todos los árboles pueden ser descritos por valores de datos binarios y la interpretación de la secuencia binaria puede estar en función de la categoría a la que pertenece el árbol. Esta información podría ser proporcionada mediante la ubicación del árbol en los datos de estructura de árbol de decodificador. Por ejemplo, todos los árboles que comprenden un mezclador ascendente TTT podrían ser ubicados primero en los datos de estructura de árbol de decodificador, seguidos sólo por los árboles de mezclador ascendente OTT, seguido por los árboles vacíos. Si el número de mezcladores ascendentes TTT y mezcladores ascendentes OTT en la estructura jerárquica de decodificador fuera incluido en los datos de estructura de árbol de decodificador, el decodificador podría ser configurado sin requerir ningún dato adicional. Por lo tanto, es conseguida una comunicación altamente eficiente de la información de la estructura requerida del decodificador. La sobrecarga de la comunicación de los datos de estructura de árbol de decodificador podría ser mantenida muy baja, todavía un sistema flexible en gran medida sería proporcionado, el cual podría describir una amplia variedad de estructuras jerárquicas de decodificador. Como un ejemplo específico, las estructuras jerárquicas de decodificador del decodificador de la Figura 7 podrían ser derivadas de los datos de estructura de árbol de decodificador a través de los siguientes procesos: - El número de señales de entrada es derivado del mezclado descendente (posiblemente codificado) . - El número de mezcladores ascendentes OTT y el número de mezcladores ascendentes TTT de la totalidad del árbol son señalizados en los datos de estructura de árbol de decodificador y podrían ser extraídos de los mismos. El número de señales de salida puede ser derivado como: #señales de salida = #señales de entrada +#mezcladores ascendentes TTT + #mezcladores ascendentes OTT.
Los canales de entrada podrían ser nuevamente mapeados en los datos de estructura de árbol de decodificador de manera que después de un nuevo mapeo los árboles de acuerdo con la situación 1 ) primero son encontrados , seguidos por los árboles de acuerdo con la situación 2 ) y posteriormente , 3 ) . Para el ej emplo de la Figura 7 esto resultaría en el orden 3 , 0 , 1 , 2 , 4 , es decir , la señal 0 es la señal 3 después del nuevo mapeo , la señal 1 es la señal 0 después del nuevo mapeo , etcétera . - Para cada mezclador ascendente TTT, el árbol OIT -sólo son dadas las descripciones de árbol utilizando el método descrito con anterioridad, un OTT -, sólo un árbol por canal de salida TTT. - Para todas las señales restantes de entrada OTT -sólo las descripciones son dadas . En algunas modalidades, una indicación de la posición del altavoz para los canales de salida es incluida en los datos de estructura de árbol de decodificador. Por ejemplo, una tabla de búsqueda de las ubicaciones predeterminadas de altavoz podría ser utilizada, tal cerno por ejemplo:
En forma alterna, las ubicaciones de altavoz pueden ser representadas utilizando un procedimiento jerárquico. Por ejemplo, algunos primeros bits especifican el eje-x, por ejemplo, L, R, C, después, otros cuantos bits especifican el eje-y, por ejemplo, el Frontal, Lateral y Envolvente y otros cuantos bits especifican el eje-z (elevación) . Como un ejemplo específico, lo siguiente proporciona una sintaxis de ejemplo de flujo de bits para un flujo de bits seguido por los principios descritos con anterioridad. En el ejemplo, el número de señales de entrada y de salida es codificado, de manera explícita, en el flujo de bits. Esta información puede ser utilizada para validar parte del flujo de bits.
Sintaxis
TreeDescriptionO { numlnChan = bsNamlnChan+l ; n?mOutChan = bsNuraOutChan+2; nvpnTttUp_mixers = baNamTttUp_n?ixers; numOttUp mixers = bsNamOttUpjmixers;
Para (ch=0; ch< numlnChan; ch++) { bsChannelRemapping[ch] }
Para (ch=0; ch< numOutChan; ch++) { bsOutpatChannelPosfch] }
ldx = 0; ottUp mixerldx = 0; Para (i=0; i< numTttUp_mixers; i++) { TttConfig(i); Para (ch=0; ch<3; ch++, i x++) { OttTreeDescription(idx); } }
mientras (ottUp-mixerldx < numOttUp_mixersi x < numlnChan + numTttUp_mixers) { Otl reeDescriptio??(idx); idx++; } numOttUp nixers = ottUpjnixerldx + 1; }
En este ejemplo, cada árbol OttTree es manejado en eeDescription( ) que se ilustra más adelante.
Sintaxis
OttTreeDescription(idx) { CurrLayerSignals = 1 NextLayerSignals = O mientras (CurrLayerSignals>0) { bsOttUpjmixerPresent si (bsOttUp_mixerPresent = 1) { OttConf?g(ottU?_mixerIdx); ottDefeultCld[ottUp_mixerIdx] = bsOttDcfauI Cld[ottUp_mixerIdx]; ottModeLfß[ottU?_mixerIdx] = bsOttModeLfe[ottUp_mixerIdx]; NextLayerSignals += 2; ottUp_mixerIdx ++; } CurrLayerSignals--; si ((CurrLayerSignals = 0) && (NextLaye?Signals>0)) { CurrLayerSignals = NextLayerSignals; NextLayerSignals = 0; } } }
En la sintaxis anterior el formateo de letras negrillas se utiliza para indicar los elementos leídos del flujo de bits. Será apreciado que la noción de las capas jerárquicas no es necesaria en esta descripción. Por ejemplo, también podría ser aplicada una descripción basada en un principio de "con la condición de que existan extremos abiertos, existirán más bits de llegada". Con el fin de decodificar los datos, esta noción podría volverse útil. Aparte de la denotación única de bits sí o no un mezclador ascendente OTT está presente, los siguientes datos son incluidos para el mezclador ascendente OTT: - La Diferencia de Nivel de Canal por omisión. - Si el mezclador ascendente OTT es un mezclador ascendente OTT LFE (Mejora de Baja Frecuencia) , es decir, si los parámetros sólo son limitados por banda y no contienen ningún tipo de datos de correlación/coherencia. Además, los datos podrían detallar las propiedades específicas de los mezcladores ascendentes, tal como en el ejemplo del mezclador ascendente TTT, que modo se utiliza (la predicción basada en la forma de onda, la descripción basada en la energía, etc.). Como será conocido por una persona experta en la técnica, un mezclador ascendente OTT utiliza una señal decorrelacionada para dividir un canal único en dos canales . Además, la señal decorrelacionada es derivada de la señal única de canal de entrada. La Figura 8 ilustra un ejemplo de un mezclador ascendente OTT de acuerdo con este procedimiento. De esta manera, el decodificador de ejemplo de la Figura 5 podría ser representado por el diagrama de la Figura 9 , en donde los bloques de decorrelacionador que generan las señales decorrelacionadas son mostrados de manera explícita. Sin embargo, como puede observarse, este procedimiento conduce a la colocación en cascada de los bloques de decorrelacionador, de manera que la señal decorrelacionada para el mezclador ascendente OTT de capa más baja sea generada a partir de una señal de entrada que ha sido creada desde otra señal decorrelacionada. De esta manera, más que ser generadas a partir de la señal original de entrada en el nivel de raíz, las señales decorrelacionadas de las capas más bajas tendrán que haber sido procesadas a través de varios bloques de decorrelación. Puesto que cada bloque de decorrelación comprende un filtro de decorrelación, este procedimiento podría resultar en una "borrosidad" de la señal decorrelacionada (por ejemplo, los transitorios podrían ser distorsionados de manera significativa) . Esto origina la degradación de la calidad del audio para la señal de salida. Por lo tanto, con el fin de mejorar la calidad del audio, los decorrelacionadores aplicados en el mezclador ascendente del decodificador podrían ser movidos en algunas modalidades, de manera que sea evitada la colocación en cascada de las señales decorrelacionadas. La Figura 10 ilustra un ejemplo de una estructura de decodificador que corresponde con la de la Figura 9 aunque con los decorrelacionadores conectados en forma directa con el canal de entrada. De esta manera, en lugar de tomar la salida del mezclador ascendente predecesor OTT como la entrada al decorrelacionador, los mezcladores ascendentes de decorrelacionador toman en forma directa la señal original de entrada to, previamente procesada por los mezcladores ascendentes de ganancia GB, Gc y GD. Estas ganancias garantizan que la energía a la entrada del decorrelacionador sea idéntica a la energía que hubiera sido conseguida en la entrada del decorrelacionador en la estructura de la Figura 9. La estructura conseguida de este modo no contiene una cascada de decorrelacionadores con lo cual, se origina una calidad mejorada del audio. A continuación, será descrito un ejemplo de la manera como se determinan los parámetros de multiplicación de matriz para los mezcladores ascendentes de las capas jerárquicas en respuesta a los datos de estructura de árbol de decodificador. De manera particular, la descripción se enfocará en las modalidades en donde los filtros de decorrelación para la generación de las señales decorrelacionadas de los mezcladores ascendentes son conectados en forma directa con los canales de entrada de audio de la estructura de decodificación. Por lo tanto, la descripción se enfocará en las modalidades de los codificadores tal como se ilustra en la Figura 10.
La Figura 11 ilustra un diagrama de flujo de ejemplo de un método de decodificación de acuerdo con algunas modalidades de la invención. En la etapa 1101, los parámetros cuantificados y codificados son decodificados a partir del flujo recibido de bis. Como será apreciado por la persona experta en la técnica, esto podría originar un número de vectores de parámetros convencionales de codificación de audio paramétrico, tal como: CLDo=[-10 15 10 12 ... 10] CLD?=[5 1 2 15 10 ... 2] ICCo=[1 0.60.9 0.3 ... -l] ICC?=[0 1 0.6 0.9 ... 0.3] etc.
Cada vector representa los parámetros a lo largo del eje de frecuencia. La etapa 1101 es seguida por la etapa 1103, en donde las matrices para los mezcladores ascendentes individuales son determinadas a partir de los datos paramétricos decodificados . Las matrices generalizadas OTT y TTT (independientes de la frecuencia) podrían ser dadas, de manera respectiva, como:
Las señales ^, di e i representan las señales de entrada, las señales decorrelacionadas derivadas a partir de las señales x¿ y las señales de salida, de manera respectiva. Las entradas de matriz H±f y Mu son funciones de los parámetros derivados en la etapa 1103. A continuación, el método se divide en dos trayectorias paralelas, en donde una trayectoria es dirigida a la derivación de los valores de matriz previa del árbol (etapa 1105) y una trayectoria es dirigida a la derivación de los valores de matriz de mezclado de árbol (etapa 1107). Las matrices previas corresponden con las multiplicaciones de matriz aplicadas a la señal de entrada antes de la decorrelación y la aplicación de matriz. De manera específica, las matrices previas corresponden con los mezcladores ascendentes de ganancia aplicados en la señal de entrada antes de los filtros de decorrelación. En mayor detalle, una implementación directa del decodificador conducirá en general hacia una cascada de filtros de decorrelación, como por ejemplo, como es aplicado en la Figura 9. Como se explicó con anterioridad, es preferible evitar esta cascada. Con el fin de hacerlo de éste modo, todos los filtros de decorrelación son movidos al mismo nivel jerárquico como se muestra en la Figura 10. Con el fin de garantizar que las señales decorrelacionadas tengan el nivel adecuado de energía, es decir, idéntico al nivel de la señal decorrelacionada en el caso directo de la Figura 9, las matrices previas son aplicadas antes de la decorrelación. Como un ejemplo, el GB de ganancia en la Figura 10 es derivado como sigue. En primer lugar, es importante observar que el mezclador ascendente de l-a-2 divide la energía de la señal de entrada hacia las salidas superior e inferior del mezclador ascendente de l-a-2. Esta propiedad es reflejada en los parámetros de Diferencia de Intensidad entre Canales (IID) o Diferencia de Nivel entre Canales (ICLD) . Por lo tanto, el GB de ganancia es calculado como la relación de energía de la salida superior dividida entre la suma de las salidas superior e inferior del mezclador ascendente de 1-a-2. Será apreciado que debido a que los parámetros IID o ICLD pueden ser variables con el tiempo y la frecuencia, la ganancia también podría variar con respecto, tanto con el tiempo como con la frecuencia. Las matrices de mezclado son las matrices aplicadas a la señal de entrada por los mezcladores ascendentes con el fin de generar los canales adicionales . Las ecuaciones finales de matriz previa y de mezclado son el resultado de una cascada de los mezcladores ascendentes OTT y TTT. Puesto que la estructura del decodificador ha sido enmendada para evitar la cascada de los decorrelacionadores, debe tomarse en cuenta cuando se determinen las ecuaciones finales. En las modalidades, en donde sólo son utilizadas configuraciones predeterminadas, la relación entre las entradas de matriz N¿f y Mi£ y las ecuaciones finales de matriz es constante y puede ser aplicada una modificación estándar. Sin embargo, para el procedimiento más flexible y dinámico descrito con anterioridad, la determinación de los valores de matriz previa y mezclado puede ser establecida a través de procedimientos más complejos como será descrito más adelante. La etapa 1105 es seguida por la etapa 1109, en donde las matrices previas derivadas en la etapa 1105 son mapeadas a la rejilla actual de frecuencia que es aplicada para transformar la señal de dominio de tiempo en el dominio de frecuencia (en la etapa 1113). La etapa 1109 es seguida por la etapa 1111, en donde la interpolación de los parámetros de matriz de frecuencia podría ser intercalada. De manera específica, en función de si o no la actualización temporal de los parámetros corresponde con la actualización de la transformación de tiempo-a-frecuencia de la etapa 1113, podría ser aplicada la interpolación . En la etapa 1113, las señales de entrada son convertidas al dominio de frecuencia con el fin de aplicar las matrices previas mapeadas e interpoladas de manera opcional . La etapa 1115 sigue de la etapa 1111 y la etapa 1113 y comprende la aplicación de las matrices previas a las señales de entrada del dominio de frecuencia. La aplicación actual de la matriz es un conjunto de multiplicaciones de matriz. La etapa 1115 es seguida por la etapa 1117 en donde parte de las señales que se originan a partir de la aplicación de matriz de la etapa 1115 es alimentada al filtro de decorrelación para generar las señales decorrelacionadas. El mismo procedimiento es aplicado para derivar las ecuaciones de matriz de mezclado. De manera específica, la etapa 1107 es seguida por la etapa 1119, en donde las ecuaciones determinadas en la etapa 1107 son mapeadas a la rejilla de frecuencia de la transformación de tiempo-a-frecuencia de la etapa 1113. La etapa 1119 es seguida por la etapa 1121, en donde los valores de matriz de mezclado son interpolados, de manera opcional, una vez más en función de la actualización temporal de los parámetros y la transformación. Los valores generados en las etapas 1115, 1117 y 1121 forman de esta manera, los parámetros requeridos para la multiplicación de matriz de mezclado ascendente y esta es realizada en la etapa 1123. La etapa 1123 es seguida por la etapa 1125, en donde la salida resultante es transformada de regreso al dominio de tiempo. Las etapas que corresponden con las etapas 1115,
1117 y 1123 en la Figura 11 además pueden ser ilustradas por la Figura 12. La Figura 12 ilustra un ejemplo de una estructura de decodificador de matriz de acuerdo con algunas modalidades de la invención. La Figura 12 ilustra cómo pueden ser utilizados los canales de mezclado descendente de entrada para reconstruir la salida de múltiples canales. Como se delineó con anterioridad, el proceso puede ser descrito por las multiplicaciones de matriz con unidades intermedias de decorrelación. Por lo tanto, el procesamiento de los canales de entrada para formar los canales de salida puede ser descrito de acuerdo con:
X' k = M2n'k X'k en donde M?n,k es una matriz de dos dimensiones que mapea un cierto número de canales de entrada en un cierto número de canales que continúan hacia los decorrelacionadores, y es definido por cada ranura de tiempo n, y cada subbanda k; y M2n,k es una matriz de dos dimensiones que mapea un cierto número de canales previamente procesados en un cierto número de canales de salida, y es definida para cada ranura de tiempo n, y cada subbanda híbrida k. A continuación, será descrito un ejemplo de la manera como podrían ser generadas las ecuaciones de matriz previa y mezclado de las etapas 1105 y 1107 a partir de los datos de estructura de árbol de decodificador. En primer lugar, las estructuras de árbol de decodificador, que sólo tienen mezcladores ascendentes OTT, serán consideradas con referencia al árbol de ejemplo de la Figura 13. Para este tipo de árboles es benéfico definir el número de variables auxiliares:
describe los índices del mezclador ascendente OTT que son encontrados para cada mezclador ascendente OTT (es decir, en el ejemplo la señal que está siendo salida hacia el cuarto mezclador ascendente OTT ha pasado través del cero y primer mezclador ascendente OTT, como es dado por la quinta columna en la matriz Tree1. En forma similar, la señal que está siendo entrada al segundo mezclador ascendente OTT ha pasado a través del bloque cero OTT, como es dado por la tercera columna en la matriz Tree1, y así sucesivamente) .
describe si la trayectoria superior o inferior es proseguida para cada mezclador ascendente OTT. El signo positivo indica la trayectoria superior y el signo negativo indica la trayectoria inferior. La matriz corresponde con la matriz Tree1, y por lo tanto, cuando una cierta columna e hilera en la matriz Tree1 indica un cierto mezclador ascendente OTT, la misma columna e hilera en la matriz Tree1 indicaría si la parte inferior o superior de este mezclador ascendente específico OTT es utilizada para alcanzar el mezclador ascendente OTT dado en la primera hilera de la columna específica (es decir, en el ejemplo, la señal que está siendo entrada al cuarto mezclador ascendente OTT ha pasado a través de la trayectoria superior del cero mezclador ascendente OTT (como se indica mediante la tercera hilera, la quinta columna en la matriz Tree1^^) , y la trayectoria inferior del primer mezclador ascendente OTT
(como es indicado por la segunda hilera, quinta columna en la matriz Tree1^^) . = [ 1 2 2 3 3 ] describe la profundidad del árbol para cada mezclador ascendente OTT (es decir, en el ejemplo el mezclador ascendente 0 se encuentra en la capa 1, los mezcladores ascendentes 1 y 2 se encuentran en la capa 2 y los mezcladores ascendentes 3 y 4 se encuentran en la capa 3); y Treeelemepts = L -3 J
denota el número de elementos en el árbol (es decir, en el ejemplo el árbol comprende cinco mezcladores ascendentes) . Entonces, una matriz temporal Ki que describe la matriz previa sólo para las señales decorrelacionadas es definida de acuerdo con:
en donde
es el valor de ganancia para el mezclador ascendente OTT indicado por Tree1(i,p) en función de si la salida superior o inferior del bloque OTT es utilizada, y en donde
Los valores IID son los valores de Diferencia de Intensidad entre Canales obtenidos a partir del flujo de bits . La matriz final de mezclado previo Mi. es entonces construida como:
Se recuerda que el objetivo de la matriz de mezclado previo es ser capaz de mover los decorrelacionadores incluidos en el mezclador ascendente OTT en la Figura 13, antes que los bloques OTT. Por lo tanto, la matriz de mezclado previo necesita suministrar una señal de entrada "seca" para todos los decorrelacionadores en el mezclador ascendente OTT, en donde las señales de entrada tienen el nivel que pudieron haber tenido en el punto específico en el árbol en donde el decorrelacionador fue situado antes de moverlo en la parte frontal del árbol . También se recuerda que la matriz previa sólo aplica una ganancia previa para las señales que se dirigen hacia los decorrelacionadores y el mezclado de las señales de decorrelacionador y la señal "seca" de mezclado descendente se realizan en la matriz de mezclado M2, que será elaborada más adelante, el primer elemento de la matriz de mezclado previo proporciona una salida que es directamente acoplada con la matriz M2 (véase la Figura 12, en donde la línea m/c ilustra esto) . Dado este mezclador ascendente OTT, sólo el árbol está siendo actualmente observado, es claro que también el segundo elemento del vector de mezclado previo Mi será uno, debido a que la señal que se dirige hacia el decorrelacionador en el mezclador ascendente cero OTT es exactamente la señal de salida de mezclado descendente, y que por esto no existe diferencia que el mezclador ascendente OTT mueva el decorrelacionador en la parte frontal del árbol debido a que ya se encuentra primero en el árbol . Además, dado que el vector de entrada a los decorrelacionadores es dado por v"'* = Mi"' xn, k y observando la Figura 13, y la Figura 12, y el modo en el que fueron derivados los elementos en la matriz Mi"'*, es claro que la primera hilera de Mi corresponde con la señal m en la Figura 12, las hileras subsiguientes corresponden con la señal de entrada de decorrelacionador del bloque 0,..., 4 OTT. Por lo tanto, el vector "'* será como sigue:
en donde en denota la salida del decorrelacionador del nvo bloque OTT en la Figura 13. Ahora observando la matriz de mezclado M2, los elementos de esta matriz pueden ser deducidos en forma similar. Sin embargo, para estia matriz el objetivo es ajustar la ganancia de la señal seca y mezclarla con las salidas relevantes del decorrelacionador. Se recuerda que cada mezclador ascendente OTT en el árbol puede ser descrito por lo siguiente:
en donde Yi es la salida superior del bloque OTT, e Y2 es la entrada inferior y X es la señal seca de entrada y Q es la señal del decorrelacionador. Debido a que los canales de salida son formados por la multiplicación de matriz yn, k = M2"'? X'k y el vector w"'* es formado como una combinación de la señal de mezclado descendente y la salida de los decorrelacionadores como se indica en la Figura 12, cada hilera de la matriz M2 corresponde con un canal de salida, y cada elemento en la hilera específica, indica que tanto tienen que ser mezclados la señal de mezclado descendente y los diferentes decorrelacionadores para formar el canal específico de salida. Como un ejemplo, la primera hilera de la matriz de mezclado M2 puede ser observada.
El primer elemento de la primera hilera en M2 corresponde con la contribución de la señal "m" , y es la contribución a la salida dada por las salidas superiores del mezclador ascendente OTT 0, 1 y 3. Dada la matriz anterior H, esto corresponde con Hll0, Hlli, y Hll3, debido a que la cantidad de la señal seca de la salida superior del bloque OTT es dada por el elemento Hll del mezclador ascendente OTT. El segundo elemento corresponde con la contribución del decorrelacionador Di, que de acuerdo con lo anterior es situado en el mezclador ascendente 0 OTT. Por lo tanto, la contribución de este es Hll0, Hll3 y Hl20. Esto es evidente debido a que el elemento H120 proporciona al decorrelacionador la salida del mezclador ascendente 0 OTT, y que la señal es subsiguientemente pasada a través de los mezcladores ascendentes 1 y 3 OTT, como parte de la señal seca, y de esta manera la ganancia es ajustada de acuerdo con los elementos Hll0 y Hll3. En forma similar, el tercer elemento corresponde con la contribución del decorrelacionador D2 , que de acuerdo con lo anterior es situado en el mezclador ascendente 1 OTT. Por lo tanto, la contribución de este es Hl20 y Hll3. El quinto elemento corresponde con la contribución del decorrelacionador D3 , el cual de acuerdo con la notación anterior es situado en el mezclador ascendente 3 OTT. Por lo tanto, la contribución de este es Hl23. El cuarto y el sexto elementos de la primera hilera es de cero debido a que ninguna contribución del decorrelacionador D4 o D6 es parte del canal de salida que corresponde con la primera hilera en la matriz. El ejemplo anterior superficial, hace evidente que los elementos de matriz puedan ser deducidos como productos de los elementos de matriz de mezclador ascendente OTT H. Con el fin de derivar la matriz de mezclado M2 para un árbol general, puede ser derivado un procedimiento similar como para la matriz Mi. En primer lugar, las siguientes variables auxiliares son derivadas: La matriz Tree, mantiene una columna para cada canal de salida, describiendo los índices de la señal de los mezcladores ascendentes OTT que deben pasar para alcanzar cada canal de salida.
7
La matriz TreeSign mantiene un indicador para cada mezclador ascendente en el árbol a fin de señalar si la trayectoria superior (1) o inferior (-1) tuviera que ser utilizada para alcanzar el actual canal de salida.
El vector Treeaepth mantiene el número de mezcladores ascendentes que tienen que ser pasados para conseguir un canal específico de salida.
TT8^ - 3 3 3 2 2]
El vector TreeeLßrent mantiene el número de mezcladores ascendentes en cada sub-árbol del árbol en su totalidad.
Tree„ =[S]
Con la condición que la notación definida con anterioridad sea suficiente para describir todos los árboles que pueden ser señalizados, puede definirse la matriz M2. La matriz para un sub-árbol k, que crea los N canales de salida a partir de 1 canal de entrada, es definida de acuerdo con:
en donde
en donde los elementos H son definidos mediante los parámetros que corresponden con el mezclador ascendente OTT con el índice Tree(p, ) . A continuación, es supuesto un árbol más general que involucra mezcladores ascendentes TTT en el nivel de raíz, tal como por ejemplo, la estructura de decodificador de la Figura 14. Los mezcladores ascendentes que contienen dos variables Mli y M2i denotan los árboles OTT y por lo tanto, no necesariamente contienen mezcladores ascendentes únicos OTT. Además, en primer lugar se supone que los mezcladores ascendentes TTT no emplean una señal decorrelacionada, es decir, la matriz TTT puede ser descrita como una matriz de
De acuerdo con estas suposiciones y con el fin de derivar las matrices previa y de mezclado para el primer mezclador ascendente TTT, dos conjuntos de matrices de mezclado previo son derivadas para cada árbol OTT, una que describe la combinación de matriz previa para la primera señal de salida del mezclador ascendente TTT y otra que describe la combinación de matriz previa para la segunda señal de salida del mezclador ascendente TTT. Después de la aplicación de ambos bloques de combinación de matriz previa y de decorrelación, las señales pueden ser sumadas. Por lo tanto, las señales de salida pueden ser derivadas como sigue:
42] -Ml^,, ' Ml144—?(±+))—- **"<•>" M24- 43] -M 1M t, .MAiTll4- 1 44] *- Ml6 *-H{.) ** M2. 6 45] — ^ M — ^H{.) — ^ M 46] 47] Finalmente, en el caso de que el mezclador ascendente TTT pudiera emplear la decorrelación, la contribución de la señal decorrelacionada puede ser agregada en la forma de un proceso posterior. Una vez que la señal decorrelacionada del mezclador ascendente TTT haya sido derivada, la contribución a cada señal de salida simplemente es la contribución dada por el vector expandido [Mi3, M23, M33] por las IDDs de cada uno de los siguientes mezcladores ascendentes OTT. La Figura 15 ilustra un método de transmisión y recepción de una señal de audio de acuerdo con algunas modalidades de la invención. El método inicia en la etapa 1501, en donde un transmisor recibe un número de canales de entrada de audio. La etapa 1501 es seguida por la etapa 1503, en donde el transmisor codifica en forma paramétrica el número de canales de entrada de audio a fin de generar el flujo de datos que comprende el número de canales de audio y los datos paramétricos de audio. La etapa 1503 es seguida por la etapa 1505, en donde es determinada la estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica. La etapa 1505 es seguida por la etapa 1507, en donde el transmisor incluye los datos de estructura de árbol de decodificador que comprenden al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos. La etapa 1507 es seguida por la etapa 1509, en donde el transmisor envía el flujo de datos al receptor. La etapa 1509 es seguida por la etapa 1511, en donde el receptor admite el flujo de datos. La etapa 1511 es seguida por la etapa 1513, en donde la estructura jerárquica de decodificador que será utilizada por el receptor es determinada en respuesta a los datos de estructura de árbol de decodificador. La etapa 1513 es seguida por la etapa 1515, en donde el receptor genera el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador. Será apreciado que la descripción anterior por motivos de claridad ha detallado las modalidades de la invención con referencia a las diferentes unidades y procesadores funcionales. Sin embargo, será aparente que cualquier distribución adecuada de funcionalidad entre las distintas unidades o procesadores funcionales podría ser utilizada sin apartarse de la invención. Por ejemplo, la funcionalidad ilustrada que será realizada a través de procesadores o controladores separados podría ser efectuada por el mismo procesador o controladores. Por lo tanto, las referencias a las unidades específicas funcionales sólo serán observadas como referencias a los medios adecuados que proporcionan la funcionalidad descrita más que indicativa de la lógica estricta o la estructura u organización física. La invención puede ser implementada en cualquier forma adecuada que incluye hardware, software, firmware o cualquier combinación de estos. De manera opcional, la invención podría ser implementada, por lo menos parcialmente, como un software de computadora que se ejecuta en uno o más procesadores de datos y/o procesadores de señal digital. Los elementos y componentes de una modalidad de la invención podrían ser implementados, física, funcional y lógicamente, en cualquier modo adecuado. En lugar de que la funcionalidad pudiera ser implementada en una unidad única, en una pluralidad de unidades o como parte de otras unidades funcionales. Como tal, la invención podría ser implementada en una unidad única o podría ser distribuida física y funcionalmente entre distintas unidades y procesadores . Aunque la presente invención ha sido descrita en conexión con algunas modalidades, no se pretende que sea limitada a la forma específica señalada en la presente. Más bien, el alcance de la presente invención sólo es limitado por las reivindicaciones que la acompañan. Además, aunque una característica podría aparecer que es descrita en conexión con modalidades particulares, una persona experta en la técnica reconocería que varias características de las modalidades descritas podrían ser combinadas de acuerdo con la invención. En las reivindicaciones, el término que comprende no excluye la presencia de otros elementos o etapas . Además, aunque son enlistados en forma individual, una pluralidad de medios, elementos o etapas de método podrían ser implementados, por ejemplo, por medio de una unidad o procesador único. Además, aunque las características individuales podrían ser incluidas en distintas reivindicaciones, estas podrían ser posiblemente combinadas de manera ventajosa, y la inclusión en diferentes reivindicaciones no implica que una combinación de características no sea factible y/o ventajosa. También la inclusión de una característica en una categoría de reivindicaciones no implica una limitación a esta categoría sino más bien indica que la característica es aplicable por igual a otras categorías de reivindicación, según sea adecuado. Además, el orden de las características en las reivindicaciones no implica ningún orden específico en el cual las características tengan que ser trabajadas y en particular, el orden de las etapas individuales en una reivindicación de método no implica que las etapas tengan que ser efectuadas en este orden. Más bien, las etapas podrían ser realizadas en cualquier orden adecuado. Además, las referencias en singular no excluyen una pluralidad. De esta manera, las referencias a "un", "una", "primero", "segundo", etc., no impiden una pluralidad. Los signos de referencia en las reivindicaciones son proporcionados simplemente como un ejemplo aclarativo que no debe ser interpretado como limitante para el alcance de las reivindicaciones en modo alguno. Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.
Claims (36)
- Reivindicaciones Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones : 1. Un aparato que genera un número de canales de salida de audio, caracterizado porque comprende: el medio que recibe un flujo de datos que incluye un número de canales de entrada de audio y los datos paramétricos de audio; el flujo de datos además incluye datos de estructura de árbol de decodificador para una estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador incluyen al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador; el medio que genera la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador; y el medio que genera el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador.
- 2. El aparato de conformidad con la reivindicación 1, caracterizado porque los datos de estructura de árbol de decodificador comprenden una pluralidad de valores de datos, cada valor de datos es indicativo de la característica de división de canal para un canal en una capa jerárquica de la estructura jerárquica de decodificador.
- 3. El aparato de conformidad con la reivindicación 2, caracterizado porque un valor predeterminado de datos es indicativo de la falta de división, de canal para el canal en la capa jerárquica.
- 4. El aparato de conformidad con la reivindicación 2, caracterizado porque un valor predeterminado de datos es indicativo de una división de uno-a-dos canales para el canal en la capa jerárquica.
- 5. El aparato de conformidad con la reivindicación 2, caracterizado porque la pluralidad de valores de datos son valores de datos binarios .
- 6. El aparato de conformidad con la reivindicación 5, caracterizado porque un valor predeterminado de datos binarios es indicativo de una división de uno-a-dos canales y otro valor predeterminado de datos binarios es indicativo de la falta de división de canal.
- 7. El aparato de conformidad con la reivindicación 1, caracterizado porque el flujo de datos además comprende una indicación del número de canales de entrada.
- 8. El aparato de conformidad con la reivindicación 1, caracterizado porque el flujo de datos además comprende una indicación del número de canales de salida.
- 9. El aparato de conformidad con la reivindicación 1, caracterizado porque el flujo de datos además comprende una indicación de un número de funciones de división de uno-a-dos canales en la estructura jerárquica de decodificador.
- 10. El aparato de conformidad con la reivindicación 1, caracterizado porque el flujo de datos además comprende una indicación de un número de funciones de división de dos-a-tres canales en la estructura jerárquica de decodificador.
- 11. El aparato de conformidad con la reivindicación 1, caracterizado porque los datos de estructura de árbol de decodificador comprenden los datos para una pluralidad de estructuras de árbol de decodificador ordenadas en respuesta a la presencia de una funcionalidad de división de dos-a-tres canales .
- 12. El aparato de conformidad con la reivindicación 1, caracterizado porque los datos de estructura de árbol de decodificador al menos para un canal de entrada comprenden una indicación de la función de división de dos-a-tres canales que está presente en la capa de raíz seguida por los datos binarios, en donde cada valor de datos binarios es indicativo ya sea de una falta de funcionalidad de división o una funcionalidad de división de uno-a-dos canales para las capas dependientes de la funcionalidad de división de dos-a-tres canales.
- 13. El aparato de conformidad con la reivindicación 1, caracterizado porque el flujo de datos además comprende una indicación de una posición de altavoz al menos para uno de los canales de salida.
- 14. El aparato de conformidad con la reivindicación 1, caracterizado porque el medio de generación de la estructura jerárquica de decodificador es situado para determinar los parámetros de multiplicación para las funciones de división de canal de las capas jerárquicas en respuesta a los datos de estructura de árbol de decodificador .
- 15. El aparato de conformidad con la reivindicación 1, caracterizado porque la estructura de árbol de decodificador comprende al menos una funcionalidad de división de canal por lo menos en una capa jerárquica, al menos una funcionalidad de división de canal incluye: el medio de decorrelación que genera una señal decorrelacionada en forma directa a partir de un canal de entrada de audio del flujo de datos; al menos una unidad de división de canal que genera una pluralidad de canales de salida de capa jerárquica a partir de un canal de audio de una capa jerárquica más alta y la señal decorrelacionada; y el medio que determina al menos una característica del filtro de decorrelación o la unidad de división de canal en respuesta a los datos de estructura de árbol de decodificador.
- 16. El aparato de conformidad con la reivindicación 15, caracterizado porque el medio de decorrelación comprende un medio de compensación de nivel que realiza la compensación de nivel de audio en el canal de entrada de audio a fin de generar una señal de audio compensada de nivel; y un filtro de decorrelación para el filtrado de la señal de audio compensada de nivel a fin de crear la señal decorrelacionada.
- 17. El aparato de conformidad con la reivindicación 16, caracterizado porque el medio de compensación de nivel comprende una multiplicación de matriz por una matriz previa.
- 18. El aparato de conformidad con la reivindicación 17, caracterizado porque los coeficientes de la matriz previa tienen al menos un valor de unidad para la estructura jerárquica de decodificador que comprende sólo una funcionalidad de división de uno-a-dos canales.
- 19. El aparato de conformidad con la reivindicación 17, caracterizado además porque comprende el medio que determina la matriz previa por lo menos para una funcionalidad de división de canal por lo menos en una capa jerárquica en respuesta a los parámetros de la funcionalidad de división de canal en una capa jerárquica más alta.
- 20. El aparato de conformidad con la reivindicación 17, caracterizado porque comprende el medio que determina una matriz de división de canal al menos para una funcionalidad de división de canal en respuesta a los parámetros por lo menos de una funcionalidad de división de canal al menos en una capa jerárquica.
- 21. El aparato de conformidad con la reivindicación 17, caracterizado además porque comprende el medio que determina la matriz previa al menos para una funcionalidad de división de canal por lo menos en una capa jerárquica en respuesta a los parámetros de la funcionalidad de división de dos-a-tres canales de una capa jerárquica más alta.
- 22. El aparato de conformidad con la reivindicación 21, caracterizado porque el medio que determina la matriz previa es situado para establecer la matriz previa al menos para una funcionalidad de división de canal en respuesta al establecimiento de una primera sub-matriz previa que corresponde con una primera entrada de un mezclado descendente de dos-a-tres y una segunda sub-matriz previa que corresponde con una segunda entrada de un mezclador ascendente de dos-a-tres.
- 23. Un aparato para la generación de un flujo de datos que incluye un número de canales de salida de audio, caracterizado porque comprende: el medio que recibe un número de canales de entrada de audio; el medio de codificación jerárquica que codifica en forma paramétrica el número de canales de entrada de audio a fin de generar el flujo de datos que incluye el número de canales de salida de audio y los datos paramétricos de audio; el medio que determina la estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica; y el medio que incluye los datos de estructura de árbol de decodificador que a su vez incluyen al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos.
- 24. Un flujo de datos, caracterizado porque comprende : un número de canales codificados de audio; los datos paramétricos de audio; y los datos de estructura de árbol de decodificador para la estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador incluyen al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador.
- 25. El medio de almacenamiento, caracterizado porque tiene almacenado en el mismo una señal de conformidad con la reivindicación 24.
- 26. Un método de generación de un número de canales de salida de audio, caracterizado porque comprende: recibir un flujo de datos que incluye un número de canales de entrada de audio y los datos paramétricos de audio; el flujo de datos además incluye los datos de estructura de árbol de decodificador para la estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador incluyen al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador; generar la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador; y generar el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador.
- 27. Un método de generación de un flujo de datos que incluye un número de canales de salida de audio, caracterizado porque comprende: recibir un número de canales de entrada de audio; codificar en forma paramétrica el número de canales de entrada de audio a fin de generar el flujo de datos que incluye el número de canales de salida de audio y los datos paramétricos de audio; determinar una estructura jerárquica de decodificador que corresponde con los medios de codificación jerárquica; e incluir los datos de estructura de árbol de decodificador que a su vez incluyen al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos.
- 28. Un receptor que genera un número de canales de salida de audio, caracterizado porque comprende: el medio que admite un flujo de datos que incluye un número de canales de entrada de audio y los datos paramétricos de audio; el flujo de datos además incluye los datos de estructura de árbol de decodificador para la estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador incluyen al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador; el medio que genera la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador; y el medio que genera el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador.
- 29. Un transmisor que genera un flujo de datos que incluye un número de canales de salida de audio, caracterizado porque comprende: el medio que admite un número de canales de entrada de audio; el medio de codificación jerárquica para la codificación en forma paramétrica del número de canales de entrada de audio para generar el flujo de datos que incluye el número de canales de salida de audio y los datos paramétricos de audio; e\ medio que determina la estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica; y el medio que incluye los datos de estructura de árbol de decodificador que a su vez incluyen al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos.
- 30. Un sistema de transmisión que incluye un transmisor que genera un flujo de datos y un receptor que genera un número de canales de salida de audio, caracterizado porque comprende : el medio que recibe un número de canales de entrada de audio; el medio de codificación jerárquica para la codificación en forma paramétrica del número de canales de entrada de audio que genera el flujo de datos que incluye el número de canales de audio y los datos paramétricos de audio; el medio que determina una estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica, el medio que incluye los datos de estructura de árbol de decodificador que a su vez incluyen al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos, y el medio que transmite el flujo de datos al receptor; y el receptor incluye: el medio que admite el flujo de datos, el medio que genera la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador, y el medio que genera el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador.
- 31. Un método de recepción de un flujo de datos, caracterizado porque comprende: recibir un flujo de datos que incluye un número de canales de entrada de audio y los datos paramétricos de audio,• el flujo de datos además incluye los datos de estructura de árbol de decodificador para la estructura jerárquica de decodificador, los datos de estructura de árbol de decodificador incluyen al menos un valor de datos indicativo de las características de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador; generar la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador; y generar el numero de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador.
- 32. Un método de transmisión de un flujo de datos que incluye un número de canales de salida de audio, caracterizado porque comprende: recibir un número de canales de entrada de audio; realizar la codificación en forma paramétrica del número de canales de entrada de audio para generar el flujo de datos que incluye el número de canales de salida de audio y los datos paramétricos de audio; determinar la estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica; incluir los datos de estructura de árbol de decodificador que incluyen al menos un valor de datos indicativo de una característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos; y transmitir el flujo de datos.
- 33. Un método de transmisión y recepción de un flujo de datos, caracterizado porque comprende: en el transmisor: recibir un número de canales de entrada de audio, realizar la codificación en forma paramétrica del número de canales de entrada de audio para generar el flujo de datos que incluye el número de canales de audio y los datos paramétricos de audio, determinar la estructura jerárquica de decodificador que corresponde con el medio de codificación jerárquica, incluir los datos de estructura de árbol de decodificador que incluyen al menos un valor de datos indicativo de la característica de división de canal para un canal de audio en una capa jerárquica de la estructura jerárquica de decodificador en el flujo de datos, y transmitir el flujo de datos al receptor; y en un receptor: admitir el flujo de datos, generar la estructura jerárquica de decodificador en respuesta a los datos de estructura de árbol de decodificador, y generar el número de canales de salida de audio a partir del flujo de datos utilizando la estructura jerárquica de decodificador.
- 34. Un producto de programa de computadora, caracterizado porque ejecuta el método de conformidad con cualquiera de las reivindicaciones 26, 27, 31, 32 y 33.
- 35. Un dispositivo de reproducción de audio, caracterizado porque comprende un aparato de conformidad con la reivindicación 1.
- 36. Un dispositivo de grabación de audio, caracterizado porque comprende un aparato de conformidad con la reivindicación 23.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05106466 | 2005-07-14 | ||
PCT/IB2006/052309 WO2007007263A2 (en) | 2005-07-14 | 2006-07-07 | Audio encoding and decoding |
Publications (1)
Publication Number | Publication Date |
---|---|
MX2008000504A true MX2008000504A (es) | 2008-03-07 |
Family
ID=37467582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2008000504A MX2008000504A (es) | 2005-07-14 | 2006-07-07 | Codificacion y decodificacion de audio. |
Country Status (14)
Country | Link |
---|---|
US (1) | US7966191B2 (es) |
EP (2) | EP1902443B1 (es) |
JP (2) | JP5097702B2 (es) |
KR (2) | KR101496193B1 (es) |
CN (2) | CN101223575B (es) |
AT (2) | ATE433182T1 (es) |
BR (1) | BRPI0613469A2 (es) |
DE (1) | DE602006007139D1 (es) |
ES (2) | ES2374309T3 (es) |
HK (1) | HK1154984A1 (es) |
MX (1) | MX2008000504A (es) |
PL (2) | PL1902443T3 (es) |
RU (2) | RU2418385C2 (es) |
WO (1) | WO2007007263A2 (es) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
US7706905B2 (en) * | 2005-07-29 | 2010-04-27 | Lg Electronics Inc. | Method for processing audio signal |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
CN101361122B (zh) | 2006-04-03 | 2012-12-19 | Lg电子株式会社 | 处理媒体信号的装置及其方法 |
MX2009007412A (es) * | 2007-01-10 | 2009-07-17 | Koninkl Philips Electronics Nv | Decodificador de audio. |
US20100241434A1 (en) * | 2007-02-20 | 2010-09-23 | Kojiro Ono | Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit |
KR101100213B1 (ko) * | 2007-03-16 | 2011-12-28 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
CN102968994B (zh) * | 2007-10-22 | 2015-07-15 | 韩国电子通信研究院 | 多对象音频解码方法和设备 |
EP4293665A3 (en) * | 2008-10-29 | 2024-01-10 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
KR20110022251A (ko) * | 2009-08-27 | 2011-03-07 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
WO2011048099A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
WO2011073201A2 (en) * | 2009-12-16 | 2011-06-23 | Dolby International Ab | Sbr bitstream parameter downmix |
CN102142924B (zh) * | 2010-02-03 | 2014-04-09 | 中兴通讯股份有限公司 | 一种多用途语音频编码传输方法和装置 |
SG193237A1 (en) | 2011-03-28 | 2013-10-30 | Dolby Lab Licensing Corp | Reduced complexity transform for a low-frequency-effects channel |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
EP2956935B1 (en) * | 2013-02-14 | 2017-01-04 | Dolby Laboratories Licensing Corporation | Controlling the inter-channel coherence of upmixed audio signals |
US9818412B2 (en) | 2013-05-24 | 2017-11-14 | Dolby International Ab | Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder |
TWI634547B (zh) * | 2013-09-12 | 2018-09-01 | 瑞典商杜比國際公司 | 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品 |
KR102244379B1 (ko) * | 2013-10-21 | 2021-04-26 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
CN105637581B (zh) | 2013-10-21 | 2019-09-20 | 杜比国际公司 | 用于音频信号的参数重建的去相关器结构 |
EP2866475A1 (en) | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
EP3540732B1 (en) * | 2014-10-31 | 2023-07-26 | Dolby International AB | Parametric decoding of multichannel audio signals |
RU2019138260A (ru) * | 2015-06-24 | 2019-12-05 | Сони Корпорейшн | Устройство, способ и программа аудиообработки |
US10416954B2 (en) | 2017-04-28 | 2019-09-17 | Microsoft Technology Licensing, Llc | Streaming of augmented/virtual reality spatial audio/video |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3298478B2 (ja) * | 1997-11-10 | 2002-07-02 | 日本電気株式会社 | Mpeg復号装置 |
JPH11330980A (ja) * | 1998-05-13 | 1999-11-30 | Matsushita Electric Ind Co Ltd | 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体 |
JP2001268697A (ja) * | 2000-03-22 | 2001-09-28 | Sony Corp | データ伝送システム、データ伝送装置、データ伝送方法 |
WO2004019656A2 (en) | 2001-02-07 | 2004-03-04 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
US6996523B1 (en) * | 2001-02-13 | 2006-02-07 | Hughes Electronics Corporation | Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
EP1500084B1 (en) * | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
KR100571824B1 (ko) * | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
US7613306B2 (en) * | 2004-02-25 | 2009-11-03 | Panasonic Corporation | Audio encoder and audio decoder |
KR101183862B1 (ko) * | 2004-04-05 | 2012-09-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템 |
ATE403217T1 (de) * | 2004-04-28 | 2008-08-15 | Matsushita Electric Ind Co Ltd | Hierarchische kodierungsanordnung und hierarchisches kodierungsverfahren |
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
JP5321820B2 (ja) * | 2009-04-23 | 2013-10-23 | セイコーエプソン株式会社 | 用紙搬送装置 |
-
2006
- 2006-07-07 AT AT06766049T patent/ATE433182T1/de not_active IP Right Cessation
- 2006-07-07 WO PCT/IB2006/052309 patent/WO2007007263A2/en active Application Filing
- 2006-07-07 ES ES09005485T patent/ES2374309T3/es active Active
- 2006-07-07 ES ES06766049T patent/ES2327158T3/es active Active
- 2006-07-07 RU RU2008105556/09A patent/RU2418385C2/ru active
- 2006-07-07 MX MX2008000504A patent/MX2008000504A/es active IP Right Grant
- 2006-07-07 PL PL06766049T patent/PL1902443T3/pl unknown
- 2006-07-07 CN CN2006800255555A patent/CN101223575B/zh active Active
- 2006-07-07 AT AT09005485T patent/ATE523877T1/de not_active IP Right Cessation
- 2006-07-07 PL PL09005485T patent/PL2088580T3/pl unknown
- 2006-07-07 CN CN2010102983019A patent/CN102013256B/zh active Active
- 2006-07-07 KR KR1020087003599A patent/KR101496193B1/ko active IP Right Grant
- 2006-07-07 US US11/995,538 patent/US7966191B2/en active Active
- 2006-07-07 JP JP2008521009A patent/JP5097702B2/ja active Active
- 2006-07-07 EP EP06766049A patent/EP1902443B1/en active Active
- 2006-07-07 KR KR1020107024547A patent/KR101492826B1/ko active IP Right Grant
- 2006-07-07 BR BRPI0613469-6A patent/BRPI0613469A2/pt not_active Application Discontinuation
- 2006-07-07 EP EP09005485A patent/EP2088580B1/en active Active
- 2006-07-07 DE DE602006007139T patent/DE602006007139D1/de active Active
-
2010
- 2010-09-08 RU RU2010137467/08A patent/RU2461078C2/ru active
- 2010-11-15 JP JP2010254409A patent/JP5269039B2/ja active Active
-
2011
- 2011-08-30 HK HK11109165.7A patent/HK1154984A1/xx unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
MX2008000504A (es) | Codificacion y decodificacion de audio. | |
CA2673624C (en) | Apparatus and method for multi-channel parameter transformation | |
JP4772279B2 (ja) | オーディオ信号のマルチチャネル/キュー符号化/復号化 | |
US7961890B2 (en) | Multi-channel hierarchical audio coding with compact side information | |
ES2609449T3 (es) | Decodificación de audio | |
JP4601669B2 (ja) | マルチチャネル信号またはパラメータデータセットを生成する装置および方法 | |
RU2406166C2 (ru) | Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов | |
US9478228B2 (en) | Encoding and decoding of audio signals | |
US20140297296A1 (en) | Audio object encoding and decoding | |
TWI541796B (zh) | 音源解碼器裝置、解碼壓縮過之輸人音源訊號方法及電腦程式 | |
EP2111617A1 (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
EP1866913A1 (en) | Audio encoding and decoding | |
JP6732739B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
US8626503B2 (en) | Audio encoding and decoding | |
KR20160003572A (ko) | 다채널 오디오 신호 처리 방법 및 장치 | |
MX2008011994A (es) | Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal. | |
KR20150045879A (ko) | 공간 필터를 이용한 다채널 오디오 부호화/복호화 장치 및 방법 | |
MX2008010631A (es) | Codificacion y decodificacion de audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Grant or registration | ||
HC | Change of company name or juridical status |