MX2007015118A - Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion. - Google Patents

Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.

Info

Publication number
MX2007015118A
MX2007015118A MX2007015118A MX2007015118A MX2007015118A MX 2007015118 A MX2007015118 A MX 2007015118A MX 2007015118 A MX2007015118 A MX 2007015118A MX 2007015118 A MX2007015118 A MX 2007015118A MX 2007015118 A MX2007015118 A MX 2007015118A
Authority
MX
Mexico
Prior art keywords
audio
channel
modification
signals
instructions
Prior art date
Application number
MX2007015118A
Other languages
English (en)
Inventor
Charles Quito Robinson
Alan Jeffrey Seefeldt
Mark Stuart Vinton
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of MX2007015118A publication Critical patent/MX2007015118A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Abstract

Durante la produccion, al menos una senal de audio es procesada con el fin de derivar instrucciones para el canal que la reconfigura. Al menos una senal de audio y las instrucciones son almacenadas o transmitidas. Durante el consumo, al menos una senal de audio es reconfigurada de canal de acuerdo con las instrucciones. La reconfiguracion de canal incluye la reconfiguracion de mezclado ascendente, de mezclado descendente y espacial. Mediante la determinacion de las instrucciones de reconfiguracion de canal durante la produccion, son reducidos los recursos de procesamiento durante el consumo.

Description

APARATO Y MÉTODO PARA CODIFICACIÓN DE SEÑALES DE AUDIO CON INSTRUCCIONES DE DECODIFICACION Técnica Anterior Con la adopción extendida de los reproductores DVD, la utilización de los sistemas de reproducción de audio de múltiples canales (más de dos canales) en el hogar se ha convertido en una situación común. Además, los sistemas de audio de múltiples canales están prevaleciendo cada vez más en el automóvil y los sistemas de radio digital satelital y terrestre de siguiente generación están ávidos de suministrar el contenido de múltiples canales a un número creciente de entornos de reproducción de múltiples canales. No obstante, en muchos casos los proveedores de contenido de múltiples canales enfrentarían la carencia de este material. Por ejemplo, la música más popular todavía existe sólo como pistas estereofónicas de dos canales ("estéreo") . Como tal, existe una demanda para el "mezclado ascendente" , tal como el contenido de "legado" que existe, ya sea en un formato monofónico ( "mono" ) o estéreo en un formato de múltiples canales . Existen soluciones de la técnica anterior para conseguir esta transformación. Por ejemplo, el sietema Dolby Pro Logic II puede tomar una grabación de estéreo original y generar un mezclado ascendente de múltiples canales en base a la dirección de la información derivada a partir de la grabación de estéreo por sí misma. Las marcas "Dolby", "Pro Logic" , y "Pro Logic II" son marcas registradas de Dolby Laboratories Licensing Corporation. Con el fin de suministrar este mezclado ascendente a un consumidor, el proveedor de contenido podría aplicar una solución de mezclado ascendente al contenido de legado durante la producción y posteriormente, podría transmitir la señal resultante de múltiples canales a un consumidor a través de algún formato adecuado de suministro de múltiples canales, tal como Dolby Digital. "Dolby Digital" es una marca registrada de Dolby Laboratories Licensing Corporation. En forma alterna, el contenido de legado no alterado podría ser suministrado a un consumidor, quien pudiera aplicar posteriormente el proceso de mezclado ascendente durante la reproducción. En el caso anterior, el proveedor de contenido tiene el control completo con respecto al modo en el cual es creado el mezclado ascendente, lo cual es deseable a partir del punto de vista del proveedor de contenido. Además, las restricciones de procesamiento en el lado de la producción, de manera general, son menores que en el lado de la reproducción y por lo tanto, existe la posibilidad de utilizar técnicas más sofisticadas de mezclado ascendente. Sin embargo, el mezclado ascendente en el lado de producción tiene algunos inconvenientes. En primer lugar, la transmisión de una señal de múltiples canales en comparación con la señal de legado es más costosa debido al aumento en el número de canales de audio. Asimismo, si el consumidor no tuviera un sistema de reproducción de múltiples canales, normalmente, la señal transmitida de múltiples canales necesitaría ser de mezclado descendente antes de su reproducción. Esta señal de mezclado descendente, en general, no es idéntica al contenido de legado original y en muchos casos podría tener un sonido inferior al original . Las Figuras 1 y 2 representan ejemplos del mezclado ascendente de la técnica anterior que es aplicado en los extremos de producción y consumo, de manera respectiva, como recién fue descrito. Estos ejemplos suponen que la señal original contiene M=2 canales y que la señal de mezclado ascendente contiene N=6 canales. En el ejemplo de la Figura 1, el mezclado ascendente es realizado en el extremo de producción, mientras que en la Figura 2 el mezclado ascendente es realizado en el extremo de consumo. Un mezclado ascendente como en la Figura 2, en el cual el mezclador ascendente sólo recibe las señales de audio en base a lo cual efectúa un mezclado ascendente, en algunas ocasiones es referido como un mezclado ascendente "ciego" . Con referencia a la Figura 1, en la porción de producción 2 de un sistema de audio, una o más señales de audio que constituyen las Señales Originales de Canal-M (en esta y en otras figuras en la presente, cada señal de audio podría representar un canal, tal como un canal izquierdo, un canal derecho, etc.) son aplicadas a un dispositivo de mezclado ascendente o a una función de mezclado ascendente ("Mezclado Ascendente") 4 que produce un incremento en el número de las señales de audio que constituyen las Señales de Mezclado Ascendente de Canal-N. Las señales de mezclado ascendente son aplicadas a un dispositivo formateador o función de formateo ("Formatear") 6 que prepara o formatea las Señales de Mezclado Ascendente de Canal-N en una forma adecuada para su transmisión o almacenamiento. El proceso de formateo podría incluir la codificación de compresión de datos. Las señales formateadas son recibidas por la porción de consumo 8 del sistema de audio en el cual una función de desformatear o dispositivo desformateador ( "Desformateador" ) 10 restituye o rehabilita las señales formateadas hacia las Señales de Mezclado Ascendente de Canal-N (o una aproximación de ellas) . Como se discutió con anterioridad, en algunos casos, el dispositivo mezclador descendente o función de mezclado descendente ("Mezclado Descendente") 12 también realiza el mezclado descendente de las Señales de Mezclado Ascendente de Canal-N a las Señales de Mezclado Descendente de Canal-M (o una aproximación de ellas) , en donde M<N. Con referencia a la Figura 2, en la porción de producción 14 de un sistema de audio, una o más señales de audio que constituyen las Señales Originales de Canal-M son aplicadas a un dispositivo de formateo o función de formateo ("Formatear") 6 que las prepara o formatea en un modo adecuado para su transmisión o almacenamiento (en esta y otras figuras, el mismo número de referencia es utilizado para los dispositivos y funciones que son esencialmente los mismos en las distintas figuras) . El formateo podría incluir la codificación de compresión de datos. Las señales formateadas son recibidas por la porción de consumo 16 del sistema de audio, en el cual la función de desformatear o dispositivo de desformatear ( "Desformateador" ) 10 restituye o rehabilita las señales formateadas a las Señales Originales de Canal-M (o una aproximación de ellas) . Las Señales Originales de Canal-M podrían ser proporcionadas como una salida y también son aplicadas a una función de mezclador ascendente o a un dispositivo de mezclado ascendente ("Mezclado Ascendente") 18 que realiza el mezclado ascendente de las Señales Originales de Canal-M para producir las Señales de Mezclado Ascendente de Canal-N.
Descripción de la Invención Los aspectos de la presente invención proporcionan alternativas a los arreglos de las Figuras 1 y 2. Por ejemplo, de acuerdo con ciertos aspectos de la presente invención, en lugar de realizar el mezclado ascendente del contenido de legado, ya sea en el extremo de producción o de consumo, el análisis del contenido de legado a través de un proceso, por ejemplo, en un codificador, podría generar una información auxiliar "lateral" o "de cadena lateral" que sea enviada, en algún modo, junto con la información de audio de contenido de legado hacia un proceso adicional, por ejemplo, en un decodificador. El modo en el cual la información lateral es enviada no es crítico para la invención; muchas formas de envío de la información lateral son conocidas, que incluyen por ejemplo, embeber la información lateral en la información de audio (por ejemplo, ocultándola) o mediante el envío de la información lateral por separado (por ejemplo, en su propio flujo de bits o multiplexada con la información de audio) . Los términos "codificador" y "decodificador" se refieren en este contexto, de manera respectiva, a un dispositivo o proceso asociado con la producción y a un dispositivo o proceso asociado con el consumo, tal como los dispositivos y procesos que podrían o no incluir la "codificación" y "decodificación" de compresión de datos. La información lateral generada por un codificador podría instruir al decodificador para realizar el mezclado ascendente del contenido de legado. De esta manera, el decodificador proporciona el mezclado ascendente con la ayuda de la información lateral. Aunque el control de esta técnica de mezclado ascendente podría situarse en el extremo de producción, el consumidor todavía podría recibir el contenido de legado no alterado que pudiera ser reproducido sin alteración si no estuviera disponible el sistema de reproducción de múltiples canales. Además, podría utilizarse una cantidad significante de energía de procesamiento en el codificador para analizar el contenido de legado y generar la información lateral para realizar un mezclado ascendente de alta calidad, permitiendo que el decodificador utilice una cantidad significativamente menor de recursos de procesamiento debido a que sólo aplica la información lateral en lugar de derivarla. Finalmente, el costo de transmisión de esta información lateral de mezclado ascendente es normalmente muy bajo. Aunque la presente invención y sus distintos aspectos podrían involucrar señales analógicas o digitales, en la práctica, es probable que la mayoría de las aplicaciones o todas las funciones de procesamiento sean realizadas en el dominio digital en base a flujos de señal digital en los cuales las señales de audio son representadas por medio de muestras . El procesamiento de señal de acuerdo con la presente invención podría ser aplicado, ya sea en señales de banda ancha o en cada banda de frecuencia de un procesador de múltiples bandas y en función de la implementación, podría realizarse una por muestra o una por conjunto de muestras, tal como un bloque de muestras cuando el audio digital es dividido en bloques. Una modalidad de múltiples bandas podría emplear, ya sea un banco de filtros o una configuración de transformada. De esta manera, los ejemplos de modalidades de la presente invención mostrados y descritos en conexión con las Figuras 3, 4A-4C, 5A-5C y 6 podrían recibir señales digitales en el dominio de tiempo (tal como por ejemplo, las señales PCM) y aplicarlas a un convertidor adecuado de tiempo-a- frecuencia o a la conversión para el procesamiento en múltiples bandas de frecuencia, estas bandas podrían ser relacionadas con las bandas críticas del oído humano. Después del procesamiento, las señales podrían ser convertidas de regreso al dominio de tiempo. En principio, un banco de filtros o una transformada podrían ser empleados para conseguir la conversión de tiempo-a- frecuencia y su inverso. Algunos ejemplos detallados de las modalidades de los aspectos de la invención descritos en la presente emplean las transformadas de tiempo-a-frecuencia, a saber, la Transformada Discreta de Fourier de Tiempo Corto (STDFT) . No obstante, será apreciado que la invención en sus distintos aspectos no es limitada al empleo de ningún convertidor o proceso de conversión particular de tiempo-a- frecuencia. De acuerdo con un aspecto de la presente invención, un método de procesamiento al menos de una señal de audio o una modificación al menos de una señal de audio que tiene el mismo número de canales por lo menos como una señal de audio, cada señal de audio que representa un canal de audio comprende la derivación de las instrucciones para la reconfiguración de canal al menos de una señal de audio o su modificación, en donde la única información de audio que recibe la derivación es al menos de una señal de audio o su modificación, y el suministro de una salida que incluye (1) al menos una señal de audio o su modificación, y (2) las instrucciones para la reconfiguración de canal, aunque no incluye ninguna reconfiguración de canal al menos de una señal de audio o su modificación cuando esta reconfiguración de canal se origine a partir de las instrucciones para la reconfiguración de canal. Al menos cada una de una señal de audio y su modificación podrían ser de dos o más señales de audio, en este caso, las dos o más señales transformadas podrían ser una modificación codificada por matriz y, cuando sean descifradas, a través de un decodificador de matriz o un decodificador de matriz activa, las dos o más señales de audio modificadas podrían proporcionar una decodificación mejorada de múltiples canales con respecto a la decodificación de las dos o más señales de audio no modificadas. La decodificación es "mejorada" en el sentido de cualquiera de las características de rendimiento bien conocidas de los decodificadores, tales como los decodificadores de matriz que incluyen, por ejemplo, la separación de canal, la formación de imagen espacial, la estabilidad de la imagen, etcétera.
Si al menos una señal de audio y su modificación fueran o no dos o más señales de audio, existirían varias alternativas para las instrucciones de reconfiguración de canal. De acuerdo con una alternativa, las instrucciones para el mezclado ascendente al menos de una señal de audio o su modificación son, de manera que cuando se realice el mezclado ascendente de acuerdo con las instrucciones para el mezclado ascendente, el número resultante de señales de audio sería más grande que el número de señales de audio que comprende al menos una señal de audio o su modificación. De acuerdo con otras alternativas para las instrucciones de reconfiguración de canal, al menos una señal de audio y su modificación son dos o más señales de audio. En una primera de otras alternativas, las instrucciones para el mezclado descendente de las dos o más señales de audio son, de manera que cuando se realice el mezclado descendente de acuerdo con las instrucciones para el mezclado descendente, el número resultante de señales de audio sea menor que el número de señales de audio que comprenden las dos o más señales de audio. En una segunda de otras alternativas, las instrucciones para la reconfiguración de las dos o más señales de audio son, de manera que cuando sean reconfiguradas de acuerdo con las instrucciones de reconfiguración, el número de señales de audio permanezca igual aunque sean cambiadas una o más ubicaciones espaciales en las cuales se pretende que sean reproducidas estas señales de audio. Al menos una señal de audio o su modificación en la salida podría ser una versión comprimida de datos al menos de una señal de audio o su modificación, de manera respectiva. En cualquiera de las alternativas y si fuera empleada o no la compresión de datos, las instrucciones podrían ser derivadas sin referencia a ninguna reconfiguración de canal que se origine a partir de las instrucciones de reconfiguración de canal. Al menos una señal de audio podría ser dividida en bandas de frecuencia y las instrucciones para la reconfiguración de canal podrían ser con relación a las respectivas bandas de frecuencia. Otros aspectos de la invención incluyen los codificadores de audio para la práctica de estos métodos. De acuerdo con otro aspecto de la invención, un método de procesamiento al menos de una señal de audio o la modificación por lo menos de una señal de audio que tiene el mismo número de canales al menos que una señal de audio, cada señal de audio que representa un canal de audio comprende la derivación de instrucciones para la reconfiguración de canal al menos de una señal de audio o su modificación, en donde sólo la información de audio que recibe la derivación es ál menos una señal de audio o su modificación, proporcionando una salida que incluye (1) al menos una señal de audio o su modificación, y (2) las instrucciones de reconfiguración de canal aunque no incluyen ninguna reconfiguración de canal al menos de una señal de audio o su modificación cuando la reconfiguración de canal se origine a partir de las instrucciones de reconfiguración de canal, y la recepción de la salida. El método además podría comprender la reconfiguración de canal al menos de una señal de audio o su modificación recibida utilizando las instrucciones recibidas para la reconfiguración de canal. Al menos cada una de una señal de audio y su modificación podrían ser dos o más señales de audio, en este caso, las dos o más señales transformadas podrían ser una modificación codificada por matriz, y cuando sean descifradas, a través de un decodificador de matriz o un decodificador de matriz activa, las dos o más señales de audio modificadas podrían proporcionar una decodificación mejorada de múltiples canales con respecto a la decodificación de las dos o más señales de audio no modificadas. El término "mejorada" se utiliza en el mismo sentido que en el primer aspecto de la presente invención, descrito con anterioridad. Del mismo modo que en el primer aspecto de la invención, existen alternativas para las instrucciones de reconfiguración de canal, por ejemplo, el mezclado ascendente, el mezclado descendente, y la reconfiguración de manera que el número de señales de audio permanezca igual aunque sean cambiadas una o más ubicaciones espaciales en estas señales de audio que se pretende sean reproducidas. Del mismo modo que en el primer aspecto de la invención, al menos una señal de audio o su modificación en la salida podría ser una versión comprimida de datos al menos de una señal de audio o su modificación, en este caso, la recepción podría incluir la descompresión de datos al menos de una señal de audio o su modificación. En cualquiera de las alternativas de este aspecto de la presente invención, si fueran empleadas o no la compresión y la descompresión de datos, las instrucciones podrían ser derivadas sin referencia a ninguna reconfiguración de canal que se origine a partir de las instrucciones de reconfiguración de canal. Del mismo modo que en el primer aspecto de la invención, al menos una señal de audio o su modificación podrían ser divididas en bandas de frecuencia, en este caso, las instrucciones de reconfiguración de canal podrían ser con respecto a estas bandas de frecuencia. Cuando el método además comprenda la reconfiguración al menos de una señal de audio o su modificación recibida utilizando las instrucciones recibidas para la reconfiguración de canal, el método todavía podría comprender el suministro de una salida de audio y podría seleccionar la salida de audio como una de: (1) al menos una señal de audio o su modificación, o (2) el canal reconfigurado al menos en una señal de audio.
Si el método además comprendiera o no la reconfiguración al menos de una señal de audio o su modificación recibida utilizando las instrucciones recibidas para la reconfiguración de canal, el método además podría comprender el suministro de una salida de audio en respuesta al menos a una señal de audio o su modificación recibida, en este caso, cuando al menos una señal de audio o su modificación en la salida de audio sean dos o más señales de audio, el método todavía podría comprender la decodificación de matriz de las dos o más señales de audio. Cuando el método además comprenda la reconfiguración al menos de una señal de audio o su modificación recibida utilizando las instrucciones recibidas para la reconfiguración de canal, el método todavía podría comprender el suministro de una salida de audio. Otros aspectos de la invención incluyen un sistema de codificación y decodificación de audio que practica estos métodos, un codificador de audio y un decodificador de audio para uso en un sistema que practica estos métodos, un codificador de audio para uso en un sistema que practica estos métodos y un decodificador de audio para uso en un sistema que practica estos métodos . De acuerdo con otro aspecto de la invención, un método de procesamiento de al menos una señal de audio o su modificación por lo menos de una señal de audio que tiene el mismo número de canales que al menos una señal de audio, cada señal de audio que representa un canal de audio comprende la recepción al menos una señal de audio o su modificación y las instrucciones de reconfiguración de canal al menos de una señal de audio o su modificación, aunque no la reconfiguración de canal al menos de una señal de audio o su modificación que se origina a partir de las instrucciones de reconfiguración de canal, las instrucciones han sido derivadas por una derivación de instrucción en la cual la única información de audio recibida es al menos una señal de audio o su modificación, y la reconfiguración de canal al menos de una señal de audio o su modificación que utiliza las instrucciones. Al menos cada una de una señal de audio y su modificación podrían ser dos o más señales de audio, en este caso, las dos o más señales de audio transformadas podrían ser una modificación codificada por matriz, y cuando sean decodificadas a través de un decodificador de matriz o un decodificador de matriz activa, las dos o más señales de audio modificadas podrían proporcionar una decodificación mejorada de múltiples canales con respecto a la decodificación de las dos o más señales de audio no modificadas. El término "mejorada" se utiliza en el mismo sentido que en los otros aspectos de la presente invención, descritos con anterioridad. Del mismo modo que en los otros aspectos de la invención, existen alternativas para las instrucciones de reconfiguración de canal, por ejemplo, el mezclado ascendente, el mezclado descendente, y la reconfiguración, de manera que el número de señales de audio permanezca igual aunque sean cambiadas una o más ubicaciones espaciales en las cuales las señales de audio se pretende que sean reproducidas . Del mismo modo que en los otros aspectos de la invención, al menos una señal de audio o su modificación en la salida podría ser una versión comprimida de datos al menos de una señal de audio o su modificación, en este caso, la recepción podría incluir la descompresión de datos al menos de una señal de audio o su modificación. En cualquiera de las alternativas de este aspecto de la presente invención, si fueran utilizadas o no la compresión y descompresión de datos, las instrucciones podrían ser derivadas sin referencia a cualquier reconfiguración de canal que se origine a partir de las instrucciones de reconfiguración de canal. Del mismo modo que en los otros aspectos de la invención, al menos una señal de audio o su modificación podrían ser divididas en bandas de frecuencia, en este caso, las instrucciones de reconfiguración de canal podrían ser con respecto a una de estas bandas de frecuencia. De acuerdo con una alternativa, este aspecto de la invención además podría comprender el suministro de una salida de audio, y la selección como la salida de audio de uno de: (1) al menos una señal de audio o su modificación, o (2) el canal reconfigurado al menos en una señal de audio. De acuerdo con otra alternativa, este aspecto de la invención además podría comprender el suministro de una salida de audio en respuesta al menos a una señal de audio o su modificación recibida, en este caso, al menos cada una de una señal de audio y su modificación podrían ser dos o más señales de audio y las dos o más señales de audio serían decodificadas de matriz. De acuerdo todavía con otra alternativa, este aspecto de la invención además podría comprender el suministro de una salida de audio en respuesta al canal reconfigurado que es recibido al menos en una señal de audio. Otros aspectos de la invención incluyen un decodificador de audio que practica cualquiera de estos métodos. De acuerdo todavía con otro aspecto de la presente invención, un método de procesamiento al menos de dos señales de audio o una modificación al menos de dos señales de audio que tienen el mismo número de canales al menos como una señal de audio, cada señal de audio que representa un canal de audio comprende la recepción al menos de dos señales de audio y las instrucciones de reconfiguración de canal al menos de dos señales de audio aunque no la reconfiguración de canal al menos de dos señales de audio que se originan a partir de las instrucciones de reconfiguración de canal, las instrucciones han sido derivadas a través de una derivación de instrucción en la cual sólo la información de audio recibida es al menos dos señales de audio y la decodificación de matriz de las dos o más señales de audio. La decodificación de matriz podría ser con o sin referencia a las instrucciones recibidas. Cuando sean decodificadas, las dos o más señales de audio modificadas podrían proporcionar una decodificación mejorada de múltiples canales con respecto a la decodificación de las dos o más señales de audio no modificadas . Las dos o más señales de audio transformadas podrían ser una modificación codificada por matriz, y cuando sean decodificadas, a través de un decodificador de matriz o un decodificador de matriz activa, las dos o más señales de audio modificadas podrían proporcionar una decodificación mejorada de múltiples canales con respecto a la decodificación de las dos o más señales de audio no modificadas. El término "mejorada" se utiliza en el mismo sentido que en los otros aspectos de la presente invención, descritos con anterioridad. Otros aspectos de la invención incluyen un decodificador de audio que practica cualquiera de estos métodos . Todavía en otros aspectos adicionales de la invención, dos o más señales de audio, cada señal de audio que representa un canal de audio, son transformadas de modo que las señales modificadas pudieran proporcionar una decodificación mejorada de múltiples canales, con respecto a la decodificación de las señales no modificadas, cuando sean descifradas a través de un decodificador de matriz. Esto podría ser conseguido a través de la modificación de una o más diferencias en las características intrínsecas de la señal entre dos o más de las señales de audio. Estas características intrínsecas de señal podrían incluir una o ambas de la amplitud y la fase. La modificación de una o más diferencias en las características intrínsecas de la señal entre dos o más de las señales de audio podría incluir el mezclado ascendente de las señales no modificadas en un número más grande de señales, y el mezclado descendente de las señales de mezclado ascendente utilizando un codificador de matriz. En forma alterna, la modificación de una o más diferencias en las características intrínsecas de señal entre dos o más de las señales de audio también podría incluir el incremento o la disminución de la correlación cruzada entre dos o más de las señales de audio. La correlación cruzada entre dos o más de las señales de audio podría ser incrementada y/o disminuida en forma variable en una o más bandas de frecuencia. Otros aspectos de la invención incluyen (1) aparatos adaptados para realizar los métodos de cualquiera de los métodos descritos en la presente, (2) un programa de computadora, almacenado en un medio susceptible de ser leído por computadora, que provoca que una computadora realice cualquiera de los métodos descritos en la presente, (3) un flujo de bits producido a través de uno de los métodos descritos en la presente, y (4) un flujo de bits producido a través de un aparato adaptado para realizar los métodos de uno de los métodos descritos en la presente.
Breve Descripción de las Figuras La Figura 1 es un diagrama de bloques esquemático funcional de un arreglo de la técnica anterior para el mezclado ascendente que tiene una porción de producción y una porción de consumo en el cual es realizado el mezclado ascendente en la porción de consumo. La Figura 2 es un diagrama de bloques esquemático funcional de un arreglo de la técnica anterior para el mezclado ascendente que tiene una porción de producción y una porción de consumo, en el cual el mezclado ascendente es realizado en la porción de producción. La Figura 3 es un diagrama de bloques esquemático funcional de un ejemplo de una modalidad de mezclado ascendente de los aspectos de la presente invención, en el cual las instrucciones para el mezclado ascendente son derivadas en una porción de producción y las instrucciones son aplicadas en una porción de consumo. La Figura 4A es un diagrama de bloques esquemático funcional de una modalidad de reconfiguración generalizada de canal de los aspectos de la presente invención, en la cual las instrucciones para la reconfiguración de canal son derivadas en una porción de producción y las instrucciones son aplicadas en una porción de consumo. La Figura 4B es un diagrama de bloques esquemático funcional de otra modalidad de reconfiguración generalizada de canal de los aspectos de la presente invención, en la cual las instrucciones para la reconfiguración de canal son derivadas en una porción de producción y las instrucciones son aplicadas en una porción de consumo. Las señales aplicadas en la porción de producción podrían ser modificadas para mejorar su reconfiguración de canal cuando esta reconfiguración sea efectuada en la porción de consumo sin referencia a las instrucciones para la reconfiguración de canal. La Figura 4C es un diagrama de bloques esquemático funcional de otra modalidad de reconfiguración generalizada de canal de los aspectos de la presente invención. Las señales aplicadas a la porción de producción son modificadas para mejorar su reconfiguración de canal cuando esta reconfiguración sea efectuada en la porción de consumo sin referencia a las instrucciones para la reconfiguración de canal. La información de reconfiguración no es enviada de la porción de producción a la porción de consumo. La Figura 5A es un diagrama de bloques esquemático funcional de un arreglo en el cual la porción de producción modifica las señales aplicadas empleando un mezclador ascendente o una función de mezclado ascendente y un codificador de matriz o función de codificación de matriz. La Figura 5B es un diagrama de bloques esquemático funcional de un arreglo en el cual la porción de producción modifica las señales aplicadas mediante la reducción de su correlación cruzada. La Figura 5C es un diagrama de bloques esquemático funcional de un arreglo en el cual la porción de producción modifica las señales aplicadas reduciendo su correlación cruzada en una base de subbanda. , La Figura 6A es un diagrama de bloques esquemático funcional que muestra un ejemplo de un codificador de la técnica anterior en un sistema de codificación espacial en el cual el codificador recibe las señales de canal-N que se desea sean reproducidas por el decodificador en el sistema de codificación espacial. La Figura 6B es un diagrama de bloques esquemático funcional que muestra un ejemplo de un codificador de la técnica anterior en un sistema de codificación espacial en el cual el codificador recibe las señales de canal-N que se desea sean reproducidas por el decodificador en el sistema de codificación espacial y también recibe las Señales Compuestas de Canal-M que son enviadas del codificador al decodificador.
La Figura 6C es un diagrama de bloques esquemático funcional que muestra un ejemplo de un decodificador de la técnica anterior en un sistema de codificación espacial que puede ser utilizado con el codificador de la Figura 6A o el codificador de la Figura 6B. La Figura 7 es un diagrama de bloques esquemático funcional de una modalidad de una modalidad de codificador de los aspectos de la presente invención que pueden utilizarse en un sistema de codificación espacial. La Figura 8 es un diagrama de bloques esquemático funcional que muestra un codificador idealizado de matriz de 5:2 de la técnica anterior adecuado para uso con un decodificador de matriz activa de 2:5.
Descripción de la Invención La Figura 3 representa un ejemplo de los aspectos de la invención en un arreglo de mezclado ascendente. En la porción de producción 20 del arreglo, las Señales Originales de Canal-M (por ejemplo, las señales de audio de legado) son aplicadas en un dispositivo o función que deriva uno o más conjuntos de información lateral de mezclado ascendente ("Derivar Información de Mezclado Ascendente") 21 y hacia un dispositivo formateador o función de formateo ("Formatear") 22. En forma alterna, las Señales Originales de Canal-M de la Figura 3 podrían ser una versión modificada de las señales de audio de legado, como se describe más adelante. La función de Formatear 22 podría incluir un multiplexor o función de multiplexión, por ejemplo, a fin de formatear o arreglar las Señales Originales de Canal-M, la información lateral de mezclado ascendente y otros datos, por ejemplo, en una serie de flujo de bits o flujos paralelos de bits. Si el flujo de bits de salida de la porción de producción 20 del arreglo se encuentra o no en serie o en paralelo no es crítico para la invención. La función de Formatear 22 también podría incluir un codificador o función de codificación adecuada de compresión de datos, tal como un codificador o función de codificación perdida, sin pérdida o combinación de perdida y sin pérdida. Si el flujo de bits o los flujos de bits de salida fueran codificados o no tampoco es crítico para la invención. El flujo de bits o los flujos de bits de salida son transmitidos o almacenados en cualquier modo adecuado. En la porción de consumo 24 del arreglo del ejemplo de la Figura 3, el flujo de bits o los flujos de bits de salida son recibidos y un desformateador o función de desformatear ( "Desformateador" ) 26 deshace la acción de la función de Formatear 22 a fin de proporcionar las Señales Originales de Canal-M (o una aproximación de ellas) y la información de mezclado ascendente. El desformateador 26 podría incluir, como podría ser necesario, un decodificador o función de decodificación adecuada de compresión de datos. La información de mezclado ascendente y las Señales Originales de Canal-M (o una aproximación de ellas) son aplicadas en un dispositivo mezclador ascendente o función de mezclado ascendente ("Mezclado Ascendente") 28 que realiza el mezclado ascendente de las Señales Originales de Canal-M (o una aproximación de ellas) de acuerdo con las instrucciones de mezclado ascendente a fin de proporcionar las Señales de Mezclado Ascendente de Canal-N. Podrían existir múltiples conjuntos de instrucciones de mezclado ascendente, cada una proporcionando por ejemplo, un mezclado ascendente a un número diferente de canales. Si existieran múltiples conjuntos de instrucciones de mezclado ascendente, uno o más conjuntos serían elegidos (esta elección podría ser fijada en la porción de consumo del arreglo o podría ser seleccionada en algún modo) . Las Señales Originales de Canal-M y las Señales de Mezclado Ascendente de Canal-N son salidas posibles de la porción de consumo 24 del arreglo. Cualquiera o ambas podrían ser proporcionadas como salidas (como se muestra) o una o la otra podrían ser seleccionadas, la elección es implementada por un selector o función de selección (no se muestra) bajo un control automático o control manual, por ejemplo, por un usuario o consumidor. Aunque la Figura 3 muestra en forma simbólica que M=2 y N=6, se entenderá que M y N no son limitadas a las mismas . En un ejemplo de una aplicación práctica de los aspectos de la presente invención, dos señales de audio, que representan los respectivos canales de sonido de estéreo, son recibidas por un dispositivo o proceso y si se deseara derivar las instrucciones adecuadas para uso en el mezclado ascendente, aquellas dos señales de audio a las que normalmente se refieren como de "5.1" canales (en realidad, seis canales, en los cuales un canal es un canal de efectos de baja frecuencia que requiere muy pocos datos) . Las dos señales de audio originales junto con las instrucciones de mezclado ascendente podrían ser entonces enviadas a un mezclador ascendente o proceso de mezclado ascendente que aplica las instrucciones de mezclado ascendente a las dos señales de audio con el fin de proporcionar los 5.1 canales deseados (un mezclado ascendente que emplea la información lateral) . Sin embargo, en algunos casos las dos señales de audio originales y las instrucciones relacionadas de mezclado ascendente podrían ser recibidas por un dispositivo o proceso que pudiera ser incapaz de utilizar las instrucciones de mezclado ascendente aunque no obstante, podría ser adaptado para realizar un mezclado ascendente de las dos señales de audio recibidas, un mezclado ascendente que a menudo es referido como un mezclado ascendente "ciego" como se mencionó con anterioridad. Estos mezclados ascendentes ciegos podrían ser proporcionados por ejemplo, por un decodificador de matriz activa tal como el decodificador "Pro Logic" , "Pro Logic II", o un decodificador Pro Logic IIx ("Pro Logic", "Pro Logic II" , y Pro Logic IIx son marcas registradas de Dolby Laboratories Licensing Corporation) . También podrían ser empleados otros decodificadores de matriz activa. Estos mezcladores ascendentes ciegos de matriz activa están en función y operan en respuesta a las características intrínsecas de señal (tal como las relaciones de amplitud y/o fase entre las señales aplicadas a este) para realizar un mezclado ascendente. Un mezclado ascendente ciego podría o no originar el mismo número de canales que pudieran haber sido proporcionados por un dispositivo o función adaptada para usar las instrucciones de mezclado ascendente (por ejemplo, en este ejemplo, el mezclado ascendente ciego no podría originar 5.1 canales). Un mezclado ascendente "ciego" realizado por un decodificador de matriz activa es mejor cuando sus entradas fueran previamente codificadas por un dispositivo o función compatible con el decodificador de matriz activa, tal como por un codificador de matriz, de manera particular, un codificador de matriz complementario al decodificador. En este caso, las señales de entrada tienen relaciones intrínsecas de amplitud y fase que son utilizadas por el decodificador de matriz activa. Un mezclado ascendente "ciego" , de las señales que no fueron previamente codificadas por un dispositivo compatible, estas señales no tienen características intrínsecas útiles de señal (o sólo tienen características intrínsecas de señal mínimamente útiles) , tal como las relaciones de amplitud o fase, es mejor realizado por lo que es denominado un mezclador ascendente "artístico" , normalmente un mezclador ascendente complejo en forma computacional, como se describe más adelante. Aunque los aspectos de la invención podrían ser utilizados, de manera ventajosa, para el mezclado ascendente, estos se aplican en el caso más general, en el cual al menos una señal de audio designada para una "configuración de canal" particular es alterada para la reproducción a través de una o más configuraciones alternas de canal. Un codificador genera, por ejemplo, la información lateral que instruye al decodificador, por ejemplo, cómo alterar la señal original, si se deseara, para una o más configuraciones alternas de canal. La "configuración de canal" en este contexto incluye, por ejemplo, no sólo el número de señales de audio de reproducción con relación a las señales de audio originales, sino también las ubicaciones espaciales en las cuales se pretende que las señales de audio de reproducción serán reproducidas con respecto a las ubicaciones espaciales de las señales de audio originales. De esta manera, una "reconfiguración" de canal podría incluir, por ejemplo, el "mezclado ascendente" en el cual uno o más canales son mapeados en algún modo en un número más grande de canales, el "mezclado descendente" en el cual dos o más canales son mapeados en algún modo en un número más pequeño de canales, la reconfiguración espacial de la ubicación en la cual estas ubicaciones en la que se pretende que sean reproducidos los canales o direcciones con las que los canales son asociados, son cambiados o nuevamente mapeados en algún modo, y la conversión del formato de altavoz a binaural (mediante la cancelación de la interferencia entre canales o el procesamiento con un cancelador de interferencia entre canales) o de un formato de altavoz a binaural (mediante la "binauralización" ) o un procesamiento a través de un convertidor de formato de altavoz a binaural, un "binauralizador" ) . De esta manera, en el contexto de la reconfiguración de canal de acuerdo con los aspectos de la presente invención, el número de canales en la señal original podría ser menor que, más grande que o igual al número de canales en cualquiera de las configuraciones alternas resultantes de canal . Un ejemplo de una configuración espacial de ubicación es la conversión de una configuración cuadrafónica (una disposición "cuadrada" con el canal frontal izquierdo, el canal frontal derecho, el canal posterior izquierdo y el canal posterior derecho) a una configuración convencional de imagen en movimiento (una disposición de "diamante" con el canal frontal izquierdo, el canal frontal central, el canal frontal derecho y el canal envolvente) . Un ejemplo de una aplicación de "reconfiguración" sin mezclado ascendente de los aspectos de la presente invención se describe en la Solicitud de Patente de los Estados Unidos S.N. 10/911,404 de Michael John Smithers, presentada el 03 de Agosto del 2004, titulada "Method for Combining Audio Signáis Using Auditory Scene Analysis." Smithers describe una técnica para las señales de mezclado descendente en forma dinámica en un modo que evita el filtrado común de peine y los efectos de cancelación de fase asociados con un mezclado descendente estático. Por ejemplo, una señal original podría consistir de los canales izquierdo, central y derecho, aunque en muchos entornos de reproducción, el canal central no se encuentra disponible. En este caso, la señal de canal central necesita ser mezclada en el canal izquierdo y derecho para su reproducción en estéreo. El método descrito por Smithers mide en forma dinámica durante la reproducción el retraso total promedio entre el canal central y los canales izquierdo y derecho. Un retraso correspondiente de compensación es entonces aplicado al canal central antes de que sea mezclado con los canales izquierdo y derecho con el fin de evitar el filtrado de peine. Además, la compensación de energía es calculada y aplicada en cada banda crítica de cada canal de mezclado descendente con el fin de remover otros efectos de cancelación de fase. Más que el cálculo, este retraso y valores de compensación de energía durante la reproducción, la presente invención permite su generación como la información lateral en el codificador y entonces, los valores podrían ser aplicados de manera opcional en el decodificador si fuera requerida la reproducción con respecto a una configuración convencional de estéreo . La Figura 4A representa un ejemplo de los aspectos de la invención en un arreglo generalizado de reconfiguración de canal. En la porción de producción 30 del arreglo, las Señales Originales de Canal-M (señales de audio de legado) son aplicadas a un dispositivo o función que deriva uno o más conjuntos de información lateral de reconfiguración de canal ("Derivar la Información de Reconfiguración de canal") 32 y a un dispositivo formateador o función de formateo ("Formatear") 22 (se describe en conexión con el ejemplo de la Figura 3) . Las Señales Originales de Canal-M de la Figura 4A podrían ser una versión modificada de las señales de audio de legado como se describe más adelante. El flujo de bits o los flujos de bits de salida son transmitidos o almacenados en cualquier modo adecuado. En la porción de consumo 34 del arreglo, el flujo de bits o los flujos de bits de salida son recibidos y un dispositivo desformateador o función de desformatear ("Desformateador") 26 (descrita en conexión con la Figura 3) deshace la acción de la función de Formatear 22 para proporcionar las Señales Originales de Canal-M (o una aproximación de ellas) y la información de reconfiguración de canal. La información de reconfiguración de canal y las Señales Originales de Canal-M (o una aproximación de ellas) son aplicadas a un dispositivo o función ("Reconfigurar Canales") 36 que reconfigura el canal de las Señales Originales de Canal-M (o una aproximación de ellas) de acuerdo con las instrucciones a fin de proporcionar las Señales Reconfiguradas de Canal-N. Del mismo modo que en el ejemplo de la Figura 3, si existieran múltiples conjuntos de instrucciones, uno o más conjuntos serían elegidos ("Seleccionar la Reconfiguración de Canal") (esta elección podría ser fijada en la porción de consumo del arreglo o podría ser seleccionada en algún modo) . Del mismo modo que en el ejemplo de la Figura 3, las Señales Originales de Canal-M y las Señales Reconfiguradas de Canal-N son salidas posibles de la porción de consumo 34 del arreglo. Cualquiera o ambas podrían ser proporcionadas como salidas (como se muestra) o una u otra podría ser seleccionada, la elección es implementada por un selector o función de selección (no se muestra) bajo un control automático o manual, por ejemplo, por un usuario o consumidor. Aunque la Figura 4A muestra en forma simbólica que M=3 y N=2, se entenderá que M y N no se limitan a las mismas. Como se observó con anterioridad, la "reconfiguración de canal" podría incluir por ejemplo, el "mezclado ascendente" en el cual uno o más canales son mapeados en algún modo en un número más grande de canales, el "mezcladp descendente" en el cual dos o más canales son mapeados en algún modo en un número más pequeño de canales, la reconfiguración espacial de ubicación en la cual estas ubicaciones son nuevamente mapeadas en algún modo en la que los canales se pretende que sean reproducidos, y la conversión de binaural al formato de altavoz (mediante la cancelación de la interferencia entre canales o el procesamiento con un cancelador de interferencia entre canales) o del formato de altavoz a binaural (mediante la "binauralización" o procesamiento a través de un convertidor de formato de altavoz a binaural, un "binauralizador") . En el caso de la binauralización, la reconfiguración de canal podría incluir (1) un mezclado ascendente para múltiples canales virtuales y/o (2) una reconfiguración espacial de ubicación virtual realizada como una señal binaural estereofónica de dos canales . El mezclado ascendente virtual y el posicionamiento virtual de altavoz son bien conocidos en la técnica, al menos desde principios de 1960 (véase por ejemplo, Atal et al, "Apparent Sound Source Translator," la Patente de los Estados Unidos No. 3,236,949 (26 de Febrero de 1966) y Bauer, "Stereophonic to Binaural Conversión Apparatus," la Patente de los Estados Unidos No. 3,088,997 (07 de Mayo de 1963) . Como se mencionó con anterioridad en conexión con los ejemplos de las Figuras 3 y 4A, una versión modificada de las Señales Originales de Canal-M podría ser empleada como entradas. Las señales son modificadas para facilitar una reconfiguración ciega a través de un dispositivo de consumo comúnmente disponible tal como un decodificador de matriz activa. En forma alterna, cuando las señales no modificadas sean señales estereofónicas de dos canales, las señales modificadas podrían ser una versión binauralizada de dos canales de las señales no modificadas. Las Señales Originales de Canal-M modificadas podrían tener el mismo número de canales que las señales no modificadas, aunque esto no es crítico para este aspecto de la invención. Con referencia al ejemplo de la Figura 4B, en la porción de producción 38 del arreglo, las Señales Originales de Canal-M (señales de audio de legado) son aplicadas a un dispositivo o función que crea un conjunto alterno o modificado de señales de audio ("Generar Señales Alternas") 40, estas señales alternas o modificadas son aplicadas en un dispositivo o función que deriva uno o más conjuntos de información lateral de reconfiguración de canal ("Derivar la Información de Reconfiguración de Canal") 32 y a un dispositivo formateador o función de formateo ("Formatear") 22 (tanto función de formateo 32 como 22 son descritas con anterioridad) . La derivación de información de reconfiguración de canal 32 también podría recibir la información sin audio a partir de generar señales alternas 40 para ayudar en la derivación de la información de reconfiguración. El flujo de bits o los flujos de bits de salida son transmitidos o almacenados en cualquier modo adecuado . En la porción de consumo 42 del arreglo, el flujo de bits o los flujos de bits de salida son recibidos y el desformateador 26 (descrito con anterioridad) deshace la acción de la función de Formatear 22 para proporcionar las Señales Alternas de Canal-M (o una aproximación de ellas) y la información de reconfiguración de canal. La información de reconfiguración de canal y las Señales Alternas de Canal-M (o una aproximación de ellas) podrían ser aplicadas en un dispositivo o función ("Reconfigurar Canales") 44 que reconfigura el canal de las Señales Originales de Canal-M (o una aproximación de ellas) de acuerdo con las instrucciones a fin de proporcionar las señales reconfiguradas de canal-N. Del mismo modo que en los ejemplos de las Figuras 3 y 4A, si existieran múltiples conjuntos de instrucciones o fuera elegido un conjunto (esta elección podría ser fijada en la porción de consumo del arreglo o podría ser seleccionada en algún modo) . Como se observó con anterioridad en la descripción del ejemplo de la Figura 4A, la "reconfiguración de canal" podría incluir por ejemplo el "mezclado ascendente" (que incluye el mezclado ascendente virtual en el cual la señal binaural de dos canales se hace que tenga canales virtuales de mezclado ascendente), el "mezclado descendente", la reconfiguración espacial de ubicación y la conversión de binaural a formato de altavoz o de formato de altavoz a binaural. Las Señales Alternas de Canal-M (o una aproximación de ellas) también podrían ser aplicadas en un dispositivo o función que reconfigure las Señales Alternas de Canal-M sin referencia a la información de reconfiguración ("Reconfigurar los Canales sin la Información de Reconfiguración") 46 a fin de proporcionar las Señales Reconfiguradas de Canal-P. El número de canales P no necesita ser el mismo que el número de canales N. Como se discutió con anterioridad, este dispositivo o función 46 podría ser, en el caso cuando la reconfiguración sea de mezclado ascendente, por ejemplo, un mezclador ascendente ciego tal como un decodificador de matriz activa (los ejemplos de los cuales son señalados con anterioridad) . El dispositivo o función 46 también podría proporcionar la conversión de binaural a formato de altavoz o de formato de altavoz a binaural . Del mismo modo que el dispositivo o la función 36 del ejemplo de la Figura 4A, el dispositivo o función 46 podría proporcionar un mezclado ascendente virtual y/o un nuevo posicionamiento virtual de altavoz en el cual la señal binaural de dos canales se hace que tenga canales virtuales de mezclado ascendente y/o nuevamente situados. Las Señales Alternas de Canal-M, las Señales Reconfiguradas de Canal-N y las Señales Reconfiguradas de Canal-P son salidas posibles de la porción de consumo 42 del arreglo. Cualquier combinación de ellas podría ser proporcionada como salidas (la figura muestra todas las tres) o una o una combinación de ellas podría ser elegida, la elección es implementada por un selector o función de selección (no se muestra) bajo el control automático o manual, por ejemplo, por un usuario o consumidor. Una alternativa adicional se muestra en el ejemplo de la Figura 4C. En este ejemplo, las Señales Originales de Canal-M son modificadas, aunque la información de reconfiguración de canal no es transmitida o registrada. De esta manera, la función derivar la información de reconfiguración de canal 32 podría ser omitida por la porción de producción 38 del arreglo, de manera que sólo las Señales Alternas de Canal-M sean aplicadas en la función de Formatear 22. De esta manera, un arreglo.de transmisión o grabación de legado, que podría ser incapaz de llevar la información de reconfiguración además de la información de audio, es requerido para llevar sólo la señal de tipo de legado, tal como la señal estereofónica de dos canales, la cual en este caso ha sido modificada a fin de proporcionar mejores resultados cuando sea aplicado un mezclador ascendente de tipo de consumo de baja complejidad, tal como un decodificador de matriz activa. En la porción de consumo 42 del arreglo, la función de Reconfigurar Canales 44 podría ser omitida con el fin de proporcionar una o ambas de las dos salidas posibles, las Señales Alternas de Canal-M y las Señales Reconfiguradas de Canal-P. Como se indicó con anterioridad, podría ser deseable modificar el conjunto de Señales Originales de Canal-M aplicadas en la porción de producción de un sistema de audio, de modo que las Señales Originales de Canal-M (o una aproximación de ellas) sean más adecuadas para el mezclado ascendente ciego en la porción de consumo de un sistema a través de un mezclador ascendente de tipo de consumo, tal como un decodificador de matriz adaptiva. Una forma para modificar este conjunto de señales de audio no óptimas es (1) realizar el mezclado ascendente del conjunto de señales utilizando un dispositivo o función que opere con menos dependencia sobre las características intrínsecas de señal (tal como las relaciones de amplitud y/o fase entre las señales aplicadas a este) que realiza un decodificador de matriz adaptiva, y (2) codificar el conjunto de mezclado ascendente de señales utilizando un codificador de matriz compatible con el decodificador adaptivo de matriz anticipado. Este procedimiento se describe más adelante en conexión con el ejemplo de la Figura 5A.
Otra forma de modificar este conjunto de señales es la aplicación de una o más técnicas conocidas de "espacialización" y/o síntesis de señal. Estas técnicas en algunas ocasiones son caracterizadas como técnicas "pseudo estéreo"' o "pseudo cuadrafónica". Por ejemplo, podría agregarse el contenido decorrelacionado y/o fuera de fase a uno o más de los canales . Este procesamiento aumenta el ancho aparente de la imagen de sonido o el envolvente de sonido al costo de disminuir la estabilidad de la imagen central. Esto se describe en conexión con el ejemplo de la Figura 5B . Para ayudar a alcanzar un equilibrio entre estas características de señal (el ancho/envolvente contra la estabilidad de la imagen central) , podría tomarse ventaja del fenómeno en el que la estabilidad de la imagen central sea determinada principalmente por las frecuencias baja a intermedia, mientras que el ancho de la imagen y el envolvente serían determinados principalmente por las frecuencias más altas. Mediante la separación o división de la señal en dos o más bandas de frecuencia, podría realizarse el proceso de las subbandas de audio en forma independiente a fin de mantener la estabilidad de la imagen en bajas y moderadas frecuencias aplicando una decorrelación mínima y mediante el incremento del sentido del envolvente en frecuencias más altas empleando una decorrelación más grande. Esto se describe en el ejemplo de la Figura 5C.
Con referencia al ejemplo de la Figura 5A, en la porción de producción 48 del arreglo, las señales de canal-M son de mezclado ascendente hasta las señales de canal-P por lo que podría caracterizarse como un dispositivo mezclador ascendente "artístico" o función de mezclado ascendente "artística" (Mezclado Ascendente Artístico) 50. Normalmente, un mezclador ascendente "artístico" , aunque no en forma necesaria, un mezclador ascendente complejo en forma computacional opera con poca o ninguna dependencia sobre las características intrínsecas de señal (tal como las relaciones de amplitud y/o fase entre las señales aplicadas a este) sobre las cuales los decodificadores de matriz activa dependen para realizar un mezclado ascendente. En su lugar, un mezclador ascendente "artístico" opera de acuerdo con uno o más procesos que el diseñador o diseñadores del mezclador ascendente consideran adecuado para producir resultados particulares. Estos mezcladores ascendentes "artísticos" podrían tomar muchas formas. Un ejemplo es proporcionado en la presente en conexión con la Figura 7 y la descripción de acuerdo con el encabezado nLa presente invención aplicada en un codificador espacial" . De acuerdo con este ejemplo de la Figura 7, el resultado es una señal de mezclado ascendente por ejemplo, con una mejor separación izquierda/derecha para minimizar el "apilamiento central" o una mayor separación frontal/trasera para mejorar el "envolvente" . La elección de una técnica o técnicas particulares para realizar un mezclado ascendente "artístico" no es crítica para este aspecto de la invención. Todavía con referencia a la Figura 5A las Señales de Canal-P de mezclado ascendente son aplicadas en un codificador de matriz o función de codificación de matriz ("Codificación de Matriz") 52 que proporciona un número más pequeño de canales, las Señales Alternas de Canal-M, estos canales son codificados con características intrínsecas de señal, tal como los avisos de amplitud y fase, adecuadas para la decodificación a través de un decodificador de matriz. Un codificador adecuado de matriz es el codificador de matriz 5:2 que se describe más adelante en conexión con la Figura 8. Otros codificadores de matriz también podrían ser adecuados. La salida de codificación de matriz es aplicada en la función de Formatear 22 que genera, por ejemplo, un flujo de bits en serie o en paralelo, como se describió con anterioridad. En forma ideal, la combinación del Mezclado Ascendente Artístico 50 y la codificación matriz 52 origina la generación de señales, que cuando son decodificadas por un decodificador convencional de matriz activa de consumo, proporciona una experiencia mejorada de escucha en comparación con una decodificación de las señales originales aplicadas al Mezclado Ascendente Artístico 50. En el arreglo de la porción de consumo 54 de la Figura 5A, el flujo de bits o flujos de bits de salida son recibidos y un Desformateador 26 (descrito con anterioridad) deshace la acción de la función de Formatear 22 a fin de proporcionar las Señales Alternas de Canal-M (o una aproximación de ellas) . Las Señales Alternas de Canal-M (o una aproximación de ellas) podrían ser proporcionadas como una salida y son- aplicadas a un dispositivo o función que reconfigure las Señales Alternas de Canal-M sin referencia a ninguna información de reconfiguración ("Reconfigurar Canales sin Información de Reconfiguración") 56 a fin de proporcionar las Señales Reconfiguradas de Canal-P. El número de canales P no necesita ser el mismo que el número de canales M. Como se discutió con anterioridad, este dispositivo o función 56 podría ser, en el caso cuando la reconfiguración sea de mezclado ascendente, por ejemplo, un mezclador ascendente ciego tal como un decodificador de matriz activa (como se discutió con anterioridad) . Las Señales Alternas de Canal-M y las Señales Reconfiguradas de Canal-P son salidas posibles de la porción de consumo 54 del arreglo. Una o ambas de ellas podrían ser seleccionadas, la elección es implementada por un selector o función de selección (no se muestra) bajo el control automático o manual, por ejemplo, por un usuario o consumidor. En el ejemplo de la Figura 5B, es mostrada otra forma de modificar un conjunto no óptimo de señales de entrada, a saber, un tipo de "espacialización" , en la cual es modificada la correlación entre canales. En la porción de producción 58 del arreglo, las señales de canal-M son aplicadas a un conjunto de dispositivos de decorrelación o funciones de decorrelación ( "Decorrelacionador" ) 60. Una reducción en la correlación cruzada entre dos o más de los canales de señal puede ser conseguida mediante el procesamiento independiente de los canales individuales con cualquiera de las técnicas bien conocidas de decorrelación. En forma alterna, la decorrelación puede ser conseguida mediante el procesamiento interdependiente entre dos o más señales. Por ejemplo, el contenido fuera de fase (es decir, la correlación negativa) entre los canales puede ser conseguido mediante la escala y la inversión de la señal a partir de un canal y el mezclado en otro. En ambos casos, el proceso puede ser controlado ajustando los niveles relativos de la señal procesada y no procesada en cada canal. Como se mencionó con anterioridad, existe un intercambio entre el ancho aparente de imagen de sonido o el envolvente de sonido y la estabilidad disminuida de la imagen central. Un ejemplo de la decorrelación a través del procesamiento independiente de canales individuales es señalado en las Solicitudes pendientes de Patente de los Estados Unidos de Seefeldt et al, S.N. 60/604,725 (presentada el 25 de Agosto de 2004), S.N. 60/700,137 (presentada el 18 de Julio del 2005), y S.N. 60/705,784 (presentada el 05 de Agosto del 2005, archivo de apoderado DOL14901) , cada una titulada "Multichannel Decorrelation in Spatial Audio Coding." Otro ejemplo de decorrelación a través del proceso independiente de canales individuales es señalado en Breebaart et al AES Convention Paper 6072 y la solicitud internacional WO 03/090206, citada más adelante. Las Señales de Canal-M con una correlación disminuida son aplicadas en la función de Formatear 22, como se describió con anterioridad, lo cual proporciona una salida adecuada, tal como uno o más flujos de bits para la aplicación en una transmisión o grabación convenientes. .El arreglo de la porción de consumo 54 de la Figura 5B podría ser el mismo que el arreglo de la porción de consumo de la Figura 5A. Como se mencionó con anterioridad, la adición del contenido decorrelacionado y/o fuera de fase hacia uno o más de los canales incrementa el ancho aparente de la imagen de sonido o el envolvente de sonido al costo de disminuir la estabilidad de la imagen central. En el ejemplo de la Figura 5C, para ayudar a alcanzar el equilibrio entre el ancho/envolvente contra la estabilidad de la imagen central, las señales son divididas en dos o más bandas de frecuencia y las subbandas de audio son procesadas de manera independiente para mantener la estabilidad de la imagen en frecuencias bajas y moderadas mediante la aplicación de una decorrelación mínima, y el incremento del sentido de envolvente a frecuencias más altas mediante el empleo de una decorrelación más grande . Con referencia a la Figura 5C, en la porción de producción 58', las Señales de Canal-M son aplicadas a un filtro de subbanda o función de filtrado de subbanda ("filtro de subbanda") 62. Aunque la Figura 5C muestra este filtro de subbanda 62 de manera explícita, debe entenderse que un filtro o función de filtrado podrían ser empleados en otros ejemplos, como se mencionó con anterioridad. Aunque el filtro de subbanda 62 podría tomar varias formas y la elección del filtro o función de filtrado (por ejemplo, un banco de filtros o una transformada) no es crítico para la invención. El filtro de subbanda 62 divide el espectro de las señales de canal-M en R bandas, cada una de las cuales podría ser aplicada en un respectivo Decorrelacionador. La figura muestra de manera esquemática, el Decorrelacionador 64 para la banda 1, el Decorrelacionador 66 para la banda 2 y el Decorrelacionador 68 para la banda R, se entiende que cada banda podría tener su propio Decorrelacionador. Algunas bandas podrían no ser aplicadas a un Decorrelacionador. Los Decorrelacionadores son esencialmente los mismos que el Decorrelacionador 60 del ejemplo de la Figura 5B, excepto que operan en base a menos que el espectro total de las señales de canal-M. Para simplificar la presentación, la Figura 5C muestra un filtro de subbanda y los decorrelacionadores para una señal única, se entiende que cada señal es dividida en subbandas y cada subbanda puede ser decorrelacionada. Después de la decorrelación, si existiera, las subbandas para cada señal podrían ser añadidas juntas por un sumador o función de suma ("Suma") 70. La salida de la suma 70 es aplicada en la función de Formatear 22 que genera por ejemplo, un flujo de bits en serie o en paralelo, como se describió con anterioridad. El arreglo de la porción de consumo 54 de la Figura 5C podría ser el mismo que los arreglos de la porción de consumo de las Figuras 5A y 5B. T-ntegrració-n con la Codificación Espacial Ciertas técnicas recientemente introducidas de codificación de velocidad de bits limitada (véase más adelante la lista de ejemplo de patentes, solicitudes de patentes y publicaciones que se refieren a la codificación espacial) analizan una señal de entrada de canal N junto con una señal compuesta de canal M (N>M) para generar la información lateral que contiene un modelo paramétrico del campo de sonido de la señal de entrada de canal N con respecto a la de la señal compuesta de canal M. Comúnmente, la señal compuesta es derivada del mismo material maestro que la señal original de canal N. La información lateral y la señal compuesta son transmitidas hacia un decodificador que aplica el modelo paramétrico a la señal compuesta con el fin de recrear una aproximación del campo de sonido original de la señal de canal N. La meta primaria de estos sistemas de "codificación espacial" es recrear el campo de sonido original con una cantidad muy limitada de datos; por lo tanto, este esfuerzo limita el modelo paramétrico utilizado para simular el campo de sonido original. Comúnmente, estos sistemas de codificación espacial emplean parámetros para modelar el campo de sonido original de la señal de canal N como diferencias de nivel entre canales (ILD) , diferencias de tiempo o de fase entre canales (ITD o IPD) , y la coherencia entre canales (ICC) . Normalmente, estos parámetros son estimados para múltiples bandas espectrales a través de todos los canales N de la señal de entrada que está siendo codificada y son estimados en forma dinámica con respecto al tiempo. Algunos ejemplos de la codificación espacial de la técnica anterior son mostrados en las Figuras 6A-6B (codificador) y 6C (decodificador) . Las Señales Originales de Canal-N podrían ser convertidas por un dispositivo o función ("Tiempo a Frecuencia") hacia el dominio de frecuencia utilizando una transformación adecuada de tiempo-a-frecuencia, tal como la transformada discreta de Fourier de tiempo corto que es bien conocida (STDFT) . Comúnmente, la transformada es manipulada, de manera que sus bandas de frecuencia se aproximen a las bandas críticas del oído. Un estimado de las diferencias de amplitud entre canales, las diferencias de tiempo o fase entre canales y la correlación entre canales es calculada para cada una de las bandas ("Generar la Información Lateral Espacial"). Si las Señales Compuestas de Canal-M que corresponden con las Señales Originales de Canal-N no existieran, estas estimaciones podrían ser utilizadas para realizar el mezclado descendente ("Mezclado Descendente") de las Señales Originales de Canal-N en las Señales Compuestas de Canal-M (como en el ejemplo de la Figura 6A) . En forma alterna, una señal existente compuesta de canal M podría ser procesada de manera simultánea con la misma transformada de tiempo-a- frecuencia (se muestra por separado por motivos de claridad en la presentación) y los parámetros espaciales de las Señales Originales de Canal-N podrían ser calculados con respecto a los parámetros de las Señales Compuestas de Canal-M (como en el ejemplo de la Figura 6B) . En forma similar, si las Señales Originales de Canal-N no estuvieran disponibles, un conjunto disponible de Señales Compuestas de Canal-M podría ser de mezclado ascendente en el dominio de tiempo para producir las "Señales Originales de Canal-N" cada conjunto de señales proporciona un conjunto de entradas a los respectivos dispositivos o funciones de tiempo a frecuencia en el ejemplo de la Figura 6B. La señal compuesta y los parámetros espaciales estimados son entonces codificados ("Formatear") en un flujo de bits único. En el decodificador (Figura 6C) , este flujo de bits es decodificado ("Desformateador") para generar las Señales Compuestas de Canal-M junto con la información lateral espacial. Las señales compuestas son transformadas al dominio de frecuencia ("Tiempo a Frecuencia") en donde los parámetros espaciales decodificados son aplicados a sus bandas correspondientes ("Aplicar la Información Lateral Espacial") para generar las Señales Originales de Canal-N en el dominio de frecuencia. Finalmente, una transformación de frecuencia-a-tiempo ("Frecuencia a Tiempo") es aplicada para producir las Señales Originales de Canal-N o aproximaciones de las mismas. En forma alterna, la información lateral espacial podría ser ignorada y las Señales Compuestas de Canal-M podrían ser seleccionadas para su reproducción. Mientras que los sistemas de codificación espacial de la técnica anterior suponen la existencia de las señales de canal-N a partir de las cuales es estimada una representación paramétrica de la baja velocidad de datos de su campo de sonido, este sistema podría ser alterado para trabajar con la invención descrita. En lugar de estimar los parámetros espaciales a partir de las Señales Originales de Canal-N, estos parámetros espaciales podrían ser generados en forma directa a partir del análisis de las señales de canal M de legado, en donde M<N. Los parámetros son generados, de manera que el mezclado ascendente deseado de canal-N de las señales de canal-M de legado sea producido en el decodificador cuando estos parámetros sean aplicados. Esto podría ser conseguido sin la generación de las actuales señales de mezclado ascendente de canal-N en el decodificador, sino que en su lugar mediante la producción de una representación paramétrica del campo de sonido deseado de la señal de mezclado ascendente en forma directa a partir de las señales de legado de canal-M. La Figura 7 representa un codificador de mezclado ascendente, el cual es compatible con el decodificador espacial que se representa en la Figura 6C. Los detalles adicionales de la producción de esta representación paramétrica son proporcionados más adelante bajo el encabezado nLa presente invención aplicada en un codificador espacial" . Con referencia a los detalles de la Figura 7, las Señales Originales de Canal-M en el dominio de tiempo son convertidas al dominio de frecuencia utilizando una transformación adecuada de tiempo-a-frecuencia ("Tiempo a Frecuencia") 72. Un dispositivo o función 74 ("Derivar la Información de Mezclado Ascendente como Información Lateral") deriva las instrucciones de mezclado ascendente en el mismo modo que la información lateral espacial es generada en un sistema de codificación espacial. Los detalles de la generación de la información lateral espacial en un sistema de codificación espacial son señalados en una o más de las referencias citadas en la presente. Los parámetros de codificación espacial, que constituyen las instrucciones de mezclado ascendente, junto con las Señales Originales de Canal-M son aplicados a un dispositivo o función ("Formatear") 76 que realiza la preparación o formateo de las Señales Originales de Canal-M y los parámetros de codificación espacial en una forma adecuada para su transmisión o almacenamiento. El formateo podría incluir la codificación de compresión de datos. Un mezclador ascendente, que emplea la generación de parámetro recién descrita en combinación con un dispositivo o función para su aplicación en las señales que serán de mezclado ascendente tal como por ejemplo, el decodificador de la Figura 6C, es adecuado como un mezclador ascendente complejo en forma computacional para uso en la generación de señales alternas como en los ejemplos de las Figuras 4B, 4C, 5A y 5B. Aunque es ventajosa la producción de la representación paramétrica en forma directa a partir de las señales de legado de canal-M sin generar las señales deseadas de mezclado ascendente de canal-N en el codificador (como en el ejemplo de más adelante) , esto no es crucial para la invención. En forma alterna, los parámetros espaciales podrían ser derivados mediante la generación de las señales deseadas de mezclado ascendente de canal-N en el codificador. De manera funcional, estas señales serían generadas dentro del bloque 74 de la Figura 7. Por lo tanto, incluso en esta alternativa, la única información de audio que la derivación de instrucción recibe es las señales de legado de canal-M. La Figura 8 es un diagrama idealizado de bloques funcional del codificador convencional pasivo de matriz de 5:2 de la técnica anterior (de tiempo lineal-invariable) compatible con los decodificadores de matriz activa Pro Logic II. Este codificador es adecuado para uso en el ejemplo de la Figura 5A, descrito con anterioridad. El codificador acepta cinco señales separadas de entrada: izquierda, central, derecha, envolvente izquierda, y envolvente derecha (L, C, R, LS, RS) , y crea dos salidas finales, total izquierda y total derecha (Lt y Rt) . La entrada C es dividida por igual y es sumada con las entradas L y R (en los combinadores 80 y 82, de manera respectiva) con una atenuación (proporcionada por el atenuador 84) de nivel de 3 dB (amplitud) con el fin de mantener la potencia acústica constante. Las entradas L y R, cada una sumada con la entrada C reducida de nivel, tienen las versiones de cambio de fase y nivel de las entradas LS y RS en forma sustractiva y son combinadas en forma aditiva con ellas. En forma ideal, la entrada envolvente izquierda (LS) es cambiada de fase en 90 grados, se muestra en el bloque 86, y posteriormente, es reducida en nivel por 1.2 dB en el atenuador 88 para la mezcla sustractiva en el combinador 90 con la L sumada y la C reducida de nivel. Entonces, esta es adicionalmente reducida de nivel en 5dB en el atenuador 92 para la mezcla aditiva en el combinador 94 con la R sumada, la C reducida de nivel y la versión reducida de nivel de cambio de fase de RS, como se describe a continuación, a fin de proporcionar la salida Rt . En forma ideal, la entrada de envolvente derecho (RS) es cambiada de fase por 90 grados, se muestra en el bloque 96, y posteriormente, es reducida en nivel en 1.2 dB en el atenuador 98 para la mezcla aditiva en el combinador 100 con la R sumada y la C reducida de nivel. A continuación, esta es adicionalmente reducida de nivel en 5 dB en el atenuador 102 para la mezcla sustractiva en el combinador 104 con la R sumada, la C reducida de nivel y la LS cambiada de fase y reducida de nivel a fin de proporcionar la salida Lt . En principio, sólo existe un bloque de cambio de fase de 90 grados en cada vía circundante de entrada, como se muestra en la figura. En la práctica, un cambiador de fase de 90 grados no puede ser realizado, de modo que cuatro redes de pasa todo podrían ser utilizadas con los cambios adecuados de fase a fin de realizar los cambios deseados de fase de 90 grados. Las redes de pasa todo tienen la ventaja de no afectar el timbre (espectro de frecuencia) de las señales de audio que están siendo procesadas.
Las señales codificadas izquierda total (Lt) y derecha total (Rt) podrían ser expresadas como: Lt = L + m(-3)dB*C -j * [m(-l .2) dB*Ls + m(-6.2)dB*Rs], y Rt = R + m(-3)dB*C +j * [(m(-1.2)dB*Rs + m(-6.2)dB*Ls), en donde L es la señal de entrada izquierda, R es la señal de entrada derecha, C es la señal de entrada central, Ls es la señal de entrada envolvente izquierda, Rs es la señal de entrada envolvente derecha, "j" es la raíz cuadrada de menos uno (-1) (un cambio de fase de 90 grados), y "m" indica multiplicar por la atenuación señalada en decibeles (de esta manera, m(-3)dB = 3dB atenuación). En forma alterna, las ecuaciones podrían ser expresadas como sigue: Lt = L + (0.707)*C-j*(0.87*Ls + 0.56*Rs), y Rt = R+ (0.707)*C +j*(0.87*Rs + 0.56*Ls), en donde 0.707 es una aproximación de la atenuación de 3 dB, 0.87 es una aproximación de la atenuación de 1.2 dB, y 0.56 es una aproximación de la atenuación de 6.2 dB . Los valores (0.707, 0.87 y 0.56) no son críticos. Otros valores podrían ser empleados con resultados aceptables . El alcance en el cual otros valores podrían ser utilizados está en función del alcance en el que el diseñador del sistema considere que los resultados auditivos sean aceptables. El Mejor Modo para Realizar la Invención Antecedentes de la Codificación Espacial Se considera un sistema de codificación espacial que utiliza como su información lateral los estimados de banda por críticos de las diferencias de nivel entre canales (ILD) y la coherencia entre canales (ICC) de la señal de canal N. Se supone que el número de canales en la señal compuesta es M=2 y que el número de canales en la señal original es N=5. Se define la siguiente notación: Xj [b, t] : La representación del dominio de frecuencia del canal j de la señal compuesta x en la banda b en el bloque de tiempo t . Este valor es derivado mediante la aplicación de una transformada de tiempo a frecuencia a la señal compuesta x enviada al decodificador. Z± [b, t] : La representación del dominio de frecuencia del canal i del estimado de la señal original z en la banda b y el bloque de tiempo t. Este valor es calculado mediante la aplicación de la información lateral a Xj [b, t] . ILDij [b, t] -. La diferencia de nivel entre canales del canal i de la señal original con respecto al canal j de la señal compuesta en la banda b y el bloque de tiempo t . Este valor es enviado como la información lateral. -TCCi [b, t] -. La coherencia entre canales del canal i de la señal original en la banda b en el bloque de tiempo t. Este valor es enviado como la información lateral. Del mismo modo que en la primera etapa en la decodificación, una representación intermedia del dominio de frecuencia de la señal de canal N es generada a través de la aplicación de las diferencias de nivel entre canales a la señal compuesta como sigue: ?r<[ft,/] = ?/ o9[6,/µry[6,í] A continuación, una versión decorrelacionada de Y± es generada a través de la aplicación de un filtro único de decorrelación H¿ a cada canal i, en donde la aplicación del filtro podría ser conseguida a través de la multiplicación en el dominio de frecuencia: ?i = ^ Yi Finalmente, el estimado del dominio de frecuencia de la señal original z es calculado como una combinación lineal de Yi y ?i , en donde la coherencia entre canales controla la proporción de esta combinación: La señal final z es entonces generada mediante la aplicación de la transformación de frecuencia a tiempo en Zi [b, t] . La presente invención aplicada en un codificador espacial A continuación, se describe una modalidad de la invención descrita que utiliza el decodificador espacial descrito con anterioridad con el fin de realizar el mezclado ascendente de una señal de canal M=2 en una señal de canal N=6. La codificación requiere la sintetización de la información lateral ILDÍ [b, t] e J i [b, t] de Xj [b, t] sola, de manera que el mezclado ascendente deseado sea producido en el decodificador cuando ILDÍJ [b, t] e ICCi íb, t] sean aplicados en Xj [b, t] , como se describió con anterioridad. Como se indicó con anterioridad, este procedimiento también proporciona un mezclado ascendente complejo en forma computacional adecuado para uso, cuando las señales de mezclado ascendente sean entonces aplicadas a un codificador de matriz, para la generación de señales alternas convenientes para el mezclado ascendente a través de un mezclador ascendente de baja complejidad tal como un decodificador de matriz activa de tipo de consumo. La primera etapa del sistema preferido de mezclado ascendente es convertir la entrada de los canales en el dominio espectral . La conversión al dominio espectral podría ser conseguida utilizando el 75% de las DFTs superpuestas con el 50% del bloque rellenado cero para evitar los efectos circulares de convolución provocados por los filtros de decorrelación. Este esquema DFT coincide con el esquema de conversión de tiempo- frecuencia utilizado en la modalidad preferida del sistema de codificación espacial. La representación espectral de la señal es entonces separada en múltiples bandas que se aproximan a la escala equivalente de banda rectangular (ERB) ; una vez más, ésta estructura de bandas es la misma que la utilizada por el sistema de codificación espacial, de manera que la información lateral podría ser utilizada para realizar el mezclado ascendente ciego en el decodificador. En cada banda b, una matriz de covariancia es calculada como se muestra en la siguiente ecuación : En donde, X2 [k, t] es la DFT del primer canal en el recipiente k y el bloque t, X2 [k, t] es la DFT del segundo canal en el recipiente k y el bloque t, -í es el ancho de la banda b contada en recipientes, y R es el estimado instantáneo de la matriz de covariancia en la banda b en el bloque t para los dos canales de entrada. Además, el operador "*" en la ecuación anterior representa la conjugación de los valores DFT. El estimado instantáneo de la matriz de covariancia es entonces suavizado con respecto a cada bloque utilizando un filtro simple de primer orden IIR aplicado en la matriz de covariancia en cada, banda, como se muestra en la siguiente ecuación: En donde, ?x es el estimado suavizado de la matriz de covariancia, y ? Es el coeficiente de suavización, que podría ser dependientes de la señal y la banda. Para un sistema ciego simple de mezclado ascendente de 2 a 6, definimos el ordenamiento del canal como sigue: Utilizando el mapeo anterior de canal se desarrolla el siguiente ILD e ICC por banda para cada uno de los canales con respecto a la matriz de covariancia suavizada: Definimos: CC "' = R xxr[ J Entonces para el canal 1 (Izquierdo) ILDl 2[b*t] = 0 ICC- [b,t = l Pa a el canal 2 ( Central ) ILD2 2[b,t] = 0 JCC2[b,t] = l Para el canal 3 (Derecho) 7Z--D, ,[£,/] = O ILD3 2[b,t] = - (ab' 1 ICC3[b,t] -= i Pa a el canal 4 (Envolvente Izquierdo) : ILD4 - [b,t] = ab-' ILD4 2[b,t] = 0 ICC4[b,t] = 0 Para el canal 5 (Envolvente Derecho) : ILDs - [b,t] = 0 JLDS 2[b,t] = b-' ICCs[b,t] = 0 Para el canal 6 (LFE) : ILD6 [b,t] = 0 ILD6¿[b,t] = 0 7CC6[?,/] = l En la práctica, un arreglo de acuerdo con el ejemplo recién descrito ha sido encontrado que se desempeña bien, éste separa los sonidos . directos de los sonidos ambientales, coloca los sonidos directos en los canales izquierdo y derecho, y mueve los sonidos ambientales a los canales traseros . También podrían crearse arreglos más complicados utilizando la información lateral transmitida dentro del sistema de codificación espacial.
Incorporación como Referencia Las siguientes patentes, solicitudes de patentes y publicaciones son incorporadas en la presente como referencia, cada una en su totalidad. Procesamiento de Sonido Virtual Atal et al, "Apparent Sound Source Translator," la Patente de los Estados Unidos No. 3,236,949 (26 de Febrero de 1966) . Bauer, "Stereophonic to Binaural Conversión Apparatus," la Patente de los Estados Unidos No. 3,088,997 (07 de Mayo de 1963) . AC-3 (Dolby Digital) ATSC Standard A52/A: Digi tal Audio Compression Standard (AC-3) , Revisión A, Advanced Televisión Systems Committee, 20 de Agosto del 2001. El documento N52A es httP: //www.atsc .org/standards .html . "Design and Implementation of AC-3 Coders," de Steve Vernon, IEEE Trans. Consumer Electronics, Vol. 41, No .3 , Agosto de 1995. "The AC-3 Multichannel Coder" de Mark Davis, Audio Engineering Society Preprint 3774, 95th AES Convention, Octubre de 1993. "High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications," de Bosi et al, Audio Engineering Society Preprint 3365, 93rd AES Convention, Octubre de 1992. Las Patentes de los Estados Unidos Nos. 5,583,962; 5,632,005; 5,633,981; 5,727,119; y 6,021,386. Codificación Espacial La Solicitud de Patente de los Estados Unidos Publicada US 2003/0026441, publicada el 06 de Febrero del 2003 La Solicitud de Patente de los Estados Unidos Publicada US 2003/0035553, publicada el 20 de Febrero del 2003, La Solicitud de Patente de los Estados Unidos Publicada US 2003/0219130 (Baumgarte & Faller) publicada el 27 de Noviembre del 2003, Audio Engineering Society Paper 5852, Marzo del 2003 La Solicitud de Patente Internacional Publicada WO 03/090206, publicada el 30 de Octubre del 2003 La Solicitud de Patente Internacional Publicada WO 03/090207, publicada el 30 de Octubre del 2003 La Solicitud de Patente Internacional Publicada WO 03/090208, publicada el 30 de Octubre del 2003 La Solicitud de Patente Internacional Publicada WO 03/007656, publicada el 22 de Enero del 2003 La Publicación de Solicitud de Patente de los Estados Unidos Publicada US 2003/0236583 Al, Baumgarte et al, publicada el 25 de Diciembre del 2003, "Hybrid Multichannel/Cue Coding/Decoding of Audio Signáis," Solicitud S.N. 10/246,570. "Binaural Cue Coding Applied to Stereo and Multichannel Audio Compression," de Faller et al, Audio Engineering Society Convention Paper 5574, 112th Convention, Munich, Mayo del 2002. "Why Binaural Cue Coding is Better than Intensity Stereo Coding," de Baumgarte et al, Audio Engineering Society Convention Paper 5575, 112th Convention, Munich, Mayo del 2002. "Design and Evaluation of Binaural Cue Coding Schemes," by Baumgarte et al, Audio Engineering Society Convention Paper 5706, 113th Convention, Los Angeles, Octubre del 2002. "Efficient Representation of Spatial Audio Using Perceptual Parameterization, " de Faller et al, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001, New Paltz, New York, Octubre del 2001, pp. 199-202. "Estimation of Auditory Spatial Cues for Binaural Cue Coding," by Baumgarte et al, Proc. ICASSP 2002, Orlando, Florida, Mayo del 2002, pp. 11-1801-1804. "Binaural Cue Coding: A Novel and Efficient Representation of Spatial Audio," de Faller et al, Proc. ICASSP 2002, Orlando, Florida, Mayo del 2002, pp . II-1841-II-1844.
"High-quality parametric spatial audio coding at low bitrates," de Breebaart et al, Audio Engineering Society Convention Paper 6072, 116th Convention, Berlin, Mayo del 2004. "Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixing," de Baumgarte et al, Audio Engineering Society Convention Paper 6060, 116th Convention, Berlin, Mayo del 2004. "Low complexity parametric stereo coding," de Schuijers et al, Audio Engineering Society Convention Paper 6073, 116th Convention, Berlin, Mayo del 2004. "Synthetic Ambience in Parametric Stereo Coding, " by Engdegard et al, Audio Engineering Society Convention Paper 6074, 116th Convention, Berlin, Mayo del 2004. Otras La Patente de los Estados Unidos No. 6,760,448, de Kenneth James Gundry, titulada "Compatible Matrix-Encoded Surround-Sound Channels in a Discrete Digital Sound Format." La Solicitud de Patente de los Estados Unidos S.N. 10/911,404 de Michael John Smithers, presentada el 03 de Agosto del 2004, titulada "Method for Combining Audio Signáis Using Auditory Scene Analysis" Las Solicitudes de Patente de los Estados Unidos de Seefeldt et al, S.N. 60/604,725 (presentada el 25 de Agosto del 2004), S.N. 60/700,137 (presentada el 18 de Julio del 2005), y S.N. 60/705,784 (presentada el 05 de Agosto del 2005, números de apoderado DOL14901) , cada una titulada "Multichannel Decorrelation in Spatial Audio Coding." La Solicitud de Patente Internacional Publicada WO 03/090206, publicada el 30 de Octubre del 2003. "High-quality parametric spatial audio coding at low bitrates," de Breebaart et al, Audio Engineering Society Convention Paper 6072, 116th Convention, Berlin, Mayo del 2004. -Implementación La invención podría ser implementada en hardware o software o una combinación de ambos (por ejemplo, arreglos lógicos programables) . A menos que sea especificado de otro modo, los algoritmos incluidos como parte de la invención no son inherentemente relacionados con ninguna computadora u otro aparato particular. En particular, podrían utilizarse varias máquinas de uso general con programas escritos de acuerdo con las enseñanzas en la presente, o podría ser más conveniente construir aparatos más especializados (por ejemplo, circuitos integrados) para realizar las etapas requeridas de método. Por lo tanto, la invención podría ser implementada en uno o más programas de computadora que se ejecuten en uno o más sistemas de cómputo programable, cada uno, comprende al menos un procesador, por lo menos un sistema de almacenamiento de datos (que incluye una memoria volátil y una memoria no volátil y/o elementos de almacenamiento) , al menos un dispositivo o puerto de entrada y por lo menos un dispositivo o puerto de salida. El código de programa es aplicado en los datos de entrada para realizar las funciones descritas en la presente y generar la información de salida. La información de salida es aplicada a uno o más dispositivos de salida en un modo conocido. Cada programa podría ser implementado en cualquier lenguaje deseado de computadora (que incluye lenguajes de máquina, ensamblador o de procedimiento de alto nivel, lógicos o de programación orientados por objeto) para comunicarse con un sistema de cómputo. En cualquier caso, el lenguaje podría ser un lenguaje compilado o interpretado. De preferencia, cada programa de computadora es almacenado o descargado en un dispositivo o medios de almacenamiento (por ejemplo, en una memoria o en medios de estado sólido, o en medios magnéticos u ópticos) que puedan ser leídos a través de una computadora programable de uso general o especial para la configuración y operación de la computadora cuando el dispositivo o los medios de almacenamiento sean leídos por el sistema de cómputo a efecto de realizar los procedimientos descritos en la presente. El sistema inventivo también puede ser considerado que será implementado como un medio de almacenamiento susceptible de ser leído por computadora, configurado con un programa de cómputo, en donde el medio de almacenamiento configurado de este modo provoca que un sistema de cómputo funcione en un modo específico y predefinido para realizar las funciones descritas en la presente. También ha sido descrito un número de modalidades de la invención. Sin embargo, se entenderá que podrían realizarse varias modificaciones sin apartarse del espíritu y alcance de la invención. Por ejemplo, algunas de las etapas descritas en la presente podrían ser independientes del orden, y de esta manera, pueden ser realizadas en un orden diferente al descrito.

Claims (27)

  1. REIVINDICACIONES 1. Un método de procesamiento al menos de una señal de audio o una modificación al menos de una señal de audio que tiene el mismo número de canales al menos que una señal de audio, cada señal de audio que representa un canal de audio, caracterizado porque comprende derivar las instrucciones para la reconfiguración de canal al menos de una señal de audio o su modificación, en donde la única información de audio que recibe la derivación es al menos de una señal de audio o su modificación, y suministrar una salida que incluye (1) al menos una señal de audio o su modificación, y (2) las instrucciones para la reconfiguración de canal .
  2. 2. El método de conformidad con la reivindicación 1, caracterizado porque al menos cada una de una señal de audio y su modificación son dos o más señales de audio.
  3. 3. El método de conformidad con la reivindicación 2, caracterizado porque las señales de audio son un par estereofónico de señales de audio y la modificación es un par de señales de audio que son una versión binauralizada del par estereofónico de señales de audio.
  4. 4. El método de conformidad con la reivindicación 2, caracterizado porque las dos o más señales de audio modificadas son descifradas por un decodificador de matriz.
  5. 5. El método de conformidad con la reivindicación 4 , caracterizado porque el decodificador de matriz es un decodificador de matriz activa.
  6. 6. El método de conformidad con cualquiera de las reivindicaciones 2, 4 y 5, caracterizado porque las dos o más señales de audio transformadas son una modificación codificada por matriz.
  7. 7. El método de conformidad con cualquiera de las reivindicaciones 1-6, caracterizado porque la derivación de instrucciones para la reconfiguración de canal deriva las instrucciones para el mezclado ascendente al menos de una señal de audio o su modificación, de manera que cuando sean de mezclado ascendente de acuerdo con las instrucciones para el mezclado ascendente, el número resultante de señales de audio sea más grande que el número de señales de audio que comprenden al menos una señal de audio o su modificación.
  8. 8. El método de conformidad con cualquiera de las reivindicaciones 1-6, caracterizado porque al menos una señal de audio y su modificación son cada una dos o más señales de audio y la derivación de las instrucciones para la reconfiguración de canal deriva las instrucciones para el mezclado descendente de las dos o más señales de audio, de manera que cuando se realice el mezclado descendente de acuerdo con las instrucciones para el mezclado ascendente, el número resultante de señales de audio sea menor que el número de señales de audio que incluye las dos o más señales de audio .
  9. 9. El método de conformidad con cualquiera de las reivindicaciones 1-6, caracterizado porque al menos una señal de audio y su modificación son cada una dos o más señales de audio y la derivación de las instrucciones para la reconfiguración de canal deriva las instrucciones para la reconfiguración de las dos o más señales de audio, de manera que cuando sean reconfiguradas de acuerdo con las instrucciones para la reconfiguración, el número de señales de audio permanezca igual aunque sean cambiadas una o más ubicaciones espaciales en la cual estas señales de audio se pretende que sean reproducidas.
  10. 10. El método de conformidad con cualquiera de las reivindicaciones 1-9, caracterizado porque al menos una señal de audio o su modificación en la salida es una versión comprimida de datos por lo menos de una señal de audio o su modificación, de manera respectiva.
  11. 11. El método de conformidad con cualquiera de las reivindicaciones 1-10, caracterizado porque al menos una señal de audio o su modificación es dividida en bandas de frecuencia y las instrucciones para la reconfiguración de canal son con respecto a unas de estas bandas de frecuencia.
  12. 12. Un método de procesamiento al menos de una señal de audio o la modificación por lo menos de una señal de audio que tiene el mismo número de canales que al menos . una señal de audio, cada señal de audio representa un canal de audio, caracterizado porque comprende recibir al menos una señal de audio o su modificación y las instrucciones para la reconfiguración de canal al menos de una señal de audio o su modificación,, las instrucciones han sido derivadas por una derivación de instrucción en la cual sólo la información de audio recibida es al menos de una señal de audio o su modificación, y la reconfiguración de canal al menos de una señal de audio o su modificación utiliza las instrucciones.
  13. 13. El método de conformidad con la reivindicación 12, caracterizado porque al menos una señal de audio y su modificación son cada una dos o más señales de audio.
  14. 14. El método de conformidad con la reivindicación 13, caracterizado porque las dos o más señales de audio modificadas son descifradas por un decodificador de matriz.
  15. 15. El método de conformidad con la reivindicación 14, caracterizado porque el decodificador de matriz es un decodificador de matriz activa.
  16. 16. El método de conformidad con cualquiera de las reivindicaciones 13-15, caracterizado porque las dos o más señales de audio transformadas son una modificación codificada por matriz.
  17. 17. El método de conformidad con cualquiera de las reivindicaciones 12-16, caracterizado porque las instrucciones para la reconfiguración de canal son instrucciones para el mezclado ascendente al menos de una señal de audio o su modificación y la reconfiguración de canal realiza el mezclado ascendente al menos de una señal de audio o su modificación, de manera que el número resultante de señales de audio sea más grande que el número de señales de audio que incluye por lo menos una señal de audio o su modificación.
  18. 18. El método de conformidad con cualquiera de las reivindicaciones 12-16, caracterizado porque al menos cada una de una señal de audio y su modificación son dos o más señales de audio y las instrucciones para la reconfiguración de canal son instrucciones para el mezclado descendente de las dos o más señales de audio y la reconfiguración de canal realiza el mezclado descendente de las dos o más señales de audio, de manera que el número resultante de señales de audio sea menor que el número de señales de audio que incluye las dos o más señales de audio .
  19. 19. El método de conformidad con cualquiera de las reivindicaciones 12-16, caracterizado porque al menos una señal de audio y su modificación son cada una dos o más señales de audio y las instrucciones para la reconfiguración de canal son instrucciones para la reconfiguración de las dos o más señales de audio, de manera que el número de señales de audio permanezca igual aunque sean cambiadas las respectivas ubicaciones espaciales en las cuales estas señales de audio se pretende que sean reproducidas .
  20. 20. El método de conformidad con cualquiera de las reivindicaciones 12-16, caracterizado porque las instrucciones para la reconfiguración de canal son instrucciones para hacer que una señal estereofónica binaural tenga un mezclado ascendente para multiplicar los canales virtuales al menos de una señal de audio o su modificación.
  21. 21. El método de conformidad con cualquiera de las reivindicaciones 12-16, caracterizado porque las instrucciones para la reconfiguración de canal son instrucciones para hacer que la señal estereofónica binaural tenga una reconfiguración virtual de la ubicación espacial.
  22. 22. El método de conformidad con cualquiera de las reivindicaciones 12-21, en donde al menos una señal de audio o su modificación es de datos comprimidos, caracterizado además porque comprende la descompresión de datos al menos de una señal de audio o su modificación.
  23. 23. El método de conformidad con cualquiera de las reivindicaciones 12-21, caracterizado porque al menos una señal de audio o su modificación es dividida en bandas de frecuencia y las instrucciones para la reconfiguración de canal son con respecto a las respectivas bandas de frecuencia.
  24. 24. El método de conformidad con cualquiera de las reivindicaciones 12-23, caracterizado además porque comprende proporcionar una salida de audio, y seleccionar como la salida de audio una de: (1) al menos una señal de audio o su modificación, o (2) el canal reconfigurado al menos en una señal de audio .
  25. 25. El método de conformidad con cualquiera de las reivindicaciones 12-23, caracterizado además porque comprende proporcionar una salida de audio en respuesta al menos a una señal de audio o su modificación recibida.
  26. 26. El método de conformidad con la reivindicación 25, en donde al menos una señal de audio y su modificación son cada una dos o más señales de audio, caracterizado además porque comprende la decodificación de matriz de las dos o más señales de audio.
  27. 27. El método de conformidad con cualquiera de las reivindicaciones 12-23, caracterizado además porque comprende proporcionar una salida de audio en respuesta al canal reconfigurado que es recibido al menos en una señal de audio.
MX2007015118A 2005-06-03 2006-05-26 Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion. MX2007015118A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US68710805P 2005-06-03 2005-06-03
US71183105P 2005-08-26 2005-08-26
PCT/US2006/020882 WO2006132857A2 (en) 2005-06-03 2006-05-26 Apparatus and method for encoding audio signals with decoding instructions

Publications (1)

Publication Number Publication Date
MX2007015118A true MX2007015118A (es) 2008-02-14

Family

ID=37498915

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2007015118A MX2007015118A (es) 2005-06-03 2006-05-26 Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.

Country Status (13)

Country Link
US (2) US20080033732A1 (es)
EP (1) EP1927102A2 (es)
JP (1) JP5191886B2 (es)
KR (1) KR101251426B1 (es)
CN (1) CN101228575B (es)
AU (1) AU2006255662B2 (es)
BR (1) BRPI0611505A2 (es)
CA (1) CA2610430C (es)
IL (1) IL187724A (es)
MX (1) MX2007015118A (es)
MY (1) MY149255A (es)
TW (1) TWI424754B (es)
WO (1) WO2006132857A2 (es)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
CA2992097C (en) 2004-03-01 2018-09-11 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
MX2007015118A (es) 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20080255857A1 (en) * 2005-09-14 2008-10-16 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US8411869B2 (en) * 2006-01-19 2013-04-02 Lg Electronics Inc. Method and apparatus for processing a media signal
US9426596B2 (en) * 2006-02-03 2016-08-23 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
KR100878816B1 (ko) * 2006-02-07 2009-01-14 엘지전자 주식회사 부호화/복호화 장치 및 방법
EP2000001B1 (en) * 2006-03-28 2011-12-21 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for a decoder for multi-channel surround sound
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US9697844B2 (en) * 2006-05-17 2017-07-04 Creative Technology Ltd Distributed spatial audio decoder
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP2084901B1 (en) 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
US9009032B2 (en) * 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
EP2092516A4 (en) 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
US8265941B2 (en) 2006-12-07 2012-09-11 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
KR101111520B1 (ko) 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
CN101578656A (zh) 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
CN101681625B (zh) 2007-06-08 2012-11-07 杜比实验室特许公司 用于从两个输入的音频信号获得两个环绕声音频通道的方法和设备
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
ES2739667T3 (es) * 2008-03-10 2020-02-03 Fraunhofer Ges Forschung Dispositivo y método para manipular una señal de audio que tiene un evento transitorio
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
US8509092B2 (en) * 2008-04-21 2013-08-13 Nec Corporation System, apparatus, method, and program for signal analysis control and signal control
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8315396B2 (en) 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
KR101392546B1 (ko) * 2008-09-11 2014-05-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
ES2385293T3 (es) * 2008-09-19 2012-07-20 Dolby Laboratories Licensing Corporation Procesamiento de señales ascendentes para dispositivos clientes en una red inalámbrica de células pequeñas
EP2329492A1 (en) * 2008-09-19 2011-06-08 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
CN102273233B (zh) 2008-12-18 2015-04-15 杜比实验室特许公司 音频通道空间转换
TWI449442B (zh) * 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統
EP2214162A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
JP5564803B2 (ja) * 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
EP2425426B1 (en) 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
FR2954570B1 (fr) * 2009-12-23 2012-06-08 Arkamys Procede de codage/decodage d'un flux numerique stereo ameliore et dispositif de codage/decodage associe
US9536529B2 (en) * 2010-01-06 2017-01-03 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
BR112013004362B1 (pt) 2010-08-25 2020-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
EP2523472A1 (en) * 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
WO2014104007A1 (ja) * 2012-12-28 2014-07-03 株式会社ニコン データ処理装置、およびデータ処理プログラム
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
EP2956935B1 (en) 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
KR20140117931A (ko) 2013-03-27 2014-10-08 삼성전자주식회사 오디오 디코딩 장치 및 방법
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
CN108806704B (zh) * 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
CN104982042B (zh) * 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
ES2653975T3 (es) 2013-07-22 2018-02-09 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de audio multicanal, codificador de audio multicanal, procedimientos, programa informático y representación de audio codificada mediante el uso de una decorrelación de señales de audio renderizadas
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR101841380B1 (ko) * 2014-01-13 2018-03-22 노키아 테크놀로지스 오와이 다중-채널 오디오 신호 분류기
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US11528574B2 (en) 2019-08-30 2022-12-13 Sonos, Inc. Sum-difference arrays for audio playback devices
US11373662B2 (en) * 2020-11-03 2022-06-28 Bose Corporation Audio system height channel up-mixing
US20220391899A1 (en) * 2021-06-04 2022-12-08 Philip Scott Lyren Providing Digital Media with Spatial Audio to the Blockchain

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4624009A (en) * 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
US4464784A (en) * 1981-04-30 1984-08-07 Eventide Clockworks, Inc. Pitch changer with glitch minimizer
US5040081A (en) * 1986-09-23 1991-08-13 Mccutchen David Audiovisual synchronization signal generator using audio signature comparison
US5055939A (en) 1987-12-15 1991-10-08 Karamon John J Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track
FR2641917B1 (fr) * 1988-12-28 1994-07-22 Alcatel Transmission Dispositif de diagnostic du canal de transmission pour modem numerique
AU8053691A (en) 1990-06-15 1992-01-07 Auris Corp. Method for eliminating the precedence effect in stereophonic sound systems and recording made with said method
US5235646A (en) * 1990-06-15 1993-08-10 Wilde Martin D Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby
WO1991019989A1 (en) 1990-06-21 1991-12-26 Reynolds Software, Inc. Method and apparatus for wave analysis and event recognition
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5175769A (en) 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
US5291557A (en) * 1992-10-13 1994-03-01 Dolby Laboratories Licensing Corporation Adaptive rematrixing of matrixed audio signals
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6430533B1 (en) * 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
US5796844A (en) * 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
JPH1074097A (ja) 1996-07-26 1998-03-17 Ind Technol Res Inst オーディオ信号のパラメータを変更する方法及び装置
US6049766A (en) 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
US5862228A (en) * 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6211919B1 (en) * 1997-03-28 2001-04-03 Tektronix, Inc. Transparent embedment of data in a video signal
JP2004507904A (ja) * 1997-09-05 2004-03-11 レキシコン 5−2−5マトリックス・エンコーダおよびデコーダ・システム
US6330672B1 (en) 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
TW444511B (en) * 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
US6624873B1 (en) * 1998-05-05 2003-09-23 Dolby Laboratories Licensing Corporation Matrix-encoded surround-sound channels in a discrete digital sound format
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
KR100898879B1 (ko) 2000-08-16 2009-05-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
MXPA03009357A (es) 2001-04-13 2004-02-18 Dolby Lab Licensing Corp Escalamiento en el tiempo y escalamiento en el tono de alta calidad de senales de audio.
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
EP1386312B1 (en) * 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
JP4272050B2 (ja) 2001-05-25 2009-06-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディトリーイベントに基づく特徴付けを使ったオーディオの比較
MXPA03010751A (es) 2001-05-25 2005-03-07 Dolby Lab Licensing Corp Segmentacion de senales de audio en eventos auditivos.
TW569551B (en) * 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
US20040037421A1 (en) * 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
ES2255678T3 (es) 2002-02-18 2006-07-01 Koninklijke Philips Electronics N.V. Codificacion de audio parametrica.
EP1500084B1 (en) * 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
EP1532734A4 (en) * 2002-06-05 2008-10-01 Sonic Focus Inc ACOUSTIC VIRTUAL REALITY ENGINE AND ADVANCED TECHNIQUES FOR IMPROVING THE DELIVERED SOUND
US7072726B2 (en) * 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
EP1523863A1 (en) * 2002-07-16 2005-04-20 Koninklijke Philips Electronics N.V. Audio coding
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
DE602004023917D1 (de) 2003-02-06 2009-12-17 Dolby Lab Licensing Corp Kontinuierliche audiodatensicherung
TWI329463B (en) * 2003-05-20 2010-08-21 Arc International Uk Ltd Enhanced delivery of audio signals
KR101164937B1 (ko) 2003-05-28 2012-07-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램
US20050058307A1 (en) * 2003-07-12 2005-03-17 Samsung Electronics Co., Ltd. Method and apparatus for constructing audio stream for mixing, and information storage medium
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CA2992097C (en) 2004-03-01 2018-09-11 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
TW200638335A (en) 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
DE602007011594D1 (de) 2006-04-27 2011-02-10 Dolby Lab Licensing Corp Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke
SG175632A1 (en) * 2006-10-16 2011-11-28 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US8255821B2 (en) * 2009-01-28 2012-08-28 Lg Electronics Inc. Method and an apparatus for decoding an audio signal

Also Published As

Publication number Publication date
IL187724A (en) 2015-03-31
US20080097750A1 (en) 2008-04-24
AU2006255662B2 (en) 2012-08-23
KR20080015886A (ko) 2008-02-20
KR101251426B1 (ko) 2013-04-05
CN101228575A (zh) 2008-07-23
US8280743B2 (en) 2012-10-02
CN101228575B (zh) 2012-09-26
US20080033732A1 (en) 2008-02-07
JP5191886B2 (ja) 2013-05-08
AU2006255662A1 (en) 2006-12-14
TW200715901A (en) 2007-04-16
TWI424754B (zh) 2014-01-21
BRPI0611505A2 (pt) 2010-09-08
MY149255A (en) 2013-07-31
WO2006132857A3 (en) 2007-05-24
CA2610430C (en) 2016-02-23
EP1927102A2 (en) 2008-06-04
IL187724A0 (en) 2008-08-07
WO2006132857A2 (en) 2006-12-14
CA2610430A1 (en) 2006-12-14
JP2008543227A (ja) 2008-11-27

Similar Documents

Publication Publication Date Title
CA2610430C (en) Channel reconfiguration with side information
US9093063B2 (en) Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
RU2407226C2 (ru) Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
RU2618383C2 (ru) Кодирование и декодирование аудиообъектов
CN103474077B (zh) 音频信号译码器、提供上混信号表示型态的方法
KR101221917B1 (ko) 오디오 신호 처리 방법 및 장치
AU2007300813B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
AU2005280041B2 (en) Multichannel decorrelation in spatial audio coding
EP2896221B1 (en) Apparatus and method for providing enhanced guided downmix capabilities for 3d audio
RU2659497C2 (ru) Управляемое модулем рендеринга пространственное повышающее микширование
CN111970629B (zh) 音频解码器和解码方法
CN101410889A (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
KR20100095541A (ko) 오디오 신호 처리 방법 및 장치
KR100917845B1 (ko) 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
CN101578656A (zh) 用于处理音频信号的装置和方法
MX2008011994A (es) Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.
Breebaart et al. 19th INTERNATIONAL CONGRESS ON ACOUSTICS MADRID, 2-7 SEPTEMBER 2007
MX2008010631A (es) Codificacion y decodificacion de audio

Legal Events

Date Code Title Description
FG Grant or registration