MXPA06008030A - Aparato y metodo para construir una senal de salida de multiples canales o para generar una senal de mezcla reductora. - Google Patents

Aparato y metodo para construir una senal de salida de multiples canales o para generar una senal de mezcla reductora.

Info

Publication number
MXPA06008030A
MXPA06008030A MXPA06008030A MXPA06008030A MXPA06008030A MX PA06008030 A MXPA06008030 A MX PA06008030A MX PA06008030 A MXPA06008030 A MX PA06008030A MX PA06008030 A MXPA06008030 A MX PA06008030A MX PA06008030 A MXPA06008030 A MX PA06008030A
Authority
MX
Mexico
Prior art keywords
channel
channels
original
signal
coherence
Prior art date
Application number
MXPA06008030A
Other languages
English (en)
Inventor
Jurgen Herre
Christof Faller
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34750329&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MXPA06008030(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MXPA06008030A publication Critical patent/MXPA06008030A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Radio Relay Systems (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Logic Circuits (AREA)

Abstract

El aparato para construir una senal de salida de multiples canales que utiliza una senal de alimentacion e informacion lateral parametrica, la senal de alimentacion incluye un primer canal de alimentacion y el segundo calan de alimentacion se deriva de una senal de multiples canales original, y la informacion lateral parametrica describe interrelaciones entre canales de la senal original de multiples canales utiliza canales base para sintetizar (324) primeros y segundos canales de salida en un lado de una posicion de oyente considerada, que son diferentes entres si. Los canales base son diferentes entre si debido a una medida de coherencia. La coherencia entre los canales base (por ejemplo el canal izquierdo y reconstruido multidireccional izquierdo) se reduce al calcular (322) un canal base para uno de sus canales por una combinacion de los canales de alimentacion, la combinacion se determina por la medida de coherencia, de esta manera, una calidad subjetiva alta de la reconstruccion puede obtenerse debido a la coherencia frontal/posterior original aproximada.

Description

APARATO Y MÉTODO PARA CONSTRUIR UNA SE AL DE SALIDA DE MÚLTIPLES CANALES O PARA GENERAR UNA SEÑAL DE MEZCLA REDUCTORA Campo de la Invención En la presente invención se refiere a un aparato-método para procesar una señal de audio de múltiples canales y en particular, un aparato y método para procesar una señal de audio de múltiples canales en una forma compatible en estéreo . Antecedentes de la Invención y Técnica Previa En los últimos tiempos, la técnica de reproducción de audio de múltiples canales, cada vez se está volviendo más importante . Esto puede deberse al hecho de que las técnicas de compresión de audio/codificación tales como la bien conocida técnica mp3, han hecho posible el distribuir grabaciones de audio por Internet u otros canales de transmisión que tienen un ancho de banda limitado. La técnica de codificación mp3 se ha vuelto muy famosa debido al hecho de que permite distribución de todas las grabaciones en un formato de estéreo, es decir una representación digital de la grabación de audio, incluyendo un canal de estéreo primero o izquierdo y un canal de estéreo derecho o segundo.
Sin embargo, hay desventajas básicas de sistemas de sonido de dos canales convencionales . Por un tanto, la técnica de sonido multidireccional se ha desarrollado. Una representación de sonido de múltiples canales recomendada incluye, además de los dos canales de estéreo L y , un canal central C y dos canales multidireccionales Ls, RB . Este formato de sonido de referencia también es referido como estéreo tres/dos, que significa tres canales frontales y dos canales multidireccionales . En general , se requieren cinco canales de transmisión. En un ambiente de reproducción, se requieren al menos cinco bocinas en los cinco diferentes sitios respectivos para obtener un punto óptimo a una cierta distancia desde los cinco altoparlantes bien colocados . Se conocen varias técnicas en la especialidad para reducir la cantidad de datos requeridos para transmisión de una señal de audio de múltiples canales. Estas técnicas se denominan técnicas conjuntas en estéreo. Para este fin, se hace referencia a la Fig. 10, que muestra un dispositivo de estéreo conjunto 60. Este dispositivo puede ser un dispositivo que implementa por ejemplo intensidad de estéreo (IS = intensity stereo) o codificación con monitreo binaural (BCC = binaural cue coding) . Este dispositivo generalmente recibe -como una alimentación- al menos dos canales (CH1, CH2 , ... CHn) , y envia de salida un solo canal portador y datos paramétricos . Los datos paramétricos se definen tal que, en un descodificador, una aproximación de un canal original (CH1, CH2 , ... CHn) pueda calcularse. Normalmente, el canal portador incluirá muestras de sub-banda, coeficientes espectrales, muestras de dominio y tiempo, etc., que proporcionan una representación comparativamente fina de la señal subyacente, mientras que los datos paramétricos no incluyen estas muestras de coeficientes espectrales sino incluyen parámetros de control para un cierto algoritmo de reconstrucción tales como ponderación por multiplicación, desplazamiento de tiempo, desplazamiento de frecuencia, ... Los datos paramétricos por lo tanto incluyen sólo una representación comparativamente burda de la señal o el canal asociado. Puesto en números, la cantidad de datos requerida por un canal portador estará en el intervalo de 60 - 70 kbits/s, mientras que la cantidad de datos requerida por información del lado paramétrico para un canal estará en el intervalo de 1.5 -2.5 kbits/s. un ejemplo de datos paramétricos son los bien conocidos factores de escala, información de intensidad estéreo o parámetros de monitoreo binaural como se describirá a continuación.
La codificación de intensidad se describe en AES preprint 3799, "Intensity Stereo Coding", J. Herré, K. H. Brandenburg, D. Lederer, febrero 1994, Amsterdam. En general, el concepto de intensidad de estéreo se basa en una transformada de eje principal aplicada a los datos de ambos canales de audio estereofónicos . Si la mayoría de los puntos de datos se concentran alrededor del primer eje principal, una ganancia de codificación puede lograrse al girar ambas señales en cierto ángulo antes de codificar. Esto sin embargo no es siempre cierto para técnicas de producción estereofónicas reales . Por lo tanto, esta técnica se modifica al excluir el segundo componente ortogonal de la transmisión en la corriente de bits. De esta manera, las señales reconstruidas para los canales izquierdo y derecho consisten de versiones de escala o ponderación diferente de la misma señal transmitida. Sin embargo, las señales reconstruidas difieren en su amplitud pero son idénticas respecto a su información de fase. Las envolventes de tiempo-energía de ambos canales de audio originales, sin embargo se preservan mediante la operación de ajuste en escala selectiva, que típicamente opera en una forma selectiva de frecuencia. Esto se adapta a la percepción humana del sonido a altas frecuencias, en donde las señales espaciales dominantes se determinan por envolventes de energía . Adicionalmente, en implementaciones prácticas, la señal transmitida, es decir, el canal portador se genera de la señal suma del canal izquierdo y el canal derecho en lugar de girar ambos componentes. Además, este procesamiento, es decir el generar parámetros de intensidad de estéreo para realizar la operación de ajuste de escala se realiza selectivo de frecuencia, es decir independientemente por cada banda de factor de escala, es decir partición de frecuencia de codificador. De preferencia, ambos canales se combinan para formar un canal "portador" o combinado, y además del canal combinado la información de intensidad estéreo se determina que depende de la energía del primer canal, la energía del segundo canal o la del canal portador o combinado . La técnica BCC se describe en el AES convention paper 5574, "Binaural cue coding applied to stereo and multi-channel audio compression" , C. Faller, F. Baumgarte, mayo 2002, Munich. En codificación BCC, una cantidad de canales de alimentación de audio se convierte a una representación espectral utilizando una transformada basad en DFT con ventanas superpuestas. El espectro uniforme resultante se divide en separaciones no superpuestas cada una que tiene un índice. Cada separación tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB = equivalent rectangular bandwidth) . Las diferencias de nivel inter-canal (ICLD = inter-channel level differences) y las diferencias de tiempo inter-canal (ICTD = inter-channel time differences) se estiman para cada partición por cada cuadro k. ICLD e ICTD se cuantifican y codifican resultando en una corriente de bits BCC. Las diferencias a nivel inter-canal y las diferencias en tiempo inter-canal se dan por cada canal respecto a un canal de referencia. Después, los parámetros se calculan de acuerdo con las fórmulas predeterminadas, que dependen de ciertas particiones de la señal a procesar. En el lado del descodificador, el descodificador recibe una señal mono y la corriente de bits BCC. La señal mono se transforma en el dominio de frecuencia y alimenta a un bloque de síntesis espacial que también recibe valores ICLD e ICTD descodificados . En el bloque de síntesis espacial, los valores de parámetros BCC (ICLD e ICTD) se emplean para realizar una operación de ponderación de la señal mono a fin de sintetizar las señales de múltiples canales, que después de una conversión de frecuencia-tiempo, representan una reconstrucción de la señal de audio de múltiples canales original . En el caso de BCC, el módulo de estéreo en conjunto 60, es operativo para enviar de salida a la información de lado de canal de manera tal que los datos de canal son parámetros ICLD o ICTD cuantificados y codificados, en donde uno de los canales originales se emplea como el canal de referencia para codificar la información del lado de canal. Normalmente, el canal portador se forma de la suma de los canales originales participantes . En forma natural, las técnicas anteriores sólo proporcionan una representación mono para un descodificador, que sólo puede procesar el canal portador, pero no es capaz de procesar los datos paramétricos, para generar una o más aproximaciones de más de un canal de alimentación. La técnica de codificación de audio conocida como codificación con monitoreo binaural (BCC) también se describe en las publicaciones de solicitud de patente de los E.U.A. número 2003, 0219130 Al, 2003/0026441 Al y 2003/0035553 Al. Referencia adicional también se hace "Binaural Cue Codíng. Part II: Schemes and Applications", C. Faller and F. Baumgarte, IEEE Trans. On Audio and Speech Proc., Vol. 11, No. 6, Nov. 2993. Las publicaciones de solicitud de patente de los E.U.A. citadas y las dos publicaciones técnicas citadas en la técnica BCC de autores Faller y Baumgarte, aquí se incorporan por referencia totalmente . A continuación, un esquema BCC genérico típico para codificación de audio de múltiples canales es elaborado con más detalle con referencia a las Figuras 11-13. La Fig. 11 muestra este esquema de codificación con monitoreo binaural genérico para codificar/transmitir señales de audio de múltiples canales . La señal de alimentación de audio de múltiples canales a una alimentación 110 de un codificador BCC 112 se somete a mezcla reductora y en un bloque de mezcla reductora 114. En el presente ejemplo, la señal de múltiples canales original en la alimentación 110 es una señal multidireccional de cinco canales que tienen un canal izquierdo frontal, un canal derecho frontal, un canal multidireccional izquierdo, un canal multidireccional derecho y un canal central . En una modalidad preferida de la presente invención, el bloque de mezcla reductora 114 produce una señal de suma por una simple adición de estos cinco canales en una señal mono. Otros esquemas de mezcla reductora se conocen en la técnica tal que, utilizando una señal de alimentación de múltiples canales, puede obtenerse una señal de mezcla reductora que tiene un solo canal . Este canal sencillo se envía de salida en una línea de señal de suma 115. Una información secundaria que se obtiene por un bloque de análisis BCC 116 se envía de salida en una línea de información lateral 117. En el bloque de análisis BCC, diferencias de nivel inter-canales (ICLD) y diferencias de tiempo inter-canales (ICTD) se calculan como se ha establecido anteriormente. Recientemente, el bloque de análisis BCC 116 se ha mejorado para también calcular los valores de correlación inter-canales (valores ICC) . La señal suma y la información secundaria se transmiten de preferencia en una forma cuantificada y codificada, a un descodificador BCC 120. El descodificador BCC descompone la señal suma transmitida en una cantidad de sub-bandas y la aplica a ajuste y escala, retrasos y otros procesamientos para generar las sub-bandas de las señales de audio de múltiples canales de salida. Este procesamiento se realiza de manera tal que los parámetros ICLD, ICTD e ICC (monitoreos) de una señal de múltiples canales reconstruida en una salida 121, son similares a los monitoreos respectivos para la señal de múltiples canales original en la alimentación 110 en el codificador BCC 112. Para este fin, el descodificador BCC 120 incluye un bloque de síntesis BCC 122 y un bloque de procesamiento de información secundaria 123.
A continuación, la construcción interna del bloque de síntesis se explica con referencia a la Fig. 12. La señal suma en la línea 115 se alimenta en una unidad de conversión de tiempo-frecuencia o banco de filtros FB 125. A la salida del bloque 125, existe un número N de señales de sub-banda o en un caso extremo, un bloque de coeficientes espectrales, cuando el banco de filtros de audio 125 realiza una transformada 1:1, es decir una transformada que produce N coeficientes espectrales a partir de N muestras de dominio de tiempo. El bloque de síntesis BCC 122 además comprende una etapa de retardo 126, una etapa de modificación de nivel 127, una etapa de procesamiento de correlación 128 y una etapa de banco de filtros inversos IFB 129. A la salida de la etapa 129, la señal de audio de múltiples canales reconstruida tiene por ejemplo cinco canales en caso de un sistema multidireccional de cinco canales, puede enviarse de salida a un conjunto de altoparlantes 124 como se ilustra en la Fig. 11. Como se muestra en la Fig. 12, la señal de alimentación s (n) se convierte al dominio de frecuencia o dominio de banco de filtros mediante el elemento 125. La salida de la señal por el elemento 125 se multiplica, de manera tal que varias versiones de la misma señal se obtienen como se ilustra por el nodo de multiplicación 130. El número de versiones de la señal original es igual al número de canales de salida en la señal de salida para reconstruirse. Cuando, en general cada versión de la señal original en el nodo 130 se somete a cierto retardo de dj_, d2, ..., di, ..., dN. Los parámetros de retardo se calculan por el bloque de procesamiento de información secundaria 123 en la Fig. 11 y se derivan de las diferencias de tiempo inter-canales como se determina por el bloque de análisis BCC 116. Lo mismo es cierto para los parámetros de multiplicación ax, a2, ..., a±, ..., aN, que también se calculan por el bloque de procesamiento de información secundaria 123 con base en las diferencias del tiempo inter-canales como se calcula por el bloque de análisis BCC 116. Los parámetros ICC calculados por el bloque de análisis BCC 116 se emplean para controlar la funcionalidad del bloque 128, de manera tal que ciertas correlaciones entre las señales retardadas y manipuladas en nivel se obtienen a las salidas del bloque 128. Habrá de notarse que el ordenamiento de las etapas 126, 127 y 128 puede ser diferente del caso mostrado en la Fig. 12. Habrá de notarse aquí que, en un procesamiento a manera de cuadro de una señal de audio, el análisis BCC se realiza a manera de cuadro, es decir variante en tiempo y también a manera de frecuencia. Esto significa que, para cada banda espectral, los parámetros BCC se obtienen. Esto significa que, en el caso de banco de filtros de audio 125 descompone la señal de alimentación por ejemplo en 32 señales de paso de banda, el bloque de análisis BCC obtiene un conjunto de parámetros BCC para cada una de las 32 bandas. En forma natural, el bloque de síntesis BCC 122 de la Fig. 11, que se muestra en detalle en la Fig. 12, realiza una reconstrucción que también se basa en las 32 bandas en el ejemplo. A continuación, se hace referencia a la Fig. 13 , que muestra una configuración para determinar ciertos parámetros BCC. Normalmente, los parámetros ICLD, ICTD e ICC pueden definirse entre pares de canales. Sin embargo, se prefiere determinar los parámetros ICLD e ICTD entre un canal de referencia y cada otro canal . Esto se ilustra en la Fig. 13A. Los parámetros ICC pueden definirse en formas diferentes. Más en general, se pueden estimar parámetros ICC en el codificador entre todos los pares de canales posibles como se indica en la Fig. 13B. En este caso, un descodificador sintetizará ICC tal que sea aproximadamente igual que en la señal de múltiples canales original entre todos los pares de canales posibles. Sin embargo, se propuso estimar sólo parámetros ICC entre los dos canales más fuertes cada vez. Este esquema se ilustra en la Fig. 13C, en donde se muestra un ejemplo, en donde en una instancia de tiempo, un parámetro ICC se estima entre los canales 1 y 2, y en otra instancia de tiempo, un parámetro ICC se calcula entre los canales 1 y 5. El descodificador sintetiza entonces la correlación inter-canales entre los canales más fuertes en el descodificador y aplica alguna regla eurística para calcular y sintetizar la coherencia inter-canales para los pares de canales restantes. Respecto al cálculo por ejemplo de los parámetros de multiplicación a.l t aN con base en los parámetros ICLD transmitidos, se hace referencia al documento AES convention paper 5574 anteriormente citado. Los parámetros ICLD representan una distribución de energía en una señal de múltiples canales original . Sin pérdida de generalidad, se muestra en la Fig. 13A que hay cuatro parámetros ICLD que muestran la diferencia en energía entre todos los otros canales y el canal izquierdo frontal. En el bloque de procesamiento de información lateral 123, los parámetros de multiplicación a^ ..., aN se derivan de los parámetros ICLD, de manera tal que la energía total de todos los canales de salida reconstruidos es la misma que (o proporcional a) la energía de la señal de suma transmitida. Una forma simple para determinar estos parámetros es un proceso de dos etapas, en donde en una primera etapa, el factor de multiplicación para el canal frontal izquierdo se ajusta a la unidad, mientras que factores de multiplicación para os otros canales en la Fig. 13A se ajustan para los valores ICLD transmitidos. Después, en una segunda etapa, la energía de todos los 5 canales se calcula y compara con la energía de la señal suma transmitida. Después, todos los canales se reducen en escala utilizando un factor de reducción a escala que es igual para todos los canales, en donde el factor de reducción a escala se elige de manera tal que la energía total de todos los canales de salida reconstruidos es, después de reducción a escala igual a la energía total de la señal de suma transmitida. Naturalmente, hay otros métodos para calcular los factores de multiplicación, que no se basan en el proceso de dos etapas sino que sólo requieren un proceso de una etapa. Independientemente de los parámetros de retardo, habrá de notarse que los parámetros de retardo ICTD, que se transmiten desde un codificador BCC, pueden emplearse directamente, cuando el parámetro de retardo dx para el canal frontal izquierdo se ajusta a cero. No tiene que realizarse reajuste en escala aquí, ya que un retardo no altera la energía de la señal . Respecto a la medida de coherencia inter- canales ICC transmitida desde el codificador BCC al descodificador BCC, habrá de notarse aquí que una manipulación de coherencia puede realizarse al modificar el factor de multiplicación a1; aN tal como al multiplicar los factores de ponderación de todas las sub-bandas con números aleatorios con valores entre 20logl0(-6) ' y 20logl0 (6) . La secuencia pseudo-aleatoria de preferencia se elige de manera tal que la variancia es aproximadamente constante para todas las bandas críticas, y el promedio es cero dentro de cada banda crítica. La misma secuencia se aplica a los coeficientes espectrales para cada cuadro diferente. De esta manera, el ancho de imagen de auditorio se controla al modificar la variancia de la secuencia pseudo-aleatoria. Una mayor variancia crea un ancho de imagen mayor . La modificación de variancia puede realizarse en bandas individuales, que son de un ancho de banda crítico. Esto permite la existencia simultánea de múltiples objetos en un escenario de auditorio, cada objeto tiene un ancho de imagen diferente. Una distribución de amplitud adecuada para la secuencia pseudo-aleatoria es una distribución uniforme en una escala logarítmica como se establece en la publicación de la solicitud de patente de los E.U.A. 2003/0219130 Al. Sin embargo, todo el procesamiento de síntesis BCC se relaciona a un solo canal de alimentación transmitido como la señal suma del codificador BCC al descodificador BCC como se muestra en la Fig. 11. Para transmitir los cinco canales en una forma compatible, es decir en un formato de corriente de bits, que también es comprensible para un descodificador de estéreo normal, la técnica así denominada de formación de matriz se ha empleado como se describe en "MUSICAM surround: a universal multi-channel coding system compatible with ISO 11172-3", G. Theile y G. Stoll, AES preprint 3403, octubre 1992, San Francisco. Los cinco canales de alimentación L, R, C, Rs y Ls se alimentan en un dispositivo de formación de matriz que realiza una operación de formación de matriz para calcular la base o canales de estéreo compatibles Lo, Ro a partir de los cinco canales de alimentación. En particular, estos canales de estéreo básicos Lo/Ro se calculan como se establece a continuación: Lo = L + xC + yLs Ro = R + xC + yRs x e y son constantes. Los otros tres canales C, Ls, Rs se transmiten como están en una capa de extensión, además de una capa de estéreo básica, se incluye una versión codificada de las señales de estéreo básicas Lo/Ro. Con respecto a la corriente de bits, esta capa de estéreo básica Lo/Ro incluye un cabezal, información tal como factores de escala y muestras de sub-banda. La capa de extensión de múltiples canales, es decir el canal central y los dos canales multidireccionales, se incluyen en el campo de extensión de múltiples canales, que también se denomina campo de datos auxiliar. En un lado del descodificado, la operación de formación de matriz inversa se realiza a fin de formar reconstrucciones de los canales izquierdo y derecho en la representación de cinco canales utilizando los canales de estéreo básicos Lo, Ro y los tres canales adicionales. Adicionalmente, los tres canales adicionales se descodifican de la información auxiliar a fin de obtener una representación multidireccional o de cinco canales descodificada de la señal de audio de múltiples canales original . Otro enfoque para codificación de múltiples canales se describe en la publicación "Improved MPEG-2 audio multi-channel encoding", B. Grill, J. Herré, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, AES preprint 3865, febrero 1994, Amsterdam, en donde para obtener compatibilidad hacia atrás, se consideran modos compatibles hacia atrás. Para este objetivo, una matriz de compatibilidad se utiliza para obtener dos canales de mezcla reductora así denominados Le, Rc a partir de los cinco canales de alimentación originales. Además, es posible seleccionar dinámicamente los tres canales auxiliares que se transmiten como datos auxiliares. A fin de explotar la irrelevancia en estéreo, la técnica en estéreo conjunto se aplica a grupos de canales, por ejemplo los tres canales frontales, es decir para el canal izquierdo, el canal derecho y el canal central. Para este objetivo, estos tres canales se combinan para obtener un canal combinado. Este canal combinado se cuantifica y empaca en la corriente de bits . Después, este canal combinado junto con la información estéreo conjunta correspondiente se alimenta en un módulo de descodificación en estéreo conjunto para obtener canales descodificados en estéreo conjuntos, es decir un canal izquierdo descodificado de estéreo conjunto, un canal derecho descodificado de estéreo conjunto y un canal central descodificado de estéreo conjunto. Estos canales descodificados de estéreo conjunto son, junto con el canal multidireccional izquierdo y la alimentación de canal multidireccional derecho en un bloque de matriz de compatibilidad para formar el primer y segundo canales de mezcla reductora Le, Rc . Después, versiones cuantificadas de ambos canales de mezcla reductora y una versión cuantificada del canal combinado, se empacan en la corriente de bits junto con los parámetros de codificación de estéreo conjuntos . Utilizando codificación de estéreo e intensidad, por lo tanto un grupo de señales de canal original independientes se transmite dentro de una sola porción de datos "portadores" . El descodificador entonces reconstruye las señales involucradas como datos idénticos, que se vuelven a ajustar en escala de acuerdo con sus envolventes de tiempo- nergía originales. Consecuentemente, una combinación lineal de los canales transmitidos llevará a resultados, que son bastante diferentes de la mezcla reductora original . Esto aplica a cualquier tipo de codificación de estéreo conjunta, con base en el concepto de intensidad en estéreo, para un sistema de codificación que proporciona canales de mezcla reductora compatible, hay una consecuencia directa: la reconstrucción por desmatrizado como se describe en la publicación previa, adolece de los artefactos provocados por la reconstrucción imperfecta. Utilizando un esquema de pre-distorsión en estéreo conjunto así denominado, en donde una codificación en estéreo conjunta de los canales izquierdo, derecho y central, se realiza antes de formación de matriz en el codificador, alivia este problema. De esta manera, el esquema de desmatrizado para reconstrucción, introduce menos artefactos ya que, en el lado del codificador, las señales descodificadas en estéreo conjuntas se han empleado para generar los canales de mezcla reductora. De esta manera, el proceso de reconstrucción imperfecta se desplaza a los canales de mezcla reductora compatible Le y Rc, en donde es mucho más probable que esté enmascarado por la propia señal de audio . Aunque este sistema ha resultado en menos artefactos debido a desmatrizado, en el lado descodificador, sin embargo tiene ciertas desventajas. Una desventaja es que los canales de mezcla reductora compatibles con estéreo Le y Rc no se derivan de los canales originales sino a partir de versiones codificada-descodificada en estéreo de intensidad de los canales originales. Por lo tanto, pérdidas de datos debido al sistema de codificación de estéreo de intensidad se incluyen en los canales de mezcla reductora compatible. Un descodificador sólo estéreo que sólo descodifica los canales compatibles en vez de los canales codificados en estéreo de intensidad mejorados, por lo tanto proporciona una señal de salida, que es aceptada por las pérdidas de datos inducidas por la intensidad de estéreo. Adicionalmente, un canal adicional completo tiene que transmitirse además de los dos canales de mezcla reductora. Este canal es el canal combinado, que se forma mediante una codificación en estéreo conjunta del canal izquierdo, el canal derecho y el canal central. Adicionalmente, la información de intensidad de estéreo para reconstruir los canales originales L, R, C del canal combinado también tiene que transmitirse al descodificador. En el descodificador, una formación de matriz inversa, es decir una operación de desmatrizado se realiza para derivar los canales multidireccionales a partir de los dos canales de mezcla reductora. Adicionalmente, los canales originales izquierdo, derecho y central son aproximados por descodificación conjunta de estéreo utilizando el canal combinado transmitido y los parámetros conjuntos de estéreo transmitidos. Habrá de notarse que los canales izquierdo, derecho y central originales se derivan por descodificación conjunta de estéreo del canal combinado . Se ha encontrado que, en el caso de técnicas de intensidad estéreo, cuando se utilizan en combinación con señales de múltiples canales, pueden producirse sólo señales de salida totalmente coherentes que se basan en el mismo canal base. En técnicas BCC, es bastante costoso el reducir la coherencia inter-canales en una señal de salida de múltiples canales reconstruida, ya que se requiere un generador de número pseudo-aleatorio para influenciar los sectores de ponderación. Adicionalmente, se ha mostrado que este tipo de procesamiento es problemático ya que artefactos debido a manipulación aleatoria de factores de multiplicación o factores de retardo de tiempo pueden introducirse, que pueden ser audibles bajo ciertas circunstancias y por lo tanto deterioran la calidad de la señal de salida de múltiples canales reconstruida. Compendio de la Invención Por lo tanto, un objeto de la presente invención es proporcionar un concepto para un procesamiento eficiente en bits y con artefactos reducidos o procesamiento inverso de una señal de audio de múltiples canales . De acuerdo con el primer aspecto de la presente invención, este objeto se logra por un aparato para construir una señal de salida de múltiples canales, utilizando una señal de alimentación e información lateral paramétrica, la señal de alimentación incluye un primer canal de alimentación y un segundo canal de alimentación derivado de una señal de múltiples canales original, la señal de múltiples canales original tiene una pluralidad de canales, la pluralidad de canales incluye al menos dos canales originales, que se definen como ubicados en un lado de una posición de oyente considerada, en donde un primer canal original es un primero de al menos dos canales originales, y en donde un segundo canal original es un segundo de al menos dos canales originales, y la información lateral paramétrica que describe interrelaciones entre canales originales de la señal original de múltiples canales, comprende: señal de múltiples canales original, medios para determinar un primer canal base al seleccionar uno del primer y segundo canales de alimentación o una combinación del primer y segundo canales de alimentación, y para determinar un segundo canal base por selección del otro del primer y segundo canales de alimentación o una combinación diferente del primer y segundo canales de alimentación, de manera tal que el segundo canal base es diferente del primer canal base; y medios para sintetizar un primer canal de salida utilizando la información lateral paramétrica y el primer canal base para obtener un primer canal de salida sintetizado que es una versión reproducida del primer canal original que se ubica en un lado de la ubicación del oyente considerada, y para sintetizar un segundo canal de salida utilizando la información lateral paramétrica y el segundo canal base, el segundo canal de salida es una versión reproducida del segundo canal original, que se ubica en el mismo lado de la posición del oyente considerada. De acuerdo con el segundo aspecto de la presente invención, este objeto se logra por un método de construir una señal de salida de múltiples canales utilizando una señal de alimentación e información lateral paramétrica, la señal de alimentación incluye un primer canal de alimentación y un segundo canal de alimentación derivado de una señal de múltiples canales original, la señal de múltiples canales original tiene una pluralidad de canales, la pluralidad de canales incluye al menos dos canales originales que se definen como ubicados en un lado de la posición del oyente considerada, en donde un primer canal original es un primero de los dos canales originales como mínimo, y en donde un segundo canal original es un segundo de los dos canales originales como mínimo, y la información lateral paramétrica que describe interrelaciones entre canales originales de la señal original de múltiples canales comprende: determinar un primer canal base al seleccionar uno del primero y el segundo canales de alimentación o una combinación del primer y segundo canales de alimentación y determinar un segundo canal base al seleccionar el otro del primer y segundo canales de alimentación o una combinación diferente del primer y segundo canales de alimentación, de manera tal que el segundo canal base es diferente del primer canal base; y sintetizar un primer canal de salida utilizando la información lateral paramétrica y el primer canal base para obtener un primer canal de salida sintetizado que es una versión reproducida del primer canal original que se ubica en un lado de la posición del oyente considerada, y sintetizar un segundo canal de salida utilizando la información lateral paramétrica y el segundo canal base, el segundo canal de salida es una versión reproducida del segundo canal original que se ubica en el mismo lado de la posición del oyente considerada. De acuerdo con el tercer aspecto de la presente invención, este objeto se logra con aparato para generar una señal de mezcla reductora a partir de una señal original de múltiples canales, la siguiente mezcla reductora tiene una cantidad de canales mas pequeños que un numero de canales originales, comprende: medios para calcular un primer canal de mezcla reductora y un segundo canal de mezcla reductora utilizando una regla de mezcla reductora; medidas para calcular información de nivel paramétrico que representa una distribución de energía entre los canales en la señal original de múltiples canales; medidas para determinar una medida de coherencia entre dos canales originales, los dos canales originales están ubicados a un lado de una posición de oyente considerada; y medios para formar la señal de salida que utilizan el primer y segundo canales de mezcla reductora, la información de nivel paramétrico y solo al menos una medida de coherencia entre los dos canales originales ubicados en un lado de un valor derivado de al menos de una medida de coherencia pero que no utilizan ninguna medida de coherencia entre canales ubicados en diferentes lados de la posición del oyente considerada. De acuerdo con un cuarto aspecto de la presente invención, este objeto se logra por un método para generar una señal de mezcla reductora a partir de una señal original de múltiples canales, la señal de mezcla reductora tiene una cantidad de canales que son más pequeños que una cantidad canales originales, comprende: calcular un primer canal de mezcla reductora y un segundo canal de mezcla reductora utilizando una regla de mezcla reductora; calcular información de nivel paramétrico que representa una distribución de energía entre dos canales en la señal original de múltiples canales; determinar una medida de coherencia entre dos canales originales, los dos canales originales se ubican a un lado de una posición de oyente considerada; y formar una señal de salida utilizando el primer y segundos canales de mezcla reductora, la información de nivel paramétrico y solo al menos una medida de coherencia entre dos canales originales ubicados a un lado o un valor derivado de al menos una medida de coherencia, pero no usando ninguna medida de coherencia entre canales ubicados en diferentes lados de la posición del oyente considerada. De acuerdo con un quinto aspecto y un sexto aspecto de la presente invención, este objeto se logra por un programa de computadora que incluye el método para construir la señal de salida en múltiples canales o el método para generar una señal de mezcla reductora. La presente invención se basa en el hallazgo de que una reconstrucción eficiente y reducida de artefactos de una señal de salida de múltiples canales se obtiene, en donde hay dos o más canales, que pueden transmitirse de un codificador a un decodificador, en donde los canales de preferencia son un canal estéreo izquierdo y uno derecho muestran un cierto grado de incoherencia. Esto normalmente será el caso ya que los canales estéreo izquierdo y derecho o los canales estéreo compatibles izquierdo y derecho se obtienen por mezcla reductora de una señal de múltiples canales usualmente mostrará un cierto grado de incoherencia, es decir no será totalmente coherente o totalmente correlacionados . De acuerdo con la presente invención, los canales de salida reconstruidos de la señal de salida de múltiples canales están des-correlacionados entre sí al determinar diferentes canales base para los diferentes canales de salida, en donde los diferentes canales base se obtienen al utilizar diversos grados de canales transmitidos no correlacionados . En otras palabras, un canal de salida reconstruido que tiene por ejemplo el canal de alimentación transmitido izquierdo como un canal base sería - en el dominio de sub-banda BCC- totalmente correlacionado con otro canal de salida reconstruido que tiene el mismo por ejemplo canal izquierdo que el canal base considerando que no hay "síntesis de correlación extra" . En este contexto, abra de notarse que el ajuste de nivel y retardo determinísticos no reducen coherencia entre estos canales. De acuerdo con la presente invención, la coherencia entre estos canales, que es 100% en el ejemplo anterior, se reduce a un cierto grado de coherencia o medida de coherencia al utilizar un primer canal base para construir el primer canal de salida y para utilizar un segundo canal base para construir el segundo canal de salida, en donde el primer y segundo canales base tienen diferentes "porciones" de los dos canales transmitidos (des-correlacionados) . Esto significa que el primer canal base se influencia mas fuerte que por el primer transmitido o incluso idéntico con el primer canal transmitido, en comparación con el segundo canal base que se influencia menos por el primer canal, es decir mas influenciado por el segundo canal transmitido. De acuerdo con la presente invención, des-correlación inherente entre los canales transmitidos se utiliza para proporcionar canales des-correlacionados en una señal de salida de múltiples canales. En una modalidad preferida, una medida de coherencia entre pares de canales respectivos tales como multidireccional izquierdo e izquierdo frontal o multidireccional derecho y derecho frontal, se determina en un codificador en una forma dependiente de tiempo y dependiente de frecuencia y transmite como información lateral, a un descodificador de la invención tal que una determinación dinámica de canales base y por lo tanto, una manipulación dinámica de coherencia entre los canales de salida reconstruidos puede obtenerse . En comparación con el caso de la técnica previa anteriormente mencionado, en donde se transmite solo una señal ICC para los dos canales mas fuertes, el sistema de la invención es mas fácil de controlar y proporciona una mejor reconstrucción de calidad, ya que no es necesaria determinación de los canales mas fuertes en un codificador o decodificador, ya que la medida de coherencia de la invención siempre se relaciona al mismo par de canales independientemente del hecho, si este par de canales incluye los canales más fuertes o no . Calidad superior en comparación con los sistemas de la técnica previa se obtiene ya que dos canales de mezcla reducida se transmiten desde un codificador a un descodificador, de manera tal que la relación de coherencia izquierda/derecha se transmite automáticamente de modo tal que no se requiere información extra en una coherencia izquierda/derecha. Una ventaja adicional de la presente invención tiene que verse en el hecho de que una carga de trabajo de cómputo del lado del decodificador puede reducirse puesto que la carga de procesamiento de des-correlación normal puede reducirse o incluso ser eliminada completamente. De preferencia, información del lado de canal paramétrica para uno o más de los canales originales se deriva de manera tal que se relaciona con uno de los canales de mezcla reductora en vez de, como en la técnica previa, a un canal en estéreo como punto "combinado" adicional . Esto significa que la información de lado de canal paramétrico se calcula de manera tal que, en el lado del descodificador, un reconstructor de canal utiliza la información de lado de canal y uno de los canales de mezcla reductora o una combinación de los canales de mezcla reductora para reconstruir una aproximación del canal de audio original al cual se asigna la información de lado de canal. Este concepto es ventajoso ya que proporciona una extensión de múltiples canales eficiente en bits, de manera tal que una señal de audio de múltiples canales pueda reproducirse en un descodificador. Adicionalmente, el concepto es compatible hacia atrás, ya que un descodificador de escala menor que solo se adapta para procesamiento de los canales, puede ignorar simplemente la información de extensión, es decir la información del lado del canal . El descodificador de escala inferior solo puede reproducir los dos canales de mezcla reductora para obtener una representación de estéreo de la señal de audio de múltiples canales original . Un descodificador de escala superior sin embargo, que es activado para procesamiento de múltiples canales, puede utilizar la información de lado de canal transmitida para reconstruir aproximaciones de los canales originales. La presente modalidad es ventajosa ya que es eficiente en bits, puesto que en contraste con la técnica previa no se requiere canal portador adicional más allá del primer y segundo canal de mezcla reductora, Le, Rc . Por el contrario, la información de lado de canal se relaciona con uno o ambos canales de mezcla reductora. Esto significa que los canales de mezcla reductora misma sirven como un canal portador, al cual la información de lado de canal se combina para reconstruir un canal de audio original. Esto significa que la información de lado de canal de preferencia es información lateral paramétrica, es decir información que no incluye ningunas muestras de sub-banda o coeficientes espectrales. Por el contrario, la información lateral paramétrica es información empleada para ponderar (en tiempo y/o frecuencia) el canal de mezcla reductora respectivo o la combinación los canales de mezcla reductora respectivos para obtener una versión reconstruida de un canal original selecto. En una modalidad preferida de la presente invención, una codificación compatible hacia atrás de una señal de múltiples canales basada en una señal estéreo compatible, se obtiene. De preferencia, la señal de estéreo compatible (señal de mezcla reductora) se genera utilizando matrizado de los canales originales de señales de audio de múltiples canales . De preferencia, la información de lado de canal para un canal original selecto se obtiene con base en técnicas de estero conjuntas tales como codificación de intensidad de estéreo o codificación con monitoreo binaural. De esta manera, en el lado del descodificador, no tiene que realizarse operación de desmatrizado. Los problemas asociados con desmatrizado, es decir ciertos artefactos relacionados a una distribución indeseable de ruido de cuantificación en operaciones de desmatrizado, se evitan. Esto se debe al hecho de que el descodificador utiliza un reconstructor de canal, que reconstruye una señal original al utilizar uno de los canales de mezcla reductora o una combinación de los canales de mezcla reductora y la información de lado de canal transmitida. De preferencia, el concepto inventivo se aplica a una señal de audio de múltiples canales que tienen cinco canales . Estos cinco canales son un canal izquierdo L, un canal derecho R, un canal central C, un canal multidireccional izquierdo Ls, y un canal multidireccional derecho Rs . De preferencia, canales de mezcla reductoras son canales de mezcla reductoras compatibles en estéreo Ls y Rs, que proporcionan una representación en estéreo de la señal de audio de múltiples canales original . De acuerdo con la modalidad preferida en la presente invención, por cada canal original, información del lado del canal se calcula en el lado del codificador empacada en los datos de salida. Información de lado de canal para el canal izquierdo original se deriva utilizando el canal de mezcla reductora izquierdo. Información de lado de canal para el canal multidireccional izquierdo original se deriva utilizando el canal de mezcla reductora izquierda. Información de lado de canal para el canal derecho original se deriva del canal de mezcla reductora derecho . Información de lado de canal para el canal multidireccional derecho original se deriva del canal de mezcla reductora derecho. De acuerdo con la modalidad preferida de la presente invención, información de canal para el canal central original se deriva utilizando el primer canal de mezcla reductora así como el segundo canal de mezcla reductora, es decir utilizando una combinación de los dos canales de mezcla reductora. De preferencia, esta combinación es una suma. De esta manera, los agrupamientos, es decir la relación entre la información de lado de canal y la señal portadora, es decir el canal de mezcla reductora empleado para proporcionar información lateral de canal para un canal original selecto son tales que, para calidad óptima, se elige un cierto canal de mezcla reductora, que contiene la cantidad relativa mas alta posible de la señal de múltiples canales original respectiva que se representa mediante información de lado de canal . Como tal, una señal portadora en estéreo conjunta, el primer y segundo canales de mezcla reductora se emplean. De preferencia, también puede emplearse la suma del primer y segundo canales de mezcla reductora. Naturalmente, la suma del primer y segundo canales de mezcla reductoras puede utilizarse para calcular la información de lado de canal para cada uno de los canales originales . De preferencia, sin embargo la suma de los canales de mezcla reductora se utiliza para calcular la información de lado de canal del canal central original en un ambiente multidireccional, tal como multidireccional de cinco canales, multidireccional de siete canales, multidireccional 5.1 o multidireccional 7.1. Utilizar la suma del primer y segundo canales de mezcla reductora es especialmente ventajoso, ya que no tiene que realizarse encabezados de transmisión adicionales. Esto se debe al hecho de que ambos canales de mezcla reductora están presentes en el decodificador, de manera tal que la suma de estos canales de mezcla reductora puede realizarse fácilmente en el decodificador sin requerir ningunos bits de transmisión adicionales. De preferencia, la información del lado de canal que forma la extensión de múltiples canales se alimenta a la corriente de bits de datos de salida en una forma compatible, de manera tal que un descodificador de escala menor simplemente ignora los datos de extensión de múltiples canales y solo proporciona una representación de estéreo de la señal de audio de múltiples canales. Sin embargo, un codificador de escala superior no solo utiliza dos canales de mezcla reductora, si no que además, emplea la información de lado de canal para reconstruir una representación de múltiples canales completa de la señal de audio original. Breve Descripción de los Dibujos Modalidades preferidas de la presente invención se describen subsecuentemente por referencia a los dibuj os anexos , en donde : La Figura 1A es un diagrama de bloques de una modalidad preferida del codificador de la invención; La Figura IB es un diagrama de bloques de un codificador de la invención para proporcionar una medida de coherencia para pares de canales de alimentación respectivos .
La Figura 2A es un diagrama de bloques de una modalidad preferida del descodificador de la invención; La Figura 2B es un diagrama de bloques de un descodificador de la invención que tiene diferentes canales base para diferentes canales de salida; La Figura 2C es un diagrama de bloques de una modalidad preferida de los medios para síntesis de la Figura 2B; La Figura 2D es un diagrama de bloques de una modalidad preferida del aparato mostrado en la Figura 2C para un sistema multi-direccional de 5 canales; La Figura 2E es una representación esquemática de medios para determinar una medida de coherencia en un codificador de la invención; La Figura 2F es una representación esquemática de un ejemplo preferido para determinar un factor de ponderación para calcular un canal base que tiene una cierta medida de coherencia respecto a otro canal base; La Figura 2G es un diagrama esquemático de una forma preferida para obtener un canal de salida reconstruido con base en un cierto factor de ponderación calculado por el esquema mostrado en la Figura 2F; La Figura 3A es un diagrama de bloques para una implementación preferida de los medios para calcular a fin de obtener la información lateral de canal selectiva de frecuencia; La Figura 3B es una modalidad preferida de un calculador que implementa procesamiento de estéreo conjunto tal que como codificación de intensidad o codificación de monitoreo binaural; La Figura 4 ilustra otra modalidad preferida de los medios para calcular información lateral de canal, en donde la información lateral de canal son factores de ganancia; La Figura 5 ilustra una modalidad preferida de una implementación del descodificador, cuando el codificador se implementa como en la Figura 4; La Figura 6 ilustra una implementación preferida de los medios para proporcionar los canales de mezcla reductora; La Figura 7 ilustra agrupamientos de canales originales y de mezcla reductora para calcular la información lateral de canal para los canales originales respectivos; La Figura 8 ilustra otra modalidad preferida de un codificador de la invención; La Figura 9 ilustra otra implementación de un descodificador de la invención; y La Figura 10 ilustra un codificador de estéreo en conjunto de la técnica previa. La Figura 11 es un diagrama de bloques que representa una cadena de descodificador/codificador BCC de la técnica previa; La Figura 12 es un diagrama de bloques de una implementación de la técnica previa de un bloque de síntesis BCC de la Figura 11; La Figura 13 es una representación de un esquema bien conocido para determinar parámetros ICLD, ICTD e ICC; La Figura 14A es una representación esquemática del esquema para atribuir diferentes canales base para la reproducción de diferentes canales de salida; La Figura 14B es una representación de los pares de canal necesarios para determinar parámetros ICC e ICTD; La Figura 15A es una representación esquemática de una primera selección de canales base para construir una señal de salida de 5 canales; y La Figura 15B es una representación esquemática de una segunda selección de canales base para construir una señal de salida de 5 canales. Descripción Detallada de Modalidades Preferidas La Figura 1A muestra un aparato para procesar una señal de audio de múltiples canales 10 que tiene al menos tres canales originales tales como R, L y C. De preferencia, la señal de audio original tiene más de tres canales, tales como cinco canales en el ambiente multidireccional, que se ilustran en la Figura 1A. Los cinco canales son el canal izquierdo L, el canal derecho R, el canal central C, el canal multi-direccional izquierdo Ls y el canal multi-direccional derecho Rs . El aparato de la invención incluye medios 12 para proporcionar un primer canal de mezcla reductora Le y un segundo canal de mezcla reductora Rc, el primer y segundo canales de mezcla reductora se derivan de los canales originales. Para derivar los canales de mezcla reductora de los canales originales, existen varias posibilidades. Una posibilidad es derivar los canales de mezcla reductora Le y Rc mediante matrizado de los canales originales utilizando una operación de matrizado como se ilustra en la Figura 6. Esta operación de matrizado se realiza en el dominio de tiempo. Los parámetros de matrizado a, b y t se eligen de manera tal que son menores que o igual a l. De preferencia, a y b son 0.7 o 0.5. El parámetro de ponderación total t de preferencia se elige de modo tal que se evita recorte de canal .
En forma alterna, como se indica en la Figura 1A, los canales de mezcla reductora Le y Rc también pueden suministrarse externamente. Esto puede efectuarse, cuando los canales de mezcla reductora Le y Rc son el resultado de una operación de "mezclado a mano" . En este escenario, un ingeniero de sonido mezcla los canales de mezcla reductora por sí mismo en vez de utilizar una operación de matrizado automatizada. El ingeniero de sonido realiza mezclado creativo para obtener canales de mezcla reductora optimizados Le y Rc que dan la mejor representación de estéreo posible de la señal de audio de múltiples canales original . En caso de un suministro externo de los canales de mezcla reductora, los medios para proporcionar no realizan una operación de matrizado sino simplemente envían los canales de mezcla reductora suministrados externamente a un medio de cálculo subsecuente 14. Los medios de cálculo 14 son operativos para calcular la información de lado de canal tal como li, lSi, r? o rSi, para canales originales selectos tales como L, Ls, R o Rs, respectivamente. En particular, los medios 14 para cálculo son operativos para calcular la información de lado de canal tal como un canal de mezcla reductora, cuando se ponderan utilizando la información de lado de canal, resulta en una aproximación del canal original selecto. En forma alterna o adicional, los medios para calcular la información del lado de canal son operativos adicionalmente para calcular la información de lado de canal para un canal original selecto, de manera tal que un canal de mezcla reductora combinado incluye una combinación del primer y segundo canales de mezcla reductora, cuando se ponderan utilizando la información de lado de canal calculado, resultando en una aproximación del canal original selecto. Para mostrar esta característica en la figura, un sumador 14a y un calculador de información de lado de canal combinado 14b se ilustran. Es claro para aquellos con destreza en la técnica que estos elementos no tienen que ser implementados como elementos distintos. Por el contrario, toda la funcionalidad de los bloques 14, 14a y 14b puede implementarse mediante un cierto procesador que puede ser un procesador de propósitos generales o cualquier otro medio para realizar la funcionalidad requerida. Adicionalmente, habrá de notarse aquí que las señales de canal son muestras de sub-banda o valores de dominio de frecuencia se indican con mayúsculas .
Información de lado de canal, en contraste con los propios canales indicada por minúsculas . La información de lado de canal Ci por lo tanto es la información de lado de canal para el canal central original C. La información de lado de canal así como los canales de- mezcla reductora Le y Rc o una versión codificada Le' y Rc' como se produce por un codificador de audio 16 se alimentan en un formateador de datos de salida 18. En general, el formateador de datos de salida 18 actúa como medios para generar datos de salida, los datos de salida incluyen la información de lado de canal para al menos un canal original , el primer canal de mezcla reductora o una señal derivada del primer canal de mezcla reductora (tal como su versión codificada) y el segundo canal de mezcla reductora o una señal derivada del segundo canal de mezcla reductora (tal como su versión codificada) . Los datos de salida o la corriente bis de salida 20 luego pueden transmitirse a un descodificador de corriente de bits o puede almacenarse o distribuirse. De preferencia, la salida de corriente bis 20 es una corriente bis compatible que también puede leerse por un descodificador de escala inferior que no tiene capacidad de extensión de múltiples canales . Estos codificadores de escala menor tales como descodificadores mp3 del estado de la técnica normales más existentes, simplemente ignorarán los datos de extensión de múltiples canales, es decir información lateral de canal . Solo descodificarán el primer y segundo canales de mezcla reductora para producir una salida de estéreo. Descodificadores de escala superior, tales como descodificadores activados para múltiples canales leerán la información lateral de canal y generarán una aproximación de los canales de audio originales tales que se obtenga una impresión de audio de múltiples canales . La Figura 8 muestra una modalidad preferida de la presente invención en el ambiente multi-direccional de cinco canales/mp3. Aquí, se prefiere escribir los datos de mejora multi-direccional en el campo de datos auxiliar en la sintaxis de corriente bits mp3 estandardizada tal que se obtenga una corriente de bit "mp3 multidireccional" . La Figura IB ilustra una representación más detallada del elemento 14 en la Figura 1A. En una modalidad preferida de la presente invención, un calculador 14 incluye medios 141 para calcular información de nivel paramétrico que representa una distribución de energía entre los canales en la señal original de múltiples canales mostrada en 10 en la Figura 1A. El elemento 141 por lo tanto es capaz de generar información de nivel de salida para todos los canales originales. En una modalidad preferida, esta información de nivel incluye parámetros ICLD obtenidos por síntesis BCC regular como se ha descrito en conexión con las Figuras 10 a 13. El elemento 14 además comprende medios 142 para determinar una medida de coherencia entre dos canales originales ubicados en un lado de la posición del oyente considerada. En caso del ejemplo multi-direccional de 5 canales mostrada en la Figura 1A, este par de canales incluye el canal derecho R y el canal multi-direccional derecho Rs o en forma alterna o adicionalmente el canal izquierdo L y el canal multi-direccional izquierdo Ls . El elemento 14 en forma alterna además comprende medios 143 para calcular la diferencia en tiempo para este par de canales, por ejemplo un par de canales que tiene canales ubicados en un lado de la posición de oyente considerada. El formateador de datos de salida 18 de la Figura 1A es operativo para alimentar en la corriente de datos en 20, la información de nivel que representa una distribución de energía entre los canales en la señal original de múltiples canales y una medida de coherencia solo para el par de canales izquierdo y multi-direccional izquierdo y derecho y/o el par de canales derecho y multi-direccional derecho. El formateador de datos de salida, sin embargo es operativo para no incluir cualesquiera otras medidas de coherencia u opcionalmente diferencias en tiempo en la señal de salida de manera tal que la cantidad de información lateral se reduce en comparación con el esquema de la técnica previa, en donde monitoreos ICC para todos los pares de canales posibles se transmiten. Para ilustrar el codificador de la invención como se muestra en la Figura IB con más detalle, se hace referencia a la Figura 14A y la Figura 14B . En la Figura 14A, un arreglo de las bocinas de canal para un sistema de 5 canales ejemplar, se da con respecto a una posición de oyente considerada, que se ubica en el punto central de un círculo en el cual se colocan las bocinas respectivas. Como se estableció anteriormente, el sistema de 5 canales incluye un canal multi-direccional izquierdo, un canal izquierdo, un canal central, un canal derecho y un canal multi-direccional derecho. De manera natural, este sistema también puede incluir un canal de altavoz de graves, que no se ilustra en la Figura 14. Habrá de notarse aquí que el canal multidireccional izquierdo también puede denominarse un "canal izquierdo posterior" . Lo mismo es cierto para el canal multi-direccional derecho. Este canal también se conoce como el canal derecho posterior. En contraste con el estado de la técnica BBC con un canal de transmisión, en donde el mismo canal base, es decir la señal mono transmitida como se muestra en la Figura 11, se utiliza para generar cada uno de los N canales de salida, el sistema de la invención utiliza, como un canal base, uno de los N canales transmitidos o una combinación lineal de los mismos como el canal base para cada uno de los N canales de salida. Por lo tanto, la Figura 14 muestra un esquema NaM, es decir un esquema en el que N canales originales se someten a mezcla reductora a dos canales de mezcla reductora. En el ejemplo de la Figura 14, N es igual a 5 mientras que M es igual a 2. En particular, para la reconstrucción de canal izquierdo frontal, el canal izquierdo Lc transmitido, se emplea. En forma análoga, para la reconstrucción de canal derecho frontal, el segundo canal transmitido Rc se utiliza como el canal base. En forma adicional, una combinación igual de Lc y Rc se emplea como el canal base para reconstruir el canal central . De acuerdo con una modalidad de la presente invención, medidas de correlación se transmiten adicionalmente de un codificador a un descodificador. Por lo tanto, para el canal multi-direccional izquierdo, no solo el canal izquierdo transmitido Lc se emplea sino el canal transmitido Lc + alf j^ Rc de manera tal que el canal base para reconstruir el canal multi-direccional izquierdo no es completamente coherente con el canal base para reconstruir el canal izquierdo frontal. En forma análoga, él mismo procedimiento se realiza para el lado derecho (con respecto a la posición del oyente considerada) , ya que el canal base para reconstruir el canal multi-direccional derecho es diferente del canal base para reconstruir el canal derecho frontal, en donde la diferencia depende de la medida de coherencia alfa2 que de preferencia se transmite desde un codificador a un descodificador con información lateral. El proceso de la invención por lo tanto es único ya que para reproducción de preferencia cada canal de salida, se utiliza un canal base diferente, en donde los canales base son iguales a los canales transmitidos o una combinación lineal de los mismos. Esta combinación lineal puede depender de los canales base transmitidos en diversos grados, en donde estos grados dependen de medidas de coherencia que dependen de la señal de múltiples canales original. El proceso de obtener los N canales base dados los M canales transmitidos, se denomina "mezclado superior" . Este mezclado superior puede implementarse al multiplicar un vector con los canales transmitidos por una matriz NxM para generar N canales base. Al hacerlo, combinaciones lineales de canales de señal transmitidos se forman para producir señales base para las señales de canal de salida. Un ejemplo específico para mezclado superior se muestra en la Figura 14A, que es un esquema 5 a 2, aplicado para generar un señal de salida multidireccional de 5 canales con una transmisión estéreo de 2 canales. De preferencia, el canal base para un canal de salida de altavoz de graves adicional es el mismo que el canal central L+R. En una modalidad preferida de la presente invención, se proporciona una medida de coherencia variante con el tiempo y - opcionalmente -variante con frecuencia, de manera tal que una matriz de mezclado superior adaptativa con el tiempo, que es -opcional - también selectiva de frecuencia, se obtiene. A continuación, se hace referencia a la Figura 14B que muestra un antecedente para una implementación de codificador de la invención ilustrado en la Figura IB. En este contexto, habrá de notarse que monitoreos ICC e ICTD entre izquierdo y derecho y multi-direccional izquierdo y multi-direccional derecho, son los mismos que en la señal estéreo transmitida. De esta manera, de acuerdo con la presente invención, no hay necesidad por utilizar monitoreo ICC e ICTD entre izquierdo y derecho y multi-direccional izquierdo y multi-direccional derecho, para sintetizar o reconstruir una señal de salida. Otra razón para no sintetizar monitoreos ICC e ICTD entre izquierdo y derecho y multi-direccional izquierdo y multi-direccional derecho es el objetivo general que establece que los canales base tienen que ser modificados lo menos posible para mantener calidad de señal máxima. Cualquier modificación de señal introduce potencialmente artefactos o no - naturalidad. Por lo tanto, solo una representación de nivel de la señal de múltiples canales originales que se obtiene al proporcionar los monitoreos ICLD se proporciona, mientras que de acuerdo con la presente invención, parámetros ICC e ICTD son solo calculados y transmitidos para pares de canales a un lado de la posición de oyente considerada. Esto se ilustra por la línea punteada 144 para el lado izquierdo y la línea punteada 145 para el lado derecho en la Figura 14B . En contraste con ICC e ICTD, síntesis ICLD es más bien no problemática con respecto a artefactos y no naturalidad, debido a que solo involucra ajuste en escala de señales sub-banda. De esta manera, ICLDs se sintetizan generalmente como el BCC regular, es decir entre un canal de referencia y todos los otros canales . Hablando más en general, en un esquema N 2 M, ICLDs se sintetizan entre pares de canales similares a BCC regular. Señales ICC e ICTD, sin embargo de acuerdo con la presente invención solo se sintetizan entre pares de canales que estarán en el mismo lado respecto a la posición de oyente considerada, es decir para el par de canales incluyendo el canal izquierdo frontal y multidireccional izquierdo o el par de canales incluyendo el frontal derecho y el canal multi-direccional derecho. En el caso de sistemas multi-direccionales de 7 canales superiores, en donde hay tres canales, en el lado izquierdo y tres canales en el lado derecho, puede aplicarse el mismo esquema, en donde solo para pares de canales posibles en el lado izquierdo o el lado derecho, se transmiten parámetros de coherencia para proporcionar diferentes canales base para la reconstrucción de los diferentes canales de salida en un lado de la posición del oyente considerada. El codificador NaM de la invención como se muestra en la Figura 1A y Figura IB, por lo tanto es único ya que las señales de alimentación se someten a mezcla reductora no en un solo canal único sino en M canales, y que monitoreos ICTD e ICC se estiman y transmiten solo entre los pares de canales para los cuales es necesario. En un sistema multi-direccional de 5 canales, la situación se muestra en la Figura 14B de lo cual queda claro que al menos una medida de coherencia entre el multi-direccional izquierdo y derecho tienen que transmitirse . Esta medida de coherencia también puede emplearse para proporcionar descorrelación entre multi-direccional derecho y derecho. Esta es una implementación de información de lado bajo. En caso de que se tiene más capacidad de canal disponible, también se puede generar y transmitir una medida de coherencia separada entre el canal derecho y multi-direccional derecho, de manera tal que en un descodificador de la invención, pueden obtenerse también diferentes grados de descorrelación en el lado izquierdo y en el lado derecho. La Figura 2A muestra una ilustración de un descodificador de la invención que actúa como un aparato para procesamiento inverso de datos de alimentación que se reciben en una compuerta de datos de alimentación 22. Los datos recibidos en la compuerta de datos de alimentación 22 son los mismos datos que la salida en la compuerta de datos de salida 20 en la Figura 1A. En forma alterna, cuando los datos no se transmiten mediante un canal cableado sino mediante un canal inalámbrico, los datos recibidos en la compuerta de alimentación de datos 22 son datos derivados de los datos originales producidos por el codificador.
Los datos de alimentación del descodificador se alimentan en un lector de corriente de datos 24 para leer los datos de alimentación, para finalmente obtener la información de lado de canal 26 y el canal de mezcla reductora izquierda 28 y el canal de mezcla reductora derecha 30. En caso que los datos de alimentación incluyen versiones codificados de los canales de mezcla reductora, que corresponde al caso en donde el codificador de audio 16 en la Figura 1A está presente, el lector de corriente de datos 24 también incluye un descodificador de audio, que se adapta al codificador de audio empleado para codificar los canales de mezcla reductora. En este caso, el descodificador de audio, que es parte del lector de corriente de datos 24, es operativo para generar el primer canal de mezcla reductora Lc y el segundo canal de mezcla reductora Rc, o dicho en forma más exacta, una versión descodificada de esos canales. Para facilidad de descripción, una distinción entre señales y sus versiones descodificadas solo se realiza cuando se establece explícitamente. La información de lado de canal 26 y los canales de mezcla reductora izquierdo y derecho 28 y 30 de salida por el lector de corriente de datos 24 se alimentan en un reconstructor de múltiples canales 32, para proporcionar una versión reconstruida 34 de las señales de audio originales, que pueden reproducirse mediante un reproductor de múltiples canales 36. En caso que el reconstructor de múltiples canales es operativo en el dominio de frecuencia, el reproductor de múltiples canales 36 recibirá datos de alimentación de dominio de frecuencia, que tienen que estar en una cierta forma descodificados tales como convertidos en un dominio de tiempo antes de reproducirlos. Para este objetivo, el reproductor de múltiples canales 36 también puede incluir instalaciones de descodificación. Habrá de notarse aquí, que un descodificador de escala menor solo tendrá el lector de corriente de datos 24, que solo envía de salida los canales de mezcla reductora izquierdo y derecho 28 y 30 a una salida de estéreo 38. Un descodificador de la invención mejorado, sin embargo extraerá la información de lado de canal 26 y utilizará esta información lateral y los canales de mezcla reductora 28 y 30 para reconstruir versiones reconstruidas 34 de los canales originales utilizando el reconstructor de múltiples canales 32. La Figura 2B muestra una implementación de la invención del reconstructor de múltiples canales 32 de la Figura 2A. Por lo tanto, la Figura 2B muestra un aparato para construir una señal de salida de múltiples canales que utiliza una señal de alimentación e información de lado paramétrica, la señal de alimentación incluye un primer canal de alimentación y un segundo canal de alimentación derivado de una señal de múltiples canales original, y la información de lado paramétrica describe interrelaciones entre canales de la señal original de múltiples canales . El aparato de la invención mostrado en la Figura 2B incluye medios 320 para proporcionar una medida de coherencia dependiendo de un primer canal original y un segundo canal original , el primer canal original y el segundo canal original se incluyen en la señal de múltiples canales original . En caso que la medida de coherencia se incluye en la información de lado paramétrica, la información de lado paramétrica se alimenta en medios 320 como se ilustra en la Figura 2B . La medida de coherencia que se proporciona por los medios 320 se alimenta en los medios 322 para determinar canales base. En particular, los medios 322 son operativos para determinar un primer canal base al seleccionar uno del primero y el segundo canales de alimentación o una combinación predeterminada del primer y segundo canales de alimentación. Medios 322 son operativos adicionalmente para determinar un segundo canal base utilizando la medida de coherencia, de manera tal que el segundo canal base es diferente del primer canal base debido a la medida de coherencia. En el ejemplo mostrado en la Figura 2B, que se relaciona con el sistema de multi-direccional de 5 canales, el primer canal de alimentación es el canal de estéreo compatible izquierdo Lc; y el segundo canal de alimentación es el canal de estéreo compatible derecho Rc. Los medios 322 son operativos para determinar los canales base que ya se han descrito en conexión con la Figura 14A. De esta manera, a la salida de los medios 322, un canal base separado por cada uno de los canales de salida a reconstruir se obtiene, en donde de preferencia, los canales base enviados de salida por los medios 322 son todos diferentes entre sí, es decir tienen una medida de coherencia entre ellos, que es diferente para cada par. Los canales base de salida por los medios 322 y la información de lado paramétrica tal como ICLD, ICTD o información de estéreo de intensidad se alimentan en medios 324 para sintetizar el primer canal de salida tal como L utilizando la información de lado paramétrica, y el primer canal base, para obtener un primer canal de salida sintetizado L, que es una versión reproducida del primer canal original correspondiente y para sintetizar un segundo canal de salida tal como Ls utilizando la información de lado paramétrica y el segundo canal base, el segundo canal de salida es una versión reproducida del segundo canal original. Además, medios 324 para sintetizar son operativos para reproducir el canal derecho R y el canal multi-direccional derecho Rs utilizando otro par de canales base, en donde los canales base en este otro par son diferentes entre sí debido a la medida de coherencia o debido a una medida de coherencia adicional que se ha derivado para el par de canales derecho/multi-direccional derecho . Una implementación más detallada del descodificador de la invención se ilustra en la Figura 2C. Puede verse que en la modalidad preferida que se ilustra en la Figura 2C, la estructura general es similar a la estructura que ya se ha descrito en conexión con la Figura 12 para un descodificador BCC de la técnica previa. Contrario a la Figura 12, el esquema de la invención mostrado en la Figura 2C incluye dos bancos de filtros de audio, es decir un banco de filtro para cada señal de alimentación. Naturalmente, un banco de filtro sencillo también es suficiente. En este caso, se requiere un control que alimenta en el banco de filtros sencillo, las señales de alimentación en un orden secuencial. Los bancos de filtros se ilustran por los bloques 319a y 319b. La funcionalidad de los elementos 320 y 322 - que se ilustran en la Figura 2B - se incluye en un bloque de mezclado superior 323 en la Figura 2C.
A la salida del bloque de mezclado superior 323, se obtienen los canales base que son diferentes entre sí . Esto es en contraste a la Figura 12 , en donde los canales base en el nodo 130 son idénticos entre sí. Los medios de síntesis 324 mostrados en la Figura 2B incluyen de preferencia una etapa de retardo 324a, una etapa de modificación de nivel 324b y en algunos casos, una etapa de procesamiento para realizar tareas de procesamiento adicional 324c así como un número respectivo de bancos de filtros de audio inversos 324d. En una modalidad, la funcionalidad de los elementos 324a, 324b, 324c y 324d puede ser la misma que en el dispositivo de la técnica previa descrito en conexión con la Figura 12. La Figura 2D muestra un ejemplo más detallado de la Figura 2C para una configuración multi-direccional de 5 canales, en donde dos canales de alimentación yx e y2 se alimentan y cinco canales de salida construidos se obtienen como se muestra en la Figura 2D. En contraste con la Figura 2C, un diseño más detallado del bloque de mezclado superior 323 se da. En particular, un dispositivo de suma 330 para proporcionar los canales base para reconstruir un canal de salida central, se ilustra. Adicionalmente, dos bloques 331, 332 con título "W" se muestran en la Figura 2D. Estos bloques realizan la combinación ponderada de los dos canales de alimentación con base en la medida de coherencia K, que se alimenta en una alimentación de medida de coherencia 334. De preferencia, el bloque de ponderación 331 o 332 también realiza operaciones de post-procesamiento respectivas para los canales base tales como alisado en tiempo y frecuencia como se establecerá a continuación. De esta manera, la Figura 2C es un caso general de la Figura 2D, en donde la Figura 2C ilustra como los N canales de salida se generan, dados los M canales de alimentación del descodificador. Las señales transmitidas se transforman a un dominio de sub-banda. El proceso de cómputo de los canales base para cada canal de salida se denota como mezclado superior, debido a que cada canal base de preferencia es una es una combinación lineal de los canales transmitidos. El mezclado superior puede realizarse en el dominio de tiempo o en el dominio de sub-banda o frecuencia. Para cómputo de cada canal base, un cierto procesamiento puede aplicarse para reducir efectos de cancelación/amplificación, cuando los canales transmitidos están fuera-de-fase o en-fase. ICTD se sintetiza al imponer retardos en las señales de sub-banda e ICLD se sintetiza al ajustar en escala las señales de sub-banda. Diferentes técnicas pueden emplearse para sintetizar ICC tales como manipular los factores de ponderación o los retardos de tiempo mediante secuencia de números al azar. Sin embargo, habrá de notarse aquí que de preferencia no hay procesamiento de coherencia/correlación entre canales de salida excepto porque se realiza la determinación de la invención de los diferentes canales base para cada canal de salida. Por lo tanto, un dispositivo de la invención preferido procesa señales ICC recibidas de un codificador para construir los canales base y señales ICTD e ICLD recibidas de un codificador para manipular el canal base ya construido. De esta manera, señales ICC o - más general - medidas de coherencia no se utilizan para manipular un canal base sino se utiliza para construir el canal base que se manipula posteriormente . En el ejemplo específico mostrado en la Fig. 2D, una señal multidireccional de cinco canales se descodifica de una transmisión de estéreo de dos canales. Una señal estéreo de dos canales transmitida se convierte en un dominio de sub-banda. Después, el mezclado superior se aplica para generar cinco canales base diferentes de preferencia. Señales ICTD sólo se sintetizan entre multidireccional izquierdo e izquierdo, y multidireccional derecho y derecho, al aplicar los retardos d± (k) como se ha discutido en conexión con la Fig. 14B . También, las medidas de coherencia se emplean para construir los canales base (bloques 331 y 332) en la Fig. 2D en vez de realizar cualquier post-procesamiento en el bloque 324c. De forma inventiva, las señales ICC e ICTD entre izquierdo y derecho y multidireccional izquierdo y multidireccional derecho, se mantienen como en la señal de estéreo transmitida. Por lo tanto, una sola señal ICC y un solo parámetro de señal ICTD serán suficientes y por lo tanto se transmitirán desde un codificador a un descodificador . En otra modalidad, señales ICC y señales ICTD para ambos lados pueden calcularse en un codificador. Estos dos valores pueden transmitirse de un codificador a un descodificador. En forma alterna, el codificador puede calcular una señal ICC o ICTD resultante al alimentar las señales de ambos lados en una función matemática tal como una función de promediado, etc., para derivar el valor resultante de las dos medidas de coherencia. A continuación, se hace referencia a las Figs. 15a y 15b para mostrar una implementación de baja complejidad del concepto de la invención. Mientras que una implementación de alta complejidad requiere una determinación del lado del codificador de la medida de coherencia, al menos entre un par de canales en un lado de la porción del oyente considerada, y transmitir esta medida de coherencia de preferencia en una forma cuantificada y codificada por entropía, la versión de baja complejidad no requiere ninguna determinación de medida de coherencia en el lado del codificador y cualquier transmisión del codificador al descodifieador de esta información. Sin embargo, para obtener una buena calidad subjetiva de la señal de salida de múltiples canales reconstruida, una medida de coherencia predeterminada o dicho en otras palabras, factores de ponderación predeterminados para determinar una combinación ponderada de los canales de alimentación transmitidos utilizando dicho factor de ponderación predeterminado, se proporciona por los medios 324 en la Fig. 2D. Existen varias posibilidades para reducir la coherencia en canales base para la reconstrucción de los canales de salida. Sin la medida de la invención, los canales de salida respectivos se dan, en una implementación de línea base, en donde no se codifican y transmiten ICC e ICTD, totalmente coherentes. Por lo tanto, cualquier uso de cualquier medida de coherencia predeterminada reducirá la coherencia en señales de salida reconstruidas, de manera tal que las señales de salida reproducidas son mejores aproximaciones de los canales originales correspondientes . Para evitar por lo tanto que canales base sean totalmente coherentes, el mezclado superior se realiza como se muestra por ejemplo en la Fig. 15A como una alternativa o la Fig. 15B como otra alternativa. Los cinco canales base se calculan de manera tal que ninguno de ellos sea totalmente coherente, si la señal de estéreo transmitida tampoco es totalmente coherente. Esto resulta en que una coherencia inter-canales entre el canal izquierdo y el canal multidireccional izquierdo o entre el canal derecho y el canal multidireccional derecho se reduce automáticamente, cuando la coherencia inter-canales entre el canal izquierdo y el canal derecho se reduce. Por ejemplo, para una señal de audio que es independiente entre todos los canales tales como una señal de aplauso, este mezclado superior tiene la ventaja de que cierta independencia entre izquierdo y multidireccional izquierdo y derecho y multidireccional derecho se genera sin necesidad por sintetizar (y codificar) coherencia inter-canales explícitamente. Por supuesto, esta segunda versión de mezclado superior puede combinarse con esquemas que aún sintetizan ICC e ICTD. La Fig. 15A muestra un mezclado superior optimizado para izquierdo frontal y derecho frontal, en donde la mayoría de la independencia se mantiene entre el izquierdo frontal y el derecho frontal. La Fig. 15B muestra otro ejemplo, en donde izquierdo frontal y derecho frontal por una parte y multidireccional izquierdo y multidireccional derecho por otra parte, se tratan n la misma forma que el grado de independencia de los canales frontales posterior es el mismo. Esto puede verse en la Fig. 15B por el hecho de que un ángulo entre izquierdo/derecho frontal es el mismo que el ángulo entre multidireccional izquierdo/derecho. De acuerdo con la modalidad preferida de la presente invención, mezclado superior dinámico en lugar de una selección estática, se emplea para este objetivo, la invención también se refiere a un algoritmo mejorado que es capaz de adaptar dinámicamente la matriz del mezclado superior a fin de optimizar un desempeño dinámico. En el ejemplo mostrado a continuación, la matriz de mezclado superior puede seleccionarse para los canales posteriores, de manera tal que la reproducción óptima de coherencia frontal-posterior se vuelve posible. El algoritmo de la invención comprende las siguientes etapas : Para los canales frontales, una simple asignación de canales bases se emplea, como la descrita en la Fig. 14A o 15A. Con esta simple elección, sep preserva coherencia de los canales sobre el eje izquierdo/derecho . En el codificador, se miden los valores de coherencia frontal-posterior tales como señales ICC entre izquierdo/multidireccional izquierdo y de preferencia entre los pares derecho/multidireccional derecho. En el descodificador, los canales base para los canales posterior izquierdo y posterior derecho, se determinan al formar combinaciones lineales de las señales de canal transmitidas, es decir un canal izquierdo transmitido y un canal derecho transmitido. Específicamente, se determinan coeficientes de mezclado superior de manera tal que la coherencia actual entre izquierdo y multidireccional izquierdo y derecho y multidireccional derecho, logra los valores medidos en el codificador. Para propósitos prácticos, esto puede lograrse cuando las señales de canal transmitidas exhiben suficientes des-correlaciones, que normalmente es el caso en escenarios de cinco canales usuales. En la modalidad preferida de mezclado superior dinámico, un ejemplo de una implementación que se considera como el mejor modo para llevar a cabo la invención, se dará con respecto a la Fig. 2E, en cuanto a una implementación de decodificador y la Fig. 2F y la Fig. 2G respecto a una implementación de descodificador.
La Fig. 2E muestra un ejemplo para medir valores de coherencia frontal/posterior (valores ICC) entre el canal izquierdo y multidireccional izquierdo o entre el canal derecho y multidireccional derecho, es decir entre un par de canales ubicados en un lado respecto a una posición de oyente considerada. La ecuación mostrada en la caja en la Fig. 2C da una medida de coherencia CC entre el primer canal x y el segundo canal y. En un caso, el primer canal x es el canal izquierdo mientras que el segundo canal y es el canal multidireccional izquierdo. En otro caso, el canal x es el canal derecho mientras que el segundo canal y es le canal multidireccional derecho. A representa una muestra del canal respectivo x en la instancia de tiempo i, mientras que y± representa una muestra en una instancia de tiempo del otro canal original y. Habrá de notarse aquí que, la medida de coherencia puede calcularse completamente en el dominio de tiempo. En este caso, el índice de suma i recorre desde un borde inferior a un borde superior, en donde el otro borde normalmente es el mismo que el número de muestras en un cuadro en caso de un procesamiento a manera de cuadros . En forma alterna, también pueden calcularse medidas de coherencia entre señales de paso de banda, es decir señales que tienen anchos de banda reducidos respecto a la señal de audio original . En este último caso, la medida de coherencia no sólo depende del tiempo sino también depende de la frecuencia. Las señales ICC frontal/posterior resultantes, es decir CCX para la coherencia frontal izquierda/posterior y CCr para la coherencia frontal derecha/posterior, se transmiten a un decodificador como una información lateral paramétrica de preferencia en forma cuantificada y codificada. A continuación, se hará referencia a la Fig. 12F para mostrar un esquema de mezclado superior de descodificador preferido. En el caso ilustrado, el canal izquierdo transmitido se mantiene como el canal base para el canal de salida izquierdo. A fin de derivar el canal base para el canal de salida posterior izquierdo, una combinación lineal entre el canal transmitido izquierdo (1) y el derecho (r) , es decir 1 + a r, se determina. El factor de ponderación a se determina de manera tal que la correlación cruzada entre 1 y 1 + ar es igual al valor deseado transmitido CC para el lado izquierdo y CCr para el lado derecho o generalmente la medida de coherencia k. El cálculo del valor a apropiado se describe en la Fig. 12F. En particular, una correlación cruzada normalizada de dos señales 1 y r se define como se muestra en la ecuación en el bloque de la Fig. 2E .
Dadas dos señales transmitidas 1 y r, el factor de ponderación a tiene que determinarse de manera tal que la correlación cruzada normalizada de la señal 1 y 1 + ar es igual a un valor deseado k, es decir la medida de coherencia. Esta medida se define como -1 y +1. Usando la definición de la correlación cruzada para los dos canales, se obtiene la ecuación dada en la Fig. 2F para el valor k. Al utilizar varias abreviaturas que se dan en el fondo de la Fig. 2F, la condición para cada k puede rescribirse como una ecuación cuadrática, la solución de la cual da el factor de ponderación a . Puede demostrarse que la ecuación siempre tiene soluciones de valor real, es decir que la discriminante se garantiza como no negativa. Dependiendo de la correlación cruzada básica de las señales 1 y r, y de la correlación cruzada deseada k, una o ambas soluciones suministradas puede de hecho llevar al negativo del valor de correlación cruzada deseado y por lo tanto se descarga para todo mayor cálculo. Después de calcular la señal de canal base como una combinación lineal de la señal 1 y la señal r, la señal resultante se normaliza (reajusta en escala) a la energía de señal original de la señal de canal 1 o r transmitida.
Similarmente, la señal de canal base para el canal de salida derecho puede derivarse al cambiar el papel de los canales izquierdo y derecho, es decir considerando la correlación cruzada entre r y r + a l . En la práctica, se prefiere alisar los resultados del proceso de cálculo para el valor a con el tiempo y frecuencia, a fin de obtener calidad de señal máxima. También, medidas de correlación frontal/posterior diferentes a izquierdo/posterior izquierdo y derecho/posterior derecho, pueden utilizarse para llevar al máximo adicionalmente la calidad de señal. Subsecuentemente, una descripción de etapa-por-etapa de la funcionalidad realizada por el reconstructor de múltiples canales 32 de la Fig. 2A se dará, con referencia a la Fig. 2G. De preferencia, un factor de ponderación a se calcula (200) con base en una medida de coherencia dinámica que se proporciona por un codificador a un descodificador o con base en un suministro estático de una medida de coherencia como se describe en conexión con la Fig. 15A y la Fig. 15B. Después, el factor de ponderación se alisa con el tiempo y/o frecuencia (etapa 202) para obtener un factor de ponderación alisado a s . Después, un canal base b se calcula para que sea por ejemplo 1 + a sr (etapa 204) . El canal base b después se emplea, junto con otros canales base para calcular las señales de salida en bruto. Como es claro en la casilla 206, el ICLD de representación de nivel así como el ICTD de representación de retardo se requieren para calcular señales de salida en bruto. Después, las señales de salida en bruto se ajustan en escala para tener la misma energía que una suma de las energías individuales de los canales de alimentación izquierdo y derecho. En otras palabras, las señales de salida en bruto se ajustan en escala mediante un factor de escala tal que una suma de las energías individuales de las señales de salida en bruto en escala es la misma que la suma de las energías individuales de los canales de alimentación izquierdo y derecho transmitidos . En forma alterna, también se puede calcular la suma de los canales transmitidos izquierdo y derecho y utilizar la energía de la señal resultante. Adicionalmente, también se puede calcular una señal suma por una suma a manera de muestra de las señales de salida en bruto y utilizar la energía de la señal resultante para propósitos de escala. Después, a una salida en la casilla 208, se obtienen los canales de salida reconstruidos, que son únicos ya que ninguno de los canales de salida reconstruidos es totalmente coherente con otro de los canales de salida reconstruidos de manera tal que se obtiene una calidad máxima de la señal de salida reproducida . Para resumir, el concepto inventivo es ventajoso ya que un número arbitrario de canales transmitidos (M) y un número arbitrario de canales de salida (N) puede emplearse . Adicionalmente, la conversión entre los canales transmitidos y los canales base para los canales de salida se realiza mediante mezclado superior dinámico preferible . En una modalidad importante, el mezclado superior consiste de una multiplicación por una matriz de mezclado superior, es decir formar combinaciones lineales de los canales transmitidos, en donde canales frontales de preferencia se sintetizan al utilizar canales base transmitidos correspondientes como canales base, mientras que los canales posteriores consisten de combinación lineal de los canales transmitidos, de una combinación lineal depende de una medida de coherencia. Adicionalmente, este proceso de mezclado superior de preferencia se realiza adaptativo de señal, en una forma variante en tiempo. Específicamente, el proceso de mezclado superior de preferencia depende en información lateral transmitida de un codificador BCC tal como señales de coherencia inter-canales para una coherencia frontal/posterior. Dado el canal base para cada canal de salida, un procesamiento similar a una codificación de monitoreo binaural regular se aplica para sintetizar señales espaciales, es decir aplicar ajustes en escala y retardos en sub-bandas y aplicar técnicas para reducir coherencia entre canales, en donde las señales ICC son adicionalmente, o en forma alterna, empleadas para construir canales base respectivos para obtener óptima reproducción de coherencia frontal-posterior. La Fig. 3A muestra una modalidad del calculador de la invención 14, para calcular la información del lado de canal, que un codificador de audio por una parte y el calculador de información lateral de canal por otra parte operan en la misma representación espectral de la señal de múltiples canales. La Fig. 1, sin embargo muestra la otra alternativa, en donde el codificador de audio por una parte y el calculador de información lateral de canal por otra parte, operan en representaciones espectrales diferentes de la señal de múltiples canales . Cuando calcular recursos no es tan importante como la calidad de audio, la alternativa de la Fig. 1A se prefiere, ya que bancos de filtros optimizados individualmente para codificación de audio y cálculo de información lateral pueden emplearse . Cuando sin embargo son un aspecto importante los recursos de cómputo, se prefiere la alternativa de la Fig. 3A, ya que esta alternativa requiere menos poder de cómputo debido a una utilización compartida de elementos. El dispositivo mostrado en la Fig. 3A es operativo para recibir dos canales, A, B. El dispositivo mostrado en la Fig. 3A es operativo para calcular una información lateral para el canal B, de manera tal que utilizando esta información lateral de canal para el canal original selecto B, una versión reconstruida del canal B puede calcularse a partir de la - señal de canal A. Adicionalmente, el dispositivo mostrado en la Fig. 3A es operativo para formar información lateral de canal con dominio de frecuencia tal como parámetros para ponderación (al multiplicar o procesar en tiempo como en codificación BCC, por ejemplo) valores espectrales de muestras de sub-bandas. Para este objetivo, el calculador de la invención incluye formar ventanas y los medios de conversión de tiempo/frecuencia 140a para obtener una representación de frecuencia del canal A en una salida 140b o una representación de dominio de frecuencia del canal B en una salida 140c.
En la modalidad preferida, la determinación de información lateral (mediante los medios para determinación lateral 14Of) se realiza utilizando valores espectrales cuantificados . Después, un cuantificador 14Od está también presente que de preferencia se controla utilizando un modelo sicoacústico que tiene una alimentación de control de modelo sicoacústico 140e. Sin embargo, no se requiere un cuantificador, cuando los medios de determinación de información lateral 140c utilizan una representación no cuantificada del canal A para determinar la información lateral de canal para el canal B . En caso que la información lateral de canal para el canal B se calcula mediante una representación de dominio de frecuencia del canal A y la representación de dominio de frecuencia del canal B, los medios de comparación de tiempo/frecuencia y formación de ventanas 14OA pueden ser los mismos que se emplean en un codificador de audio basado en banco de filtros . En este caso, cuando AAC (ISO/IEC 13818-3) se considera, se implementa el medio 140 como un banco de filtros de transformada coseno discreto modificado (MDCT = modified discrete cosine transform) con 50% de funcionalidad superposición-y-adición.
En dicho caso, el cuantificador 14Od es un cuantificador iterativo tal como el que se emplea cuando se generan señales de audio mp3 y AAC codificadas. La representación de dominio de frecuencia del canal A, que de preferencia ya está cuantificada puede entonces emplearse directamente para codificación de entropía utilizando un codificador de entropía 140g, que puede ser un codificador de base Huffman o un codificador de entropía que implementa codificación aritmética. Cuando se compara con la Fig. 1, la salida del dispositivo en la Fig. 3A es la información lateral tal como lx para un canal original (que corresponde a la información lateral para B a la salida del dispositivo 14Of) . La corriente de bits codificada con entropía para el canal A corresponde por ejemplo al canal de mezcla reductora izquierdo codificado Lc' a la salida del bloque 16 en la Fig. 1. De la Fig. 3A queda claro que el elemento 14 (Fig. 1), es decir el calculador para la información lateral de canal y el codificador de audio 16 (Fig. 1), pueden implementarse como medios separados o pueden implementarse como una versión compartida tal que ambos dispositivos comparten varios elementos tal como el banco de filtros MDCT 140a, el cuantificador 140e y el codificador de entropía 14 Og. Naturalmente, en caso que se requiera una transformada diferente etc. para determinar una información lateral de canal, entonces el codificador 16 y el calculador 14 (Fig. 1) se implementarán en dispositivos diferentes tal que ambos elementos no compartan el banco de filtros, etc. En general, el determinador actual para cálculo de la información lateral (o dicho en general el calculador 14) , puede implementarse como un módulo en estéreo conjunto como se ilustra en la Fig. 3B, que opera de acuerdo con cualquiera de las técnicas conjuntas en estéreo tales como codificación de intensidad estéreo o codificación con monitoreo binaural . En contraste con estos codificadores de intensidad estéreo de la técnica previa, los medios de determinación de la invención 140f no tienen que calcular el canal combinado. El "canal combinado" o canal portador, como se puede decir, ya existe y es el canal de mezcla reductora compatible izquierdo Lc o el canal de mezcla reductora compatible derecho Rc o una versión combinada de estos canales de mezcla reductora tal como Lc + Rc . Por lo tanto, el dispositivo de la invención 140f sólo tiene que calcular la información de escala para ajustar en escala el canal de mezcla reductora respectivo de manera tal que la envolvente de energía/tiempo de el canal original selecto respectivo se obtiene, cuando el canal de mezcla reductora se pondera utilizando la información de escala o como se puede decir en la información direccional de intensidad. Por lo tanto, el módulo conjunto en estéreo 14Of en la Fig. 3B se ilustra de manera tal que recibe, como una alimentación, el canal "combinado" A, que es el primer o segundo canal de mezcla reductora o una combinación de canales de mezcla reductora, y el canal selecto original. Este módulo, naturalmente, envía de salida el canal "combinado" A y los parámetros conjuntos en estéreo como información lateral de canal tal que, utilizando el canal combinado A y los parámetros conjuntos en estéreo puede calcularse una aproximación del canal selecto original B . En forma alterna, el módulo conjunto en estéreo 14Of puede implementarse para realizar codificación con monitoreo binaural . En el caso de BCC, el módulo conjunto en estéreo 140f es operativo para enviar de salida la información lateral de canal, de manera tal que la información lateral de canal son parámetros ICLD o ICTD cuantificados y codificados, en donde el canal original selecto sirve como el canal actual a procesar, mientras que el canal de mezcla reductora respectivo empleado para calcular la información lateral tal como el primero, el segundo o una combinación del primer y segundo canales de mezcla reductora, se utiliza como el canal de referencia en el sentido de la técnica de codificación/decodificación BCC. Con referencia a la Fig. 4, se da una implementación dirigida de energía simple del elemento 140. Este dispositivo incluye un selector de banda de frecuencia 44, que selecciona una banda de frecuencia del canal A y una banda de frecuencia correspondiente del canal B. Después, en ambas bandas de frecuencia, se calcula una energía mediante un calculador de energía 42 por cada ramificación. La implementación detallada del calculador de energía 42 dependerá de si la señal de salida del bloque 40 es una señal de sub-banda o son coeficientes de frecuencia. En otras implementaciones, cuando se calculan factores de escala para banda de factor de escala, ya se pueden utilizar factores de escala del primer y segundo canales A, B como valores de energía EA y EB o al menos como estimados de la energía. En un dispositivo para cálculos de factor de ganancia 44, un factor de ganancia gB para la banda de frecuencia selecta se determina con base en una cierta regla tal como la regla para determinación de ganancia ilustrada en el bloque 44 de la Fig. 4. Aquí, el factor de ganancia gB puede emplearse directamente para ponderar muestras de dominio de tiempo o coeficientes de frecuencia tal como se describirá posteriormente en la Fig. 5. Para este objetivo, el factor de ganancia gB, que es válido para la banda de frecuencia selecta, se utiliza como la información lateral de canal para el canal B como el canal original selecto. Este canal original selecto B no se transmitirá al descodificador pero se representa por la información lateral de canal paramétrico como se calcula por el calculador 14 en la Fig. 1. Habrá de notarse aquí que no es necesario transmitir valores de ganancia como una información lateral de canal. También es suficiente transmitir valores dependientes de frecuencia relacionados a la energía absoluta del canal original selecto. Después, el descodificador tiene que calcular la energía actual del canal de mezcla reductora y el factor de ganancia, con base en la energía de canal de mezcla reductora y la energía transmitida para el canal b. La Fig. 5 muestra una implementación posible de una configuración de descodificador, en conexión con un codificador de audio perceptual basado en transformada. En comparación con la Fig. 2, las funcionalidades del descodificador de entropía y cuantificador inverso 50 (Fig. 5) se incluirán en el bloque 24 de la Fig. 2. La funcionalidad de los elementos de conversión de frecuencia/tiempo 52a, 52b (Fig. 5) sin embargo, se implementará en el ítem 36 de la Fig. 2. El elemento 50 en la Fig. 5 recibe una versión codificada de la primera o la segunda señal de mezcla reductora Lc ' o Rc ' . A la salida del elemento 50, está presente una versión descodificada cuando menos parcialmente del primer y el segundo canales de mezcla reductora, que subsecuentemente se denomina canal A. el canal A se alimenta en un selector de banda de frecuencia 54 para seleccionar una cierta banda de frecuencia del canal A. Esta banda de frecuencia selecta se pondera utilizando un multiplicador 56. El multiplicador 56 recibe, para multiplicar un cierto factor ganancia gB, que se asigna a la banda de frecuencia selecta, elegida por el selector de banda de frecuencia 54, que corresponde al selector de banda de frecuencia 40 en la Fig. 4, en el lado del codificador. En la entrada del convertidor de tiempo frecuencia 52a existe, junto con otras bandas, una representación de dominio de frecuencia del canal A. A la salida del multiplicador 56 y en particular a la entrada de los medios de conversión de frecuencia/tiempo 52b, habrá una representación de dominio de frecuencia reconstruida del canal B. Por lo tanto, a la salida del elemento 52a, habrá una representación de dominio en tiempo para el canal A, mientras que a la salida del elemento 52b, habrá una representación de dominio en tiempo del canal reconstruido B . Habrá de notarse aquí que, dependiendo de cierta .implementación, el canal de mezcla reductora descodificado Lc o Rc no se reproduce en un descodificador mejorado de múltiples canales. En este descodificador mejorado de múltiples canales, los canales de mezcla reductora descodificados sólo se emplean para reconstruir los canales originales . Los canales de mezcla reductora descodificados sólo se reproducen en descodificadores sólo estéreo de escala menor. Para este objetivo, se hace referencia a la Fig. 9, que muestra la implementación preferida de la presente invención en un ambiente multidireccional/mp3. Una corriente de bits multidireccional mejorada mp3 se alimenta en un descodificador mp3 estándar 24, que envía de salida versiones descodificadas de los canales de mezcla reductora original . Estos canales de mezcla reductora después pueden reproducirse directamente mediante un descodificador de bajo nivel. En forma alterna, estos dos canales se alimentan en el dispositivo de descodificación conjunta estéreo avanzada 32 que también recibe los datos de extensión de múltiples canales, que de preferencia se alimentan en campos de datos auxiliares en una corriente de bits que cumple con mp3. Subsecuentemente, se hace referencia a la Fig. 7 que muestra el agrupamiento del canal original selecto y el respectivo canal de mezcla reductora o canal de mezcla reductora combinado. En este aspecto, la columna derecha de la tabla en la Fig. 7 corresponde al canal A en la Fig. 3A, 3B, 4 y 5, mientras que la columna en la parte media corresponde al canal B en estas figuras . En la columna de izquierda de la Fig. 7, la información de lado de canal respectiva se establece explícitamente. De acuerdo con la Tabla de la Fig. 7, la información lateral de canal L.¡_ para el canal izquierdo original L, se calcula utilizando el canal de mezcla reductora izquierdo Lc . La información lateral de canal multidireccional izquierdo LSi se determina mediante el canal multidireccional izquierdo selecto original Ls y el canal de mezcla reductora izquierdo Lc es el portador. La información lateral de canal derecho R± para el canal derecho original R se determina utilizando el canal de mezcla reductora derecho Rc . Adicionalmente, la información lateral de canal para el canal multidireccional derecho RSi se determina utilizando el canal de mezcla reductora derecho Rc como el portador. Finalmente, la información lateral de canal Ci para el canal central C se determina utilizando el canal de mezcla reductora combinado, que se obtiene mediante una combinación del primer y segundo canales de mezcla reductora, que puede calcularse fácilmente tanto en un codificador como descodificador y que no requiere bits extra para transmisión. Naturalmente, también se puede calcular la información lateral de canal para el canal izquierdo, por ejemplo son base en un canal de mezcla reductora combinado o incluso un canal de mezcla reductora que se obtiene por una adición ponderada del primer y segundo canales de mezcla reductora tal como 0.7 Lc y 0.3 Rc, siempre que los parámetros de ponderación se conozcan a un descodificador o transmitan de conformidad. Para la mayoría de las aplicaciones, sin embargo se preferirá sólo derivar información lateral de canal para el canal central del canal de mezcla reductora combinado, es decir de una combinación del primer y segundo canales de mezcla reductor . Para mostrar el potencial de ahorro de bits de la presente invención, se da el siguiente ejemplo típico. En caso de una señal de audio de cinco canales, un codificador normal requiere una velocidad de bits de 64 kbits/s por cada canal que representa una velocidad de bits total de 320 kbits/s para la señal de cinco canales.
Las señales estéreo izquierda y derecha requieren una velocidad de bits de 128 kbits/s. Informacuión lateral de canales para un canal, está entre 1.5 y 2 kbits/s. De esta manera, incluso en un caso, en donde se transmite información lateral de canal por cada uno de los cinco canales, estos datos adicionales contribuyen con sólo 7.5 a 10 kbits/s. De esta manera, el concepto inventivo permite transmisión de una señal de audio de cinco canales utilizando una velocidad de bits de 138 kbits/s (en comparación con 320 (!) kbits/s) con buena calidad, ya que el descodificador no utiliza la operación de desmatrizado problemática. Probablemente aún más importante es el hecho de que el concepto inventivo es totalmente compatible hacia atrás, ya que cada una de los reproductores mp3 existentes es capaz de reproducir el primer canal de mezcla reductora y el segundo canal de mezcla reductora para producir una salida de estéreo convencional . Dependiendo del ambiente de aplicación, los métodos de la invención para construir o generar pueden implementarse en equipo físico o en soporte lógico. La implementación puede ser un medio de almacenamiento digital tal como un disco o CD que tiene señales de control de lectura electrónica, que puede cooperar con un sistema de computadora programable tal como los métodos de la invención se llevan a cabo. Dicho en general, la invención por lo tanto también se refiere a un producto de programa de computadora que tiene un código de programa almacenado en un portador legible por máquina, el código de programa se adapta para realizar los métodos de la invención, cuando el producto de programa de computadora corre en una computadora. En otras palabras, la invención por lo tanto también se refiere a un programa de computadora que tiene un código de programa para realizar los métodos, cuando el programa de computadora corre en una computadora .

Claims (25)

  1. REIVINDICACIONES 1. Aparato para construir una señal de salida de múltiples canales, utilizando una señal de alimentación e información lateral paramétrica, la señal de alimentación incluye un primer canal de alimentación (Lc) y un segundo canal de alimentación (Rc) derivado de una señal de múltiples canales original, la señal de múltiples canales original tiene una pluralidad de canales, la pluralidad de canales incluye al menos dos canales originales, que se definen como ubicados en un lado de una posición de oyente considerada, en donde un primer canal original es un primero de al menos los dos canales originales, y en donde un segundo canal original es un segundo de al menos los dos canales originales y la información lateral paramétrica describe interrelaciones entre canales originales de la señal original de múltiples canales, que comprende: medios para determinar un primer canal base al seleccionar uno del primer y segundo canales de alimentación o una combinación del primer y segundo canales de alimentación, y para determinar un segundo canal base al seleccionar el otro del primer y segundo canales de alimentación o una combinación diferente del primer y segundo canales de alimentación, de manera tal que el segundo canal base es diferente al primer canal base; y medios para sintetizar un primer canal de salida utilizando la información lateral paramétrica y el primer canal base, para obtener un primer canal de salida sintetizado que es una versión reproducida del primer canal original que se ubica en un lado de la posición de oyente considerada, y para sintetizar un segundo canal de salida utilizando la información lateral paramétrica y el segundo canal base, el segundo canal de salida es una versión reproducida del segundo canal original que se ubica en el mismo lado de la posición del oyente considerada.
  2. 2. Aparato de conformidad con la reivindicación 1, caracterizado porque además comprende: medios para proporcionar una medida de coherencia, la medida de coherencia depende de coherencia entre un primer canal original y un segundo canal original, el primer y segundo canales originales se incluyen en una señal de múltiples canales original; en donde los medios para determinar son operativos para determinar el primer y segundo canales base diferentes entre sí, con base en la medida de coherencia.
  3. 3. Aparato de conformidad con la reivindicación 1, caracterizado porque los dos canales originales como mínimo incluyen un canal original izquierdo y un canal original multidireccional izquierdo o un canal original derecho y un canal original multidireccional derecho.
  4. 4. Aparato de conformidad con la reivindicación 1, caracterizado porque una combinación del primer y segundo canales de alimentación determinada como el segundo canal base, es tal que uno de los dos canales de alimentación contribuye al segundo canal base más que el otro canal de alimentación.
  5. 5. Aparato de conformidad con la reivindicación 2, caracterizado porque la medida de coherencia varía con el tiempo, de manera tal que los medios para determinar acción son operativos para determinar el segundo canal base como una combinación del primer canal de alimentación y el segundo canal de alimentación, la combinación es variable con el tiempo.
  6. 6. Aparato de conformidad con la reivindicación 2, caracterizado porque la información lateral paramétrica incluye la medida de coherencia, la medida de coherencia se determina utilizando el primer canal original y el segundo canal original, en donde los medios para proporcionar son operativos para extraer la medida de coherencia a partir de la información lateral paramétrica.
  7. 7. Aparato de conformidad con la reivindicación 6, caracterizado porque la señal de alimentación tiene una secuencia de cuadros y la información lateral paramétrica incluye una secuencia de parámetros que incluye la medida de coherencia, los parámetros se asocian con los cuadros .
  8. 8. Aparato de conformidad con la reivindicación 1, caracterizado porque la señal original además incluye un canal central , en donde los medios para determinar además son operativos para calcular un tercer canal base, utilizando el primer canal de alimentación y el segundo canal de alimentación en porciones iguales.
  9. 9. Aparato de conformidad con la reivindicación 1, caracterizado porque la información lateral paramétrica depende de frecuencia y los medios para sintetizar son operativos para realizar una síntesis dependiente de frecuencia.
  10. 10. Aparato de conformidad con la reivindicación 1, caracterizado porque la información lateral paramétrica incluye parámetros de codificación con monitoreo binaural (BCC) incluyendo parámetros de diferencia de nivel inter-canales y parámetros de retardo de tiempo inter-canales, y en donde los medios para sintetizar son operativos para realizar una síntesis BCC utilizando un canal base determinado por los medios para determinar cuando se sintetiza un canal de salida.
  11. 11. Aparato de conformidad con la reivindicación 2, caracterizado porque los medios para determinar son operativos para determinar el primer canal base como uno del primer y segundo canales de alimentación y determinar el segundo canal base como una combinación ponderada del primer y segundo canales de alimentación, un factor de ponderación depende de la medida de coherencia.
  12. 12. Aparato de conformidad con la reivindicación 11, caracterizado porque el factor de ponderación se determina como sigue: _ -B± ¡B2 -%AC «13 = 2A en donde a es el factor de ponderación y en donde A, B, C se determinan como sigue: A=Ó~1?IR B=2ü0[l-k2) C=É(Xk2) en donde L, R, C se determinan como sigue: y en donde k es la medida de coherencia y en donde 1 es el primer canal de alimentación y r es el segundo canal de alimentación.
  13. 13. Aparato de conformidad con la reivindicación 10, caracterizado porque la medida de coherencia está dada para una banda de frecuencia y en donde los medios para determinar son operativos para determinar el segundo canal base para la banda de frecuencia.
  14. 14. Aparato de conformidad con la reivindicación 11, caracterizado porque la medida de coherencia se determina como sigue: en donde cc(x,y) es la medida de coherencia entre dos canales originales x, y, en donde xA es una muestra en una instancia de tiempo i del primer canal original y en donde y¡_ es una muestra en una instancia de tiempo i del segundo canal original .
  15. 15. Aparato de conformidad con la reivindicación 1, caracterizado porque los medios para determinar son operativos para ajustar en escala los canales de salida utilizando medidas de potencia derivadas de los canales originales, las medidas de potencia se transmiten dentro de la información lateral paramétrica.
  16. 16. Aparato de conformidad con la reivindicación 11, caracterizado porque los medios para determinar son operativos para alisar el factor de ponderación con el tiempo y/o frecuencia.
  17. 17. Aparato de conformidad con la reivindicación 1, caracterizado porque la información lateral paramétrica incluye información de nivel que representa una distribución de energía de los canales originales en la señal original , y en donde los medios para sintetizar son operativos para ajustar en escala los canales de salida tal que la suma de las energías de los canales de salida sea igual a una suma de las energías del primer canal de alimentación y el segundo canal de alimentación .
  18. 18. Aparato de conformidad con la reivindicación 17, caracterizado porque los medios para sintetizar son operativos para calcular canales de salida en bruto con base en canales base determinados y la información de nivel y ajustar en escala los canales de salida en bruto, de manera tal que una energía total de canales de salida en bruto en escala es igual a una energía total del primer y segundo canales de alimentación.
  19. 19. Aparato de conformidad con la reivindicación 1, caracterizado porque la señal de alimentación incluye un canal izquierdo y un canal derecho, y el canal original incluye un canal izquierdo frontal, un canal multidireccional izquierdo, un canal derecho frontal y un canal multidireccional derecho, y en donde los medios para determinar son operativos para determinar el canal izquierdo como el canal base para una síntesis del canal izquierdo frontal (L) , el canal derecho es el canal base para una síntesis del canal derecho frontal (R) , una combinación del canal izquierdo y el canal derecho como el canal base para el canal multidireccional izquierdo (Ls) o el canal multidireccional derecho (Rs) .
  20. 20. Aparato de conformidad con la reivindicación 1, caracterizado porque la señal de alimentación incluye un canal izquierdo y un canal derecho y la señal original incluye un canal izquierdo frontal, un canal multidireccional izquierdo, un canal derecho frontal y un canal multidireccional derecho, y en donde los medios para determinar son operativos para determinar el canal izquierdo como el canal base para una síntesis del canal izquierdo frontal, el canal derecho como el canal base para una síntesis del canal multidireccional derecho y una combinación del primer y segundo canales de alimentación como el canal base para una síntesis del canal derecho frontal o el canal multidireccional izquierdo.
  21. 21. Método para construir una señal de salida de múltiples canales utilizando una señal de alimentación e información lateral paramétrica, la señal de alimentación incluye un primer canal de alimentación y un segundo canal de alimentación derivado de una señal de múltiples canales original , la señal de múltiples canales original tiene una pluralidad de canales, la pluralidad de canales incluye al menos dos canales originales, que se definen como ubicados en un lado de una posición de oyente considerada, en donde un primer canal original es un primero de al menos dos canales originales , y en donde un segundo canal original es un segundo de los dos canales originales como mínimo, y la información lateral paramétrica describe interrelaciones entre los canales originales de la señal original de múltiples canales, que comprende : determinar un primer canal base al seleccionar uno del primer y segundo canales de alimentación o una combinación del primer y segundo canales de alimentación, y determinar un segundo canal base al seleccionar el otro del primer y segundo canales de alimentación o una diferencia de combinación del primer y segundo canales de alimentación, de manera tal que el segundo canal base es diferente del primer canal base; y sintetizar un primer canal de salida utilizando la información lateral paramétrica y el primer canal base para obtener un primer canal de salida sintetizado que es una versión reproducida del primer canal original que se ubica en un lado de la posición del oyente considerada, y sintetizar un segundo canal de salida utilizando la información lateral paramétrica y el segundo canal base, el segundo canal de salida es una versión reproducida del segundo canal original que se ubica en el mismo lado de la posición de oyente considerada.
  22. 22. Aparato para generar una señal de mezcla reductora a partir de una señal original de múltiples canales, la señal de mezcla reductora tiene una cantidad de canales que es más pequeña que una cantidad de canales originales, que comprende: medios para calcular un primer canal de mezcla reductora y un segundo canal de mezcla reductora utilizando una regla de mezcla reductora; medios para calcular información de nivel paramétrica que representa una distribución de energía entre los canales en la señal original de múltiples canales; medios para determinar una medida de coherencia entre los dos canales originales, los dos canales originales se ubican a un lado de una posición de oyente considerada; y medios para formar una señal de salida utilizando el primer y segundo canales de mezcla reductora, la información de nivel paramétrica y sólo al menos una medida de coherencia entre dos canales originales ubicados en un lado o un valor derivado de al menos una medida de coherencia, pero no utilizar ninguna medida de coherencia entre canales ubicados en diferentes lados de la posición de oyente considerada.
  23. 23. Aparato de conformidad con la reivindicación 22, caracterizado porque además comprende medios para determinar información de retardo de tiempo entre dos canales originales ubicados a un lado de la posición del oyente considerada; y en donde los medios para formación son operativos para sólo incluir información de nivel de tiempo entre dos canales originales ubicados en un lado de la posición del oyente considerada pero no información de nivel de tiempo entre dos canales originales ubicados en diferentes lados de la posición del oyente considerada.
  24. 24. Método para generar una señal de mezcla reductora a partir de una señal original de múltiples canales, la señal de mezcla reductora tiene un número de canales más pequeño que un número de canales originales, que comprende: calcular un primer canal de mezcla reductora y un segundo canal de mezcla reductora utilizando una regla de mezcla reductora, calcular información de nivel paramétrica que representa una distribución de energía entre los canales en la señal original de múltiples canales; determinar una medida de coherencia entre dos canales originales, los dos canales originales se ubican en un lado de una posición de oyente considerada; y formar una señal de salida utilizando el primer y segundo canales de mezcla reductora, la información de nivel paramétrica y sólo al menos una medida de coherencia entre dos canales originales ubicados en un lado o un valor derivado de al menos una medida de coherencia, pero no utilizando ninguna medida de coherencia entre canales ubicados en lados diferentes de la posición de oyente considerada.
  25. 25. Programa de computadora que tiene un código de programa para realizar un método para construir múltiples canales de acuerdo con la reivindicación 21 o un método para generar una señal de mezcla reductora de acuerdo con la reivindicación 24.
MXPA06008030A 2004-01-20 2005-01-17 Aparato y metodo para construir una senal de salida de multiples canales o para generar una senal de mezcla reductora. MXPA06008030A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/762,100 US7394903B2 (en) 2004-01-20 2004-01-20 Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
PCT/EP2005/000408 WO2005069274A1 (en) 2004-01-20 2005-01-17 Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal

Publications (1)

Publication Number Publication Date
MXPA06008030A true MXPA06008030A (es) 2007-03-07

Family

ID=34750329

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA06008030A MXPA06008030A (es) 2004-01-20 2005-01-17 Aparato y metodo para construir una senal de salida de multiples canales o para generar una senal de mezcla reductora.

Country Status (17)

Country Link
US (1) US7394903B2 (es)
EP (1) EP1706865B1 (es)
JP (1) JP4574626B2 (es)
KR (1) KR100803344B1 (es)
CN (1) CN1910655B (es)
AT (1) ATE393950T1 (es)
AU (1) AU2005204715B2 (es)
BR (1) BRPI0506533B1 (es)
CA (1) CA2554002C (es)
DE (1) DE602005006385T2 (es)
ES (1) ES2306076T3 (es)
IL (1) IL176776A (es)
MX (1) MXPA06008030A (es)
NO (1) NO337395B1 (es)
PT (1) PT1706865E (es)
RU (1) RU2329548C2 (es)
WO (1) WO2005069274A1 (es)

Families Citing this family (197)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7454257B2 (en) * 2001-02-08 2008-11-18 Warner Music Group Apparatus and method for down converting multichannel programs to dual channel programs using a smart coefficient generator
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7929708B2 (en) * 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
MXPA06011396A (es) * 2004-04-05 2006-12-20 Koninkl Philips Electronics Nv Metodos de codificacion y decodificacion de senales estereofonicas y aparatos que utilizan los mismos.
EP1735774B1 (en) * 2004-04-05 2008-05-14 Koninklijke Philips Electronics N.V. Multi-channel encoder
US9992599B2 (en) * 2004-04-05 2018-06-05 Koninklijke Philips N.V. Method, device, encoder apparatus, decoder apparatus and audio system
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
US20050273324A1 (en) * 2004-06-08 2005-12-08 Expamedia, Inc. System for providing audio data and providing method thereof
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US8793125B2 (en) * 2004-07-14 2014-07-29 Koninklijke Philips Electronics N.V. Method and device for decorrelation and upmixing of audio channels
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
BRPI0516201A (pt) * 2004-09-28 2008-08-26 Matsushita Electric Ind Co Ltd aparelho de codificação escalonável e método de codificação escalonável
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
US20060093164A1 (en) * 2004-10-28 2006-05-04 Neural Audio, Inc. Audio spatial environment engine
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1810279B1 (en) * 2004-11-04 2013-12-11 Koninklijke Philips N.V. Encoding and decoding of multi-channel audio signals
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
JP5106115B2 (ja) * 2004-11-30 2012-12-26 アギア システムズ インコーポレーテッド オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
DE602005017302D1 (de) * 2004-11-30 2009-12-03 Agere Systems Inc Synchronisierung von parametrischer raumtonkodierung mit extern bereitgestelltem downmix
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
WO2006103586A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Audio encoding and decoding
JP4610650B2 (ja) * 2005-03-30 2011-01-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多チャンネルオーディオ符号化
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
JP4907522B2 (ja) * 2005-04-28 2012-03-28 パナソニック株式会社 音声符号化装置および音声符号化方法
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
WO2007004833A2 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8073702B2 (en) * 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP5227794B2 (ja) * 2005-06-30 2013-07-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
CN101248483B (zh) * 2005-07-19 2011-11-23 皇家飞利浦电子股份有限公司 多声道音频信号的生成
WO2007027051A1 (en) * 2005-08-30 2007-03-08 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
JP4568363B2 (ja) * 2005-08-30 2010-10-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
EP1761110A1 (en) * 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Method to generate multi-channel audio signals from stereo signals
US8019614B2 (en) * 2005-09-02 2011-09-13 Panasonic Corporation Energy shaping apparatus and energy shaping method
EP1946297B1 (en) 2005-09-14 2017-03-08 LG Electronics Inc. Method and apparatus for decoding an audio signal
JP4740335B2 (ja) * 2005-09-14 2011-08-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1943642A4 (en) * 2005-09-27 2009-07-01 Lg Electronics Inc METHOD AND DEVICE FOR CODING / DECODING A MULTI-CHANNEL AUDIO SIGNAL
TWI450603B (zh) * 2005-10-04 2014-08-21 Lg Electronics Inc 音頻訊號處理方法及其系統與電腦可讀取媒體
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
KR100857111B1 (ko) * 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007040364A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
WO2007043388A1 (ja) * 2005-10-07 2007-04-19 Matsushita Electric Industrial Co., Ltd. 音響信号処理装置および音響信号処理方法
EP1946309A4 (en) * 2005-10-13 2010-01-06 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING
US8019611B2 (en) * 2005-10-13 2011-09-13 Lg Electronics Inc. Method of processing a signal and apparatus for processing a signal
JP5536335B2 (ja) * 2005-10-20 2014-07-02 エルジー エレクトロニクス インコーポレイティド マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置
US7653533B2 (en) * 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
WO2007049881A1 (en) * 2005-10-26 2007-05-03 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
US8027485B2 (en) * 2005-11-21 2011-09-27 Broadcom Corporation Multiple channel audio system supporting data channel replacement
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
US8111830B2 (en) * 2005-12-19 2012-02-07 Samsung Electronics Co., Ltd. Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
WO2007083952A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
CN102693727B (zh) * 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
EP1984913A4 (en) * 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
KR101358700B1 (ko) 2006-02-21 2014-02-07 코닌클리케 필립스 엔.브이. 오디오 인코딩 및 디코딩
US7974287B2 (en) * 2006-02-23 2011-07-05 Lg Electronics Inc. Method and apparatus for processing an audio signal
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
ATE538604T1 (de) * 2006-03-28 2012-01-15 Ericsson Telefon Ab L M Verfahren und anordnung für einen decoder für mehrkanal-surroundton
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US20090313029A1 (en) * 2006-07-14 2009-12-17 Anyka (Guangzhou) Software Technologiy Co., Ltd. Method And System For Backward Compatible Multi Channel Audio Encoding and Decoding with the Maximum Entropy
KR100763920B1 (ko) * 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
EP2070392A2 (en) * 2006-09-14 2009-06-17 Koninklijke Philips Electronics N.V. Sweet spot manipulation for a multi-channel signal
JP5174027B2 (ja) * 2006-09-29 2013-04-03 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びミックス信号処理方法
RU2551797C2 (ru) * 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
KR100891666B1 (ko) 2006-09-29 2009-04-02 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
US9418667B2 (en) 2006-10-12 2016-08-16 Lg Electronics Inc. Apparatus for processing a mix signal and method thereof
CN101692703B (zh) * 2006-10-30 2012-09-26 深圳创维数字技术股份有限公司 一种实现数字电视中图文电子节目指南信息的方法及装置
JP4838361B2 (ja) * 2006-11-15 2011-12-14 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
KR101111520B1 (ko) * 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
WO2008069584A2 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
US20100121470A1 (en) * 2007-02-13 2010-05-13 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2118886A4 (en) * 2007-02-13 2010-04-21 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL
WO2008108701A1 (en) * 2007-03-02 2008-09-12 Telefonaktiebolaget Lm Ericsson (Publ) Postfilter for layered codecs
US7933372B2 (en) * 2007-03-08 2011-04-26 Freescale Semiconductor, Inc. Successive interference cancellation based on the number of retransmissions
JP5213339B2 (ja) 2007-03-12 2013-06-19 アルパイン株式会社 オーディオ装置
GB0705328D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
EP2158587A4 (en) * 2007-06-08 2010-06-02 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AUDIO SIGNAL
ES2358786T3 (es) * 2007-06-08 2011-05-13 Dolby Laboratories Licensing Corporation Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial.
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8170218B2 (en) * 2007-10-04 2012-05-01 Hurtado-Huyssen Antoine-Victor Multi-channel audio treatment system and method
DE602007005137D1 (de) * 2007-10-04 2010-04-15 Hurtado Huyssen Antoine Victor Multikanal-Audioverarbeitungssystem und -verfahren
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101438389B1 (ko) * 2007-11-15 2014-09-05 삼성전자주식회사 오디오 매트릭스 디코딩 방법 및 장치
US8548615B2 (en) * 2007-11-27 2013-10-01 Nokia Corporation Encoder
US8600532B2 (en) * 2007-12-09 2013-12-03 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101439205B1 (ko) 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
ATE557387T1 (de) * 2008-07-30 2012-05-15 France Telecom Rekonstruktion von mehrkanal-audiodaten
CA2820199C (en) * 2008-07-31 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Signal generation for binaural signals
AU2015207815B2 (en) * 2008-07-31 2016-10-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Signal generation for binaural signals
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
TWI496479B (zh) * 2008-09-03 2015-08-11 Dolby Lab Licensing Corp 增進多聲道之再生
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
JP5522920B2 (ja) * 2008-10-23 2014-06-18 アルパイン株式会社 オーディオ装置及びオーディオ処理方法
EP2353161B1 (en) * 2008-10-29 2017-05-24 Dolby International AB Signal clipping protection using pre-existing audio gain metadata
EP2214162A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
PL2394268T3 (pl) * 2009-04-08 2014-06-30 Fraunhofer Ges Forschung Urządzenie, sposób i program komputerowy do realizacji upmixu sygnału audio downmixu z użyciem wygładzania wartości faz
US20120045065A1 (en) * 2009-04-17 2012-02-23 Pioneer Corporation Surround signal generating device, surround signal generating method and surround signal generating program
JP2011002574A (ja) * 2009-06-17 2011-01-06 Nippon Hoso Kyokai <Nhk> 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US9351070B2 (en) * 2009-06-30 2016-05-24 Nokia Technologies Oy Positional disambiguation in spatial audio
KR101615262B1 (ko) * 2009-08-12 2016-04-26 삼성전자주식회사 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치
JP5635097B2 (ja) 2009-08-14 2014-12-03 ディーティーエス・エルエルシーDts Llc オーディオオブジェクトを適応的にストリーミングするためのシステム
JP2011048101A (ja) * 2009-08-26 2011-03-10 Renesas Electronics Corp 画素回路および表示装置
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
EP2309781A3 (en) * 2009-09-23 2013-12-18 Iosono GmbH Apparatus and method for calculating filter coefficients for a predefined loudspeaker arrangement
US8774417B1 (en) * 2009-10-05 2014-07-08 Xfrm Incorporated Surround audio compatibility assessment
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
US9305550B2 (en) * 2009-12-07 2016-04-05 J. Carl Cooper Dialogue detector and correction
FR2954640B1 (fr) 2009-12-23 2012-01-20 Arkamys Procede d'optimisation de la reception stereo pour radio analogique et recepteur de radio analogique associe
US8908874B2 (en) 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
US20120155650A1 (en) * 2010-12-15 2012-06-21 Harman International Industries, Incorporated Speaker array for virtual surround rendering
EP2661912B1 (en) * 2011-01-05 2018-08-22 Koninklijke Philips N.V. An audio system and method of operation therefor
US9026450B2 (en) 2011-03-09 2015-05-05 Dts Llc System for dynamically creating and rendering audio objects
EP2523472A1 (en) * 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
CN102301669B (zh) 2011-07-04 2014-07-16 华为技术有限公司 支持多个载波的射频模块、基站和载波分配方法
JP5737077B2 (ja) * 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
US9183842B2 (en) * 2011-11-08 2015-11-10 Vixs Systems Inc. Transcoder with dynamic audio channel changing
WO2013073810A1 (ko) * 2011-11-14 2013-05-23 한국전자통신연구원 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
US8711013B2 (en) * 2012-01-17 2014-04-29 Lsi Corporation Coding circuitry for difference-based data transformation
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction
WO2013192111A1 (en) * 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9363603B1 (en) 2013-02-26 2016-06-07 Xfrm Incorporated Surround audio dialog balance assessment
US9613660B2 (en) 2013-04-05 2017-04-04 Dts, Inc. Layered audio reconstruction system
WO2014161996A2 (en) 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
EP3712889A1 (en) 2013-05-24 2020-09-23 Dolby International AB Efficient coding of audio scenes comprising audio objects
CN117012210A (zh) 2013-05-24 2023-11-07 杜比国际公司 对音频场景进行解码的方法、装置及计算机可读介质
US9818412B2 (en) 2013-05-24 2017-11-14 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
US9892737B2 (en) 2013-05-24 2018-02-13 Dolby International Ab Efficient coding of audio scenes comprising audio objects
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2854133A1 (en) * 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
KR20160072131A (ko) * 2013-10-02 2016-06-22 슈트로밍스위스 게엠베하 다채널 신호의 다운믹스 및 다운믹스 신호의 업믹스 방법 및 장치
SG11201602628TA (en) 2013-10-21 2016-05-30 Dolby Int Ab Decorrelator structure for parametric reconstruction of audio signals
JP6530412B2 (ja) 2014-01-08 2019-06-12 ドルビー・インターナショナル・アーベー 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
JP6235725B2 (ja) 2014-01-13 2017-11-22 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
EP3127109B1 (en) 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
CN107004421B (zh) * 2014-10-31 2020-07-07 杜比国际公司 多通道音频信号的参数编码和解码
US9691408B2 (en) * 2014-12-16 2017-06-27 Psyx Research, Inc. System and method for dynamic equalization of audio data
EP3107097B1 (en) * 2015-06-17 2017-11-15 Nxp B.V. Improved speech intelligilibility
KR20180075610A (ko) * 2015-10-27 2018-07-04 앰비디오 인코포레이티드 사운드 스테이지 향상을 위한 장치 및 방법
CA2987808C (en) * 2016-01-22 2020-03-10 Guillaume Fuchs Apparatus and method for encoding or decoding an audio multi-channel signal using spectral-domain resampling
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
DE102018127071B3 (de) * 2018-10-30 2020-01-09 Harman Becker Automotive Systems Gmbh Audiosignalverarbeitung mit akustischer Echounterdrückung
US11356791B2 (en) * 2018-12-27 2022-06-07 Gilberto Torres Ayala Vector audio panning and playback system
CN111615044B (zh) * 2019-02-25 2021-09-14 宏碁股份有限公司 声音信号的能量分布修正方法及其系统

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG43996A1 (en) * 1993-06-22 1997-11-14 Thomson Brandt Gmbh Method for obtaining a multi-channel decoder matrix
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
JP4478220B2 (ja) * 1997-05-29 2010-06-09 ソニー株式会社 音場補正回路
JP3657120B2 (ja) * 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000214887A (ja) * 1998-11-16 2000-08-04 Victor Co Of Japan Ltd 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
ATE390823T1 (de) * 2001-02-07 2008-04-15 Dolby Lab Licensing Corp Audiokanalübersetzung
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
KR100752482B1 (ko) * 2001-07-07 2007-08-28 엘지전자 주식회사 멀티채널 스트림 기록 재생장치 및 방법
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
TW569551B (en) * 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
EP1500083B1 (en) 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
CN1650528B (zh) * 2002-05-03 2013-05-22 哈曼国际工业有限公司 多信道下混频设备
JP2003333699A (ja) * 2002-05-10 2003-11-21 Pioneer Electronic Corp マトリックス・サラウンドデコード装置
KR20040043743A (ko) * 2002-11-19 2004-05-27 주식회사 디지털앤디지털 멀티채널 검색장치와 방법
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치

Also Published As

Publication number Publication date
NO337395B1 (no) 2016-04-04
DE602005006385T2 (de) 2009-05-28
WO2005069274A1 (en) 2005-07-28
JP4574626B2 (ja) 2010-11-04
ES2306076T3 (es) 2008-11-01
KR100803344B1 (ko) 2008-02-13
EP1706865B1 (en) 2008-04-30
EP1706865A1 (en) 2006-10-04
CN1910655B (zh) 2010-11-10
BRPI0506533A (pt) 2007-02-27
RU2329548C2 (ru) 2008-07-20
ATE393950T1 (de) 2008-05-15
US7394903B2 (en) 2008-07-01
JP2007519349A (ja) 2007-07-12
RU2006129940A (ru) 2008-02-27
BRPI0506533B1 (pt) 2018-11-06
AU2005204715A1 (en) 2005-07-28
CA2554002A1 (en) 2005-07-28
CN1910655A (zh) 2007-02-07
US20050157883A1 (en) 2005-07-21
IL176776A0 (en) 2008-03-20
IL176776A (en) 2010-11-30
AU2005204715B2 (en) 2008-08-21
KR20060132867A (ko) 2006-12-22
DE602005006385D1 (de) 2008-06-12
NO20063722L (no) 2006-10-19
CA2554002C (en) 2013-12-03
PT1706865E (pt) 2008-08-12

Similar Documents

Publication Publication Date Title
CA2554002C (en) Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US10165383B2 (en) Compatible multi-channel coding/decoding
US9865270B2 (en) Audio encoding and decoding
RU2409912C2 (ru) Декодирование бинауральных аудиосигналов
RU2361185C2 (ru) Устройство и способ для формирования многоканального выходного сигнала
RU2376726C2 (ru) Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио
RU2407226C2 (ru) Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
AU2004306509B2 (en) Compatible multi-channel coding/decoding

Legal Events

Date Code Title Description
FG Grant or registration