MXPA06014968A - Sntetizador de multicanal y metodo para generar una senal de salida de multicanal. - Google Patents

Sntetizador de multicanal y metodo para generar una senal de salida de multicanal.

Info

Publication number
MXPA06014968A
MXPA06014968A MXPA06014968A MXPA06014968A MXPA06014968A MX PA06014968 A MXPA06014968 A MX PA06014968A MX PA06014968 A MXPA06014968 A MX PA06014968A MX PA06014968 A MXPA06014968 A MX PA06014968A MX PA06014968 A MXPA06014968 A MX PA06014968A
Authority
MX
Mexico
Prior art keywords
post
channel
processed
reconstruction
parameter
Prior art date
Application number
MXPA06014968A
Other languages
English (en)
Inventor
Sascha Disch
Juergen Herre
Johannes Hilpert
Christian Ertel
Andreas Hoelzer
Claus-Christian Spenger
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MXPA06014968A publication Critical patent/MXPA06014968A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Radio Relay Systems (AREA)
  • Channel Selection Circuits, Automatic Tuning Circuits (AREA)
  • Stereophonic System (AREA)

Abstract

Se describe un sintetizador de multicanal que incluye un post-procesador (10) para determinar parametros de reconstruccion post-procesados o cantidades derivadas del parametro de reconstruccion para una porcion de tiempo actual de la senal de entrada, de tal manera que el parametro de reconstruccion post-procesado o la cantidad post-procesada es diferente del parametro de reconstruccion cuantificado e inversamente cuantificado correspondiente en que el valor del parametro de reconstruccion post-procesado o la cantidad derivada no esta limitado por el tamano de la etapa de cuantificacion. Un reconstructor (12) de multicanal usa el parametro de reconstruccion post-procesado para reconstruir la senal de salida de multicanal. Mediante el post-procesamiento de los parametros de reconstruccion, en relacion con la codificacion/descodificacion de multicanal permite una baja proporcion de datos por una parte y una alta calidad por otra parte, puesto que se reducen los cambios fuertes en la senal de salida de multicanal reconstruida debido a un tamano de etapa de cuantificacion mas grande para el parametro de reconstruccion, que es preferible debido a los requerimientos de baja proporcion de bits.

Description

SINTETIZADOR DE MULTICANAL Y MÉTODO PARA GENERAR UNA SEÑAL DE SALIDA DE MULTICANAL CAMPO DE LA INVENCIÓN La presente invención es concerniente con el procesamiento de audio de multicanal y en particular con la reconstrucción de audio de multicanal utilizando un canal base e información lateral paramétrica para reconstruir una señal de salida que tiene una pluralidad de canales.
ANTECEDENTES DE LA INVENCIÓN Y ARTE PREVIO En tiempos recientes, la técnica de reproducción de audio de multicanal se está volviendo más y más importante. Esto puede ser debido al hecho de que técnicas de compresión/codificación de audio tales como la técnica bien conocida de MP3 hicieron posible distribuir grabaciones de audio vía internet u otros canales de transmisión que tienen ancho de banda limitado. La técnica la codificación de MP3 se ha vuelto tan famosa debido al hecho que permite la distribución de todas las grabaciones en un formato estereofónico, esto es, una representación digital de la grabación de audio que incluye un primer canal o canal estereofónico izquierdo y un segundo canal o canal estereofónico derecho. No obstante, hay deficiencias básicas de los sistemas de sonido de dos canales convencionales. Por consiguiente, se ha desarrollado la técnica "surround" o envolvente. Una representación envolvente de multicanal recomendada incluye, además de los dos canales estéreo L y R, un canal central adicional C y dos canales envolventes Ls, Rs . Este formato de sonido de referencia también es denominado como tres/dos estéreo, que significa tres canales frontales y dos canales envolventes. En general, se requieren cinco canales de transmisión. En un ambiente de reproducción, por lo menos cinco altavoces en los respectivos cinco lugares diferentes son necesarios para obtener un punto de barrido óptimo en una cierta distancia de los cinco altavoces bien colocados. Varias técnicas son conocidas en el arte para reducir la cantidad de datos requeridos para transmisión de una señal de audio de multicanal. Tales técnicas son llamadas técnicas estéreo adjuntas. Para este fin, se hace referencia a la figura 10, que muestra un dispositivo estéreo adjunto 60. Este dispositivo puede ser un dispositivo que implementa por ejemplo estéreo intensidad (IS) o codificación de tono binaureal (BCC) . Tal dispositivo recibe en general - como entrada - por lo menos dos canales (CH1, CH2, ... CHn) , y emite un solo canal portador y datos paramétricos . Los datos paramétricos son definidos de tal manera que, en un descodificador, se puede calcular una aproximación de un canal original (CHl, CH2 ... CHn). Normalmente, el canal portador incluirá muestras de sub-banda, coeficientes espectrales, muestras de dominio de tiempo, etc., que proporcionan una representación comparativamente fina de la señal subyacente en tanto que los datos paramétricos no incluyen tales muestras de coeficientes espectrales pero incluyen parámetros de control para controlar un cierto algoritmo de reconstrucción tal como ponderación o pesada por multiplicación, desplazamiento de tiempo, desplazamiento de frecuencia, desplazamiento de fase ... Por consiguiente, los datos paramétricos incluyen solamente una representación comparativamente burda de la señal o el canal asociado. Dicho en números, la cantidad de datos requeridos por un canal portador estará en el intervalo de 60-70 kbit/segundo, en tanto que la cantidad de datos requeridos por la información lateral paramétrica para un canal estará en el intervalo de 1.5-2.5 kbit/segundo. Un ejemplo para datos paramétricos son los factores de escala bien conocidos, información de estéreo intensidad o parámetros de tono binaural como se describirá posteriormente en la presente. La codificación estéreo de intensidad es descrita en AES preprint 3799, "Intensity Stereo Coding", J. Herré, K. H. Brandemburg, D. Laderer, Febrero de 1994, Á sterdam. El concepto de estéreo intensidad está basado en una transformada de eje principal a ser aplicada a los datos de ambos canales de audio estereofónicos . Si la mayoría de los puntos de datos están concentrados alrededor del primer ejemplo principal, se puede obtener una ganancia de codificación al hacer girar ambas señales por un cierto ángulo antes de la codificación. Esto es, sin embargo, no siempre es cierto para técnicas de producción estereofónicas reales. Por consiguiente, esta técnica es modificada al excluir el segundo componente ortogonal de transmisión en la corriente de bits. Así, las señales reconstruidas para los canales izquierdo y derecho consisten de versiones diferentemente ponderadas o escaladas de la misma señal transmitida. No obstante, las señales reconstruidas difieren en su amplitud pero son idénticas con respecto a su información de fase. Las envolventes de energía-tiempo de ambos canales de audio originales, sin embargo, son conservados por medio de operación de escalado selectiva, que opera comúnmente de manera selectiva en frecuencia. Esto se conforma a la percepción humana de sonido a altas frecuencias, en donde los tonos espaciales dominantes son determinados por las envolventes de energía. Adicionalmente, en implementaciones prácticas, la señal transmitida, esto es, el canal portador es generado de la señal de suma del canal izquierdo y el canal derecho en lugar de hacer girar ambos componentes. Además, este procesamiento, esto es, generación de parámetros de estéreo intensidad para efectuar la operación de escalado, es efectuado selectivo en frecuencia, esto es, independientemente para cada banda de factor de escala, esto es partición de frecuencia de codificador. Preferiblemente, ambos canales son combinados para formar un canal combinado o "portador" y además del canal combinado, la información de estéreo intensidad es determinada que depende de la energía del primer canal, la energía del segundo canal o la energía del canal combinado. La técnica de BCC es descrita en AES convention paper 5574, "Binaural cue coding applied to stereo and multichannel audio compression", C. Faller, F. Baumgarte, mayo de 2002, Munich. En codificación de BCC, un número de canales de entrada de audio son convertidos a una representación espectral utilizando una transformada a base de DFT con ventanas traslapantes. El espectro uniforme resultante es dividido en particiones no traslapantes que tienen cada una un índice. Cada partición tiene un ancho de banda proporciona al ancho de banda rectangular equivalente (ERB) . Las diferencias de nivel inter-canal (ICLD) las diferentes de tiempo inter-canal (ICTD) son estimadas para cada partición para cada cuadro k. Los ICLD e ICTD con cuantificados y codificados dando como resultado una corriente de bits de BCC. Las diferencias de nivel inter-canal y diferencias de tiempo inter-canal son dadas para cada canal en relación con un canal de referencia. Luego, los parámetros son calculados de acuerdo con formales prescritas, gue dependen de las ciertas particiones de la señal a ser procesada. En un lado de decodificador, el descodificador recibe una señal mono y la corriente de bit de BCC. La señal monoaural es transformada al dominio de frecuencia e introducida a un bloque de síntesis espacial, que también recibe valores de ICLD e ICTD descodificados. En el bloque de síntesis espacial, los valores de parámetros de BCC (ICLD e ICTD) son usados para efectuar una operación de ponderación de la señal monoaural con el fin de sintetizar las señales de multicanal, las cuales después de una conversión en frecuencia/tiempo, representan una reconstrucción de la señal de audio de multicanal original. En el caso de BCC, el módulo 60 estereofónico adjunto es operativo para emitir la información lateral de canal de tal manera gue los datos de canal paramétricos son codificados y parámetros ICLD o ICTD codificados, en donde uno de los canales originales son usados como el canal de referencia para codificar la información lateral de canal. Normalmente, el canal portador es formado de la suma de los canales originales participantes. Naturalmente, las técnicas anteriores solamente proporcionan una representación monoaural para un descodificador, que puede solamente procesar el canal portador, pero no es apto de procesar los datos paramétricos para generar una o más aproximación de más de un canal de entrada. La técnica de codificación de audio conocida como codificación de tono binaural (BCC) es también descrita en las publicaciones de solicitud de patente Estadounidense US 2003, 0129130 Al, 2003/0026441 Al y 2003/0035553 Al. También se hace referencia adicional a "Binaural Cue Coding. Part II: Schemes and Applications", C. Faller y F. Baumgarte, IEEE Trans. On Audio and Speech Proc., Volumen. 11, No. 6, noviembre de 1993. Las publicaciones de solicitud de patente estadounidense y las dos publicaciones técnicas citadas en cuanto a la técnica de BCC de Faller y Baumgarte son incorporados en la presente por referencia en su totalidad. En lo siguiente, un esquema de BCC genérico típico para codificación de audio multicanal es elaborado en más detalle con referencia a las figuras 11 a 13. La figura 11 muestra un esquema de codificación de tono binaural genérico para codificación/transmisión de señales de audio de multicanal. La señal de entrada de audio de multicanal en una entrada 110 de un codificador BCC 112 es mezclada descendentemente en un bloque de mezclado descendente 114. En el ejemplo presente, la señal de multicanal original en la entrada 110 es una señal envolvente de cinco canales que tiene un canal izquierdo frontal, un canal derecho frontal, un canal envolvente izquierdo, un canal envolvente derecho y un canal central. En una modalidad preferida de la presente invención, el bloque 114 de mezclado descendente produce una señal de suma mediante una simple adición de estos cinco canales a una señal mono. Otros esquemas de mezclado descendente son conocidos en el arte de tal manera que, utilizando una señal de entrada de multicanal, se puede obtener una señal de mezclado descendente que tiene un solo canal. Este único canal es emitido en una línea de señal de suma 115. Una información lateral obtenida mediante un bloque 116 de análisis de BCC es emitida en una línea de información lateral 117. En el bloque de análisis de BCC, diferencias de nivel de inter-canal (ICLD) y diferencias de tiempo inter-canal (ICTD) con calculadas como se ha resumido anteriormente. Recientemente, el bloque 116 de análisis de BCC ha sido mejorado para también calcular valores de correlación inter-canal (valores ICC) . La señal de suma y la información lateral es transmitida, ' preferiblemente en una forma cuantificada y codificada, a un descodificador de BCC 120. El descodificador de BCC descompone la señal de suma transmitida en un número de sub-bandas y aplica escalado, retardos y otro procesamiento para generar las sub-bandas de las señales de audio de multicanal emitidas. Este procesamiento es efectuado de tal manera que los parámetros de ICLD, ICTD e ICC (tonos) de una señal de multicanal reconstruida en una salida 121 son similares a los tonos respectivos de la señal de multicanal original en la entrada 110 al codificador de BCC 112. Para este fin, el descodificador de BCC 120 incluye un bloque 122 de síntesis de BCC y un bloque 123 de procesamiento de información lateral. En lo siguiente, la construcción interna del bloque 122 de síntesis de BCC es explicada con referencia a la figura 12. La señal de suma en la línea 115 es introducida a una unidad de conversión de tiempo/frecuencia o banco de filtros FB 125. En la salida del bloque 125, existe un número N de señales de sub-banda o en un caso extremo, un bloque de coeficientes espectrales, cuando el banco 125 de filtros de audio efectúa una transformada 1:1, esto es, una transformada que produce N coeficientes espectrales de N muestras de dominio de tiempo. El bloque 122 de síntesis de BCC comprende además una etapa de retardo 126, una etapa 127 de modificación de nivel, una etapa 128 de procesamiento de correlación y una etapa IFB 129 de banco de filtros inverso. En la salida de la tapa 129, la señal de audio de multicanal reconstruido que tiene por ejemplo cinco canales en el caso de un sistema envolvente de cinco canales, puede ser emitida a un conjunto de altavoces 124 como se ilustra en la figura 11. Como se muestra en la figura 12, la señal de entrada (n) es convertida al dominio de frecuencia o dominio de banco de filtros por medio del elemento 125. La señal emitida por el elemento 125 es multiplicada de tal manera que varias versiones de la misma señal sean obtenidas como se ilustra por el nodo de multiplicación 130. El número de versiones de la señal original es igual al número de canales de salida en la señal de entrada a ser reconstruida cuando, en general, cada versión de la señal original en el nodo 130 es sometida a un cierto retardo di, d2, ..., di, ..., dN. Los parámetros de retardo son calculados por el bloque 123 de procesamiento de información lateral en la figura 11 y son derivados de las diferencias de tiempo inter-canal como se determina por el bloque 116 de análisis de BBC. Lo mismo es cierto para los parámetros de multiplicación ai, a2, ..., al f . . . , aN, que son también calculados por el bloque 123 de procesamiento de información lateral en base a diferencias de nivel inter-canal como se calcula por el bloque 116 de análisis de BCC. Los parámetros de ICC calculados por el bloque 116 de análisis de BCC son usados para controlar la funcionalidad del bloque 128, de tal manera que ciertas correlaciones entre las señales retardadas y manipuladas en nivel son obtenidas en las salidas del bloque 128. Se notará aquí que el ordenamiento de las etapas 126 127, 128 puede ser diferente del caso mostrado en la figura 12. Se notará aquí que, en un procesamiento a manera de cuadros de una señal de audio, el análisis de BCC es efectuado por cuadros, esto es, variable en el tiempo y también por frecuencia. Esto significa que, para cada banda espectral, se obtiene los parámetros de BCC. Esto significa que, en el caso del banco 125 de filtros de audio descompone la señal de entrada en por ejemplo 32 señales de paso de banda, el bloque de análisis de BCC obtiene un conjunto de parámetros BCC para cada una de las 32 bandas. Naturalmente, el bloque 122 de síntesis de BCC de la figura 11, que es mostrado en detalle en la figura 12, efectúa una reconstrucción que también está basada en las 32 bandas en el ejemplo.
En lo siguiente, se hace referencia a la figura 13 que muestra un montaje para determinar ciertos parámetros de BCC. Normalmente, los parámetros de ICLD, ICTD e ICC pueden ser definidos entre pares de canales. Sin embargo, es preferido determinar los parámetros de ICLD e ICTD entre un canal de referencia y un canal si y otro no. esto es ilustrado en la figura 13A. Los parámetros de ICC pueden ser definidos de diferentes maneras. Más en general, se podrían estimar parámetros de ICC en el codificador, entre todos los pares de canales posibles como se indica en la figura 13B. En este caso, un descodificador sintetizaría ICC de tal manera que es aproximadamente el mismo como en la señal de multicanal original entre todos los pares de canales posibles. Sin embargo, se propuso estimar solamente parámetros de ICC entre los dos canales más fuertes en cada vez. Este esquema es ilustrado en la figura 13C, en donde se muestra un ejemplo, en el cual en una instancia de tiempo, un parámetro de ICC es estimado entre los canales 1 y 2 y en otra instancia de tiempo, un parámetro de ICC es calculado entre los canales 1 y 5. Luego el descodificador sintetiza la correlación inter-canal entre los canales más fuertes en el descodificador y aplica alguna regla heurística para calcular y sintetizar la coherencia de inter-canal para los pares de canales restantes. Con respecto al cálculo de por ejemplo los parámetros de multiplicación ai, aN basados en los parámetros de ICLD transmitidos, se hace referencia al documento de convención AES 5574 citado anteriormente. Los parámetros de ICLD representan una distribución de energía en una señal de multicanal original. Sin pérdida de generalidad, se muestra en la figura 13A que hay cuatro parámetros ICLD que muestran la diferencia de energía en todos los otros canales y el canal izquierdo frontal. En el bloque 123 de procesamiento de información lateral, los parámetros de multiplicación ai, ... , aN son derivados de los parámetros de ICLD, de tal manera que la energía total de todos los canales de salida reconstruidos es la misma como (o proporcional a) la energía de la señal de suma transmitida. Una manera simple para determinar estos parámetros es un proceso de dos etapas, en el cual, en una primera etapa, el factor de multiplicación para el canal frontal izquierdo es ajustado a la unidad, en tanto que los factores de multiplicación para los otros canales en la figura 13A son ajustados a los valores de ICLD transmitidos. Luego, en una segunda etapa, la energía de todos los cinco canales es calculada y comparada con la energía de la señal de suma transmitida. Luego, todos los canales son escalados descendentemente utilizando un factor de escalamiento descendente que es igual para todos los canales, en donde el factor de escalamiento descendente es seleccionado de tal manera que la energía total de todos los canales de salida reconstruidos es, después del escalado descendente, igual a la energía total de la señal de suma transmitida. Naturalmente, hay otros métodos para calcular los factores de multiplicación, que no dependen del proceso de dos etapas pero que solamente necesitan un proceso de una etapa. Con respecto a los parámetros de retardo, se notará que los parámetros de retardo ICTD, que son transmitidos de un codificador de BCC pueden ser usados directamente, cuando el parámetro de retardo di para el canal frontal izquierdo es ajustado a cero. Ningún re-escalado o re-escalamiento se tiene que hacer aquí, puesto que un retardo no altera la energía de la señal. Con respecto al ICC de medida de coherencia de inter-canal transmitido del codificador de BCC al descodificador de BCC, se notará aquí que se puede efectuar una manipulación de coherencia al modificar los factores de multiplicación ai, ..., an tal como al multiplicar los factores de ponderación de todas las sub-bandas con números aleatorios con valores de entre 201ogl (-6) y 201ogl0(6). La secuencia pseudo-aleatoria es preferiblemente escogida de tal manera que la varianza es aproximadamente constante para todas las bandas críticas y el promedio es cero dentro de cada banda crítica. La misma secuencia es aplicada a los coeficientes espectrales para cada cuadro diferente. Así, el ancho de imagen auditivo es controlado al modificar la varianza de la secuencia pseudo-aleatoria. Una varianza más grande crea un ancho de imagen más grande. Una modificación de varianza puede ser efectuada en bandas individuales que son de ancho de banda crítico. Esto permite la existencia simultánea de múltiples objetos en una escena auditiva, cada objeto tiene un ancho de imagen diferente. Una distribución de amplitud apropiada para la secuencia pseudo-aleatoria es una distribución uniforme en una escala logarítmica como es resumido en la publicación de solicitud de patente estadounidense 2003/0219130 Al. No obstante, todo el procesamiento de síntesis de BCC está relacionado con un solo canal de entrada transmitido como la señal de suma del codificador de BCC al descodificador de BCC como se muestra en la figura 11. Una técnica relacionada, también conocida como estéreo paramétrica es descrita en J. Breebaart, S. van der Par, A. Kohlrausch, E. Schuijers, "High-Quality Parametric Spatial Audio Coding at Lo Bitrates, AES 116th Convention, Berlín, Preprint 6072, mayo de 2004, y E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, "Low Complexity Parametric Stereo Coding", AES 116th Convention, Berlín, Preprint 673, mayo de 2004. Como se ha resumido anteriormente con respecto a la figura 13, la información lateral paramétrica, esto es, las diferencias de nivel inter-canal (ICLD), las diferencias de tiempo inter-canal (ICTD) o el parámetro de coherencia inter-canal (ICC) pueden ser calculados y transmitidos para cada uno de los cinco canales. Esto significa que, normalmente, transmite cinco conjuntos de diferencias de nivel inter-canal para una señal de cinco canales. Lo mismo es cierto para las diferencias de tiempo inter-canal. Con respecto al parámetro de coherencia inter-canal, puede también ser suficiente transmitir solamente por ejemplo dos conjuntos de estos parámetros. Como se ha resumido anteriormente con respecto a la figura 12, no hay un solo parámetro de diferencia de nivel, parámetro de diferente de tiempo o parámetro de coherencia para un cuadro o porción de tiempo de una señal. En lugar de esto, estos parámetros son determinados para varias bandas de frecuencia diferentes de tal manera que se obtiene una parametrización dependiente de frecuencia. Puesto que es preferido usar por ejemplo 32 canales de frecuencia, esto es, un banco de filtros gue tiene 32 bandas de frecuencia para el análisis de BCC y síntesis de BCC, los parámetros pueden ocupar muchos datos. Aunque - en comparación con otras transmisiones de multicanal - la representación paramétrica da como resultado una proporción de datos bastante baja, hay necesidad continua de reducción adicional de la proporción de datos necesaria para representar una señal de multicanal tal como una señal que tiene dos canales (señal estéreo) o una señal que tiene más de dos canales tal como una señal envolvente de multicanal. Para este fin, los parámetros de reconstrucción calculados del lado del codificador son codificados de acuerdo con una cierta regla de cuantificación. Esto significa que los parámetros de reconstrucción sin cuantificar son mapeados sobre un conjunto limitado de niveles de cuantificación o índices de cuantificación como es conocido en el arte y descrito en detalle en C. Faller y F. Baumgarte, "Binaural cue coding applied to audio compression with flexible rendering", AES 113th Convention, Los Angeles, Preprint 5686, octubre de 2002. La cuantificación tiene el efecto de gue todos los valores de parámetros, que son más pequeños gue el tamaño de etapa de cuantificación, son cuantificados a cero. Adicionalmente, al mapear un conjunto grande de valores sin cuantificar a un conjunto pequeño de valores cuantificados da como resultado ahorro de datos per se. Estos ahorros en proporción de datos son mejorados adicionalmente mediante codificación por entropía de los parámetros de reconstrucción codificados en el lado del codificador. Métodos de codificación por entropía preferidos son métodos de Huffman a base de tablas de códigos predefinidos o a base de una determinación real de estadística de señal y construcción adaptable a señal de libros de códigos. Alternativamente, otras herramientas de codificación por entropía pueden ser usadas tales como codificación aritmética. En general, se tiene la regla de que la proporción de datos requerida para los parámetros de reconstrucción disminuye con el tamaño de etapa de cuantificador incrementada. En otras palabras, una cuantificación más burda da como resultado una proporción de datos más baja y una cuantificación más fina da como resultado una proporción de datos más alta. Puesto gue las representaciones de señales paramétricas son normalmente requeridas para ambientes de baja proporción de datos, se trata de cuantificar los parámetros de reconstrucción tan burdos como sean posibles para obtener una representación de señal que tiene una cierta cantidad de datos en el canal base y que tiene también una cantidad pequeña razonable de datos para la información lateral que incluye los parámetros de reconstrucción codificados y parámetros de reconstrucción codificados por entropía. Por consiguiente, los métodos del arte previo derivan los parámetros de reconstrucción a ser transmitidos directamente de la señal de multicanal a ser codificada. Una cuantificación burda como se discute anteriormente da como resultado distorsiones de parámetro de reconstrucción, que dan como resultado grandes errores de redondeo, cuando el parámetro de reconstrucción modificado es cuantificado inversamente en un descodificador y usados para síntesis de multicanal. Naturalmente, el error de redondeo se incrementa con el tamaño de etapa de cuantificador, esto es, con la "tosquedad de cuantificador" seleccionada. Tales errores de redondeo pueden dar como resultado un cambio de nivel de cuantificación, esto es, en un cambio de un primer nivel de cuantificación en una primera instancia de tiempo a un segundo nivel de cuantificación en una instancia de tiempo posterior, en donde la diferencia entre un nivel de cuantificador y otro nivel de cuantificador es definido por el tamaño de etapa de cuantificador bastante grande, que es preferible para una cuantificación burda. Desafortunadamente, tal cambio de nivel de cuantificador que suma al tamaño de etapa de cuantificador grande puede ser disparado por solamente un cambio de parámetro pegueño, cuando el parámetro sin cuantificar está en la parte media entre los dos niveles de cuantificación. Es claro que la presencia de tales cambios de índice de cuantificador en la información lateral da como resultado los mismos cambios fuertes en la etapa de síntesis de señal. Cuando - como ejemplo - se consideran la diferencia de nivel de inter-canal, se hace claro que un cambio fuerte da como resultado una disminución aguda de volumen de una cierta señal de altavoz y un incremento agudo acompañante del volumen de una señal para otro altavoz. Esta situación, que es solamente disparada por un cambio de nivel de cuantificación y una cuantificación burda puede ser percibida como una reubicación inmediata de una fuente de sonido de un primer lugar (virtual) a un segundo lugar (virtual) . Tal reubicación inmediata de una instancia de tiempo a otra instancia de tiempo suena no natural, esto es, es percibida como un efecto de modulación, puesto que fuentes de sonido de, en particular, señales de tono no cambian su ubicación muy rápido. En general, los errores de transmisión pueden dar como resultado cambios agudos de índices de cuantificador, que inmediatamente dan como resultado cambios agudos en la señal de salida de multicanal, que es aún más cierta para situaciones en las cuales un cuantificador burdo por razones de proporción de datos ha sido adoptado.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Es el objeto de la presente invención proporcionar un concepto de síntesis de señal mejorado que permite una baja proporción de datos por una parte y una buena calidad subjetiva por otra parte. De acuerdo con el primer aspecto de la presente invención, este objeto es obtenido por un sintetizador de multicanal para generar una señal de salida a partir de una señal de entrada, la señal de entrada tiene por lo menos un canal de entrada y una secuencia de parámetros de reconstrucción cuantificados, los parámetros de reconstrucción codificados siendo cuantificados de acuerdo con una regla de cuantificación y siendo asociados con porciones de tiempo subsecuentes del canal de entrada, la señal de salida tiene un número de canales de salida sintetizados y el número de canales de salida sintetizados es mayor de uno o mayor que un número de canales de entrada, que comprende: un post-procesador para determinar un parámetro de reconstrucción post-procesado o una cantidad post-procesada derivada del parámetro de reconstrucción para una porción de tiempo de la señal de entrada a ser procesada, en donde el post-procesador es operativo para determinar el parámetro de reconstrucción postprocesado, de tal manera que un valor del parámetro de reconstrucción post-procesado o la cantidad post-procesada es diferente de un valor obtenible utilizando la recuantificación de acuerdo con la regla de cuantificación y un reconstructor de multicanal para reconstruir una porción de tiempo del número de canales de salida sintetizados utilizando la porción de tiempo del canal de entrada y el parámetro de reconstrucción postprocesado o la cantidad post-procesada. De acuerdo con un segundo aspecto de la invención, este objeto es obtenido por un método para generar una señal de salida a partir de una señal de entrada, la señal de entrada tiene por lo menos un canal de entrada y una secuencia de parámetros de reconstrucción cuantificados, los parámetros de reconstrucción cuantificados son cuantificados de acuerdo con una regla de cuantificación y siendo asociados con porciones de tiempo subsecuentes del canal de entrada, la señal de salida tiene un número de canales de salida sintetizados y el número de canales de salida sintetizados siendo mayor de uno o mayor de un número de canales de entrada, que comprende: determinar un parámetro de reconstrucción post-procesado o una cantidad post-procesada derivada del parámetro de reconstrucción para una porción de tiempo de la señal de entrada a ser procesada, de tal manera que un valor del parámetro de reconstrucción post-procesado o la cantidad post-procesada es diferente de un valor obtenible utilizando recuantificación de acuerdo con la regla de cuantificación y reconstrucción de una porción de tiempo del número de canales de salida sintetizados utilizando la porción de tiempo del canal de entrada y el parámetro de reconstrucción post-procesado o la cantidad post-procesada. De acuerdo con un tercer aspecto de la presente invención, este objeto es obtenido por un programa de computadora que implementa el método anterior, cuando se ejecuta en una computadora. La presente invención está basada en el hallazgo que un post-procesamiento para parámetros de reconstrucción codificados usados en un sintetizador de multicanal es operativo para reducir o aún eliminar problemas asociados con la cuantificación burda por una parte y cambios de nivel de cuantificación por otra parte. En tanto que, en los sistemas del arte previo, un cambio de parámetro pequeño en un codificador da como resultado un cambio de parámetro fuerte en el descodificador, puesto que una recuantificación en el sintetizador es solamente admisible para conjunto limitado de valores cuantificados, el dispositivo de la invención lleva a cabo un post-procesamiento de parámetros de reconstrucción, de tal manera que el parámetro de reconstrucción post-procesado para una porción de tiempo a ser procesado de la señal de entrada no es determinado por la trama de cuantificación adoptada del codificador, sino que da como resultado un valor del parámetro de reconstrucción, que es diferente de un valor obtenible por la cuantificación de acuerdo con la regla de cuantificación. En tanto que, en un caso de cuantificador lineal, el método del arte previo permite solamente que valores cuantificados inversamente sean múltiples enteros del tamaño de etapa de cuantificador, el post-procesamiento de la invención permite que valores cuantificados inversamente no sean múltiples enteros del tamaño de etapa de cuantificador. Esto significa que el post-procesamiento de la invención elimina la limitación de tamaño de etapa de cuantificador, puesto que también los parámetros de reconstrucción post-procesados que caen entre dos niveles de cuantificador adyacentes pueden ser obtenidos mediante post-procesamiento y usados por el reconstructor multicanal de la invención, que hace uso del parámetro de reconstrucción post-procesado. Este post-procesamiento puede ser efectuado antes o después de la cuantificación en un sintetizador de multicanal. Cuando el post-procesamiento es efectuado con los parámetros cuantificados, esto es, con los índices de cuantificador, un cuantificador inverso es necesario, que puede cuantificar inversamente no solamente múltiples etapas de cuantificador, pero que puede también cuantificar inversamente a valores cuantificados inversamente entre múltiplos del tamaño de etapa del cuantificador. En el caso que el post-procesamiento sea efectuado utilizando parámetros de reconstrucción inversamente cuantificados, se puede usar un cuantificador inverso directo y la interpolación/filtración/suavizado se efectúa con los valores inversamente cuantificados . En el caso de una regla de cuantificación no lineal, tal como una regla de cuantificación logarítmica, un postprocesamiento de los parámetros de reconstrucción codificados antes de la recuantificación es preferido, puesto que la cuantificación logarítmica es similar a la percepción del oído humano del sonido, que es más exacto para un sonido de bajo nivel y menos exacto para el sonido de alto nivel, esto es hace una clase de compresión logarítmica. Se notará en la presente que los méritos de la invención no son obtenidos solamente al modificar el parámetro de reconstrucción mismo que está incluido en la corriente de bits como el parámetro cuantificado. Las ventajas pueden también ser obtenidas al derivar una cantidad post-procesada a partir del parámetro de reconstrucción. Esto es especialmente útil, cuando el parámetro de reconstrucción es un parámetro de diferencia y se efectúa una manipulación tal como suavizado sobre un parámetro absoluto derivado del parámetro de diferencia . En una modalidad preferida de la presente invención, el post-procesamiento para los parámetros de reconstrucción es controlado por medio de un analizador de señal, gue analiza la porción de señal asociada con un parámetro de reconstrucción para encontrar, cual característica de señal está presente. En una modalidad preferida, el post-procesamiento de la invención es activado solamente para porciones tonales de la señal (con respecto a frecuencia y/o tiempo) , en tanto que el postprocesamiento es desactivado para porciones no tonales, esto es, porciones transitorias de la señal de entrada. Esto asegura que la plena dinámica de cambios de parámetros de reconstrucción sean transmitidos para secciones transitorias de la señal de audio, en tanto que este no es el caso para porciones tonales de la señal. Preferiblemente, el post-procesador efectúa una modificación en forma de un suavizado de los parámetros de reconstrucción, en donde esto hace sentido desde un punto de vista psicoacústico, sin afectar tonos de detección espacial importantes, que son de especial importancia para porciones de señal no tonales, esto es, transitorias. La presente invención da como resultado una baja proporción de datos, puesto que una cuantificación del lado del codificador de parámetros de reconstrucción puede ser una cuantificación burda, puesto que el diseñador del sistema no tiene que temer cambios fuertes en el descodificador debido a un cambio de un parámetro de reconstrucción de un nivel inversamente cuantificado a otro nivel inversamente cuantificado, tal cambio es reducido por el procesamiento de la invención mediante mapeo a un valor entre dos niveles de recuantificación. Otra ventaja de la presente invención es que la calidad del sistema es mejorada, puesto que los artefactos audibles provocados por un cambio de un nivel de recuantificación al siguiente nivel de recuantificación permitido son reducidos por el post-procesamiento de la invención, que es operativo para mapear un valor entre dos niveles de recuantificación permitidos. Naturalmente, el post-procesamiento de la invención de parámetros de reconstrucción representa una perdida de información adicional, además de la pérdida de información obtenida mediante la parametrización en el codificador y cuantificación subsecuente del parámetro de reconstrucción. Esto es, sin embargo, no tan malo como suena, puesto que el post-procesador de la invención usa preferiblemente los parámetros de reconstrucción reales o cuantificados precedentes para determinar un parámetro de reconstrucción post-procesado a ser usado para la reconstrucción de la porción de tiempo real de la señal de entrada, esto es, el canal base. Se ha demostrado que esto da como resultado una calidad subjetiva mejorada, puesto que los errores inducidos por el codificador pueden ser compensados a un cierto grado. Aún cuando los errores inducidos por el lado del codificador no son compensados por el post-procesamiento de los parámetros de reconstrucción, cambios fuertes de la percepción espacial en la señal de audio de multicanal reconstruida son reducidos, de preferencia solamente para porciones de señal tonales, de tal manera que la calidad de escucha subjetiva es mejorada en cualquier caso, independientemente del hecho de si esto da como resultado perdida de información adicional o no.
BREVE DESCRIPCIÓN DE LAS FIGURAS Modalidades preferidas de la presente invención son descritas subsecuentemente al referirse a las figuras adjuntas, en las cuales: La figura 1 es un diagrama de bloques de una modalidad preferida del sintetizador de multicanal de la invención; La figura 2 es un diagrama de blogues de una modalidad preferida de un sistema de codificador/descodificador, en el cual el sintetizador de multicanal de la figura 1 está incluido; La figura 3 es un diagrama de bloques de una combinación de post-procesador/analizador de señal a ser usado en el sintetizador de multicanal de la invención de la figura 1; La figura 4 es una representación esquemática de porciones de tiempo de la señal de entrada y parámetros de reconstrucción cuantificados asociados para porciones de señal pasadas, porciones de señal actuales a ser procesadas y porciones de señal futuras; La figura 5 es una modalidad del post-procesador de la figura 1; La figura 6a es otra modalidad del post-procesador mostrado en la figura 1; La figura 6b es otra modalidad preferida del postprocesador; La figura 7a es otra modalidad del post-procesador mostrado en la figura 1; La figura 7b es una indicación esquemática de los parámetros a ser post-procesados de acuerdo con la invención, que muestra que también una cantidad derivada del parámetro de reconstrucción puede ser suavizada; La figura 8 es una representación esguemática de un cuantificador/cuantificador inverso gue efectúa un mapeo directo o un mapeo mejorado; La figura 9a es un curso de tiempo ejemplar de parámetros de reconstrucción cuantificados asociados con porciones de señal de entrada subsecuentes; La figura 9b es un curso en el tiempo de parámetros de reconstrucción post-procesados, los cuales han sido postprocesados por el post-procesador que implementa una función de suavizado (paso de bajos); La figura 10 ilustra un codificador estéreo adjunto del arte previo; La figura 11 es una representación en diagrama de bloques de una cadena de codificador/descodificador de BCC del arte previo; La figura 12 es un diagrama de bloques de una implementación del arte previo de un bloque de síntesis de BCC de la figura 11; y La figura 13 es una representación de un esquema bien conocido para determinar parámetros de ICLD, ICTD e ICC. La figura 1 muestra un diagrama de bloques de un sintetizador de multicanal de la invención para generar una señal de salida a partir de una señal de entrada. Como se mostrará más tarde con referencia a la figura 4, la señal de entrada tiene por lo menos un canal de entrada y una secuencia de parámetros de reconstrucción cuantificados, los parámetros de reconstrucción cuantificados son cuantificados de acuerdo con una regla de cuantificación. Cada parámetro de reconstrucción está asociado con una porción de tiempo del canal de entrada, de tal manera que una secuencia de porciones de tiempo tiene asociada con la misma una secuencia de parámetros de reconstrucción cuantificados . Adicionalmente, se notará que la señal de salida, que es generada por el sintetizador de multicanal de la figura 1 tiene un número de canales de salida sintetizados, que en cualquier caso es mayor gue el número de canales de entrada en la señal de entrada. Cuando el número de canales de entrada es uno, esto es, cuando hay un solo canal de entrada, el número de canales de salida será dos o más. Sin embargo, cuando el número de canales de entrada es dos o tres, el número de canales de salida será por lo menos 3 o por lo menos 4. En el caso de BCC descrito anteriormente, el número de canales de entrada será 1 o en general no más de 2, en tanto gue el número de canales de salida será 5 (envolvente izquierdo, izquierdo, central, derecho, envolvente derecho) o 6 (5 canales envolventes más un 1 canal de sub-bajo) o aún más, en el caso de formatos de multicanal 7.1 o 9.1. Como se muestra en la figura 1, el sintetizador de multicanal de la invención incluye, como elementos esenciales, un post-procesador 10 de parámetros de reconstrucción y un reconstructor 12 de multicanal. El post-procesador 10 de parámetros de reconstrucción es operativo para recibir parámetros de reconstrucción cuantificados y preferiblemente codificados para porciones de tiempo subsecuentes del canal de entrada. El post-procesador 10 de parámetro de reconstrucción es operativo para determinar un parámetro de reconstrucción post-procesado en la salida del mismo para una porción de tiempo a ser procesada de la señal de entrada. El postprocesador de parámetro de reconstrucción opera de acuerdo con una regla de post-procesamiento, que es en ciertas modalidades preferidas una regla de filtración de paso de bajos, una regla de suavizado o algo como aquellos. En particular, el postprocesador 10 es operativo para determinar el parámetro de reconstrucción post-procesado, de tal manera que un valor del parámetro de reconstrucción post-procesado es diferente de un valor obtenible mediante la recuantificación de cualquier parámetro de reconstrucción cuantificado de acuerdo con la regla de cuantificación. El reconstructor 12 de multicanal es usado para reconstruir una porción de tiempo de cada uno del número de canales de salida de síntesis utilizando la porción de tiempo a ser procesada del canal de entrada y el parámetro de reconstrucción post-procesado. En modalidades preferidas de la presente invención, los parámetros de reconstrucción cuantificados son parámetros BCC cuantificados tales como diferencias de nivel inter-canal, diferencia de tiempo inter-canal o parámetros de coherencia inter-canal. Naturalmente, todos los otros parámetros de reconstrucción tales como parámetros estéreo para estéreo intensidad o estéreo paramétrico pueden ser procesados de acuerdo con la presente invención también. Para resumir, el sistema de la invención tiene una primera entrada 14a para los parámetros de reconstrucción cuantificados y preferiblemente codificados asociados con porciones de tiempo subsecuentes de la señal de entrada. Las porciones de tiempo subsecuentes de la señal de entrada son introducidas a una segunda entrada 14b, que es conectada al reconstructor 12 de multicanal y preferiblemente a un analizador 16 de señal de entrada, que serán descritos posteriormente. En el lado de salida, el sintetizador de multicanal de la invención de la figura 1 tiene una salida 18 de señal de salida de multicanal, gue incluye varios canales de salida, el número de los cuales es mayor que un número de canales de entrada, en donde el número de canales de entrada puede ser un solo canal de entrada o dos o más canales de entrada. En cualquier caso, hay más canales de salida que canales de entrada, puesto que los canales de salida sintetizados son formados mediante el uso de la señal de entrada por una parte y la información lateral en forma de parámetros de reconstrucción por otra parte. En lo siguiente, se hará referencia a la figura 4, que muestra un ejemplo para una corriente de bits. La corriente de bits incluye varios cuadros 20a, 20b, 20c, ... cada cuadro incluye una porción de tiempo de la señal de entrada indicada por el rectángulo superior de un cuadro en la figura 4.
Adicionalmente, cada cuadro incluye un conjunto de parámetros de reconstrucción cuantificados que son asociados con la porción de tiempo y que son ilustrados en la figura 4 por el rectángulo inferior de cada cuadro 20a, 20b, 20c. Ejemplarmente, se considera el cuadro 20b como la porción de señal de entrada a ser procesada, en donde este cuadro tiene porciones de señal de entrada precedentes, esto es, que forman el "pasado" de la porción de señal de entrada a ser procesada. Adicionalmente, hay porciones de señal de entrada siguientes que forman el "futuro" de la porción de señal de entrada a ser procesada (la porción de entrada a ser procesada es también denominada como la porción de señal de entrada "actual"), en tanto que las porciones de señal de entrada en el "pasado" son denominadas como primeras porciones de señal de entrada, en tanto que las porciones de señal en el futuro son denominadas como porciones de señal de entrada posteriores. En lo siguiente, se hace referencia a la figura 2 con respecto a un montaje de codificador/descodificador completo, en el cual se puede situar el sintetizador de multicanal de la invención. La figura 2 muestra un lado de codificador 21 y un lado de descodificador 22. En el codificador, N canales de entrada originales son introducidos a una etapa de mezclador descendente 23. La etapa de mezclador descendente es operativo para reducir el número de canales a por ejemplo un solo monocanal o posiblemente a dos canales estéreo. La representación de señal mezclada descendentemente en la salida del mezclador descendente 23 es luego introducida a un codificador fuente 24, el codificador fuente es implementado por ejemplo como un descodificador MP3 o como un codificador AAC que produce una corriente de bits de salida. El lado del codificador 21 comprende además un extractor 25 de parámetros, que de acuerdo con la presente invención, efectúa el análisis de BCC (bloque 116 en la figura 119 y emite las diferencias de nivel inter-canal cuantificadas y preferiblemente codificadas por Huffman (ICLD). La corriente de bits en la salida del codificador fuente 24 también como los parámetros de reconstrucción cuantificados emitidos por el extractor 25 de parámetros puede ser transmitida a un descodificador 22 o puede ser almacenada para su transmisión posterior a un descodificador, etc. El descodificador 22 incluye un descodificador fuente 26, que es operativo para reconstruir una señal a partir de la corriente de bits recibida (que se origina del codificador fuente 24). Para este fin, el descodificador fuente 26 suministra, en su salida, porciones de tiempo subsecuentes de la señal de entrada a un mezclador ascendente 12, que efectúa la misma funcionalidad como el reconstructor 12 de multicanal en la figura 1. Preferiblemente, esta funcionalidad es una síntesis de BCC como se implementa por el blogue 122 en la figura 11. Contrario a la figura 11, el sintetizador de multicanal de la invención comprende además el post-procesador 10, que es denominado como "suavizador de diferencia de nivel inter-canal (ICLD)", que es controlado por el analizador 16 de señal de entrada, que efectúa preferiblemente un análisis de tonalidad de la señal de entrada. Se puede ver de la figura 2 que hay parámetros de reconstrucción tales como las diferencias de nivel inter-canal (ICLD), que son introducidos al suavizador de ICLD, en tanto que hay una conexión adicional entre el extractor 25 de parámetros y el mezclador ascendente 12. Vía esta conexión de desviación, otros parámetros para reconstrucción, que no tienen que ser post-procesados pueden ser suministrados del extractor 25 de parámetros al mezclador ascendente 12. La figura 3 muestra una modalidad preferida del procesamiento de parámetro de reconstrucción adaptable de señal formado por el analizador 16 de señal y el suavizador de ICLD 10. El analizador 16 de señal es formado a partir de una unidad 16a de determinación de tonalidad y un dispositivo de formación de umbral subsecuente 16b. Adicionalmente, el postprocesador 10 de parámetros de reconstrucción de la figura 2 incluye un filtro de suavizado 10a y un conmutador 10b postprocesador. El conmutador 10b de post-procesador es operativo para ser controlado por el dispositivo 16b de formación de umbral, de tal manera que el conmutador es accionado, cuando el dispositivo de formación de umbral 16b determina que una cierta señal característica de la señal de entrada tal como la característica de tonalidad está en una relación predeterminada con un cierto umbral especificado. En el caso presente, la situación es tal que el conmutador es accionado para estar en la posición superior (como se muestra en la figura 3) , cuando la tonalidad de una porción de señal de la señal de entrada y en particular, una cierta banda de frecuencia de una cierta porción de tiempo de la señal de entrada tiene una tonalidad por encima de un umbral de tonalidad. En este caso, el conmutador 10b es accionado para conectar la salida del filtro de suavizado 10a a la entrada del reconstructor 12 de multicanal, de tal manera que las diferencias de inter-canal post-procesadas, pero todavía no inversamente cuantificadas son suministradas al descodificador/reconstructor de multicanal/mezclador descendente 12. Sin embargo, cuando los medios de determinación de tonalidad determinan que una cierta banda de frecuencia de una porción de tiempo actual de la señal de entrada, esto es, una cierta banda de frecuencia de una porción de señal de entrada a ser procesada tiene una tonalidad más baja que el umbral especificado, esto es, es transitorio, el conmutador es accionado de tal manera que el filtro de suavizado de 10a es omitido.
En el último caso, el post-procesamiento adaptable de señal por el filtro de suavizado 10a asegura que los cambios de parámetros de reconstrucción para señales transitorias pasen la etapa de post-procesamiento sin modificar y de como resultado cambios rápidos en la señal de salida reconstruida con respecto a la imagen espacial que corresponde a situaciones reales con un alto grado de probabilidad para señales transitorias. Se notará en la presente que la modalidad de la figura 3, esto es, activación de post-procesamiento por una parte y plena desactivación post-procesamiento por otra parte, esto es, una decisión binaria para post-procesamiento o no es solo una modalidad preferida debido a su estructura simple y eficiente. No obstante, se notará que, en particular con respecto a la tonalidad, esta característica de señal no es solamente un parámetro cualitativo sino también un parámetro cuantitativo, el cual puede ser normalmente entre 0 y 1. De acuerdo con el parámetro determinado cuantitativamente, el grado de suavizado de un filtro de suavizado o por ejemplo la frecuencia de corte de un filtro de paso de bajos puede ser ajustada de tal manera que, para señales pesadamente tonales, un suavizado fuerte es activado, en tanto que para señales que no son tan tonales, el suavizado con un grado de suavizado más bajo es iniciado. Naturalmente, también se podrían detectar porciones transitorias y exagerar los cambios en los parámetros a valores entre valores cuantificados predefinidos o índices de cuantificación de tal manera que, para señales fuertemente transitorias, el post-procesamiento para los parámetros de reconstrucción dé como resultado un cambio aún más exagerado de la imagen espacial de una señal multicanal. En este caso, un tamaño de etapa de cuantificación de 1 como instruida por parámetros de reconstrucción subsecuentes para porciones de tiempo subsecuentes puede ser mejorada por ejemplo a 1.5, 1.4, 1.3, etc., gue da como resultado una imagen espacial aún más dramáticamente cambiante de la señal de multicanal reconstruida . Se notará en la presente que una característica de señal tonal, una característica de señal transitoria u otras características de señal son solamente ejemplos para características de señal, en base a las cuales se puede efectuar un análisis de señal para controlar un post-procesador de parámetros de reconstrucción. En respuesta a este control, el post-procesador de parámetros de reconstrucción determina un parámetro de reconstrucción post-procesado que tiene un valor que es diferente de cualesquier valores para índices de cuantificación por una parte o valores de recuantificación por otra parte como se determina por una regla de cuantificación predeterminada . Se notará en la presente que el post-procesamiento de parámetros de reconstrucción dependientes de una característica de señal, esto es, un post-procesamiento de parámetro adaptable a señal es solamente opcional. Un post-procesamiento independiente de señal también proporciona ventajas para muchas señales. Una cierta función de post-procesamiento podría por ejemplo ser seleccionada por el usuario de tal manera gue el usuario obtiene cambios mejorados (en caso de una función de exageración) o cambios amortiguados (en el caso de una función de suavizado) . Alternativamente, un post-procesamiento independiente de cualguier selección del usuario e independiente de características de señal puede también proporcionar ciertas ventajas con respecto a resiliencia de error. Se hace claro que, especialmente en el caso de un tamaño de etapa de cuantificador grande, un error de transmisión en un índice de cuantificador puede dar como resultado artefactos fuertemente audibles. Para este fin, se efectúa una corrección de error directa o algo como aquello, cuando la señal tiene que ser transmitida en canales propensos a error. De acuerdo con la presente invención, el post-procesamiento puede eliminar la necesidad de cualesquier códigos de corrección de error ineficientes en bits, puesto que el post-procesamiento de los parámetros de reconstrucción basado en parámetros de reconstrucción en el pasado da como resultado detección de parámetros de reconstrucción codificados trasmitidos erróneos y dará como resultado contramedidas apropiadas contra tales errores. Adicionalmente, cuando la función de post-procesamiento es una función de suavizado, parámetros de reconstrucción codificados fuertemente diferentes de parámetros de reconstrucción anteriores o posteriores serán automáticamente manipulados como se resumirá posteriormente en la presente. La figura 5 muestra una modalidad preferida del postprocesador 10 de parámetro de reconstrucción de la figura 1. En particular, se considera la situación en la cual los parámetros de reconstrucción cuantificados son codificados. Aquí, los parámetros de reconstrucción cuantificados codificados entran a un descodificador de entropía 10c, que emite la secuencia de parámetros de reconstrucción cuantificados descodificados. Los parámetros de reconstrucción en la salida del descodificador de entropía son cuantificados, lo que significa que no tienen un cierto valor "útil", pero que significa que indican ciertos índices de cuantificador o niveles de cuantificador de una cierta regla de cuantificación implementada por un cuantificador inverso subsecuente. El manipulador 10 puede ser por ejemplo un filtro digital, tal como un IIR (preferiblemente) o un filtro FIR que tiene cualquier característica de filtro determinada por la función de postprocesamiento requerida. Una función de post-procesamiento de suavizado o de filtración de paso de bajos es preferida. En la salida del manipulador lOd, se obtiene una secuencia de parámetros de reconstrucción cuantificados manipulados, que no son solamente números enteros sino que son cualesquier números reales que caen dentro del intervalo determinado por la regla de cuantificación. Tal parámetro de reconstrucción cuantificado manipulado podría tener valores de 1.1, 0.1, 0.05, ..., en comparación con valores 1, 0, 1 antes de la etapa lOd. La secuencia de valores en la salida del blogue lOd son luego introducidos a un cuantificador lOe inverso mejorado para obtener parámetros de reconstrucción post-procesados, que pueden ser usados para la reconstrucción multicanal (por ejemplo, síntesis de BCC) en el bloque 12 de la figura 1. Se notará que el cuantificador mejorado lOe es diferente de un cuantificador inverso normal puesto gue un cuantificador inverso normal solamente mapea cada entrada de cuantificación de un número limitado de índices de cuantificación a un valor de salida cuantificado inversamente especificado. Los cuantificadores inversos normales no pueden mapear índices de cuantificador que no son enteros. Por consiguiente, el cuantificador lOe inverso mejorado es implementado a preferiblemente el uso de la misma regla de cuantificación como una ley de cuantificación lineal o logarítmica, pero puede aceptar entradas que no son enteros para proporcionar valores de salida que son diferentes de valores obtenibles al solamente utilizar entradas de enteros. Con respecto a la presente invención, no hace ninguna diferencia básicamente, si la manipulación es efectuada antes de la recuantificación (véase figura 5) o después de la recuantificación (véase figura 6a, figura 6b) . En el último caso, el cuantificador inverso solamente tiene gue ser un cuantificador inverso directo normal, que es diferente del cuantificador inverso mejorado lOe de la figura 5 como se ha resumido anteriormente. Naturalmente, la selección entre figura 5 y figura 6a será cuestión de elección dependiendo de la cierta implementación. Para la implementación de BCC presente, la modalidad de la figura 5 es preferida, puesto que es más compatible con los algoritmos de BCC existentes. No obstante, esta puede ser diferente para otras aplicaciones. La figura 6b muestra una modalidad en la cual el cuantificador lOe inverso mejorado de la figura 6a es reemplazado por un cuantificador inverso directo y un mapeador lOg para mapear de acuerdo con una curva lineal o preferiblemente no lineal. Este mapeador puede ser implementado en elementos físicos o en elementos de programación, tal como un circuito para efectuar una operación matemática tal como una tabla de consulta. La manipulación de datos, utilizando por el ejemplo el suavizador lOg puede ser efectuada antes del mapeador lOg o dosis del mapeador lOg o en ambos lugares en combinación. Esta modalidad es preferida cuando el postprocesamiento es efectuado en el dominio de cuantificador inverso, puesto que todos los elementos lOf, lOh, lOg pueden ser implementados utilizando componentes directos tales como circuitos de rutinas de elementos de programación. En general, el post-procesador 10 es implementado como un post-procesador como se indica en la figura 7a, que recibe todos o una selección de parámetros de reconstrucción cuantificados actuales, parámetros de reconstrucción futuros o parámetros de reconstrucción cuantificados pasados. En el caso en el cual el post-procesador solamente recibe por lo menos un parámetro de reconstrucción del pasado y el parámetro de reconstrucción actual, el post-procesador actuará como un filtro de paso de bajos. Cuando el post-procesador 10, sin embargo recibe un parámetro de reconstrucción cuantificado del futuro, que no es posible en aplicaciones en tiempo real, pero que es posible en todas las otras aplicaciones, el postprocesador puede efectuar una interpolación entre el parámetro de reconstrucción cuantificado del presente o del pasado a por ejemplo suavizar un curso de tiempo de un parámetro de reconstrucción, por ejemplo para una cierta banda de frecuencia . Como se ha resumido anteriormente, la manipulación de datos para superar artefactos debidos a tamaños de etapa de cuantificación en un ambiente de cuantificación burdo puede también ser efectuada en una cantidad derivada del parámetro de reconstrucción anexado al canal base en la señal de multicanal codificada paramétricamente . Cuando por ejemplo el parámetro de reconstrucción cuantificado es un parámetro de diferencia (ICLD), este parámetro puede ser cuantificado inversamente sin ninguna modificación. Luego un valor de nivel absoluto para un canal de salida puede ser derivado y la manipulación de datos de la invención es efectuada sobre el valor absoluto. Este procedimiento también da como resultado la reducción de artefactos de la invención, en tanto que una manipulación de datos en la trayectoria de procesamiento entre el parámetro de reconstrucción cuantificado y la reconstrucción actual es efectuada de tal manera que un valor del parámetro de reconstrucción post-procesado o la cantidad post-procesada es diferente de un valor obtenible utilizando la recuantificación de acuerdo con la regla de cuantificación, esto es sin manipulación para superar la "limitación de tamaño de etapa". Muchas funciones de mapeo para derivar la cantidad eventualmente manipulada del parámetro de reconstrucción cuantificado son ideables y usadas en el arte, en donde estas funciones de mapeo incluyen funciones para mapear de manera única un valor de entrada a un valor de salida de acuerdo con una regla de mapeo para obtener una cantidad no post-procesada, la cual es luego post-procesada para obtener la cantidad post-procesada usada en el algoritmo de reconstrucción de multicanal (síntesis) . En lo siguiente, se hace referencia a la figura 8 para ilustrar diferencias entre un cuantificador inverso mejorado lOe de la figura 5 y un cuantificador inverso directo lOf de la figura 6a. Para este fin, la ilustración de la figura 8 muestra, como un eje horizontal, un eje de valor de entrada para valores no cuantificados . El eje vertical ilustra los niveles de cuantificador o índices de cuantificador, que son preferiblemente enteros que tienen un valor de 0, 1, 2, 3. Se notará en la presente que el cuantificador de la figura 8 no dará como resultado cualesquier valores entre 0 y 1 ó 1 y 2. El mapeo a estos niveles de cuantificador es controlado por la función en forma de escalera de tal manera que valores entre -10 y 10 por ejemplo son mapeados a 0, en tanto que valores entre 10 y 20 son cuantificados a 1, etc. Una función de cuantificador inverso posible es mapear un nivel de cuantificador de 0 a un valor inversamente cuantificado de 0. Un nivel de cuantificador de 1 sería mapeado a un valor inversamente cuantificado de 10. Análogamente, un nivel de cuantificador de 2 sería mapeado a un valor inversamente cuantificado de 20 por ejemplo. La recuantificación es controlada por consiguiente por una función de cuantificador inversa indicada por el número de referencia 31. Se notará que, para un cuantificador inverso directo, solamente los puntos de cruce de la línea 30 y línea 31 son posibles. Esto significa que, para un cuantificador inverso que tiene una regla de cuantificador inversa de la figura 8 solamente valores de 0, 10, 20, 30 pueden ser obtenidos mediante recuantificación.
Esto es diferente en el cuantificador inverso mejorado lOe, puesto que el cuantificador inverso mejorado recibe, como entrada, valores entre 0 y 1 ó 1 y 2 tal como el valor de 0.5. La recuantificación avanzada del valor 0.5 obtenido por el manipulador lOd dará como resultado un valor de salida inversamente cuantificado de 5, esto es, en un parámetro de reconstrucción post-procesado que tiene un valor que es diferente de un valor obtenible mediante recuantificación de acuerdo con la regla de cuantificación. En tanto gue la regla de cuantificación normal solamente permite valores de 0 ó 10, el cuantificador inverso de la invención que trabaja de acuerdo con la función 31 de cuantificador inverso da como resultado un valor diferente, esto es, el valor de 5 como se indica en la figura 8. En tanto que el cuantificador inverso directo mapea niveles de cuantificador enteros a niveles cuantificados solamente, el cuantificador inverso mejorado recibe "niveles" de cuantificador no enteros para mapear estos valores a "valores inversamente cuantificados" entre los valores determinados por la regla de cuantificador inverso. La figura 9 muestra el impacto del post-procesamiento de la invención para la modalidad de la figura 5. La figura 9a muestra una secuencia de parámetros de reconstrucción cuantificados que varían entre 0 y 3. La figura 9b muestra una secuencia de parámetros de reconstrucción post-procesados, que también son denominados como "índices de cuantificador modificados", cuando la forma de onda de la figura 9a es introducida a un filtro de paso de bajos (suavizado) . Se notará aquí que, los incrementos/disminuciones en la instancia de tiempo 1, 4, 6, 8, 9 10 son reducidos en la modalidad de la figura 9b. Se notará con énfasis que el pico entre el instante de tiempo 8 y el instante de tiempo 9, el cual podría ser un artefacto es amortiguado por toda una etapa de cuantificación. La amortiguación de tales valores extremos puede ser controlada sin embargo por un grado de post-procesamiento de acuerdo con un valor de tonalidad cuantitativo como se ha resumido anteriormente . La presente invención es ventajosa en que el postprocesamiento de la invención suaviza fluctuaciones o suaviza valores extremos cortos. Esta situación surge especialmente en un caso, en el cual porciones de señal de varios canales de entrada que tienen una energía similar son sobre-colocados en una banda de frecuencia de una señal, esto es, el canal base o canal de señal de entrada. Esta banda de frecuencia es luego, por porción de tiempo y dependiente de la situación de instante mezclada a los canales de salida respectivos de una manera altamente fluctuante. Desde el punto de vista psico-acústico, sin embargo, sería mejor suavizar estas fluctuaciones, puesto gue estas fluctuaciones no contribuyen sustancialmente a una detección de la ubicación de una fuente pero afectan la impresión de escucha subjetiva de manera negativa. De acuerdo con una modalidad preferida de la presente invención, tales artefactos audibles son reducidos o aún eliminados sin incurrir en algunas pérdidas de calidad en un lugar diferente en el sistema o sin requerir una resolución/cuantificación más alta (y así una proporción de datos más alta) de los parámetros de reconstrucción transmitidos. La presente invención alcanza este objeto al efectuar una modificación adaptable a la señal (suavizado) de los parámetros sin influenciar sustancialmente tonos de detección de localización espacial importantes. Los cambios que ocurren repentinamente en la característica de la señal de salida reconstruida dan como resultado artefactos audibles en particular para señales de audio que tienen una característica estacionaria altamente constante. Este es el caso con señales tonales. Por consiguiente, es importante proporcionar una transición "más suave" entre parámetros de reconstrucción cuantificados para tales señales. Esto puede ser obtenido por ejemplo mediante suavizado, interpolación, etc. Adicionalmente, tal modificación de valor de parámetro puede introducir distorsiones audibles para otros tipos de señales de audio. Este es el caso para señales que incluyen fluctuaciones rápidas en su característica. Tal característica puede ser encontrada en la parte transitoria o ataque de un instrumento de percusión. En este caso, la presente invención proporciona una desactivación del suavizado de parámetros. Esto es obtenido mediante el post-procesamiento de los parámetros de reconstrucción cuantificados transmitidos de una manera adaptable a la señal. La adaptabilidad puede ser lineal o no lineal. Cuando la adaptabilidad es no lineal, se efectúa un procedimiento de formación de umbral como se describe en la figura 3. Otro criterio para controlar la adaptabilidad es una determinación de la calidad estacionaria de una característica de señal. Una cierta forma para determinar la calidad estacionaria de una característica de señal es la evaluación de la envolvente de señal o, en particular, la tonalidad de la señal. Se notará aquí que la tonalidad puede ser determinada para todo el intervalo de frecuencia o de preferencia, individualmente para diferentes bandas de frecuencia de una señal de audio. La presente invención da como resultado una reducción o aún eliminación de artefactos, los cuales eran hasta ahora inevitables, sin incurrir en un incremento de la proporción de datos requerida para transmitir los valores de parámetros. Como se ha resumido anteriormente con respecto a las figuras 2 y 3, la modalidad preferida de la presente invención efectúa un suavizado de diferencias de nivel inter-canal, cuando la porción de señal bajo consideración tiene una característica tonal. Diferencias de nivel inter-canal, que son calculadas en un codificador y cuantificadas en un codificador son enviadas a un descodificador para experimentar una operación de suavizado adaptable a la señal. El componente adaptable es una determinación de tonalidad que conmuta a encendido la filtración de diferencias de nivel inter-canal para componentes espectrales tonales y que conmuta a apagado tal post-procesamiento para componentes semejantes a ruido y componente espectrales transitorios. En esta modalidad, ninguna información lateral adicional de un codificador es requerida para efectuar algoritmos de suavizado adaptables. Se notará en la presente que el post-procesamiento de la invención puede también ser usado para otros conceptos de codificación paramétrica de señales de multicanal tales como MP3/AAC estéreo paramétricos, envolvente MP3 y métodos similares .

Claims (26)

  1. REIVINDICACIONES 1. Un sintetizador de multicanal para generar una señal de salida a partir de una señal de entrada, la señal de entrada tiene por lo menos un canal de entrada y una secuencia de parámetros de reconstrucción cuantificados, los parámetros de reconstrucción cuantificados son cuantificados de acuerdo con una regla de cuantificación y son asociados con porciones de tiempo subsecuentes del canal de entrada, la señal de salida tiene un número de canales de salida sintetizados y el número de canales de salida sintetizados es mayor de 1 o mayor de un número de canales de entrada, caracterizado porque comprende: un post-procesador para determinar un parámetro de reconstrucción post-procesado o una cantidad post-procesada derivada del parámetro de reconstrucción para una porción de tiempo de la señal de entrada a ser procesada, en donde el post-procesador es operativo para determinar el parámetro de reconstrucción post-procesado o la cantidad post-procesada, de tal manera que un valor del parámetro de reconstrucción postprocesado o la cantidad post-procesada es diferente de un valor obtenible utilizando la recuantificación de acuerdo con la regla de cuantificación; un reconstructor de multicanal para reconstruir una porción de tiempo del número de canales de salida sintetizados utilizando la porción de tiempo del canal de entrada y el parámetro de reconstrucción post-procesado o el valor post-procesado .
  2. 2. El sintetizador de multicanal de conformidad con la reivindicación 1, caracterizado porque comprende además: un analizador de señal de entrada para analizar la señal de entrada para determinar una característica de señal de la porción de tiempo de la señal de entrada a ser procesada; y en donde el post-procesador es operativo para determinar el parámetro de reconstrucción post-procesado dependiendo de la característica de señal.
  3. 3. El sintetizador de multicanal de conformidad con la reivindicación 2, caracterizado porque el post-procesador es operativo para determinar el parámetro de reconstrucción postprocesado, cuando una característica de señal predeterminada es determinada por el analizador de señal de entrada y para omitir el post-procesador, cuando la característica de señal predeterminada no es determinada por el analizador de señal de entrada para una porción de tiempo de la señal de entrada.
  4. 4. El sintetizador de multicanal de conformidad con la reivindicación 3, caracterizado porque el analizador de señal de entrada es operativo para determinar la característica de señal como la característica de señal predeterminada, cuando un valor de característica de señal está en una relación especificada a un umbral.
  5. 5. El sintetizador de multicanal de conformidad con la reivindicación 2, 3 ó 4, caracterizado porque la característica de señal es una característica de tonalidad o una característica transitoria de la porción de la señal de entrada a ser procesada.
  6. 6. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-5, caracterizado porque el post-procesador es operativo para efectuar una función de suavizado, de tal manera que una secuencia de parámetros de reconstrucción post-procesados es más lisa o suave en el tiempo en comparación con una secuencia de parámetros de reconstrucción inversamente cuantificados no post-procesados.
  7. 7. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-6, caracterizado porque el post-procesador es operativo para efectuar una operación de suavizado y en el cual el post-procesador incluye un filtro digital que tiene una característica de paso de bajos, el filtro recibe como entrada por lo menos un parámetro de reconstrucción asociado con una porción de tiempo precedente de la señal de entrada.
  8. 8. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-7, caracterizado porque el post-procesador es operativo para efectuar una función de interpolación utilizando un parámetro de reconstrucción asociado con por lo menos una porción de tiempo precedente o usando un parámetro de reconstrucción asociado con por lo menos una porción de tiempo subsecuente.
  9. 9. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-8, caracterizado porque el post-procesador es operativo. para determinar un parámetro de reconstrucción manipulado que no es coincidente con cualquier nivel de cuantificación definido por la regla de cuantificación; y para cuantificar inversamente el parámetro de reconstrucción manipulado utilizando un cuantificador inverso que es operable para mapear el parámetro de reconstrucción manipulado a un parámetro de reconstrucción manipulado inversamente cuantificado que no es coincidente con un valor inversamente cuantificado definido por el mapeo de cualquier nivel de cuantificación por el cuantificador inverso.
  10. 10. El sintetizar de multicanal de conformidad con la reivindicación 9, caracterizado porque la regla de cuantificación es una regla de cuantificación logarítmica.
  11. 11. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-11, caracterizado porque el post-procesador es operativo: para cuantificar inversamente parámetros de reconstrucción cuantificados de acuerdo con la regla de cuantificación, para manipular parámetros de reconstrucción inversamente cuantificados obtenidos; y para mapear parámetros manipulados de acuerdo con una función no lineal o una función lineal.
  12. 12. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-11, caracterizado porque el post-procesador es operativo: para cuantificar inversamente parámetros de reconstrucción cuantificados de acuerdo con la regla de cuantificación, para mapear parámetros inversamente cuantificados de acuerdo con una función no lineal o función lineal, y para manipular parámetros de reconstrucción mapeados obtenidos .
  13. 13. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-12, caracterizado porque el post-procesador es operativo a un parámetro de reconstrucción inversamente cuantificado asociado con la porción de tiempo subsecuente de la señal de entrada de acuerdo con la regla de cuantificación; y en el cual el post-procesador es operativo adicionalmente para determinar un parámetro de reconstrucción post-procesado en base a por lo menos un parámetro de reconstrucción inversamente cuantificado para por lo menos una porción de tiempo precedente de señal de entrada.
  14. 14. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-13, caracterizado porque una porción de tiempo de la señal de entrada tiene asociado con la misma una pluralidad de parámetros de reconstrucción cuantificados para diferentes bandas de frecuencia de la señal de entrada, y en el cual el post-procesador es operativo para determinar parámetros de reconstrucción post-procesados para las diferentes bandas de frecuencia de la señal de entrada.
  15. 15. El sintetizador de multicanal de conformidad con cualguiera de las reivindicaciones 1-14, caracterizado porque la señal de entrada es un espectro de suma obtenido al combinar por lo menos dos canales originales de una señal de audio de multicanal, y en el cual el parámetro de reconstrucción cuantificado es un parámetro de diferencia de nivel de inter-canal, un parámetro de diferencia de tiempo inter-canal, un parámetro de diferencia de fase inter-canal o un parámetro de coherencia de inter-canal.
  16. 16. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 2-15, caracterizado porque el analizador de canal de entrada es operativo para determinar un grado que indica cuantitativamente cuanto la señal de entrada tiene la característica de señal, y en el cual el post-procesador es operativo para efectuar un post-procesamiento con una intensidad o fuerza dependiente del grado.
  17. 17. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-16, caracterizado porque el post-procesador es operativo para usar el parámetro de reconstrucción cuantificado asociado con la porción de tiempo a ser procesada, cuando se determina el parámetro de reconstrucción post-procesado para la porción de tiempo a ser procesada .
  18. 18. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-17, caracterizado porgue la regla de cuantificación es de tal manera que una diferencia entre dos niveles de cuantificación adyacentes es más grande que una diferencia entre dos números determinados por una exactitud de procesador de un procesador para efectuar cálculos numéricos .
  19. 19. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-18, caracterizado porque los parámetros de reconstrucción cuantificados son codificados por entropía y asociados con la porción de tiempo en una forma codificada por entropía, y en el cual el post-procesador es operativo para descodificar por entropía el parámetro de reconstrucción cuantificado codificado por entropía usado para determinar los parámetros de reconstrucción post-procesados.
  20. 20. El sintetizador de multicanal de conformidad con la reivindicación 7, caracterizado porque el filtro digital es un filtro de IIR.
  21. 21. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-20, caracterizado porque el post-procesador es operativo para implementar una regla de post-procesamiento, de tal manera que una diferencia entre parámetros de reconstrucción post-procesados para porciones de tiempo subsecuentes es más pequeña que una diferencia entre parámetros de reconstrucción no post-procesados derivados de los parámetros de reconstrucción cuantificado asociados con porciones de tiempo subsecuente mediante recuantificación.
  22. 22. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-21, caracterizado porque la cantidad post-procesada es derivada del parámetro de reconstrucción cuantificado solamente utilizando una función de mapeo que mapea únicamente un valor de entrada a un valor de salida de acuerdo con una regla de mapeo para obtener una cantidad no post-procesada, y en la cual el post-procesador es operativo para post-procesar la cantidad no post-procesada para obtener la cantidad post-procesada.
  23. 23. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-22, caracterizado porque el parámetro de reconstrucción cuantificado es un parámetro de diferencia que indica una diferencia de parámetros entre dos cantidades absolutas asociadas con los canales de entrada y en el cual la cantidad post-procesada es un valor absoluto usado para reconstruir un canal de salida correspondiente a uno de los canales de entrada.
  24. 24. El sintetizador de multicanal de conformidad con cualquiera de las reivindicaciones 1-23, caracterizado porque el parámetro de reconstrucción cuantificado es una diferencia de nivel inter-canal y en el cual la cantidad post-procesada indica un nivel absoluto de un canal de salida, o en el cual el parámetro de reconstrucción cuantificado es una diferencia de tiempo inter-canal y en el cual la cantidad post-procesada indica una referencia de tiempo absoluta de un canal de salida, o en el cual, el parámetro de reconstrucción cuantificado es una medida de coherencia inter-canal y en el cual la cantidad post-procesada indica un nivel de coherencia absoluta de un canal de salida, o en el cual el parámetro de reconstrucción cuantificado es una diferencia de fase inter-canal y en el cual la cantidad post-procesada indica un valor de fase absoluto de un canal de salida.
  25. 25. Un método para generar una señal de salida a partir de una señal de entrada, la señal de entrada tiene por lo menos un canal de entrada y una secuencia de parámetros de reconstrucción cuantificados, los parámetros de reconstrucción cuantificados son codificados de acuerdo con una regla de cuantificación y son asociados con porciones de tiempo subsecuentes del canal de entrada, la señal de salida tiene un número de canales de salida sintetizados y el número de canales de salida sintetizados es mayor de 1 o mayor que un número de canales de entrada, caracterizado porque comprende:- determinar un parámetro de reconstrucción post-procesado o una cantidad post-procesada derivada del parámetro de reconstrucción para una porción de tiempo de la señal de entrada a ser procesada, de tal manera que un valor del parámetro de reconstrucción post-procesado o la cantidad post-procesada es diferente de un valor obtenible utilizado la recuantificación de acuerdo con la regla de cuantificación, y reconstruir una porción de tiempo del número de canales de salida sintetizados utilizando la porción de tiempo del canal de entrada y el parámetro de reconstrucción postprocesado o el valor post-procesado.
  26. 26. Un programa de computadora caracterizado porque tiene un código de programa para efectuar, cuando se ejecuta en una computadora, el método de conformidad con la reivindicación 25.
MXPA06014968A 2004-06-30 2005-06-13 Sntetizador de multicanal y metodo para generar una senal de salida de multicanal. MXPA06014968A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/883,538 US8843378B2 (en) 2004-06-30 2004-06-30 Multi-channel synthesizer and method for generating a multi-channel output signal
PCT/EP2005/006315 WO2006002748A1 (en) 2004-06-30 2005-06-13 Multi-channel synthesizer and method for generating a multi-channel output signal

Publications (1)

Publication Number Publication Date
MXPA06014968A true MXPA06014968A (es) 2007-02-08

Family

ID=34971777

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA06014968A MXPA06014968A (es) 2004-06-30 2005-06-13 Sntetizador de multicanal y metodo para generar una senal de salida de multicanal.

Country Status (18)

Country Link
US (1) US8843378B2 (es)
EP (1) EP1649723B1 (es)
JP (1) JP4712799B2 (es)
KR (1) KR100913987B1 (es)
CN (1) CN1954642B (es)
AT (1) ATE394901T1 (es)
AU (1) AU2005259618B2 (es)
BR (1) BRPI0511362B1 (es)
CA (1) CA2569666C (es)
DE (1) DE602005006495D1 (es)
ES (1) ES2307188T3 (es)
HK (1) HK1090504A1 (es)
IL (1) IL178670A (es)
MX (1) MXPA06014968A (es)
NO (1) NO338980B1 (es)
PT (1) PT1649723E (es)
RU (1) RU2345506C2 (es)
WO (1) WO2006002748A1 (es)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4612787B2 (ja) * 2003-03-07 2011-01-12 キヤノン株式会社 画像データの暗号化装置の制御方法及び画像データ変換装置の制御方法、及び、それらの装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
ES2373728T3 (es) * 2004-07-14 2012-02-08 Koninklijke Philips Electronics N.V. Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
EP1858006B1 (en) * 2005-03-25 2017-01-25 Panasonic Intellectual Property Corporation of America Sound encoding device and sound encoding method
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007037613A1 (en) * 2005-09-27 2007-04-05 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
US20090028344A1 (en) * 2006-01-19 2009-01-29 Lg Electronics Inc. Method and Apparatus for Processing a Media Signal
KR100852223B1 (ko) * 2006-02-03 2008-08-13 한국전자통신연구원 멀티채널 오디오 신호 시각화 장치 및 방법
KR100991795B1 (ko) * 2006-02-07 2010-11-04 엘지전자 주식회사 부호화/복호화 장치 및 방법
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
DE602007005729D1 (de) * 2006-06-19 2010-05-20 Sharp Kk Signalverarbeitungsverfahren, Signalverarbeitungsvorrichtung und Aufzeichnungsmedium
DE102006030276A1 (de) 2006-06-30 2008-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines gefilterten Aktivitätsmusters, Quellentrenner, Verfahren zum Erzeugen eines bereinigten Audiosignals und Computerprogramm
KR100763919B1 (ko) * 2006-08-03 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
JP4769673B2 (ja) 2006-09-20 2011-09-07 富士通株式会社 オーディオ信号補間方法及びオーディオ信号補間装置
EP2084901B1 (en) 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
EP2092516A4 (en) 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
US8265941B2 (en) 2006-12-07 2012-09-11 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
JP5302207B2 (ja) 2006-12-07 2013-10-02 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
KR20090122221A (ko) * 2007-02-13 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
RU2565008C2 (ru) 2008-03-10 2015-10-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и метод для обработки аудио сигнала, содержащего переходный сигнал
WO2010016270A1 (ja) * 2008-08-08 2010-02-11 パナソニック株式会社 量子化装置、符号化装置、量子化方法及び符号化方法
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
WO2010036060A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
MX2012003785A (es) 2009-09-29 2012-05-22 Fraunhofer Ges Forschung Decodificador de señal de audio, codificador de señal de audio, metodo para proveer una representacion de señal de mezcla ascendente, metodo para proveer una representacion de señal de mezcla descendente, programa de computadora y cadena de bits usando un valor de parametro de correlacion-inter-objeto-comun.
ES2461172T3 (es) * 2009-10-21 2014-05-19 Dolby International Ab Aparato y procedimiento para generar una señal de audio de alta frecuencia usando sobremuestreo adaptativo
WO2011061174A1 (en) * 2009-11-20 2011-05-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
RU2559899C2 (ru) 2010-04-09 2015-08-20 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
EP2464145A1 (en) * 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a downmixer
WO2012105885A1 (en) * 2011-02-02 2012-08-09 Telefonaktiebolaget L M Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
US9299355B2 (en) 2011-08-04 2016-03-29 Dolby International Ab FM stereo radio receiver by using parametric stereo
KR101606665B1 (ko) * 2012-04-05 2016-03-25 후아웨이 테크놀러지 컴퍼니 리미티드 파라미터 공간 오디오 코딩 및 디코딩을 위한 방법, 파라미터 공간 오디오 코더 및 파라미터 공간 오디오 디코더
KR101621287B1 (ko) * 2012-04-05 2016-05-16 후아웨이 테크놀러지 컴퍼니 리미티드 다채널 오디오 신호 및 다채널 오디오 인코더를 위한 인코딩 파라미터를 결정하는 방법
EP2862166B1 (en) * 2012-06-14 2018-03-07 Dolby International AB Error concealment strategy in a decoding system
US9319790B2 (en) * 2012-12-26 2016-04-19 Dts Llc Systems and methods of frequency response correction for consumer electronic devices
CN103533123B (zh) * 2013-09-23 2018-04-06 陕西烽火电子股份有限公司 一种飞机用多接收通道通话静噪方法
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US9774974B2 (en) * 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
WO2017148526A1 (en) * 2016-03-03 2017-09-08 Nokia Technologies Oy Audio signal encoder, audio signal decoder, method for encoding and method for decoding
CN109247069B (zh) * 2016-03-18 2021-12-21 弗劳恩霍夫应用研究促进协会 通过使用音频频谱图上的结构张量来重构相位信息的编码
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5675701A (en) * 1995-04-28 1997-10-07 Lucent Technologies Inc. Speech coding parameter smoothing method
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
JP3266178B2 (ja) * 1996-12-18 2002-03-18 日本電気株式会社 音声符号化装置
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP3657120B2 (ja) * 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP4008607B2 (ja) * 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
JP3558031B2 (ja) * 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030220801A1 (en) * 2002-05-22 2003-11-27 Spurrier Thomas E. Audio compression method and apparatus
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
DE602004002390T2 (de) * 2003-02-11 2007-09-06 Koninklijke Philips Electronics N.V. Audiocodierung
US20060171542A1 (en) * 2003-03-24 2006-08-03 Den Brinker Albertus C Coding of main and side signal representing a multichannel signal
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Also Published As

Publication number Publication date
CA2569666C (en) 2013-07-16
RU2345506C2 (ru) 2009-01-27
EP1649723B1 (en) 2008-05-07
DE602005006495D1 (de) 2008-06-19
KR20070028481A (ko) 2007-03-12
JP4712799B2 (ja) 2011-06-29
NO338980B1 (no) 2016-11-07
NO20070560L (no) 2007-03-30
IL178670A (en) 2011-10-31
HK1090504A1 (en) 2006-12-22
US8843378B2 (en) 2014-09-23
US20060004583A1 (en) 2006-01-05
AU2005259618A1 (en) 2006-01-12
PT1649723E (pt) 2008-07-28
JP2008504578A (ja) 2008-02-14
AU2005259618B2 (en) 2008-05-22
ES2307188T3 (es) 2008-11-16
CA2569666A1 (en) 2006-01-12
BRPI0511362A (pt) 2007-12-04
ATE394901T1 (de) 2008-05-15
KR100913987B1 (ko) 2009-08-25
CN1954642A (zh) 2007-04-25
RU2007103341A (ru) 2008-08-10
EP1649723A1 (en) 2006-04-26
CN1954642B (zh) 2010-05-12
BRPI0511362B1 (pt) 2018-12-26
IL178670A0 (en) 2007-02-11
WO2006002748A1 (en) 2006-01-12

Similar Documents

Publication Publication Date Title
AU2005259618B2 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
RU2361288C2 (ru) Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
RU2711513C1 (ru) Устройство и способ оценивания межканальной разницы во времени
KR100933548B1 (ko) 비상관 신호의 시간적 엔벨로프 정형화
KR100803344B1 (ko) 멀티채널 출력 신호를 구성하고 다운믹스 신호를 생성하기위한 장치 및 방법
RU2388176C2 (ru) Почти прозрачная или прозрачная схема многоканального кодера/декодера
RU2376726C2 (ru) Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио
RU2376655C2 (ru) Зависящее от энергии квантование для эффективного кодирования пространственных параметров звука
CN110890101B (zh) 用于基于语音增强元数据进行解码的方法和设备
JP7204774B2 (ja) チャネル間時間差を推定するための装置、方法またはコンピュータプログラム

Legal Events

Date Code Title Description
FG Grant or registration