ES2387248T3 - Aparato y procedimiento para generar una señal de salida multi-canal - Google Patents

Aparato y procedimiento para generar una señal de salida multi-canal Download PDF

Info

Publication number
ES2387248T3
ES2387248T3 ES05740130T ES05740130T ES2387248T3 ES 2387248 T3 ES2387248 T3 ES 2387248T3 ES 05740130 T ES05740130 T ES 05740130T ES 05740130 T ES05740130 T ES 05740130T ES 2387248 T3 ES2387248 T3 ES 2387248T3
Authority
ES
Spain
Prior art keywords
channel
input
channels
transmission
base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05740130T
Other languages
English (en)
Inventor
Jürgen HERRE
Christof Faller
Sascha Disch
Johannes Hilpert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Agere Systems LLC
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Agere Systems LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34966842&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2387248(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Agere Systems LLC filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2387248T3 publication Critical patent/ES2387248T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Logic Circuits (AREA)

Abstract

1. Aparato para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal desalida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales detransmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajoque tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales deentrada, donde E es>=C es > E, y K es > 1 y <= C donde la operación de mezclado hacia abajo es eficaz paraintroducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, ypara introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, que comprende: uncalculador de canal de anulación (20) para calcular un canal de anulación (21) empleando información relacionadacon el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o lainformación paramétrica; un combinador (23) para combinar el canal de anulación (21) y el primer canal detransmisión (23) o una versión procesada de estos para obtener un segundo canal de base (25), en el que unainfluencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada en elprimer canal de transmisión; y un canal reconstructor (26) para reconstruir un segundo canal de salidacorrespondiente al segundo canal de entrada empleando el segundo canal de base e información paramétricarelacionada con el segundo canal de entrada, y para reconstruir un primer canal de salida correspondiente al primercanal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho deque la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétricarelacionada con el primer canal de entrada.

Description

Aparato y procedimiento para generar una señal de salida multi-canal.
Sector de la invención
[0001] La presente invención se refiere a la descodificación multi-canal y, en particular, a la descodificación multicanal, en la que por ejemplo están presentes al menos dos canales de transmisión, que es estéreo compatible.
[0002] En los últimos tiempos, la técnica de reproducción de audio multi-canal se está convirtiendo cada vez más importante. Esto puede ser debido al hecho de que las técnicas de compresión/ codificación de audio tales como la bien conocida técnica mp3 han hecho posible distribuir los registros de audio a través de Internet u otros canales de transmisión con un ancho de banda limitado. La técnica de codificación mp3 se ha hecho tan famosa por el hecho de que permite la distribución de todos los registros en un formato estéreo, es decir, una representación digital de la grabación de audio que incluye un canal estéreo primero o izquierdo y un segundo canal estéreo o derecho.
[0003] Sin embargo, hay carencias básicas en los sistemas de sonido de dos canales convencionales. Por lo tanto, se ha desarrollado la técnica envolvente. Una representación envolvente multi-canal recomendada incluye, además de los dos canales estéreo L y R, un canal central adicional C y dos canales de sonido envolvente Ls, Rs. Este formato de sonido de referencia también se conoce como estéreo tres / dos, lo que significa tres canales frontales y dos canales de sonido envolvente. Generalmente, se requieren cinco canales de transmisión. En un entorno de reproducción, son necesarios por lo menos cinco altavoces en los respectivos cinco lugares diferentes para obtener un punto óptimo agradable a una cierta distancia de los cinco altavoces bien colocados.
[0004] Son conocidas varias técnicas en la técnica para reducir la cantidad de datos necesarios para la transmisión de una señal de audio de canales múltiples. Estas técnicas se denominan técnicas estéreo conjuntas. Para este fin, se hace referencia a la figura 10, que muestra un dispositivo estéreo conjunto 60. Este dispositivo puede ser un dispositivo que implementa por ejemplo intensidad estéreo (IS) o codificación binaural (BCC). Este dispositivo recibe generalmente - como entrada- al menos dos canales (CH1, CH2,...CHn), y tiene como salida un canal portador único y datos paramétricos. Los datos paramétricos se definen se modo que, en un descodificador, se puede calcular una aproximación de un canal original (CH1, CH2,...
[0005] Normalmente, el canal portador incluirá muestras de sub-banda, coeficientes espectrales, muestras en el dominio del tiempo etc, que proporcionan una representación comparativamente fina de la señal subyacente, mientras que los datos paramétricos no incluyen estas muestras de coeficientes espectrales sino que incluyen los parámetros de control para controlar un algoritmo de reconstrucción determinado, tal como la ponderación por multiplicación, desfase de tiempo, cambio de frecuencia, ... Los datos paramétricos, por lo tanto, incluyen solamente una representación relativamente basta de la señal o del canal asociado. Expresado en números, la cantidad de datos requeridos por un canal portador estará en el intervalo de 60-70 kbit / s, mientras que la cantidad de datos requeridos por el lado de información paramétrico para un canal estará en el intervalo de 1,5 - 2, 5 kbit / s. Un ejemplo de datos paramétricos son los bien conocidos factores de escala, la información de intensidad estéreo o los parámetros binaurales tal como se describen a continuación.
[0006] El documento de HERRE J., FALLER C.: "MP3 Surround: Efficient y Compatible Coding de Multi-Channel Audio" AES CONVENTION, 8 May 2004 (2004-05-08), páginas 1-14, describe: un aparato para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, los E canales de transmisión representando un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales de entrada, donde E es 2, C es > E, y K es > 1 y : C.
[0007] La codificación de intensidad estéreo se describe en la pre-impresión AES 3799, "Intensity Stereo Coding", J. Herre, K. H. Brandenburg, D. Lederer, Febrero 1994, Amsterdam. En general, el concepto de intensidad estéreo se basa en una transformada de eje principal que debe ser aplicada a los datos de ambos canales de audio estereofónicos. Si la mayoría de los puntos de datos se concentran alrededor del primer eje principal, puede lograrse una ganancia de codificación mediante la rotación de ambas señales en un ángulo determinado antes de la codificación. Esto es, sin embargo, no siempre es cierto para las técnicas de producción estereofónicas reales. Por lo tanto, esta técnica se ha modificado mediante la exclusión de la segunda componente ortogonal de la transmisión en el flujo de bits. Así, las señales reconstruidas para los canales izquierdo y derecho consisten en versiones de la misma señal transmitida ponderadas o escaladas de manera diferente. Sin embargo, las señales reconstruidas difieren en su amplitud, pero son idénticas en cuanto a su información de fase. Las envolventes energía-tiempo de ambos canales de audio originales, sin embargo, se conservan por medio de la operación de escalado selectivo, que normalmente opera de una manera selectiva en frecuencia. Esto se ajusta a la percepción humana del sonido en las frecuencias altas, donde las señales espaciales dominantes están determinadas por las envolventes de energía.
[0008] Además, en implementaciones prácticas, la señal transmitida, es decir, el canal portador se genera a partir de la señal suma de los canales izquierdo y derecho en lugar de girar ambos componentes. Además, este procesamiento, es decir, la generación de parámetros de intensidad estéreo para realizar la operación de escalado, se realiza en frecuencia selectiva, es decir, de forma independiente para cada banda de factor de escala, es decir, partición de frecuencia de codificación. Preferentemente, los dos canales se combinan para formar un combinado o canal "portador", y, sumado al canal combinado, la información de intensidad estéreo se determina como dependiente de la energía del primer canal, la energía del segundo canal o la energía del combinado o canal.
[0009] La técnica de BCC se describe en el documento de la convención AES 5574 5574, "Binaural cue coding applied to stereo y multi-channel audio compression", C. Faller, F. Baumgarte, mayo de 2002, Munich. En la codificación de BCC, un número de canales de entrada de audio se convierten en una representación espectral, utilizando una transformada basada en DFT con ventanas solapadas. El espectro uniforme resultante se divide en particiones no superpuestas cada una con un índice. Cada partición tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB). Las diferencias de nivel entre canales (ICLD) y las diferencias de tiempo entre canales () se calculan para cada partición para cada marco k. El ICLD y el ICTD se cuantifican y se codifican resultando en un flujo de bits BCC. Las diferencias de nivel entre canales y diferencias de tiempo entre canales se dan para cada canal con respecto a un canal de referencia. A continuación, los parámetros se calculan de acuerdo con las fórmulas prescritas, que dependen de las determinadas particiones de la señal a procesar.
[0010] En un lado decodificador, el descodificador recibe una señal mono y el flujo de bits BCC. La señal mono se transforma en el dominio de la frecuencia y entra en un bloque de síntesis espacial, que también recibe los valores decodificados ICLD y ICTD. En el bloque de síntesis espacial, se utilizan los valores de los parámetros BCC (ICLD y ) para realizar una operación de ponderación de la señal mono con el fin de sintetizar las señales del canal múltiple, que, después de una conversión de frecuencia / tiempo, representan una reconstrucción de la señal audio multicanal original.
[0011] En el caso de BCC, el módulo estéreo conjunto 60 es operativo para dar como salida información de lado de canal de tal manera que los datos de canal paramétricos se cuantifican y codifican en parámetros ICLD o TICD, donde uno de los canales originales se utiliza como canal de referencia para la codificación de la información de lado de canal.
[0012] Normalmente, el canal portador está formado por la suma de los canales participantes originales.
[0013] Naturalmente, las técnicas anteriores sólo proporcionan una representación mono para un decodificador, que sólo puede procesar el canal portador, pero no es capaz de procesar los datos paramétricos para generar una o más aproximaciones de más de un canal de entrada.
[0014] La técnica de codificación de audio conocida como codificación de señal binaural (BCC) también está bien descrita en las solicitudes de patente americana publicadas US 2003, 0219130 A1, 2003/0026441 A1 y 2003/0035553 A1. Referencia adicional también se hace a "Binaural Cue Coding. Part II: Schemes y Applications",
C. Faller y F. Baumgarte, IEEE Trans. On Audio y Speech Proc., Vol. 11, No. 6, Nov. 2993. Las publicaciones de solicitud de patentes americanas citadas y las dos publicaciones técnicas citadas sobre la técnica BCC escritas por Faller y Baumgarte se incorporan aquí por referencia en su totalidad.
[0015] En lo que sigue, se elabora un típico esquema genérico BCC para codificación de audio multi-canal con más detalle con referencia a las figuras 11 a 13. La figura 11 muestra un esquema de codificación de señal binaural genérico para la la codificación / transmisión de señales de audio multi-canal. La señal de entrada de audio multicanal en una entrada 110 de un codificador 112 se mezcla en un bloque de mezcla hacia abajo 114. En el presente ejemplo, la señal en la entrada multi-canal original 110 es una señal de sonido envolvente de 5 canales que tiene un canal delantero izquierdo, un canal delantero derecho, un canal izquierdo envolvente, un canal derecho envolvente y un canal central. Por ejemplo, el bloque de mezclado hacia abajo 114 produce una señal de suma por una simple adición de estos cinco canales en una señal mono. Otros esquemas downmix (mezcla hacia abajo) son conocidos en la técnica de tal manera que, utilizando una señal de entrada de múltiples canales, se puede obtener una señal downmix que tiene un solo canal. Este canal único se da como salida en una línea de señal de suma 115. Una información de lado obtenida por un bloque de análisis BCC 116 se da como salida a una línea de información de lado 117. En el bloque de análisis BCC, las diferencias de nivel entre canales (ICLD), y las diferencias de tiempo entre canales(ICTD) se calculan como se ha descrito anteriormente Recientemente, el bloque de análisis BCC 116 se ha mejorado para calcular también valores de correlación entre canales (valores ICC). La señal de suma y la información de lado se transmiten, preferentemente de forma cuantificada y codificada, a un decodificador BCC 120. El decodificador BCC descompone la señal de suma transmitida en un número de sub-bandas y aplica escalados, retardos y otras operaciones para generar las sub-bandas de las señales de audio multi-canal de salida. Este procesamiento se lleva a cabo de tal manera que los parámetros ICLD, ICTD y ICC (señales) de una señal multicanal reconstruida en una salida 121 son similares a las señales respectivas para la señal multi-canal original en la entrada 110 en el codificador BCC 112. Para este fin, el descodificador BCC 120 incluye un bloque de síntesis BCC 122 y un bloque de procesamiento de información de lado 123.
[0016] A continuación, se explica la construcción interna del bloque de síntesis BCC 122 con referencia a la figura
12. La señal de suma en la línea 115 se introduce en una unidad de conversión tiempo / de frecuencia o banco de filtros FB 125. En el bloque de salida 125, existe un número N de señales de sub banda o, en un caso extremo, un bloque de coeficientes espectrales, cuando el banco de filtros de audio 125 realiza una transformada 1: 1, es decir, una transformada que produce N coeficientes espectrales de N muestras en el dominio del tiempo.
[0017] El bloque de síntesis BCC 122 comprende además una etapa de retardo 126, una etapa de modificación de nivel 127, una etapa de procesamiento de correlación 128 y una etapa de banco de filtros inversos IFB 129. En la salida de la etapa 129, la señal de audio multi-canal reconstruida que tiene por ejemplo cinco canales en el caso de un sistema de sonido envolvente de 5-canales, puede ser la salida a un conjunto de altavoces 124, tal como se ilustra en la figura 11.
[0018] Tal como se muestra en la figura 12, las señales de entrada (n) se convierten en el dominio de la frecuencia o el dominio del banco de filtros por medio del elemento 125. La salida de señal por el elemento 125 se multiplica de tal manera que se obtienen varias versiones de la misma señal tal como se ilustra por el nodo de multiplicación 130. El número de versiones de la señal original es igual al número de canales de salida en la señal de salida, que hay que reconstruir cuando, en general, cada versión de la señal original en el nodo 130 es sometida a un cierto retardo d1, d2, ..., di, ..., dN. Los parámetros de retardo se calculan mediante el bloque de procesamiento de información de lado 123 en la figura 11 y se derivan de las diferencias de tiempo entre canales determinadas por el bloque de análisis BCC 116.
[0019] Lo mismo es cierto para los parámetros de multiplicación a1, a2, ..., ai, ..., aN, que también se calculan mediante el bloque de procesamiento de información de lado 123 a partir de las diferencias de nivel entre canales tal como fueron calculadas por el bloque de análisis BCC 116.
[0020] Los parámetros ICC calculados por el bloque de análisis BCC 116 se utilizan para controlar la funcionalidad del bloque 128 de tal manera que se obtienen ciertas correlaciones entre las señales retardadas y manipuladas de nivel en las salidas del bloque 128. Es de notar aquí que el orden entre las etapas 126, 127, 128 puede ser diferente del caso que se muestra en la figura 12.
[0021] Es de notar aquí que, en procesamiento a lo largo de un marco de una señal de audio, el análisis BCC se realiza a lo largo de un marco, es decir, variable en el tiempo, y también a lo largo de frecuencia. Esto significa que, para cada banda espectral, se obtienen los parámetros BCC. Esto significa que, en el caso de que el banco de filtros de audio 125 descomponga la señal de entrada en, por ejemplo, 32 señales de paso de banda, el bloque de análisis BCC obtiene un conjunto de parámetros BCC para cada una de las 32 bandas. Naturalmente, el bloque de síntesis BCC 122 de la figura 11, que se muestra en detalle en la figura 12, realiza una reconstrucción que también se basa en las 32 bandas en el ejemplo.
[0022] En lo que sigue, se hace referencia a la figura 13 que muestra una configuración para determinar ciertos parámetros BCC. Normalmente, los parámetros ICLD, ICTD e ICC se pueden definir entre pares de canales. Sin embargo, se prefiere determinar los parámetros ICLD e ICTD entre un canal de referencia y cada uno de los otros canales. Esto se ilustra en la figura 13A.
[0023] Los parámetros ICC se pueden definir de diferentes maneras. Más en general, se podrían estimar los parámetros ICC en el codificador de entre todos los pares de canales posibles, tal como se indica en la figura 13B. En este caso, un decodificador sintetizaría los ICC de manera que fueran aproximadamente los mismos que en la señal multi-canal original de entre todos los pares de canales posibles. Sin embargo, se propuso estimar los parámetros ICC sólo entre los más fuertes de los dos canales en cada momento. Este esquema se ilustra en la figura 13C, donde se muestra un ejemplo, en el que en un instante de tiempo se estima un parámetro ICC entre los canales 1 y 2, y, en otro ejemplo de tiempo, se calcula un parámetro ICC entre los canales 1 y 5. El decodificador sintetiza a continuación la correlación entre canales entre los más fuertes de los canales en el decodificador y se aplica una regla heurística para el cálculo y la síntesis de la coherencia entre canales para los pares de canales restantes.
[0024] En cuanto al cálculo de, por ejemplo, los parámetros de multiplicación a1, aN basado en los parámetros de transmisión ICLD, se hace referencia al documento de la convención AES 5574 citado más arriba. Los parámetros ICLD representan una distribución de energía en una señal multi-canal original. Sin pérdida de generalidad, se muestra en la figura 13 que hay cuatro parámetros ICLD que muestran la diferencia de energía entre todos los demás canales y el canal frontal izquierdo. En el bloque de procesamiento de información lateral 123, los parámetros de multiplicación a1, ..., aN se derivan de los parámetros ICLD tales que la energía total de todos los canales de salida reconstruidos es la misma que (o proporcional a) la energía de la señal de suma transmitida. Una forma simple para determinar estos parámetros es un proceso de dos etapas, en el que, en una primera etapa, se establece el factor de multiplicación para el canal frontal izquierdo a la unidad, mientras que los factores de multiplicación para los otros canales de la figura 13 se establecen en los valores ICLD transmitidos. Luego, en una segunda etapa, se calcula la energía de los cinco canales y se compara con la energía de la señal de suma transmitida. A continuación, todos los canales se escalan a la baja utilizando un factor de reducción de escala que es igual para todos los canales, donde el factor de reducción de escala se selecciona de tal manera que la energía total de todos los canales de salida reconstruidos es, después de la reducción de escala, igual a la energía total de la señal de suma de transmitida.
[0025] Naturalmente, hay otros métodos para el cálculo de los factores de multiplicación, que no se basan en el proceso de 2 etapas, pero que sólo necesitan un proceso de una etapa.
[0026] En cuanto a los parámetros de retardo, es de señalar que el retardo de parámetros ICTD, que se transmiten desde un codificador BCC pueden ser utilizados directamente, cuando el parámetro de retardo d1 para el canal frontal izquierdo se establece en cero. Aquí no es necesario reescalado alguno, ya que un retardo no altera la energía de la señal.
[0027] En cuanto a la medida de coherencia inter-canal ICC transmitida desde el codificador BCC al decodificador BCC, es de notar aquí que puede hacerse una manipulación de coherencia mediante la modificación de los factores de multiplicación a1, ..., an como por ejemplo multiplicando los factores de ponderación de todas las sub-bandas con números aleatorios con un intervalo de [20log10(-6) y 20log10 (6)]. La secuencia pseudo-aleatoria se elige preferentemente de manera que la variación sea aproximadamente constante para todas las bandas críticas, y la media sea cero dentro de cada banda crítica. La misma secuencia se aplica a los coeficientes espectrales para cada marco diferente. Así, la anchura de la imagen auditiva se controla mediante la modificación de la varianza de la secuencia pseudo-aleatoria. La modificación de varianza se puede realizar en bandas individuales que son de anchura de banda crítica. Esto permite la existencia simultánea de varios objetos en una escena auditiva, teniendo cada objeto una anchura de imagen diferente. Una distribución de amplitud adecuada para la secuencia pseudoaleatoria es una distribución uniforme en una escala logarítmica tal como se describe en la publicación de solicitud de patente americana 2003/0219130 A1. Sin embargo, todo el procesamiento de síntesis BCC se relaciona con un canal de entrada único transmitido como la suma de señales del codificador BCC al decodificador BCC tal como se muestra en la figura 11.
[0028] Para transmitir los cinco canales en una forma compatible, es decir, en un formato de cadena de bits, que también es comprensible para un descodificador estéreo normal, la técnica llamada de matrizado se ha utilizado tal como se describe en "", G. Theile y G. Stoll, pre-impresión de AES 3403, Octubre de 1992, San Francisco. Los cinco canales de entrada L, R, C, Ls, y Rs se introducen en un dispositivo de matrizado realizando una operación de matrizado para calcular los canales estéreo básicos o compatibles Lo, Ro, a partir de los cinco canales de entrada. En particular, estos canales estéreo básicos Lo/Ro se calculan tal como se establece a continuación:
[0029] X e Y son constantes. Los otros tres canales C, Ls, Rs se transmiten tal como están en una capa de extensión, además de una capa básica estéreo, que incluye una versión codificada de las señales estéreo básicas Lo/Ro. Con respecto a la corriente de bits, esta capa estéreo básica Lo/Ro incluye un encabezamiento, información tal como factores de escala y muestras de sub-banda. La capa de extensión multi-canal, es decir, el canal central y los dos canales de sonido envolvente se incluyen en el ámbito de extensión multi-canal, que también se denomina campo de datos auxiliares.
[0030] En el lado decodificador, se realiza una operación de matrizado inversa con el fin de formar reconstrucciones de los canales izquierdo y derecho en la representación de cinco canales utilizando los canales de base estéreo Lo, Ro y los tres canales adicionales. Adicionalmente, los tres canales adicionales son decodificados de la información auxiliar con el fin de obtener una representación decodificada de cinco canales o envolvente de la señal de audio multi-canal original.
[0031] Otro enfoque para la codificación multi-canal se describe en la publicación "Improved MPEG-2 audio multichannel encoding", B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, AES preprint 3865, February 1994, Amsterdam, en el que, con el fin de alcanzar la compatibilidad hacia atrás, se consideran unos modos compatibles hacia atrás. Para este fin, se utiliza una matriz de compatibilidad para obtener dos así llamados canales downmix Lc, Rc a partir de los cinco canales de entrada originales. Además, es posible seleccionar dinámicamente los tres canales de transmisión auxiliares como datos auxiliares.
[0032] Con el fin de explotar la irrelevancia estéreo, se aplica una técnica estéreo conjunta a grupos de canales, por ejemplo, a los tres canales frontales, es decir, al canal izquierdo, el canal derecho y el canal central. Para este fin, estos tres canales se combinan para obtener un canal combinado. Este canal combinado se cuantifica y se empaqueta en el flujo de bits. A continuación, este canal combinado junto con la información estéreo conjunta correspondiente se introduce en un módulo de decodificación estéreo conjunto para obtener conjuntos de canales estéreo decodificados, es decir, un canal izquierdo decodificado estéreo conjunto, un canal derecho decodificado estéreo conjunto y un canal central decodificado estéreo conjunto. Estos canales decodificados estéreo conjuntos, junto con el canal izquierdo de sonido envolvente y el canal derecho de sonido envolvente se entran en un bloque de matriz de compatibilidad para formar los canales downmix primero y segundo Lc, Rc. Entonces, las versiones cuantificadas de los dos canales downmix y una versión cuantificada del canal combinado se empaquetan en el flujo de bits, junto con parámetros de codificación estéreo conjuntos.
[0033] Por lo tanto, utilizando la codificación estéreo de intensidad, se transmite un grupo de señales de canales originales independientes dentro de una sola porción de datos "portadores". Entonces el decodificador reconstruye las señales involucradas como datos idénticos, que son reescalados de acuerdo con sus envolventes energía/ tiempo originales. En consecuencia, una combinación lineal de los canales transmitidos dará lugar a resultados, que son bastante diferentes del downmix original. Esto se aplica a cualquier tipo de codificación estéreo conjunta basada en el concepto de intensidad estéreo. Para un sistema de codificación que proporcione canales downmix compatibles, hay una consecuencia directa: La reconstrucción por supresión de matriz, tal como se describe en la publicación anterior, sufre de artefactos causados por la reconstrucción imperfecta. El uso de un así llamado esquema de predistorsión estéreo conjunto, en el que se realiza una codificación estéreo conjunta de los canales izquierdo, derecho y central antes de la matrización en el codificador, alivia este problema. De esta manera, el esquema de supresión de matriz para la reconstrucción introduce menos artefactos, ya que, en el lado codificador, se han utilizado las señales decodificadas estéreo conjuntas para generar los canales downmix. Así, el proceso de reconstrucción imperfecta se desplaza en los canales downmix compatibles Lc y Rc, donde es mucho más probable que se enmascare por la propia señal de audio.
[0034] Aunque este sistema ha dado lugar a un menor número de artefactos por la supresión de matriz en el lado decodificador, tiene no obstante algunos inconvenientes. Un inconveniente es que los canales downmix compatibles estéreo Lc y Rc no se derivan de los canales originales, sino de las versiones codificada / decodificada de intensidad estéreo de los canales originales. Por lo tanto, las pérdidas de datos debidas al sistema de codificación de intensidad estéreo se incluyen en los canales downmix compatibles. Por lo tanto, un decodificador solamente estéreo, que sólo decodifica los canales compatibles en lugar de los canales codificados de intensidad estéreo mejorada, proporciona una señal de salida, que está afectada por las pérdidas de datos inducidas de intensidad estéreo.
[0035] Además, debe transmitirse un canal completo adicional, además de los dos canales downmix. Este canal es el canal combinado, que se forma por medio de codificación estéreo conjunta de los canales izquierdo, derecho y central. Además, la información de intensidad estéreo para reconstruir los canales originales, L, R, C a partir del canal combinado también tiene que ser transmitida al decodificador. En el decodificador, se realiza un matrizado inverso, es decir, una operación de supresión de matriz para obtener los canales de sonido envolvente a partir de los dos canales downmix. Además, los canales izquierdo, derecho y central originales se aproximan por decodificación estéreo conjunta a través del canal combinado transmitido y los parámetros estéreo conjuntos transmitidos. Es de señalar que los canales izquierdo, derecho y central originales se derivan por decodificación estéreo conjunta del canal combinado.
[0036] Una mejora del esquema BCC mostrado en la figura 11 es un esquema BCC con al menos dos canales de transmisión de audio de modo que se obtiene un procesamiento estéreo compatible. En el codificador, C canales de entrada se mezclan hacia abajo a E canales de transmisión de audio. Las señales ICTD, ICLD e ICC señales entre ciertos pares de canales de entrada se calcula en función de la frecuencia y el tiempo. Las señales estimadas se transmiten al decodificador como información lateral. Un esquema BCC con C canales de entrada y E canales transmitidos se denota como C-2-E BCC.
[0037] En términos generales, el procesamiento BCC es un procesamiento posterior de frecuencia selectiva y variable en el tiempo de los canales transmitidos. En lo que sigue, con el entendimiento implícito de esto, no se introducirá un índice de banda de frecuencia. En cambio, se asumen las variables xn, Sn, yn, an, etc. como vectores de dimensión (1,f), donde f indica el número de bandas de frecuencia.
[0038] El así llamado esquema regular BCC se describe en C. Faller y F. Baumgarte, "Binaural Cue Coding applied to stereo and multi-channel audio compression," en preimpresión 112th Conv. Aud. Engl. Soc., May 2002, F. Baumgarte and C. Faller, "Binaural Cue Coding - Part I: Psychoacoustic fundamentals and design principles," IEEE Trans. On Speech and Audio Proc., vol. 11, no. 6, Nov. 2003, y C. Faller y F. Baumgarte, "Binaural Cue Coding -Part II; Schemes and applications," IEEE Trans. On Speech y Audio Proc., vol. 11, no. 6, Nov. 2003. Aquí, solo se dispone de un canal de transmisión de audio tal como se muestra en la figura 11, que es una extensión compatible con versiones anteriores de los sistemas mono existentes para la reproducción audio estéreo o multicanal. Puesto que el canal de transmisión de audio único es una señal mono válida, es adecuado para la reproducción de los receptores de la herencia.
[0039] Sin embargo, la mayor parte de la infraestructura de radiodifusión de audio instalada (radio analógica y digital, televisión, etc) y los sistemas de almacenamiento de audio (discos de vinilo, casete compacto, disco compacto, vídeo VHS, MP3 de almacenamiento de sonido, etc) están basados en estéreo de dos canales. Por otro lado, "los sistemas de cine en casa", según la norma 5.1 (Rec. ITU-R BS.775, Multi-Channel Stereophonic Sound sytem with or without Accompanying Picture, ITU, 1993, http://www.itu.org) son cada vez más populares. Por lo tanto, con dos canales de transmisión BCC (C-to-2 BCC), tal como se describe en J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, y C. Spenger, "MP3 Surround: Efficient y compatible coding de multi-channel audio," en la preimpresión 116th Conv. Aud. Eng. Soc., Mayo 2004, es particularmente interesante para ampliar los sistemas estéreo existentes para sonido envolvente multicanal. A este respecto, también se hace referencia a la solicitud de patente americana " Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal ", Número de serie US 10/762,100, presentada el 20 de enero de 2004.
[0040] En el dominio analógico, los algoritmos de matrizado tales como "Dolby Surround", "Dolby Pro Logic", y "Dolby Pro Logic II" (J. Hull, "Surround sound past, present, and future," Techn. Rep., Dolby Laboratories, 1999, www.dolby.com/tech/; R. Dressler, "Dolby Surround Prologic II Decoder - Principles of operation," Techn Rep., Dolby Laboratories, 2000, www.dolby.com/tech/) ya son populares desde hace años. Estos algoritmos aplican el "matrizado" para la asignación de los 5.1 canales de audio a un par de canales estéreo compatibles. Sin embargo, los algoritmos de matrizado sólo proporcionan una flexibilidad significativamente reducida y calidad en comparación con canales de audio discretos tal como se describe en J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, y C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio," en Preimpresión 116th Conv. Aud. Eng. Soc., May 2004. Si ya se consideran las limitaciones de los algoritmos de matrizado a la hora de mezclar señales de audio para sonido envolvente 5.1, algunos de los efectos de esta imperfección se pueden reducir tal como se indica en J. Hilson, "Mixing with Dolby Pro Logic II Technology," Tech. Rep., Dolby Laboratories, 2004, www.dolby.com/tech/PLII.Mixing.JimHilson.html.
[0041] El C-to-2 BCC puede ser visto como un esquema con una funcionalidad similar a un algoritmo de matrizado con información de ayuda de lado adicional. Es, sin embargo, más general en su naturaleza, ya que admite la asignación de cualquier número de canales originales a cualquier número de canales transmitidos. El C-to-E BCC está pensado para el dominio digital y por lo general su información de lado de baja velocidad de bits puede ser incluida en la transmisión de datos existentes de una manera compatible con versiones anteriores. Esto significa que los receptores existentes ignorarán la información de lado adicional y reproducirán directamente los 2 canales transmitidos tal como destaca en J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, y C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio," en Preimpresión 116th Conv. Aud. Eng. Soc., Mayo 2004. El eterno objetivo es lograr una calidad de audio similar a una transmisión discreta de todos los canales de audio originales, es decir, una calidad mucho mejor de lo que puede esperarse de un algoritmo matrizado convencional.
[0042] En lo que sigue, se hace referencia a la figura 6a a fin de ilustrar el funcionamiento del codificador downmix convencional para generar dos canales de transmisión a partir de cinco canales de entrada, que son un canal izquierdo L o x1, un canal derecho R o x2, un canal central C o x3, un canal izquierdo de sonido envolvente SL o x4 y un derecho de sonido envolvente de canal SR o x5. La situación downmix se muestra esquemáticamente en la figura 6a. Se hace evidente que el primer canal de transmisión y1 se forma con un canal de la izquierda x1, un canal central x3 y el canal izquierdo de sonido envolvente x4. Además, la figura 6 bis establece claramente que el canal de transmisión derecho y2 se forma utilizando el canal derecho x2, el canal central x3 y el canal derecho de sonido envolvente x5.
[0043] La regla generalmente preferida de downmixing o matriz downmixing se muestra en la figura 6c. Se hace evidente que el canal central x3 está ponderado con un factor de ponderación de 1 / [raíz cuadrada de] 2, lo que significa que la primera mitad de la energía del canal central x3 está puesta en el canal de transmisión izquierdo o primer canal de transmisión Lt, mientras que la segunda mitad de la energía en el canal central es introducida en el segundo canal de transmisión o canal derecho de transmisión Tr. Por lo tanto, el downmix asigna los canales de entrada a los canales transmitidos. El downmix está convenientemente descrito por una matriz (m, n), que asigna n muestras de entrada a m muestras de salida. Las entradas de esta matriz son los pesos aplicados a los canales correspondientes antes de sumar para formar el canal de salida correspondiente.
[0044] Existen diferentes métodos de downmix que se pueden encontrar en las recomendaciones de la ITU (Rec. ITU-R BS. 775, Multi-Channel Stereophonic Sound system with or without Accompanying Picture, ITU, 1993, http://www.itu.org). Además, se hace referencia a J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, y C. Spenger, "MP3 Surround: Efficient and compatible coding of multi-channel audio," en Preimpresión 116th Conv. Aud. Eng. Soc., Mayo 2004, Sección 4.2 con respecto a los métodos downmix diferentes. El downmix se puede realizar ya sea
en tiempo o en el dominio de la frecuencia. Puede ser que sea variable en el tiempo de una forma de adaptación de la señal o dependiente de la frecuencia (banda).
[0045] Por lo tanto, para el caso importante de 5-to-2 BCC, se calcula un canal transmitido desde la derecha, posterior derecha y central, y el otro canal transmitido desde la izquierda a derecha, posterior izquierda y central, que corresponde a una matriz downmix que también se muestra en la figura 6c., por ejemplo
[0046] En esta matriz downmix, los factores de ponderación se pueden elegir de tal manera que la suma de los cuadrados de los valores en cada columna sea uno, de tal manera que la potencia de cada señal de entrada contribuya igualmente a las señales mezcladas hacia abajo. Por supuesto podrían utilizarse también otros esquemas downmix.
[0047] En particular, se hace referencia a la figura 6b o 7b, que muestra una implementación específica de un esquema downmix del codificador. Se muestra el procesamiento de una sub-banda. En cada sub-banda, los factores de escalado E1 y E2 están controlados para "ecualizar" el volumen de los componentes de la señal en la señal mezclada hacia abajo. En este caso, el downmix se realiza en dominio de frecuencia, designando la variable N (Fig. 7b) un índice de tiempo de sub-banda en el dominio de la frecuencia y siendo k el índice del bloque de señal en el dominio del tiempo transformada. En particular, se destaca el dispositivo de ponderación para la ponderación del canal central antes de introducir la versión ponderada del canal central en el canal izquierdo transmitido de los canales y el canal derecho transmitido por los respectivos dispositivos de suma.
[0048] La operación Upmix correspondiente en el decodificador se muestra con respecto a las figuras 7a, 7b y 7c. En el decodificador debe calcularse un Upmix, que asigna el canal transmitido a los canales de salida. El Upmix está convenientemente descrito por una matriz (i, j) (i filas, columnas j), que asigna i muestras transmitidas a j muestras de salida. Una vez más, las entradas de esta matriz son los pesos aplicados a los canales correspondientes antes de sumar para formar el canal de salida correspondiente. El Upmix se puede realizar ya sea en el dominio del tiempo
o de la frecuencia. Adicionalmente, podría ser variable en el tiempo de una manera adaptativa a la señal dependiente de la frecuencia (banda). A diferencia de la matriz downmix, los valores absolutos de las entradas de la matriz no representan los pesos finales de los canales de salida, puesto que estos canales upmixed se modificadan aún más en caso de tratamiento BCC. En particular, la modificación se lleva a cabo utilizando la información proporcionada por las señales espaciales tales como ICLD, etc. Aquí, en este ejemplo, todas las entradas están a 0
o 1.
[0049] La figura 7a muestra la situación upmixing para un sistema de sonido envolvente de 5 altavoces. Al lado de cada altavoz, se muestra el canal de base que se utiliza para la síntesis BCC. En particular, con respecto al canal de salida de sonido envolvente izquierdo, se utiliza un primer canal transmitido Y1. Lo mismo es cierto para el canal izquierdo. Este canal se usa como un canal base, también llamado el "canal izquierdo transmitido".
[0050] En cuanto a canal de salida derecho y al canal de salida de sonido envolvente derecho, también utilizan el mismo canal, es decir, el canal segundo o derecho transmitido y2. En lo que respecta al canal central, es de notar aquí que el canal base para la síntesis BCC del canal central está formado de acuerdo con la matriz upmixing que se muestra en la figura 7c, es decir, mediante la adición de los dos canales transmitidos.
[0051] El proceso de generación de la señal de salida de 5 canales, dados los dos canales transmitidos se muestra en la figura 7b. Aquí, el Upmix se realiza en dominio de la frecuencia donde la variable n indica un índice de tiempo de sub-banda en el dominio de la frecuencia, y k el índice del bloque de señal de dominio en el tiempo transformada. Es de notar aquí que la síntesis ICTD e ICC ICC se aplica entre los pares de canales para los cuales se utiliza el mismo canal base, es decir, entre el izquierdo e izquierda posterior, derecho y derecho posterior, respectivamente. Los dos bloques indicados A en la figura 7b incluyen esquemas para la síntesis ICC de dos canales.
[0052] La información de lado estimada en el codificador, que es necesaria para calcular todos los parámetros para la señal de decodificador de síntesis de salida incluye las siguientes señales: fL12, fL13, fL14, fL15, ,14, ,25, c14, y c25 (fLij es la diferencia de nivel los canales i y j, ,ij es la diferencia de tiempo entre el canal i y j, y cij es un coeficiente de correlación entre el canal i y j). Es de notar aquí que pueden utilizarse también otras diferencias de nivel. Existe el requisito de que haya suficiente información disponible en el decodificador para la computación por ejemplo, de los factores de escala, los retardos etc para la síntesis BCC.
[0053] En lo que sigue, se hace referencia a la figura 7d con el fin de ilustrar aún más la modificación de nivel para cada canal, es decir, el cálculo de ai y la posterior normalización en general, que no se muestra en la figura 7b. Preferentemente, diferencias de nivel entre canales fLi se transmiten como información lateral, es decir como ICLD. Aplicado a la señal del canal, se tiene que usar la relación exponencial entre el canal de referencia Fref y y un canal que se calcula, es decir Fi. Esto se muestra en la parte superior de la figura 7d.
[0054] Lo que no se muestra en la figura 7b es la normalización global posterior o final, que puede tener lugar antes de los bloques de correlación A o después de los bloques de correlación A. Cuando los bloques de correlación afectan a la energía de los canales ponderados por ai, la normalización global debería tener lugar después de los bloques de correlación A. Para asegurarse de que la energía de todos los canales de salida es igual a la energía de todos los canales transmitidos, el canal de referencia se escala tal como se muestra en la figura 7d. Preferentemente, el canal de referencia es la raíz de la suma de los cuadrados de los canales trasmitidos.
[0055] En lo que sigue, se describen los problemas asociados con estos sistemas downmix / upmixing. Cuando se considera el esquema de BCC 5-a-2 tal como se ilustra en la figura 6 y la figura 7, se aprecia lo siguiente.
[0056] El canal central original se introduce en los dos canales transmitidos y, por consiguiente, también en los canales de salida reconstruidos izquierdo y derecho.
[0057] Además, en este esquema, la contribución central común tiene la misma amplitud en ambos canales de salida reconstruidos.
[0058] Además, la señal central original se sustituye durante la decodificación por una señal central, que se deriva de los canales izquierdo y derecho transmitidos y, por tanto, no puede ser independiente de (es decir, no correlacionado con) los canales izquierdo y derecho reconstruidos.
[0059] Este efecto tiene consecuencias desfavorables sobre la calidad del sonido percibido para señales con una imagen de sonido muy amplia que se caracteriza por un alto grado de decorrelación (es decir, baja coherencia) entre todos los canales de audio. Un ejemplo de estas señales es el sonido de un público aplaudiendo, al utilizar diferentes micrófonos con un espaciado suficientemente amplio para la generación de las señales multi-canal originales. Para tales señales, la imagen de sonido del sonido decodificado se estrecha y se reduce su amplitud natural.
Resumen de la invención
[0060] Es objeto de la presente invención proporcionar un concepto de reconstrucción multi-canal de mayor calidad que se traduce en una señal de salida multi-canal que tiene una percepción del sonido mejorada.
[0061] Según un primer aspecto de esta invención, este objeto se logra con un aparato para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica lateral relacionada con los canales de entrada, donde E es �2, C es > E, y K es > 1 y:C, y donde la operacion de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, y para introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, que comprende: un calculador de canal de anulación para calcular un canal de anulación empleando información relacionada con el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o la información paramétrica de lado; un combinador para combinar el canal de anulación y el primer canal de transmisión o una versión procesada de estos para obtener un segundo canal de base, en el que una influencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada en el primer canal de transmisión; y un canal reconstructor para reconstruir un segundo canal de salida correspondiente al segundo canal de entrada empleando el segundo canal de base e información paramétrica lateral relacionada con el segundo canal de entrada, y para reconstruir un primer canal de salida correspondiente al primer canal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho de que la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétrica lateral relacionada con el primer canal de entrada.
[0062] Según un segundo aspecto de la presente invención, este objeto se logra con un procedimiento para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica lateral relacionada con los canales de entrada, donde E es
2, C es > E, y K es > 1 y :C, y donde la operación de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, y para introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, que comprende: calcular un canal de anulación empleando información relacionada con el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o la información paramétrica lateral; combinar el canal de anulación y el primer canal de transmisión o una versión procesada de estos para obtener un segundo canal de base, en el que una influencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada en el primer canal de transmisión; y reconstruir un segundo canal de salida correspondiente al segundo canal de entrada empleando el segundo canal de base e información paramétrica lateral relacionada con el segundo canal de entrada, y un primer canal de salida correspondiente al primer canal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho de que la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétrica lateral relacionada con el primer canal de entrada.
[0063] Según un tercer aspecto de la presente invención, este objeto se logra con un programa de ordenador que tiene un código de programa para realizar el procedimiento para generar una señal de salida multi-canal, cuando el programa se ejecuta en un ordenador.
[0064] Es de notar aquí, que preferentemente, K es igual a C. No obstante, también se podrían reconstruir menos canales de salida, tales como tres canales de salida L, R, C y no reconstruir Ls y Rs. En este caso, los K (= 3) canales de salida corresponden a tres de los C (= 5) canales de entrada L, R, C originales.
[0065] La presente invención se basa en el hallazgo de que, para mejorar la calidad de sonido de la señal de salida de varios canales, se calcula un determinado canal de base mediante la combinación de un canal transmitido y un canal de cancelación, que se calcula en el extremo receptor o decodificador. El canal de cancelación se calcula de manera que el canal de base modificado obtenido mediante la combinación del canal de cancelación y el canal transmitido tiene una influencia reducida del canal central, es decir, el canal que se introduce en ambos canales transmitidos. Dicho en otras palabras, la influencia del canal central, es decir, el canal que se introduce en ambos canales transmitidos, lo que inevitablemente se produce cuando se llevan a cabo las operaciones upmixing downmix y posterior, se reduce en comparación con una situación en la que no se calcula dicho canal de cancelación ni se combina con un canal transmitido.
[0066] En contraste con la técnica anterior, por ejemplo el canal izquierdo transmitido no se utiliza simplemente como canal de base para la reconstrucción el canal izquierdo o de sonido envolvente izquierdo. En contraste con ello, el canal izquierdo transmitido se modifica mediante la combinación con el canal de cancelación de modo que se reduce la influencia del canal central de entrada original en el canal de base para la reconstrucción del canal de salida izquierdo o derecho o incluso se cancela por completo.
[0067] Según la invención, el canal de cancelación se calcula en el decodificador utilizando la información sobre el canal central original, que ya está presente en el decodificador o generador de salida multi-canal. La información sobre el canal central está incluida en el canal izquierdo transmitido, el canal derecho transmitido y la información paramétrica lateral tal como diferencias de nivel, diferencias de tiempo o parámetros de correlación para el canal central. Dependiendo de ciertas realizaciones, toda esta información puede utilizarse para obtener un canal central de cancelación de alta calidad. En otras realizaciones de nivel más bajo, sin embargo, sólo una parte de esta información se utiliza en el canal de entrada central. Esta información puede ser el canal transmitido izquierdo, el canal transmitido derecho o la información paramétrica lateral. Adicionalmente, también se puede utilizar la información estimada en el codificador y transmitida al decodificador.
[0068] Así, en un entorno 5-a-2, el canal izquierdo transmitido o el canal derecho transmitido no se utilizan directamente para la reconstrucción izquierda y derecha, pero se modifican al ser combinados con el canal de cancelación para obtener un canal de base modificado, que es diferente del canal transmitido correspondiente. Preferentemente, un factor de ponderación adicional, que dependerá de la operación downmix realizada en un codificador para generar los canales transmitidos también se incluye en el cálculo del canal de cancelación. En un entorno 5-a-2, se calculan al menos dos canales de cancelación de modo que cada canal transmitido se puede combinar con un canal de cancelación designado para obtener canales de base modificados para la reconstrucción los canales de salida izquierdo e izquierdo envolvente, derecho y derecho envolvente respectivamente.
[0069] La presente invención se puede incorporar en una serie de sistemas o aplicaciones, incluyendo, por ejemplo, consolas de videojuego digitales, reproductores de audio digital, computadoras, receptores de satélite, receptores de cable, receptores de radiodifusión terrestre y sistemas de entretenimiento domésticos.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
[0070] Unas realizaciones preferidas de la presente invención se describen a continuación con referencia a las figuras adjuntas, en las cuales:
La figura 1 es un diagrama de bloques de un codificador multicanal que produce canales transmitidos y la información de lado paramétrica en los canales de entrada;
La figura 2 es un diagrama esquemático de bloques del aparato preferido para generar una señal de salida multicanal de acuerdo con la presente invención;
La figura 3 es un diagrama esquemático del aparato de la invención de acuerdo con una primera realización de la presente invención;
La figura 4 es una implementación del circuito de la realización preferida de la figura 3;
La figura 5a es un diagrama de bloques del aparato de la invención de acuerdo con una segunda realización de la presente invención;
La figura 5b es una representación matemática de upmixing dinámico tal como se muestra en la figura 5a;
La figura 6a es un diagrama general para ilustrar la operación downmixing;
La figura 6b es un diagrama de circuito para implementar la operación downmix de la figura 6a;
La figura 6c es una representación matemática de la operación downmix;
La figura 7a es un diagrama esquemático para indicar los canales de base utilizados para upmixing en un entorno estéreo compatible;
La figura 7b es un diagrama de circuito para la aplicación de una reconstrucción multi-canal en un entorno estéreo compatible;
La figura 7c es una presentación matemática de la matriz upmixing utilizada en la figura 7b;
La figura 7d es una ilustración matemática de la modificación de nivel para cada canal y la normalización global posterior; La figura 8 ilustra un codificador; La figura 9 ilustra un descodificador; La figura 10 ilustra un codificador estéreo conjunto del estado de la técnica.
La figura 11 es una representación de diagrama de bloques de un sistema codificador / decodificador BCC del estado de la técnica;
La figura 12 es un diagrama de bloques de una implementación según el estado de la técnica de un bloque de síntesis BCC de la figura 11, y
La figura 13 es una representación de un esquema bien conocido para la determinación de los parámetros ICLD, ICTD e ICC.
[0071] Antes de dar una descripción detallada de realizaciones preferidas se presentará el problema que subyace a la invención y la solución al problema en términos generales. La técnica de la invención para mejorar la anchura auditivo imagen espacial para canales de salida reconstruidos es aplicable a todos los casos en los que un canal de entrada se mezcla en más de uno de los canales transmitidos en un sistema multicanal paramétrico C-a-E. La realización preferida es la aplicación de la invención a un sistema de codificación de señal binaural (BCC). Por simplicidad de discusión, pero sin pérdida de generalidad, la técnica de la invención se ha descrito para el caso específico de un esquema BCC para la codificación / decodificación de señales envolventes 5.1 rodea de forma compatible hacia atrás.
[0072] El problema antes mencionado de la reducción de anchura de la imagen auditiva se produce sobre todo para señales de audio que contienen transitorios rápidos independientes que se repiten desde distintas direcciones, tal como una señal de aplausos de una audiencia en cualquier tipo de grabación en vivo. Mientras que la reducción de anchura de la imagen puede, en principio, ser abordada mediante una resolución de tiempo mayor para la síntesis ICLD, esto daría lugar a una mayor tasa de información de lado y también requiere un cambio en el tamaño de la ventana del banco de filtros de análisis / síntesis utilizado. Es de notar aquí que esta posibilidad adicionalmente resulta en efectos negativos sobre componentes tonales, ya que un aumento de la resolución de tiempo conlleva automáticamente una disminución de la resolución de frecuencia.
[0073] En su lugar, la invención es un concepto simple que no tiene estas desventajas y su objetivo es reducir la influencia del componente del canal central en los canales laterales.
[0074] Tal como se ha discutido en relación con las figuras 7a-7d, los canales de base para los cinco canales de salida reconstruidos 5-a-2 BCC son:
[0075] Es de señalar que la componente de la señal del canal central original x3 aparece amplificado 3 dB en la subbanda de canal de base central s3 (factor 1/12) y atenuada 3 dB en las sub-bandas canal de base restantes (canal lateral).
[0076] Con el fin de atenuar aún más la influencia de la componente de señal de canal central en las sub-bandas de canal de base lateral de acuerdo con esta invención, se aplica la idea general siguiente, tal como se ilustra en la figura 2.
[0077] Una estimación de la señal de canal central decodificada final se calcula preferentemente escalándola al nivel objetivo deseado tal como se describe en la información de nivel correspondiente, tal como un valor ICLD en entornos BCC. Preferentemente, esta señal central descodificada se calcula en el dominio espectral con el fin de ahorrar cálculo, es decir, sin procesamiento de bancos de filtro de síntesis.
[0078] Además, esta señal decodificada central o señal reconstruida central, que corresponde al canal de cancelación, se puede ponderar y luego se combina para ambas señales de canal de base de los otros canales de salida. Esta combinación es preferentemente una resta. No obstante, cuando los factores de ponderación tienen un signo diferente, entonces una adición también resulta en la reducción de la influencia del canal central en el canal de base utilizado para la reconstrucción del canal de salida izquierdo o derecho. Este proceso resulta en la formación de un canal de base modificado para la reconstrucción del izquierdo o sonido envolvente izquierdo y derecho o envolvente derecho. Preferentemente un factor de ponderación de -3 dB es el preferido, aunque también es posible cualquier otro valor.
[0079] En lugar de las señales de canal de base transmitido originales tal como se utilizan en la figura 7b, se utilizan unas señales del canal de base modificada las para el cálculo del canal de salida decodificado de los otros canales de salida, es decir, los canales que no sean el canal central.
[0080] A continuación, se discutirá un diagrama de bloques del concepto inventivo con referencia a la figura 2. La figura 2 muestra un aparato para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, los E canales de transmisión representando un resultado de una operación de mezclado hacia abajo que tiene los C canales de entrada como entrada, y utilizar información paramétrica lateral on los canales de entrada, donde C es 2, C es > E, y K es > 1 y :C. Adiciona lmente, la operación de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión. El aparato de la invención incluye el calculador de canal de anulación 20 para calcular al menos un canal de anulación 21, que entra en un combinador 22, que recibe, en una segunda entrada 23, el primer canal de transmisión directamente o una versión procesada del primer canal de transmisión. El procesamiento del primer canal de transmisión para obtener la versión procesada del primer canal de transmisión se realiza mediante un procesador 24, que puede estar presente en algunas realizaciones, pero que en general es opcional. El combinador funciona para obtener un segundo canal de base 25 para ser la entrada en un canal reconstructor 26.
[0081] El canal reconstructor utiliza el segundo canal de base 25 y la información paramétrica lateral en el canal de entrada izquierdo original, que son entrados en el canal reconstructor 26 en otra entrada 27, para generar el segundo canal de salida. En la salida del canal reconstructor, se obtiene un segundo canal de salida 28, que puede ser el canal de salida izquierdo reconstruido, que se genera, comparado con el escenario de la figura 7b, por un canal de base, que tiene una influencia pequeña o incluso una influencia totalmente cancelada del canal de entrada central original en comparación con la situación de la figura 7b.
[0082] Mientras que el canal de salida izquierdo generado tal como se muestra en la figura 7b incluye una cierta influencia tal como se ha descrito anteriormente, esta cierta influencia se reduce en el segundo canal de base tal como se ha generado en la figura 2 debido a la combinación del canal de anulación y el primer canal de transmisión
o el primer canal de transmisión procesado.
[0083] Tal como se muestra en la figura 2,el calculador de canal de anulación 20 calcula el canal de anulación empleando información sobre el canal central original disponible como un decodificador, es decir información para generar la señal de salida multi-canal. Esta información incluye información paramétrica lateral en el primer canal de entrada 30, o incluye el primer canal de transmisión 31, que también incluye alguna información sobre el canal central a causa de la operación downmix, o incluye el segundo canal de transmisión 32, que también incluye información sobre el canal central, debido a la operación downmix. Preferentemente, toda esta información se utiliza para la reconstrucción óptima del canal central para obtener el canal de anulación 21.
[0084] Tal realización óptima posteriormente se describirá con respecto a la figura 3 y la figura 4. En contraste con la figura 2, la figura 3 muestra el dispositivo de 2-pliegue de la figura 2, es decir, un dispositivo para la cancelación de la influencia del canal central en el canal de base izquierdo S1, así como el canal de base derecha s2.
El canal de cancelación calculadora 20 de la figura 2 incluye un dispositivo de reconstrucción de canal central 20a y un dispositivo de ponderación 20b para obtener el canal de cancelación 21 en la salida del dispositivo de ponderación. El combinador 22 en la figura 2 es un simple restador que es operativo para sustraer el canal de anulación 21 del primer canal de transmisión 21 para obtener -en términos de la figura 2- el segundo canal de base 25 para reconstruir el segundo canal de salida (tal como el canal de salida izquierdo) y,, opcionalmente, también el canal izquierdo de salida de sonido envolvente. El canal central reconstruido x3 (k) se puede obtener en la salida del dispositivo de reconstrucción del canal central 20a.
[0085] La figura 4 indica una forma de realización preferida implementada como un diagrama de circuito, que utiliza la técnica que se ha discutido con respecto a la figura 3. Además, la figura 4 muestra el procesamiento de frecuencia selectiva que es óptimo para ser integrado en un sencillo dispositivo de reconstrucción de frecuencia selectiva BCC.
[0086] La reconstrucción del canal central 26 se lleva a cabo mediante la suma de los dos canales transmitidos en un sumador 40. Entonces, se utiliza la información paramétrica de lado de las diferencias de nivel de canal, o el factor a3derivado de la diferencia de nivel inter-canal tal como se discute en la figura 7d para generar una versión modificada del primer canal de base (en términos de la figura 2), que se introduce en el reconstructor de canal 26 en la entrada del primer canal de base 29 en la figura 2. El canal central reconstruido en la salida del multiplicador 41 puede utilizarse para la reconstrucción del canal de salida central (después de la normalización general que se describe en la figura 7d).
[0087] Para reconocer la influencia del canal central en la reconstrucción de los canales de base izquierdo y derecho, se aplica un factor de ponderación de 1/12 que se ilustra por medio de un multiplicador 42 en la figura 4. A continuación, el canal central reconstruido y ponderado de nuevo se alimenta de nuevo a los sumadores 43a y 43b, que corresponden al combinador 22 en la figura 2.
[0088] De este modo, el segundo canal de base s1 o s4 (o s2 y s5) es diferente del canal de transmisión y1 en que la influencia del canal central se reduce en comparación con el caso en la figura 7b.
[0089] Los sub-bandas del canal de base resultantes se dan en términos matemáticos tal como sigue: [0090] Así, el dispositivo de la figura 4 prevé una sustracción de una estimación de sub-banda del canal central a partir de los canales de base para los canales laterales con el fin de mejorar la independencia entre los canales y, por lo tanto, para proporcionar una mejor anchura espacial de la señal multi-canal de salida reconstruida.
[0091] De acuerdo con otra realización de la presente invención, que se describirá posteriormente con respecto a la figura 5a y la figura 5b, se determina un canal de cancelación diferente del canal cancelación calculado en la figura
3. En contraste con la realización de las figuras 3/ 4, el canal de anulación 21 para calcular el segundo canal de base s1(k) no se deriva del primer canal de transmisión así como el segundo canal de transmisión si no que se deriva solamente del segundo canal de transmisión y2(k) empleando un determinado factor de ponderación xlr, que se ilustra por el dispositivo de multiplicación 51 en la figura 5a. Así, el canal de cancelación 21en la figura 5a es diferente del canal de cancelación de la figura 3, y también contribuye a una reducción de la influencia del canal central en el canal de base s1(k) utilizado para reconstruir el segundo canal de salida, es decir canal de salida izquierdo x1(k).
[0092] En la realización de la figura 5a, también se muestra una realización preferida del procesador 24. En particular, el procesador 24 se implementa como otro dispositivo de multiplicación 52, que aplica una multiplicación por un factor de multiplicación (1-xlr). Preferentemente, tal como se muestra en la figura 1a, el factor de multiplicación aplicado por el procesador 24 al primer canal de transmisión depende del factor de multiplicación 51, que se utiliza para multiplicar el segundo canal transmitido para obtener el canal de cancelación 21. Finalmente, la versión procesada del primer canal transmitido en una entrada 23 al combinador 22 se utiliza para combinar, lo cual consiste en restar el canal de cancelación 21 de la versión procesada del primer canal transmitido. Todo esto resulta de nuevo en el canal de base 25, que tiene una influencia reducida o totalmente cancelada del canal de entrada central original.
[0093] Tal como se muestra en la figura 5a se repite, el mismo procedimiento para obtener el tercer canal de base s2(k) en una entrada en el dispositivo de reconstrucción envolvente derecho / derecho. Sin embargo, tal como se muestra en la figura 5a, el tercer canal de base s2(k se obtiene mediante la combinación de la versión procesada de el segundo canal de transmisión y(k) y otro canal de anulación 53, que se deriva del primer canal de transmisión y1(k) a través de la multiplicación en un dispositivo de multiplicación 54, que tiene un factor de multiplicación xrl, que puede ser idéntico a xlr para un dispositivo 51, para un dispositivo 51, pero que también puede ser diferente de este valor. El procesador para procesar el segundo canal transmitido, tal como se indica en la figura 5a, es un dispositivo de multiplicación 55. El combinador para combinar el segundo canal de anulación 53 y la versión procesada del segundo canal de transmisión y2(k) se ilustrado por el número de referencia 56 en la figura 5a. El calculador de canal de anulación de la figura 2 también incluye un dispositivo para calcular los coeficientes de cancelación, que está indicado por el número de referencia 57 en la figura 5a. El dispositivo 57 es operativo para obtener información de lado paramétrica en el canal central original o de entrada, tales como la diferencia de nivel entre canales, etc Lo mismo es cierto para el dispositivo 20a en la figura 3, donde el dispositivo de reconstrucción de canal central 20a también incluye una entrada para recibir información de lado paramétrica tal como los valores de nivel o diferencias de nivel entre canales, etc.
[0094] La siguiente ecuación muestra la descripción matemática de la realización de la figura 5a e ilustra, en el lado derecho del mismo, el procesamiento de cancelación en el calculador de canal de anulación por un lado y los procesadores (21, 24 en la figura 2) por otro lado. En esta realización específica, que se ilustra aquí, los factores xlr y xrl son idénticos entre sí.
[0095] La realización anterior deja claro que la invención incluye una composición de los canales de base de reconstrucción como combinación lineal de adaptación a la señal de los canales transmitidos izquierdo y derecho. Esta topología se ilustra en la figura 5a.
[0096] Cuando se observa desde un ángulo diferente, el dispositivo de la invención también puede entenderse como un procedimiento de upmixing dinámico, en el que se utiliza una matriz upmixing diferente para cada sub-banda y cada instante de tiempo k. Esta matriz upmixing dinámica se ilustra en la figura 5b. Es de señalar que, para cada sub-banda, es decir, para cada salida del dispositivo de banco de filtros en la figura 4, existe esta matriz upmixing U. En cuanto a la manera dependiente del tiempo, es de señalar que la figura 5b incluye el índice de tiempo k. Cuando se tiene información de nivel para cada índice de tiempo, la matriz upmixing cambiaría para cada instante de tiempo a cada instante de tiempo. Sin embargo, cuando se utiliza la misma información de nivel a3 para un bloque completo de valores transformado en una representación en frecuencia por el banco de filtros de entrada FB, entonces estará presente un valor a3 para un bloque completo de por ejemplo 1024 o 2048 valores de muestreo. En este caso, la matriz upmixing cambiaría en el sentido del tiempo de bloque a bloque y no de valor a valor. Sin embargo, existen técnicas para suavizar los valores de nivel paramétricos de manera que se puedan obtener diferentes factores de modificación de amplitud a3 durante el upmixing en una banda de frecuencia determinada.
[0097] Dicho de forma general, también se podrían utilizar diferentes factores para el cálculo de las sub-bandas de canal de salida central y de los factores para "upmixing dinámico", lo que resulta en un factor a3, que es una versión escalada de a3 tal como se ha calculado anteriormente.
[0098] En una realización preferida, la fuerza de ponderación de la cancelación de componente central está controlada de forma adaptativa por medio de una transmisión explícita de información de lado del codificador al decodificador. En este caso, el calculador de canal de anulación 20 que se muestra en la figura 2 incluirá una entrada de control adicional, que recibe una señal de control explícita que podría ser calculada para indicar una interdependencia directa entre los canales izquierdo y central o derecho y central. En este sentido, esta señal de control sería diferente de las diferencias de nivel para el canal central y el canal izquierdo, debido a que estas diferencias de nivel están relacionadas con un tipo de canal de referencia virtual, que podría ser la suma de la energía en el primer canal de transmisión y la suma de la energía en el segundo canal de transmisión tal como se ilustra en la parte superior de la figura 7d.
[0099] Por ejemplo, este parámetro de control podría indicar que el canal central está por debajo de un umbral y se aproxima a cero, mientras que hay una señal en el canal izquierdo o derecho, que está por encima del umbral. En este caso, una reacción adecuada del calculador de canal de anulación a una señal de control correspondiente sería apagar la cancelación del canal y aplicar un esquema upmixing normal tal como se muestra en la figura 7b para evitar la "sobre-cancelación" del canal central, que no está presente en la entrada. En este sentido, esta sería una especie extrema de controlar la fuerza de ponderación tal como se describió anteriormente.
[0100] Preferentemente, como se evidencia en la figura 4, no se realiza operación de tratamiento de retardo de tiempo para el cálculo del canal central de reconstrucción. Esto es ventajoso en que la realimentación funciona sin tener que tomar en consideración los retrasos de tiempo. Sin embargo, esto puede ser obtenido sin pérdida de calidad, cuando el canal central original se utiliza como canal de referencia para calcular las diferencias de tiempo di. Lo mismo es cierto para cualquier medida de correlación. Se prefiere no realizar ningún procesamiento de correlación para reconstruir el canal central.
Dependiendo del tipo de cálculo de correlación, esto puede hacerse sin pérdida de calidad, cuando el canal central original se utiliza como referencia para todos los parámetros de correlación.
[0101] Es de señalar que la invención no depende de un determinado esquema downmix. Esto significa que uno puede utilizar un downmix automático o manual realizado por un ingeniero de sonido. Incluso se puede utilizar la información paramétrica generada automáticamente junto con canales downmix generados manualmente.
[0102] Según el entorno de aplicación, los métodos de la invención para la construcción o la generación puede ser implementado en hardware o software. La implementación puede ser un medio de almacenamiento digital, tal como un disco o un CD que tiene señales de control electrónicamente legibles, que pueden cooperar con un sistema de ordenador programable de tal manera que lleven a cabo los procedimientos de la invención. Por lo tanto, dicho de forma general, la invención, también se refiere a un producto de programa de ordenador que tiene un código de programa almacenado en un soporte legible por máquina, estando el código de programa adaptado para realizar los procedimientos de la invención, cuando el producto de programa de ordenador se ejecuta en un ordenador. En otras palabras, la invención, por tanto, también se refiere a un programa de ordenador que tiene un código de programa para llevar a cabo los procedimientos, cuando el programa de ordenador se ejecuta en un ordenador.
[0103] La presente invención puede ser utilizada en conjunción con o incorporados en una variedad de diferentes aplicaciones o sistemas, incluidos los sistemas de televisión o distribución electrónica de música, radiodifusión, transmisión por corrientes de datos y / o recepción. Estos incluyen sistemas de decodificación / codificación de transmisiones a través de, por ejemplo, vía terrestre, satélite, cable, Internet, intranets, o medios físicos (por ejemplo, discos compactos, discos versátiles digitales, chips semiconductores, discos duros, tarjetas de memoria y similares).
La presente invención también se puede emplear en los juegos y sistemas de juego que incluyen, por ejemplo, los productos de software interactivos destinados a interactuar con el usuario en juegos de entretenimiento (de acción, juegos de rol, estrategia, aventura, simulación, carreras, deportes, arcade, juegos de cartas y de mesa) y / o educación que pueda ser publicada por varios equipos, plataformas o medios de comunicación. Además, la presente invención puede incorporarse en los reproductores de audio o sistemas CD-ROM/DVD. La presente invención también se puede incorporar en las aplicaciones de software para PC que incorporan decodificación digital (por ejemplo jugador, decodificador) y aplicaciones de software que incorporan las capacidades de codificación digital (por ejemplo de codificador, desgarrador, Recodificador, y máquina de reproducción de discos).

Claims (21)

  1. REIVINDICACIONES
    1.
    Aparato para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales de entrada, donde E es 2, C es > E, y K es > 1 y :C, y donde la operacion de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, y para introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, que comprende: un calculador de canal de anulación (20) para calcular un canal de anulación (21) empleando información relacionada con el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o la información paramétrica; un combinador (23) para combinar el canal de anulación (21) y el primer canal de transmisión (23) o una versión procesada de estos para obtener un segundo canal de base (25), en el que una influencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada en el primer canal de transmisión; y un canal reconstructor (26) para reconstruir un segundo canal de salida correspondiente al segundo canal de entrada empleando el segundo canal de base e información paramétrica relacionada con el segundo canal de entrada, y para reconstruir un primer canal de salida correspondiente al primer canal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho de que la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétrica relacionada con el primer canal de entrada.
  2. 2.
    Aparato según la reivindicación 1, en el que el combinador (22) es operativo para sustraer el canal de anulación del primer canal de transmisión o la versión procesada de estos.
  3. 3.
    Aparato según la reivindicación 1 o la reivindicación 2, en el que el calculador de canal de anulación (20) es operativo para calcular una estimación para el primer canal de entrada empleando el primer canal de transmisión y el segundo canal de transmisión para obtener el canal de anulación (21).
  4. 4.
    Aparato según cualquiera de las reivindicaciones 1 - 3, en el que la información paramétrica incluye un parámetro de diferencia entre el primer canal de entrada y un canal de referencia, y en el que el calculador de canal de anulación (20) es operativo para calcular una suma del primer canal de transmisión y el segundo canal de transmisión y para ponderar la suma empleando el parámetro de diferencia.
  5. 5.
    Aparato según cualquiera de las reivindicaciones 1 - 4, en el que la operación de mezclado hacia abajo es tal que el primer canal de entrada es introducido en el primer canal de transmisión tras ser escalado por un factor de mezclado hacia abajo, y en el que el calculador de canal de anulación (20) es operativo para escalar la suma de los canales de transmisión primero y segundo empleando un factor de escala, que depende del factor de mezclado hacia abajo.
  6. 6.
    Aparato según la reivindicación 5, en el que el factor de ponderación es igual al factor de mezclado hacia abajo.
  7. 7.
    Aparato según cualquiera de las reivindicaciones 1 - 6, en el que el calculador de canal de anulación (20) es operativo para determinar una suma de los canales de transmisión primero y segundo para obtener el primer canal de base.
  8. 8.
    Aparato según cualquiera de las reivindicaciones 1 -7, que comprende además un procesador (24) que es operativo para procesar el primer canal de transmisión por ponderación empleando un primer factor de ponderación, y en el que el calculador de canal de anulación (20) es operativo para ponderar el segundo canal de transmisión empleando un segundo factor de ponderación.
  9. 9.
    Aparato según la reivindicación 8, en el que la información paramétrica incluye el parámetro de diferencia entre el primer canal de entrada y un canal de referencia, y en el que el calculador de canal de anulación (20) es operativo para determinar el segundo factor de ponderación basado en un parámetro de diferencia.
  10. 10.
    Aparato según la reivindicación 8 o 9, en el que el primer factor de ponderación es igual a (1-h), donde h es un valor real, y en el que el segundo factor de ponderación es igual a h.
  11. 11.
    Aparato según la reivindicación 10, en el que la información paramétrica incluye un valor de diferencia de nivel, y donde h se deriva de el valor de diferencia de nivel paramétrico.
  12. 12.
    Aparato según la reivindicación 11, en el que h es igual a un valor derivado de la diferencia de nivel dividida por un factor que depende de la operación de mezclado hacia abajo.
  13. 13.
    Aparato según la reivindicación 10, en el que la información paramétrica incluye la diferencia de nivel entre el primer canal y el canal de referencia, y en el que h es igual a 112 x 10Ll20, donde L es la diferencia de nivel.
  14. 14.
    Aparato según cualquiera de las reivindicaciones 1 - 13, en el que la información paramétrica también incluye una señal de control que depende de la relación entre el primer canal de entrada y el segundo canal de entrada, y en el que el calculador de canal de anulación (20) está controlado por la señal de control para aumentar o disminuir activamente una energía del canal de anulación o incluso deshabilitar el cálculo del canal de anulación del todo.
  15. 15.
    Aparato según cualquiera de las reivindicaciones 1 - 14, en el que la operación de mezclado hacia abajo también es operativa para introducir un tercer canal de entrada en el segundo canal de transmisión, comprendiendo el aparato además otro combinador para combinar el canal de anulación y el segundo canal de transmisión o una versión procesada de estos para obtener un tercer canal de base, en el que una influencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada on el segundo canal de transmisión; y un canal reconstructor para reconstruir el tercer canal de salida correspondiente al tercer canal de entrada empleando el tercer canal de base e información paramétrica relacionada con el tercer canal de entrada.
  16. 16.
    Aparato según cualquiera de las reivindicaciones 1 - 15, en el que la información paramétrica incluye diferencias de nivel entre canales, diferencias de tiempo entre canales, diferencias de fase entre canales o valores de correlación entre canales, y en el que el canal reconstructor (26) es operativo para aplicar cualquiera de los parámetros del grupo mencionado en un canal de base para obtener un canal de salida en bruto.
  17. 17.
    Aparato según la reivindicación 16, en el que el canal reconstructor (26) es operativo para escalar the canal de salida en bruto de modo que toda la energía en el canal de salida reconstruido final es igual a toda la energía de los E canales de transmisión.
  18. 18.
    Aparato según cualquiera de las reivindicaciones 1 - 17, en el que la información paramétrica se dan por bandas, y en el que el calculador de canal de anulación (20), el combinador (22) y el canal reconstructor (26) son operativos para procesar la pluralidad de bandas empleando información paramétrica determinada por bandas, y en el que el aparato también comprende una unidad de conversión tiempo/ frecuencia (IFB) para convertir los canales de transmisión en una representación en frecuencia que tiene bandas de frecuencia, y una unidad de conversión frecuencia/ tiempo para convertir bandas de frecuencia reconstruidas en el dominio del tiempo.
  19. 19.
    El aparato según cualquiera de las reivindicaciones 1 - 18 que comprende además: un sistema que se selecciona de entre el grupo que consiste en un reproductor de video digital, un reproductor de audio digital, un ordenador, un receptor satélite, un receptor cable , un receptor de difusión terrestre, y un sistema de entretenimiento doméstico; y donde el sistema comprende el calculador de canal, el combinador, y el canal reconstructor.
  20. 20.
    Procedimiento para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multi-canal que tiene C canales de entrada, empleando E canales de transmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales de entrada, donde E es 2, C es > E, y K es > 1 y :C, y donde la operacion de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, y para introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, que comprende: calcular (20) un canal de anulación empleando información relacionada con el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o la información paramétrica; combinar (22) el canal de anulación y el primer canal de transmisión o una versión procesada de estos para obtener un segundo canal de base, en el que una influencia del primer canal de entrada es reducida comparado con la influencia del primer canal de entrada en el primer canal de transmisión; y reconstruir (26) un segundo canal de salida correspondiente al segundo canal de entrada empleando el segundo canal de base e información paramétrica relacionada con el segundo canal de entrada, y un primer canal de salida correspondiente al primer canal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho de que la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétrica relacionada con el primer canal de entrada.
  21. 21.
    Programa de ordenador que tiene un código de programa para implementar, cuando se ejecuta en un ordenador, un procedimiento para generar una señal de salida multi-canal que tiene K canales de salida, correspondiendo la señal de salida multi-canal a una señal de entrada multicanal que tiene C canales de entrada, empleando E canales de transmisión, representando los E canales de transmisión un resultado de una operación de mezclado hacia abajo que tiene C canales de entrada como entrada, y utilizar información paramétrica relacionada con los canales de entrada, donde E es 2, C es > E, y K es > 1 y :C, y dond e la operación de mezclado hacia abajo es eficaz para introducir un primer canal de entrada en un primer canal de transmisión y en un segundo canal de transmisión, y para introducir adicionalmente un segundo canal de entrada en el primer canal de transmisión, comprendiendo el procedimiento: calcular (20) un canal de anulación empleando información relacionada con el primer canal de entrada incluido en el primer canal de transmisión, el segundo canal de transmisión o la información paramétrica; combinar (22) el canal de anulación y el primer canal de transmisión o una versión procesada de estos para obtener un segundo canal de base, en el que una influencia del primer canal de entrada es reducida comparado con la
    influencia del primer canal de entrada en el primer canal de transmisión; y reconstruir (26) un segundo canal de salida correspondiente al segundo canal de entrada empleando el segundo canal de base e información paramétrica relacionada con el segundo canal de entrada, y un primer canal de salida correspondiente al primer canal de entrada empleando un primer canal de base que sea diferente del segundo canal de base en el hecho de que la influencia del primer canal es mayor comparado con el segundo canal de base, e información paramétrica relacionada con el primer canal de entrada.
    Izquierda Derecha Central Posterior – izq Posterior - der
    IZQUIERDO ENV. IZQ. CENTRAL DERECHO ENV. DER.
ES05740130T 2004-07-09 2005-05-12 Aparato y procedimiento para generar una señal de salida multi-canal Active ES2387248T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US58657804P 2004-07-09 2004-07-09
US586578P 2004-07-09
US935061 2004-09-07
US10/935,061 US7391870B2 (en) 2004-07-09 2004-09-07 Apparatus and method for generating a multi-channel output signal
PCT/EP2005/005199 WO2006005390A1 (en) 2004-07-09 2005-05-12 Apparatus and method for generating a multi-channel output signal

Publications (1)

Publication Number Publication Date
ES2387248T3 true ES2387248T3 (es) 2012-09-19

Family

ID=34966842

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05740130T Active ES2387248T3 (es) 2004-07-09 2005-05-12 Aparato y procedimiento para generar una señal de salida multi-canal

Country Status (16)

Country Link
US (1) US7391870B2 (es)
EP (1) EP1774515B1 (es)
JP (1) JP4772043B2 (es)
KR (1) KR100908080B1 (es)
CN (1) CN1985303B (es)
AT (1) ATE556406T1 (es)
AU (1) AU2005262025B2 (es)
BR (1) BRPI0512763B1 (es)
CA (1) CA2572989C (es)
ES (1) ES2387248T3 (es)
HK (1) HK1099901A1 (es)
NO (1) NO338725B1 (es)
PT (1) PT1774515E (es)
RU (1) RU2361185C2 (es)
TW (1) TWI305639B (es)
WO (1) WO2006005390A1 (es)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US8027478B2 (en) * 2004-04-16 2011-09-27 Dublin Institute Of Technology Method and system for sound source separation
ES2373728T3 (es) * 2004-07-14 2012-02-08 Koninklijke Philips Electronics N.V. Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1810279B1 (en) * 2004-11-04 2013-12-11 Koninklijke Philips N.V. Encoding and decoding of multi-channel audio signals
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
CN101151660B (zh) * 2005-03-30 2011-10-19 皇家飞利浦电子股份有限公司 多通道音频编码器、解码器以及相应方法
KR101271069B1 (ko) * 2005-03-30 2013-06-04 돌비 인터네셔널 에이비 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
JP2008542816A (ja) * 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4896449B2 (ja) * 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
EP1943642A4 (en) * 2005-09-27 2009-07-01 Lg Electronics Inc METHOD AND DEVICE FOR CODING / DECODING A MULTI-CHANNEL AUDIO SIGNAL
US8073703B2 (en) * 2005-10-07 2011-12-06 Panasonic Corporation Acoustic signal processing apparatus and acoustic signal processing method
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
JP4997781B2 (ja) * 2006-02-14 2012-08-08 沖電気工業株式会社 ミックスダウン方法およびミックスダウン装置
CN101390443B (zh) 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
FR2899424A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede de synthese binaurale prenant en compte un effet de salle
FR2899423A1 (fr) 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
US20100040135A1 (en) * 2006-09-29 2010-02-18 Lg Electronics Inc. Apparatus for processing mix signal and method thereof
CN101529898B (zh) * 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
EP2054875B1 (en) * 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
CA2670864C (en) * 2006-12-07 2015-09-29 Lg Electronics Inc. A method and an apparatus for processing an audio signal
AU2008215231B2 (en) 2007-02-14 2010-02-18 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
JP2010521866A (ja) 2007-03-16 2010-06-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
US8032085B2 (en) * 2007-09-10 2011-10-04 Technion Research & Development Foundation Ltd. Spectrum-blind sampling and reconstruction of multi-band signals
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
WO2009135532A1 (en) * 2008-05-09 2009-11-12 Nokia Corporation An apparatus
CN102037507B (zh) * 2008-05-23 2013-02-06 皇家飞利浦电子股份有限公司 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
CN101809656B (zh) * 2008-07-29 2013-03-13 松下电器产业株式会社 音响编码装置、音响解码装置、音响编码解码装置及会议系统
WO2010038318A1 (en) 2008-10-01 2010-04-08 Thomson Licensing Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus
DE102008056704B4 (de) * 2008-11-11 2010-11-04 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
EP2399342A4 (en) 2009-02-18 2015-04-01 Technion Res & Dev Foundation EFFICIENT SENSING AND RECONSTRUCTION OF TRANSPARENT MULTI-BAND SIGNALS
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
JP2011002574A (ja) * 2009-06-17 2011-01-06 Nippon Hoso Kyokai <Nhk> 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
US8774417B1 (en) * 2009-10-05 2014-07-08 Xfrm Incorporated Surround audio compatibility assessment
EP2367293B1 (en) * 2010-03-14 2014-12-24 Technion Research & Development Foundation Low-rate sampling of pulse streams
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
US8717210B2 (en) 2010-04-27 2014-05-06 Technion Research & Development Foundation Ltd. Multi-channel sampling of pulse streams at the rate of innovation
EP2586025A4 (en) * 2010-07-20 2015-03-11 Huawei Tech Co Ltd A tone signal
BR122021003887B1 (pt) 2010-08-12 2021-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
RU2573774C2 (ru) * 2010-08-25 2016-01-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер
WO2012049591A1 (en) 2010-10-13 2012-04-19 Technion Research & Development Foundation Ltd. Sub-nyquist sampling of short pulses
TWI462087B (zh) 2010-11-12 2014-11-21 Dolby Lab Licensing Corp 複數音頻信號之降混方法、編解碼方法及混合系統
US20120155650A1 (en) * 2010-12-15 2012-06-21 Harman International Industries, Incorporated Speaker array for virtual surround rendering
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
ITTO20120067A1 (it) 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction
CN105393304B (zh) * 2013-05-24 2019-05-28 杜比国际公司 音频编码和解码方法、介质以及音频编码器和解码器
PL3429233T3 (pl) 2013-07-30 2020-11-16 Dts, Inc. Dekoder matrycowy z panoramowaniem parami o stałej mocy
WO2015036350A1 (en) 2013-09-12 2015-03-19 Dolby International Ab Audio decoding system and audio encoding system
WO2015081293A1 (en) 2013-11-27 2015-06-04 Dts, Inc. Multiplet-based matrix mixing for high-channel count multichannel audio
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN106997768B (zh) * 2016-01-25 2019-12-10 电信科学技术研究院 一种语音出现概率的计算方法、装置及电子设备
EP3246923A1 (en) 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
RU2628198C1 (ru) * 2016-05-23 2017-08-15 Самсунг Электроникс Ко., Лтд. Способ межканального предсказания и межканальной реконструкции для многоканального видео, снятого устройствами с различными углами зрения
BR112019009424A2 (pt) 2016-11-08 2019-07-30 Fraunhofer Ges Forschung mixador de redução, método para mixagem de redução de pelo menos dois canais, codificador multicanal, método para codificar um sinal multicanal, sistema e método de processamento de áudio
JP6866679B2 (ja) * 2017-02-20 2021-04-28 株式会社Jvcケンウッド 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム
US20230319498A1 (en) * 2020-03-09 2023-10-05 Nippon Telegraph And Telephone Corporation Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium
JP7385531B2 (ja) * 2020-06-17 2023-11-22 Toa株式会社 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法
CN117476026A (zh) * 2023-12-26 2024-01-30 芯瞳半导体技术(山东)有限公司 一种多路音频数据混音的方法、系统、装置及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583962A (en) 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP3577798B2 (ja) * 1995-08-31 2004-10-13 ソニー株式会社 ヘッドホン装置
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6249578B1 (en) 1998-04-06 2001-06-19 Ameritech Corporation Interactive electronic ordering for telecommunications products and services
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
TW589815B (en) * 2002-01-16 2004-06-01 Winbond Electronics Corp Control method for multi-channel data transmission
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩

Also Published As

Publication number Publication date
ATE556406T1 (de) 2012-05-15
NO20070034L (no) 2007-02-06
RU2361185C2 (ru) 2009-07-10
CA2572989A1 (en) 2006-01-19
BRPI0512763A (pt) 2008-04-08
KR100908080B1 (ko) 2009-07-15
PT1774515E (pt) 2012-08-09
CN1985303B (zh) 2011-06-15
US7391870B2 (en) 2008-06-24
KR20070027692A (ko) 2007-03-09
NO338725B1 (no) 2016-10-10
HK1099901A1 (en) 2007-08-24
BRPI0512763B1 (pt) 2018-08-28
JP4772043B2 (ja) 2011-09-14
WO2006005390A1 (en) 2006-01-19
AU2005262025B2 (en) 2008-10-09
RU2007104933A (ru) 2008-08-20
CN1985303A (zh) 2007-06-20
TWI305639B (en) 2009-01-21
US20060009225A1 (en) 2006-01-12
EP1774515A1 (en) 2007-04-18
AU2005262025A1 (en) 2006-01-19
JP2008505368A (ja) 2008-02-21
EP1774515B1 (en) 2012-05-02
CA2572989C (en) 2011-08-09
TW200617884A (en) 2006-06-01

Similar Documents

Publication Publication Date Title
ES2387248T3 (es) Aparato y procedimiento para generar una señal de salida multi-canal
ES2623365T3 (es) Compactación de información secundaria para la codificación paramétrica de audio espacial
ES2306076T3 (es) Aparato y metodo para construir una señal de salida multicanal o para generar una señal de downmix.
KR101215872B1 (ko) 송신되는 채널들에 기초한 큐들을 갖는 공간 오디오의파라메트릭 코딩
ES2317297T3 (es) Conformacion de envolvente de sonido difuso para esquemas de codificacion de indicacion binaural y similares.
ES2323275T3 (es) Conformacion de envolvente temporal de canal individual para esquemas de codificacion de indicacion binaural y similares.
TWI427621B (zh) 編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體
WO2006014449A1 (en) Audio coding/decoding
BRPI0518507B1 (pt) Informações auxiliares compactas para a codificação paramétrica de áudio espacial