ES2426917T3 - Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado - Google Patents

Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado Download PDF

Info

Publication number
ES2426917T3
ES2426917T3 ES05718592T ES05718592T ES2426917T3 ES 2426917 T3 ES2426917 T3 ES 2426917T3 ES 05718592 T ES05718592 T ES 05718592T ES 05718592 T ES05718592 T ES 05718592T ES 2426917 T3 ES2426917 T3 ES 2426917T3
Authority
ES
Spain
Prior art keywords
processing
right signals
signal
spatial parameters
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05718592T
Other languages
English (en)
Inventor
Machiel W. Van Loon
Gerard H. Hotho
Dirk J. Breebaart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2426917T3 publication Critical patent/ES2426917T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Abstract

Método para procesar una señal estéreo obtenida de un codificador, codificador que codifica una señal de audio de N canales en señales izquierda y derecha (L0; R0) y parámetros espaciales (P), estando el método caracterizado porque comprende: - procesar dichas señales izquierda y derecha con el fin de proporcionar una señal estéreo procesada (L0w; R0w), en el que dicho procesamiento se controla dependiendo de dichos parámetros espaciales (P).

Description

Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado
La presente invención se refiere a un método y a un dispositivo para procesar una señal estéreo obtenida de un codificador, codificador que codifica una señal de audio de N canales en señales izquierda y derecha y parámetros espaciales. La invención también se refiere a un aparato codificador que comprende un codificador de este tipo y un dispositivo de este tipo.
La presente invención también se refiere a un método y a un dispositivo para procesar una señal estéreo obtenida mediante un método de este tipo y un dispositivo de este tipo para procesar una señal estéreo obtenida de un codificador. La invención también se refiere a un aparato decodificador que comprende un dispositivo de este tipo para procesar una señal estéreo.
La presente invención también se refiere a un sistema de audio que comprende un aparato codificador de este tipo y un aparato decodificador de este tipo.
Durante mucho tiempo, ha predominado la reproducción estéreo de música, por ejemplo en el entorno doméstico. Durante los años 70, se realizaron algunos experimentos con la reproducción de cuatro canales en equipos de música domésticos.
En salas más grandes, tales como salas de cine, una reproducción de sonido de múltiples canales ha estado presente durante mucho tiempo. Dolby Digital® y otros sistemas se desarrollaron para proporcionar una reproducción de sonido realista e impresionante en una sala grande.
Tales sistemas de múltiples canales se han introducido en el cine en casa y están adquiriendo mucho interés. Por tanto, actualmente en el mercado son comunes los sistemas que tienen cinco canales de alcance completo y un canal de alcance parcial o canal de efectos de baja frecuencia (LFE), los denominados sistemas 5.1. También existen otros sistemas, tales como 2.1, 4.1, 7.1 e incluso 8.1.
Con la introducción de SACD y DVD, la reproducción de audio de múltiples canales está adquiriendo más interés. Muchos consumidores ya tienen la posibilidad de reproducir múltiples canales en sus hogares, y el material de fuente de múltiples canales está volviéndose popular.
Debido a la popularidad creciente del material de múltiples canales, la codificación eficaz de material de múltiples canales está volviéndose más importante, lo que también reconocen los órganos de normalización tales como MPEG.
Los codificadores conocidos previamente a menudo no aplican métodos eficaces para codificar audio de múltiples canales. Los canales de entrada pueden codificarse básicamente de manera individual (posiblemente después del matrizado), requiriendo así una alta tasa de transmisión de bits debido al gran número de canales.
Sin embargo, un codificador de audio de múltiples canales puede generar una mezcla descendente de 2 canales que es compatible con los sistemas de reproducción de 2 canales, mientras todavía se permite una reconstrucción de múltiples canales de alta calidad en el lado de decodificador. La reconstrucción de alta calidad se controla mediante parámetros P transmitidos que controlan el proceso de mezcla ascendente de estéreo a múltiples canales. Estos parámetros contienen información que describe, entre otros, la relación de señal frontal frente a señal envolvente que está presente en la mezcla descendente de 2 canales. Usando un enfoque de este tipo, un decodificador puede controlar la cantidad de señal frontal frente a señal envolvente en el proceso de mezcla ascendente. En otras palabras, los parámetros describen propiedades importantes del campo de sonido espacial que está presente en la señal de múltiples canales original, pero que se pierde en la mezcla de estéreo debido al proceso de mezcla descendente.
Un ejemplo de un codificador y decodificador de múltiples canales se da a conocer en la publicación de patente del Tratado de Cooperación en materia de Patentes WO2004/008805.
La invención actual se refiere a la posibilidad de usar esta información espacial parametrizada para aplicar un procesamiento posterior dependiente de parámetros, preferiblemente invertible, en una mezcla descendente de 2 canales para mejorar la mezcla descendente, tal como la calidad perceptual o propiedades espaciales de la misma.
Un objeto de la presente invención es hacer posible un procesamiento posterior de la mezcla descendente después de la codificación, basándose en los parámetros según se determina en el codificador de múltiples canales y todavía mantener la posibilidad de una decodificación de múltiples canales sin influir en el procesamiento posterior.
Este objeto se consigue mediante un método y un dispositivo para procesar una señal estéreo obtenida de un codificador, codificador que codifica una señal de N canales (N>2) en señales izquierda y derecha y parámetros espaciales. El método comprende procesar dichas señales de canal izquierda y derecha con el fin de proporcionar una señal estéreo procesada. El procesamiento se controla dependiendo de dichos parámetros espaciales. La idea general es usar los parámetros espaciales obtenidos de un codificador de N canales a estéreo para controlar un determinado algoritmo de procesamiento posterior. De esta manera, la señal estéreo obtenida del codificador puede
5 procesarse, por ejemplo para mejorar la impresión espacial.
En una realización de la invención, el procesamiento se controla mediante un primer parámetro para cada canal de entrada, es decir para cada una de las señales izquierda y derecha, dependiendo el primer parámetro de los parámetros espaciales. El primer parámetro puede ser una función de tiempo y/o frecuencia. Por tanto, el sistema puede tener una cantidad variable de procesamiento posterior dependiendo la cantidad real de procesamiento posterior de los parámetros espaciales. El procesamiento posterior puede realizarse individualmente en diferentes bandas de frecuencia. El codificador entrega parámetros espaciales independientes que describen la imagen espacial para un conjunto de bandas de frecuencia. En ese caso, el primer parámetro puede depender de la frecuencia.
15 En otra realización de la invención, el procesamiento posterior comprende añadir una primera, segunda y tercera señal con el fin de obtener dichas señales de canal procesadas. La primera señal incluye la primera señal de entrada, es decir la señal izquierda o derecha, modificada por una primera función de transferencia, la segunda señal incluye la primera señal de entrada modificada por una segunda función de transferencia, y la tercera señal incluye la segunda señal de entrada, es decir la señal derecha o izquierda, modificada por una tercera función de transferencia. La segunda función de transferencia puede comprender dicho primer parámetro y una primera función de filtro. La primera función de transferencia puede comprender un segundo parámetro, con lo que la suma de dicho primer parámetro y dicho segundo parámetro puede ser una unidad. La tercera función de transferencia puede comprender dicho primer parámetro de la segunda señal de entrada y una segunda función de filtro.
25 Las funciones de filtro pueden ser invariables con el tiempo.
En una realización específica, las señales pueden describirse mediante la ecuación:
siendo a una constante.
Usando esta representación, el efecto de filtrado de las funciones de filtro H1, H2, H3 y H4 es variable variando los
35 parámetros wl y wr. Si ambos parámetros tienen valores igual a cero, las señales procesadas posteriormente L0w, R0w son esencialmente iguales al par de señales de entrada estéreo L0, R0. Por otro lado, si los parámetros son +1, el par de estéreo procesado posteriormente L0w, R0w se procesa completamente mediante las funciones de filtro H1, H2, H3 y H4. Esta invención hace posible controlar la cantidad real de filtrado, es decir, el valor de los parámetros w1 y wr mediante los parámetros espaciales P.
Según una realización, las funciones y parámetros de filtro se seleccionan de modo que la matriz de función de transferencia sea invertible. Esto hace posible la reconstrucción de la señal estéreo original.
En otro aspecto de la invención, comprende un dispositivo para procesar una señal estéreo según los métodos 45 mencionados anteriormente, y un aparato codificador que comprende un dispositivo de este tipo.
En otro aspecto de la invención se proporciona un método y un dispositivo para invertir el procesamiento según los métodos mencionados anteriormente, y un aparato decodificador que comprende un dispositivo inversor de este tipo.
Todavía en otro aspecto de la invención se proporciona un sistema de audio que comprende un aparato codificador de este tipo y un aparato decodificador de este tipo.
Los objetos, características y ventajas adicionales de la invención serán evidentes a partir de la siguiente descripción
55 detallada de la invención con referencia a las realizaciones de la misma y con referencia a los dibujos adjuntos, en los que:
La figura 1 muestra un diagrama de bloques esquemático de un sistema de audio de codificador/decodificador que incluye un procesamiento posterior y un procesamiento posterior inverso según la presente invención.
La figura 2 muestra un diagrama de bloques detallado de una realización de un dispositivo para procesar posteriormente una señal estéreo obtenida de un codificador de múltiples canales.
La figura 3 muestra un diagrama de bloques de otra realización del dispositivo para procesar posteriormente una señal estéreo obtenida de un decodificador de múltiples canales.
La figura 4 muestra un diagrama de bloques de una realización de un dispositivo para procesar posteriormente de manera inversa una señal estéreo que comprende señales izquierda y derecha.
La figura 1 es un diagrama de bloques de un sistema de codificador/decodificador en el que pretende usarse la presente invención. En el sistema 1 de audio una señal de audio de N canales se suministra a un codificador 2, siendo N un número entero que es mayor que 2. El codificador 2 transforma las señales de audio de N canales a señales L0 y R0 e información de decodificador paramétrica P, por medio de lo cual un decodificador puede decodificar la información y estimar las señales de N canales originales que van a emitirse desde el decodificador. El conjunto de parámetros espaciales P depende preferiblemente del tiempo y/o la frecuencia. Las señales de N canales pueden ser señales para un sistema 5.1, que comprende un canal central, dos canales frontales, dos canales envolventes y un canal de LFE.
El par de señales estéreo L0 y R0 codificadas y la información espacial de decodificador P, se transmiten al usuario de una manera adecuada, tal como mediante CD, DVD, VHS, H-i-Fi, difusión, disco láser, DBS, cable digital, Internet
o cualquier otro sistema de transmisión o distribución, indicados por una línea 4 circular en la figura 1. Puesto que se transmiten las señales izquierda y derecha, el sistema es compatible con el gran número de equipos de recepción que sólo pueden reproducir señales estéreo. Si el equipo de recepción incluye un decodificador, el decodificador puede decodificar las señales de N canales y proporcionar una estimación de las mismas, basándose en la información en el par de señales estéreo L0 y R0 así como las señales de información espacial de decodificador o parámetros espaciales P.
Sin embargo, debido al número decreciente de señales de reproducción, las señales estéreo carecen de información espacial en comparación con las señales de N canales u otras propiedades que pueden desearse para determinadas situaciones. Por tanto, según la presente invención, se proporciona un procesador 5 posterior que procesa la señal estéreo antes de su transmisión/distribución al receptor. El procesamiento posterior puede ser una “adición dependiente de la posición de graves o reverberación, o eliminación de vocales (karaoke con vocales en el canal central).
Otros ejemplos de procesamiento posterior son ampliación de estéreo-base, que puede realizarse usando el conocimiento de la composición de la mezcla envolvente original, tal como frontal/trasera, puesto que la contribución de señales de entrada individuales se conoce de las señales de información de decodificador P. En principio, ya puede aplicarse una ampliación estéreo en el codificador, pero ésta generalmente no es invertible, puesto que sólo están disponibles dos señales en el decodificador, en lugar de N, la inversión es generalmente imposible. Pero además de la ampliación de estéreo, también son posibles otras técnicas de procesamiento posterior en las contribuciones de múltiples canales individuales.
Según la invención, las señales procesadas posteriormente se transmiten a un receptor tal como se indicó mediante el círculo 6 en la figura 1. El dispositivo de la invención para procesar una señal estéreo obtenida de un codificador comprende el procesador 5 posterior. El aparato codificador según la presente invención comprende el codificador 2 y el procesador 5 posterior.
La señal recibida puede usarse directamente, por ejemplo si el receptor no incluye un decodificador de múltiplescanales. Éste puede ser el caso en un ordenador que recibe la señal 6 por Internet, o en un receptor que tiene sólo dos altavoces. Tal señal recibida se percibe como señal de alta calidad, puesto que ha mejorado la impresión espacial u otras características tal como se determina en el procesamiento de las mismas mediante el codificador y el procesador posterior.
Si la señal debe usarse para una decodificación en un decodificador 3 de N canales convencional, en primer lugar debe procesarse posteriormente de manera inversa mediante un procesador 7 posterior inverso, con el fin de reconstruir el par de señales estéreo L0 y R0 originales que junto con la información de decodificador o los parámetros espaciales P, produce una señal de N canales estimada. Según la invención, es posible tal reconstrucción de la mezcla de múltiples canales, reconstrucción que apenas se ve afectada por el procesamiento posterior. Además, es posible un procesamiento posterior en el decodificador para una reproducción estéreo como una característica seleccionable por el usuario, sin tener que determinar en primer lugar la señal de múltiples canales. El dispositivo de la invención para procesar una señal estéreo que comprende señales izquierda y derecha comprende el procesador 7 posterior inverso. El aparato decodificador según la presente invención comprende el decodificador 3 y el procesador 7 posterior inverso.
Sin el procesamiento posterior la mezcla descendente puede compararse con una mezcla descendente de ITU convencional. Sin embargo, el método de la invención puede mejorar la mezcla descendente de manera significativa.
El método de la invención puede determinar la contribución en la mezcla descendente de los canales originales en la mezcla de múltiples canales con la ayuda de los parámetros espaciales P determinados en el codificador. De esta manera puede aplicarse un procesamiento posterior a canales específicos de la mezcla de múltiples canales, por
5 ejemplo una ampliación de estéreo-base de los canales traseros, mientras que los otros canales no se ven afectados. El procesamiento posterior no afecta la reconstrucción de múltiples canales final si el procesamiento posterior es invertible. También puede aplicarse para una reproducción estéreo mejorada sin la necesidad de reconstruir en primer lugar la mezcla de múltiples canales.
10 Este método difiere de las técnicas de procesamiento posterior existentes porque usa el conocimiento de la mezcla de múltiples canales original, es decir los parámetros espaciales P determinados.
El codificador 2 opera de la siguiente manera:
15 Supóngase una señal de audio de N canales como señal de entrada al codificador 2, donde z1[n], z2[n],....zN[n] describen las formas de onda de dominio de tiempo discreto de los N canales. Estas N señales se segmentan usando una segmentación común, usando preferiblemente ventanas de análisis superpuestas. Posteriormente, cada segmento se convierte al dominio de frecuencia usando una transformada compleja (por ejemplo, FFT). Sin embargo, las estructuras de banco de filtros complejas también pueden ser apropiadas para obtener mosaicos de
20 tiempo/frecuencia. Este proceso da como resultado representaciones de subbanda segmentadas de las señales de entrada que se indicarán por, Z1[k], Z2[k],...., ZN[k], indicando k el índice de frecuencia.
A partir de estos N canales, se crean 2 canales de mezcla descendente, que son L0[k] y R0[k]. Cada canal de mezcla descendente es una combinación lineal de las N señales de entrada:
Los parámetros (i y 1i se eligen de manera que la señal estéreo que consiste en L0[k] y R0[k] tiene una buena imagen de estéreo. En caso de una señal de entrada de 5 canales que consiste en Lf, Rf, C, Ls y Rs (para los canales 30 izquierdo frontal, derecho frontal, central, izquierdo envolvente, derecho envolvente, respectivamente), puede obtenerse una mezcla descendente adecuada según:
Las señales L y R pueden obtenerse según las ecuaciones:
40 Adicionalmente, se extraen parámetros espaciales P para permitir la reconstrucción perceptual de las señales Lf, Rf, C, Ls y Rs a partir de L0 y R0.
En una realización, el conjunto de parámetros P incluye diferencias de intensidad entre canales (IID) y posiblemente valores de correlación cruzada entre canales (ICC) entre los pares de señales (Lf, Ls) y (Rf, Rs). La IID y la ICC entre 45 el par Lf, Ls se obtienen según las ecuaciones:
En este caso, (*) indica la conjugación compleja. Para otros pares de señal, pueden usarse ecuaciones similares. Por tanto, el parámetro IIDl describe la cantidad relativa de energía entre los canales izquierdo-frontal e izquierdo
5 envolvente y el parámetro ICCl describe la cantidad de correlación mutua entre los canales izquierdo-frontal e izquierdo-envolvente. Estos parámetros describen esencialmente los parámetros relevantes de manera perceptual entre los canales frontal y envolvente.
Puede obtenerse una parametrización de la cantidad de señal central que está presente en L0, R0 estimando dos
10 parámetros c1 y c2 de predicción. Estos dos parámetros de predicción definen una matriz de 2x3 que controla el proceso de mezcla ascendente de decodificador desde L0, R0 a L, C, y R:
15 Una implementación de la matriz de mezcla ascendente M se proporciona por:
Para el ejemplo mostrado anteriormente, el conjunto de parámetros P incluye {c1, c2, IIDl, ICCl, IIDr, ICCr} para cada 20 mosaico de tiempo/frecuencia.
En el par de señales estéreo (L0, R0) resultantes, puede aplicarse un procesamiento posterior de una manera que afecta principalmente a la contribución de Zi[k], por ejemplo Ls y Rs en la mezcla de estéreo. En la figura 1, se muestra la posición de este bloque en el códec.
25 La figura 2 es una vista detallada del procesador 5 posterior en la figura 1 según una realización de la invención. La señal izquierda L0w procesada posteriormente es la suma de tres señales, concretamente la señal izquierda L0 modificada por una función de transferencia HA, la señal izquierda L0 modificada por una función de transferencia HB y la señal derecha R0 modificada por una función de transferencia HD. De la misma manera, la señal derecha R0w
30 procesada posteriormente es la suma de tres señales, concretamente la señal derecha R0 modificada por una función de transferencia HF, la señal derecha R0 modificada por una función de transferencia HE y la señal izquierda L0 modificada por una función de transferencia HC. Las funciones de transferencia HA - HF pueden implementarse como filtros de tipo FIR o IIR, o pueden ser simplemente factores de escala (complejos) que pueden depender de la frecuencia. Además, la función de transferencia HA puede ser una multiplicación por un segundo parámetro (1-wl) y
35 la función de transferencia HB puede incluir un primer parámetro wl con lo que este parámetro wl determina la cantidad de procesamiento posterior de la señal estéreo.
Esto se muestra en la figura 3. El parámetro wl determina la cantidad de procesamiento posterior de L0[k] y wr de R0[k]. Cuando wl es igual a 0, L0[k] no se ve afectado, y cuando wl es igual a 1, L0[k] se ve afectado al máximo. Lo 40 mismo se aplica para wr con respecto a R0[k].
Se aplican las siguientes ecuaciones para los parámetros de procesamiento posterior wl y wr: Los bloques H1, H2, H3 y H4 en la figura 3 son funciones de filtro, que pueden ser diversos tipos de filtros, por ejemplo filtros de ampliación de estéreo, tal como se muestra a continuación.
Las salidas resultantes son:
siendo a una constante arbitraria (por ejemplo, +1).
10 Si las funciones de filtro H1, H2, H3 y H4 se eligen apropiadamente, la matriz de función de transferencia H puede invertirse. Además, para permitir el cálculo de la matriz inversa en el lado de decodificador, las funciones de filtro H1, H2, H3 y H4 y los parámetros wl y wr deben conocerse en el deodificador. Esto es posible puesto que wl y wr pueden calcularse a partir de los parámetros transmitidos. Por tanto, la señal estéreo original L0, R0 estará disponible de
15 nuevo lo que es necesario para decodificar la mezcla de múltiples canales.
Otra posibilidad es transmitir la señal estéreo original y aplicar el procesamiento posterior en el decodificador para hacer posible la reproducción estéreo mejorada sin la necesidad de determinar en primer lugar la mezcla de múltiples canales.
20 A continuación, se describe en detalle una realización del procesamiento posterior. Sin embargo, la invención no se limita a los detalles exactos sino que puede variarse dentro del alcance de la invención tal como se define en las reivindicaciones de patente adjuntas.
25 Los parámetros de procesamiento posterior o pesos wl y wr son una función de los parámetros espaciales transmitidos:
30 La función f se diseña de tal manera que wl aumenta si la señal L0 contiene más energía desde la señal izquierdaenvolvente en comparación con las señales izquierda-frontal o central. De una manera similar, wr aumenta con una energía relativa creciente de la señal derecha-envolvente presente en R0. Una expresión conveniente para wl y wr viene dada por:
con
y
Para las funciones de filtro H1, H2, H3 y H4 entonces se eligen las siguientes funciones a modo de ejemplo (en el dominio z):
Esta invención puede integrarse en un aparato codificador de audio de múltiples canales que crea una mezcla descendente compatible con estéreo. El esquema general de un codificador de audio paramétrico de múltiples canales de este tipo que se mejora mediante el esquema de procesamiento posterior tal como se describió anteriormente puede exponerse tal como sigue:
-
conversión de la señal de entrada de múltiples canales al dominio de frecuencia, o bien mediante segmentación y transformada o bien mediante aplicación de un banco de filtros;
-
extracción de parámetros espaciales P y generación de una mezcla descendente en el dominio de frecuencia;
-
aplicación del algoritmo de procesamiento posterior en el dominio de frecuencia; conversión de las señales procesadas posteriormente al dominio de tiempo;
-
codificación de la señal estéreo usando técnicas de codificación convencionales, tal como se define en MPEG;
-
multiplexación del flujo de bits estéreo con los parámetros P codificados para formar un flujo de bits emitidos total.
Un aparato decodificador de múltiples canales correspondiente (es decir, un decodificador con inversión de procesamiento posterior integrado) puede exponerse tal como sigue:
-
demultiplexación del flujo de bits de parámetros para recuperar los parámetros P y la señal estéreo codificada;
-
decodificación de la señal estéreo;
-
conversión de la señal estéreo decodificada al dominio de frecuencia;
-
aplicación de la inversión de procesamiento posterior basándose en los parámetros P;
-
mezcla ascendente desde la salida estéreo a múltiples canales basándose en los parámetros P;
-
conversión de la salida de múltiples canales al dominio de tiempo.
Puesto que el procesamiento posterior y procesamiento posterior inverso se realizan en el dominio de frecuencia, las funciones de filtro H1 a H4 se convierten o se realiza una aproximación a las mismas preferiblemente en el dominio de frecuencia mediante factores de escala (de valor real o complejos) sencillos, que pueden depender de la frecuencia.
Los expertos en la técnica pueden entender que una o más fases de procesamiento tal como se expuso anteriormente pueden combinarse como única fase de procesamiento.
Otra aplicación de la invención es aplicar el procesamiento posterior en la señal estéreo sólo en el lado de decodificador (es decir, sin procesamiento posterior en el lado de codificador). Usando este enfoque, el decodificador puede generar una señal estéreo mejorada desde una señal estéreo no mejorada.
Puede proporcionarse información adicional en el flujo de bits que indique si el procesamiento posterior se ha realizado o no y las funciones de parámetro f1, f2, y qué funciones de filtro H1, H2, H3, y H4 se han usado, lo que permite un procesamiento posterior inverso.
Una función de filtro puede describirse como una multiplicación en el dominio de frecuencia. Puesto que hay parámetros presentes para bandas de frecuencia individuales, la invención puede implementarse como ganancias sencillas, complejas en lugar de filtros, que se aplican individualmente en diferentes bandas de frecuencia. En este caso, las bandas de frecuencia de L0w, R0w se obtienen mediante una multiplicación de matriz (2x2) sencilla desde las bandas de frecuencia correspondientes desde (L0, R0). Las entradas de matriz reales se determinan por los parámetros y las representaciones de dominio de frecuencia de las funciones de filtro H que consisten por tanto en las ganancias invariables con el tiempo H y las ganancias controladas por parámetros que varían con el tiempo/frecuencia wl y wr. Debido a que los filtros son escalares para cada banda, es posible la inversión.
El procesamiento posterior en el codificador puede describirse mediante la siguiente ecuación de matriz:
Esta ecuación de matriz se aplica para cada banda de frecuencia. La matriz H contiene todos los escalares. El uso de escalares hace que el procesamiento posterior y el procesamiento posterior inverso sean relativamente fáciles.
Los parámetros wl y wr son escalares y funciones del conjunto de parámetros P. Estos 2 parámetros determinan la cantidad de procesamiento posterior de los canales de entrada.
Los parámetros H1…H4 son funciones de filtro complejas.
La inversión de este proceso también puede realizarse mediante una única multiplicación de matriz por banda de frecuencia. Se aplica la siguiente ecuación por banda de frecuencia:
donde
La matriz H-1 contiene sólo escalares. Los elementos de H-1, k1... k4, también son funciones del conjunto de parámetros P. Cuando las funciones en la matriz H, h11...... h22, y los parámetros P se conocen en el decodificador, entonces puede invertirse el procesamiento posterior.
Un diagrama de bloques de un procesador 3 posterior inverso que realiza tal procesamiento posterior inverso está ilustrado en la figura 4.
Esta inversión es posible cuando el determinante de la matriz H no es igual a cero. El determinante de H es igual a:
Cuando se eligen funciones h11 ... h22 adecuadas, det(H) será distinto de cero, de modo que el proceso es invertible.
Se menciona que la expresión “que comprende” no excluye otros elementos o etapas y que “un” o “una” no excluye una pluralidad de elementos. Además, los símbolos de referencia en las reivindicaciones no deben interpretarse como limitativos del alcance de las reivindicaciones.
Aunque la presente invención se ha descrito en conexión con algunas realizaciones, no se pretende que se limite a la forma específica expuesta en el presente documento. En cambio, el alcance de la presente invención se limita sólo por las reivindicaciones adjuntas. Adicionalmente, aunque parezca que se describe una característica en conexión con realizaciones particulares, un experto en la técnica reconocerá que según la invención pueden combinarse diversas características de las realizaciones descritas.

Claims (20)

  1. REIVINDICACIONES
    1. Método para procesar una señal estéreo obtenida de un codificador, codificador que codifica una señal de audio de N canales en señales izquierda y derecha (L0; R0) y parámetros espaciales (P), estando el método caracterizado porque comprende:
    -
    procesar dichas señales izquierda y derecha con el fin de proporcionar una señal estéreo procesada (L0w; R0w), en el que dicho procesamiento se controla dependiendo de dichos parámetros espaciales (P).
  2. 2.
    Método según la reivindicación 1, en el que dicho procesamiento se controla por un primer parámetro (wl; wr) para cada una de dichas señales izquierda y derecha, dependiendo dicho primer parámetro de los parámetros espaciales (P).
  3. 3.
    Método según la reivindicación 2, en el que dicho primer parámetro (wl; wr) es una función de tiempo y/o frecuencia.
  4. 4.
    Método según la reivindicación 1, 2 ó 3, en el que dicho procesamiento comprende filtrar al menos una de dichas señales izquierda y derecha con una función de transferencia que depende de los parámetros espaciales (P).
  5. 5.
    Método según la reivindicación 1, 2, 3 ó 4, en el que dicho procesamiento comprende:
    -
    añadir una primera, segunda y tercera señal con el fin de obtener dichas señales de canal procesadas (L0w; R0w), en las que la primera señal incluye la señal estéreo de un canal modificada por una primera función de transferencia (L0*HA; R0*HF), la segunda señal incluye la señal estéreo del mismo canal modificada por una segunda función de transferencia (L0*HB; R0*HE) y la tercera señal incluye la señal estéreo del otro canal modificada por una tercera función de transferencia (R0*HD; L0*HC).
  6. 6.
    Método según la reivindicación 5, en el que dicha segunda función de transferencia (HB; HE) comprende una multiplicación por dicho primer parámetro (Wl; Wr) seguida por una multiplicación por una primera función de filtro (Hl; H4).
  7. 7.
    Método según la reivindicación 5, en el que dicha primera función de transferencia (HA; HF) comprende una multiplicación por un segundo parámetro.
  8. 8.
    Método según la reivindicación 5, en el que dicha primera función de transferencia (HA; HF) comprende una multiplicación por un segundo parámetro siendo dicho primer parámetro una función de dicho segundo parámetro.
  9. 9.
    Método según la reivindicación 5, 6, 7 u 8, en el que dicha tercera función de transferencia (HC; HD) comprende una multiplicación de la señal izquierda o derecha (L0; R0) por dicho primer parámetro (Wl; Wr) seguida por una segunda función de filtro (H2; H3).
  10. 10.
    Método según la reivindicación 6, 7, 8 ó 9, en el que dichas funciones de filtro (H1, H2, H3, H4) son invariables con el tiempo.
  11. 11.
    Método según una cualquiera de las reivindicaciones anteriores, en el que dichas señales se describen mediante la ecuación:
    en la que la matriz de función de transferencia (H) es una función de los parámetros espaciales (P).
  12. 12. Método según la reivindicación 11, en el que dicha matriz de función de transferencia (H) se describe mediante la ecuación:
    siendo a una constante.
  13. 13.
    Método según la reivindicación 12, en el que dichas funciones de filtro (H1, H2, H3, H4) y dichos parámetros (wl, wr) se seleccionan de modo que la matriz de función de transferencia (H) es invertible.
  14. 14.
    Método según una cualquiera de las reivindicaciones anteriores, en el que dichos parámetros espaciales
    (P) contienen información que describe niveles de señales de la señal de N canales.
  15. 15.
    Dispositivo para procesar una señal estéreo obtenida de un codificador, codificador que codifica una señal de audio de N canales en señales izquierda y derecha (L0; R0) y parámetros espaciales (P), estando el dispositivo caracterizado porque comprende:
    -
    un procesador (5) posterior para procesar posteriormente dichas señales izquierda y derecha con el fin de proporcionar una señal estéreo procesada (L0w; R0w), en el que dicho procesamiento posterior se controla dependiendo de dichos parámetros espaciales (P).
  16. 16. Aparato codificador que comprende:
    -
    un codificador (2) para codificar una señal de audio de N canales en señales izquierda y derecha (L0; R0) y parámetros espaciales (P), y
    -
    un dispositivo (5) según la reivindicación 15 para procesar dichas señales izquierda y derecha (L0; R0) dependiendo de dichos parámetros espaciales (P).
  17. 17. Aparato decodificador que comprende:
    -
    un dispositivo (7) para recibir señales izquierda y derecha (L0w; R0w) procesadas y parámetros espaciales, siendo las señales izquierda y derecha (L0w; R0w) procesadas señales izquierda y derecha (L0; R0) procesadas dependiendo de los parámetros espaciales, representando las señales izquierda y derecha (L0; R0) y los parámetros espaciales una codificación de una señal de audio de N canales,
    -
    medios para procesar las señales izquierda y derecha (L0w; R0w) procesadas en respuesta a los parámetros espaciales para generar señales izquierda y derecha (L0; R0) de decodificador, y
    -
    un decodificador para decodificar las señales izquierda y derecha (L0; R0) de decodificador en una señal de audio de N canales.
  18. 18.
    Aparato decodificador según la reivindicación 17, en el que los medios para procesar están dispuestos para invertir el procesamiento de las señales izquierda y derecha (L0; R0) para generar las señales izquierda y derecha (L0w; R0w) procesadas.
  19. 19.
    Método para decodificar que comprende:
    -
    recibir señales izquierda y derecha (L0w; R0w) procesadas y parámetros espaciales, siendo las señales izquierda y derecha (L0w; R0w) procesadas señales izquierda y derecha (L0; R0) procesadas dependiendo de los parámetros espaciales, representando las señales izquierda y derecha (L0; R0) y los parámetros espaciales una codificación de una señal de audio de N canales;
    -
    procesar las señales izquierda y derecha (L0w; R0w) procesadas en respuesta a los parámetros espaciales para generar señales izquierda y derecha (L0; R0) de decodificador, y
    -
    decodificar las señales izquierda y derecha (L0; R0) de decodificador en una señal de audio de N canales.
  20. 20. Sistema (1) de audio que comprende un aparato codificador según la reivindicación 16 y un aparato decodificador según la reivindicación 17.
ES05718592T 2004-04-05 2005-03-30 Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado Active ES2426917T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04101405 2004-04-05
EP04101405 2004-04-05
EP04103367 2004-07-14
EP04103367 2004-07-14
PCT/IB2005/051065 WO2005098826A1 (en) 2004-04-05 2005-03-30 Method, device, encoder apparatus, decoder apparatus and audio system

Publications (1)

Publication Number Publication Date
ES2426917T3 true ES2426917T3 (es) 2013-10-25

Family

ID=34962191

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05718592T Active ES2426917T3 (es) 2004-04-05 2005-03-30 Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado

Country Status (12)

Country Link
US (1) US9992599B2 (es)
EP (1) EP1735779B1 (es)
JP (1) JP5284638B2 (es)
KR (1) KR101183862B1 (es)
CN (1) CN1947172B (es)
BR (1) BRPI0509110B1 (es)
ES (1) ES2426917T3 (es)
MX (1) MXPA06011397A (es)
PL (1) PL1735779T3 (es)
RU (1) RU2396608C2 (es)
TW (1) TWI455614B (es)
WO (1) WO2005098826A1 (es)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2175671T3 (pl) 2004-07-14 2012-10-31 Koninl Philips Electronics Nv Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
CN101223575B (zh) * 2005-07-14 2011-09-21 皇家飞利浦电子股份有限公司 音频编码和解码
US8626503B2 (en) 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
EP1927266B1 (en) * 2005-09-13 2014-05-14 Koninklijke Philips N.V. Audio coding
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
ES2446245T3 (es) 2006-01-19 2014-03-06 Lg Electronics Inc. Método y aparato para procesar una señal de medios
WO2007091845A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
BRPI0707969B1 (pt) * 2006-02-21 2020-01-21 Koninklijke Philips Electonics N V codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador
AU2007312597B2 (en) 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
CN103400583B (zh) 2006-10-16 2016-01-20 杜比国际公司 多声道下混对象编码的增强编码和参数表示
JP5394931B2 (ja) * 2006-11-24 2014-01-22 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の復号化方法及びその装置
US8855795B2 (en) 2007-01-09 2014-10-07 Mediatek Inc. Multiple output audio system
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
CN102714036B (zh) 2009-12-28 2014-01-22 松下电器产业株式会社 语音编码装置和语音编码方法
CN102280107B (zh) * 2010-06-10 2013-01-23 华为技术有限公司 边带残差信号生成方法及装置
EP2612321B1 (en) * 2010-09-28 2016-01-06 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
PL2647222T3 (pl) 2010-12-03 2015-04-30 Fraunhofer Ges Forschung Pozyskiwanie dźwięku za pomocą ekstrakcji informacji geometrycznej z estymacji kierunku nadejścia sygnału
WO2012093345A1 (en) * 2011-01-05 2012-07-12 Koninklijke Philips Electronics N.V. An audio system and method of operation therefor
EP2804176A1 (en) 2013-05-13 2014-11-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio object separation from mixture signal using object-specific time/frequency resolutions
EP2830046A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal to obtain modified output signals
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4095049A (en) * 1976-03-15 1978-06-13 National Research Development Corporation Non-rotationally-symmetric surround-sound encoding system
US4236039A (en) * 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JPH06165079A (ja) * 1992-11-25 1994-06-10 Matsushita Electric Ind Co Ltd マルチチャンネルステレオ用ダウンミキシング装置
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US5642423A (en) 1995-11-22 1997-06-24 Sony Corporation Digital surround sound processor
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
SG54379A1 (en) 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
EP0990368B1 (en) 1997-05-08 2002-04-24 STMicroelectronics Asia Pacific Pte Ltd. Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions
US6173061B1 (en) * 1997-06-23 2001-01-09 Harman International Industries, Inc. Steering of monaural sources of sound using head related transfer functions
US6067361A (en) * 1997-07-16 2000-05-23 Sony Corporation Method and apparatus for two channels of sound having directional cues
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
WO2005081229A1 (ja) * 2004-02-25 2005-09-01 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ及びオーディオデコーダ
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US20050247756A1 (en) 2004-03-31 2005-11-10 Frazer James T Connection mechanism and method
CN102122509B (zh) 2004-04-05 2016-03-23 皇家飞利浦电子股份有限公司 多信道解码器和多信道解码方法
PL2175671T3 (pl) * 2004-07-14 2012-10-31 Koninl Philips Electronics Nv Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio

Also Published As

Publication number Publication date
RU2006139068A (ru) 2008-05-20
KR101183862B1 (ko) 2012-09-20
RU2396608C2 (ru) 2010-08-10
TWI455614B (zh) 2014-10-01
WO2005098826A1 (en) 2005-10-20
CN1947172A (zh) 2007-04-11
EP1735779A1 (en) 2006-12-27
BRPI0509110A (pt) 2007-08-28
BRPI0509110B1 (pt) 2019-07-09
BRPI0509110A8 (pt) 2016-02-10
JP5284638B2 (ja) 2013-09-11
KR20070001205A (ko) 2007-01-03
MXPA06011397A (es) 2006-12-20
CN1947172B (zh) 2011-08-03
PL1735779T3 (pl) 2014-01-31
TW200611588A (en) 2006-04-01
JP2007531916A (ja) 2007-11-08
EP1735779B1 (en) 2013-06-19
US20070183601A1 (en) 2007-08-09
US9992599B2 (en) 2018-06-05

Similar Documents

Publication Publication Date Title
ES2426917T3 (es) Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado
ES2373728T3 (es) Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
JP5185337B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP5156386B2 (ja) 空間音声のパラメトリック符号化のためのコンパクトなサイド情報
ES2323275T3 (es) Conformacion de envolvente temporal de canal individual para esquemas de codificacion de indicacion binaural y similares.
JP5311597B2 (ja) マルチチャンネル・エンコーダ
KR101184568B1 (ko) 청각 장면들의 후부 잔향-기반의 합성
ES2317297T3 (es) Conformacion de envolvente de sonido difuso para esquemas de codificacion de indicacion binaural y similares.
RU2407226C2 (ru) Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
KR101215872B1 (ko) 송신되는 채널들에 기초한 큐들을 갖는 공간 오디오의파라메트릭 코딩
CN104428835B (zh) 音频信号的编码和解码
JP4976304B2 (ja) 音響信号処理装置、音響信号処理方法およびプログラム
TWI458365B (zh) 用以產生電平參數之裝置及方法、用以產生多聲道表示之裝置及方法以及儲存參數表示之儲存媒體