ES2387867T3 - Síntesis espacial de señales de audio multicanal - Google Patents

Síntesis espacial de señales de audio multicanal Download PDF

Info

Publication number
ES2387867T3
ES2387867T3 ES09794018T ES09794018T ES2387867T3 ES 2387867 T3 ES2387867 T3 ES 2387867T3 ES 09794018 T ES09794018 T ES 09794018T ES 09794018 T ES09794018 T ES 09794018T ES 2387867 T3 ES2387867 T3 ES 2387867T3
Authority
ES
Spain
Prior art keywords
signal
synthesis
coefficients
spatialization
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09794018T
Other languages
English (en)
Inventor
Florent Jaillet
David Virette
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Application granted granted Critical
Publication of ES2387867T3 publication Critical patent/ES2387867T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

Procedimiento de síntesis espacial de una señal de suma para obtener al menos dos señales de audio digitalesde salida, procediendo la señal de suma, así como los parámetros de espacialización, de una codificaciónparamétrica mediante matrización de una señal de audio digital multicanal original, comprendiendo 5 el procedimientolas etapas de:- decorrelación (Decorr.) de la señal de suma (s) para obtener una señal decorrelacionada (d),- aplicación (Sint.) de una matriz de síntesis (M Minq) cuyos coeficientes dependen de los parámetros deespacialización (R, I), a la señal decorrelacionada y a la señal de suma para obtener dichas señales de salida;caracterizado porque, para al menos un intervalo de valor de al menos un parámetro de espacialización, loscoeficientes de la matriz de síntesis se determinan según un criterio de minimización de una función cuantitativa (q),relativa a la cantidad de señal decorrelacionada en cada una de las señales de salida obtenidas mediante la etapade aplicación de la matriz de síntesis, siendo la función cuantitativa tal que el aumento en valor absoluto de loscoeficientes de la matriz de síntesis aplicados a la señal decorrelacionada hace aumentar el valor de dicha funciónaplicada a estos mismos coeficientes.

Description

Síntesis espacial de señales de audio multicanal
5 La presente invención se refiere al campo de la codificación/decodificación de señales de audio digitales multicanal.
Más particularmente, la presente invención se refiere a la codificación/decodificación paramétrica de señales de audio multicanal.
10 Este tipo de codificación/decodificación se basa en la extracción de parámetros de espacialización para que, durante la decodificación, la percepción espacial del oyente pueda reconstituirse.
Dicha técnica de codificación es conocida con el nombre de “Binaural Cue Coding” en inglés (BCC) que pretende, por un lado, extraer y, a continuación, codificar los índices de espacialización auditiva y, por otro lado, codificar una 15 señal monofónica o estereofónica obtenida de una matrización de la señal multicanal original.
Este enfoque paramétrico es una codificación de bajo rendimiento. El principal interés de este enfoque de codificación es permitir una mejor tasa de compresión que los métodos convencionales de compresión de señales de audio digitales multicanal, mientras se asegura la retrocompatibilidad del formato comprimido obtenido con los
20 formatos de codificación y los sistemas de difusión ya existentes.
De este modo, la invención se refiere, más particularmente, a la decodificación espacial de una escena sonora en 3 D a partir de un número reducido de canales transmitidos.
25 La norma MPEG Surround descrita en el documento de la norma MPEG ISO/IEC 23003-1: 2007 y en el documento de “Breebaart, J. y Hotho, G. y Koppens, J. y Schuijers, E. y Oomen, W. y van de Par, S.,” titulado “Background, concept, and architecture for the recent MPEG surround standard on multichannel audio compression” en Journal of the Audio Engineering Society 55-5 (2007) 331-351, describe una estructura específica de codificación/decodificación de la señal de audio multicanal.
30 La figura 1 describe dicho sistema de codificación/decodificación en el que el codificador 100 construye una señal de suma (“downmix” en inglés) Ss mediante matrización en 110 de los canales de la señal multicanal original S y proporciona mediante un módulo de extracción de parámetros 120, un conjunto reducido de parámetros P que caracteriza el contenido espacial de la señal multicanal original.
35 En el decodificador 150, la señal multicanal es reconstruida (S') por un módulo de síntesis 160 que tiene en cuenta a al vez la señal de suma y los parámetros P transmitidos.
La señal de suma comprende un número reducido de canales. Estos canales pueden ser codificados por un
40 codificador de audio convencional antes de la transmisión o el almacenamiento. Típicamente, la señal de suma comprende dos canales y es compatible con una difusión estéreo convencional. Antes de la transmisión o el almacenamiento, esta señal de suma también puede ser codificada por cualquier codificador estéreo convencional. La señal codificada de este modo es entonces compatible con los dispositivos que comprenden el decodificador correspondiente que reconstruyen la señal de suma ignorando los datos espaciales.
45 La norma MPEG Surround ha adoptado una estructura específica para la representación de los datos espaciales: el codificador se apoya en una estructura arborescente de codificación construida a partir de un número reducido de bloques elementales de codificación que permiten, cada uno, extraer parámetros espaciales en un número reducido de canales. Existen dos tipos de bloque elemental de codificación:
-
los bloques TTO (por “Two To One” en inglés) que permiten extraer los parámetros espaciales entre dos canales y construir una señal de suma monofónica a partir de estos dos canales,
-
los bloques TTT (por “Three To Two” en inglés) que permiten extraer los parámetros espaciales entre tres canales 55 y construir una señal de suma que contiene dos canales a partir de estos tres canales.
La figura 2 ilustra un primer ejemplo de una estructura de codificación o árbol de codificación que utiliza bloques TTO (TTO0, TTO1, TTO2, TTO3 y TTO4) para obtener una señal monofónica S a partir de una señal multicanal 5.1 que comprende 6 canales (L, R, C, LFE, Ls y Rs).
60 La figura 3 ilustra un segundo ejemplo de estructura de codificación que utiliza a la vez bloques TTO y bloques TTT para obtener una señal estereofónica Sl y Sr a partir de la señal 5.1.
La decodificación de las señales monofónicas o estereofónicas recibidas de este modo se realiza utilizando un árbol 65 de decodificación simétrico a los representados en las figuras 2 y 3.
De este modo, para la decodificación de una señal codificada según el árbol de la figura 2, la decodificación puede verse como una sucesión de etapas de reconstrucción.
En este caso, la primera etapa de decodificación consiste en reconstruir las señales que corresponden a las señales
5 de entrada del bloque TTO0 a partir de la señal de suma S y de los parámetros espaciales extraídos por el bloque TTO0, la etapa siguiente consiste a continuación en reconstruir las señales que corresponden a las señales de entrada del bloque TTO1 a partir de la señal reconstruida en la etapa precedente y de los parámetros espaciales extraídos por el bloque TTO1, la decodificación continúa a continuación de manera similar hasta la reconstrucción del conjunto de los canales de la señal multicanal codificada. En la práctica, el decodificador construye una matriz que
10 permite pasar directamente de la señal de suma monofónica a los 6 canales reconstruidos mediante combinación de las matrices de tamaño inferior de los diferentes bloques TTO y TTT.
La técnica adoptada en la norma MPEG Surround para la decodificación de los bloques TTO impone, sin embargo, una limitación muy penalizante para la codificación de señales multicanal que comprenden canales en oposición de 15 fase.
Esta técnica de decodificación se describe de forma más precisa en la solicitud de patente titulada “signal synthesizing” publicada con el número WO 03/090206 A1 el 30 de octubre de 2003 (Solicitante: Koninklijke Philips Electronics N.V., Inventor: Dirk J. Breebaart).
20 Esta técnica consiste, como se representa en referencia a la figura 4, en efectuar una etapa de decorrelación en 410 mediante filtrado de la señal de suma s para obtener una señal decorrelacionada d. La señal de suma y la señal decorrelacionada obtenida de este modo son procesadas a continuación por un módulo de síntesis 420 mediante una matriz de síntesis M, en función de los parámetros espaciales R y I para crear las dos señales l y r que respetan
25 los parámetros espaciales especificados. Los parámetros R y I son, en este caso, respectivamente la relación de energía entre los canales de la señal multicanal y un índice de correlación intercanal de los canales de la señal multicanal.
La matrización de las señales s y d se realiza siguiendo las siguientes relaciones: 30
35 Ahora bien, esta matrización presenta la limitación mencionada anteriormente y que hace a este método inadecuado para la codificación de las señales de audio multicanal que presentan correlaciones intercanal negativas.
En particular, dicha técnica no es adecuada para la decodificación de las señales ambiofónicas que comprenden oposiciones de fase entre canales.
40 En efecto, cuando la correlación intercanal I es negativa, y en particular cuando está próxima a -1, la proporción de señal decorrelacionada utilizada para sintetizar las señales l y r se vuelve muy importante, superando en algunos casos particulares claramente la cantidad de señal de suma s utilizada. En el caso más problemático, puede constatarse que, para una diferencia intercanal del nivel de 0dB, es decir para R=1, cuando la correlación intercanal I
45 tiende a -1, la matriz de mezclado tiende a la siguiente matiz:
Esta matriz corresponde a señales reconstruidas
1
=
d y r
=
d
que no implican a la señal de suma en
50 su expresión, sino que utilizan únicamente la señal decorrelacionada. De este modo, la forma de onda de la señal reconstruida no está controlada, ya que depende totalmente de la decorrelación experimentada por la señal s.
El problema de reconstrucción ilustrado en el ejemplo precedente en un caso extremo se presenta también para otros valores de R e I, y es tanto más marcado en cuanto I está próximo a -1. De este modo, la forma de onda de los canales reconstruidos no es, en estos casos, tan próxima como podría serlo a las señales originales, lo que limita inútilmente la calidad de las señales reconstruidas.
5 El efecto de esta limitación es aún más marcado cuando la señal presenta varios canales que tienen correlaciones intercanal próximas a -1. En este caso, más de dos canales tienen formas de onda próximas, pero algunos de ellos están en oposición de fase.
10 Durante la restitución de la señal multicanal original, las señales de estos diferentes canales que tienen formas de ondas próximas interactuarán en la zona de restitución creando interferencias constructivas y destructivas que permitirán reconstruir el campo sonoro deseado.
Después de la decodificación, la forma de onda de los canales se deformará fuertemente debido al problema 15 mencionado anteriormente.
Además, como cada decodificador de bloque TTO que interviene en el árbol de decodificación, utiliza un filtro de decorrelación diferente, la deformación de la forma de onda no será la misma para los diferentes canales.
20 Los canales reconstruidos ya no tienen entonces, como en la señal original, formas de onda próximas y las interferencias que permitían la reconstrucción del campo sonoro durante la restitución, ya no se producen como en la señal original. Esto desemboca, por un lado, en una mala reconstrucción espacial de la escena sonora y, por otro lado, en la creación de artefactos audibles, conllevando las diferencias de forma de onda la creación de componentes ruidosas perceptibles.
25 La presente invención mejora la situación.
Para ello, la presente invención propone un procedimiento de síntesis espacial de una señal de suma para obtener al menos dos señales de salida, obteniéndose la señal de suma así como parámetros de espacialización de una
30 codificación paramétrica mediante matrización de una señal multicanal original. El procedimiento comprende las etapas de:
-
decorrelación de la señal de suma para obtener una señal decorrelacionada,
35 - aplicación de una matriz de síntesis cuyos coeficientes dependen de los parámetros de espacialización, a la señal decorrelacionada y a la señal de suma para obtener dichas señales de salida;
caracterizado porque, para al menos un intervalo de valor de al menos un parámetro de espacialización, los coeficientes de la matriz de síntesis se determinan según un criterio de minimización de una función cuantitativa (q),
40 relativa a la cantidad de señal decorrelacionada en cada una de las señales de salida obtenidas mediante la etapa de aplicación de la matriz de síntesis, siendo la función cuantitativa tal que el aumento en valor absoluto de los coeficientes de la matriz de síntesis aplicados a la señal decorrelacionada hace aumentar el valor de dicha función aplicada a estos mismos coeficientes.
45 De este modo, el tener en cuenta la cantidad de señal decorrelacionada en cada una de las señales y, por lo tanto, en la etapa de síntesis de la señal, permite librarse del caso particular mencionado anteriormente en el que solamente la señal decorrelacionada interviene en la matrización de síntesis. El procedimiento de acuerdo con la invención permite, de este modo, tratar los casos en los que un parámetro de espacialización situado en un intervalo de valor predeterminado conlleva dicha situación.
50 La minimización de dicha función cuantitativa permite definir coeficientes de la matriz de síntesis que permiten asegurar un correcto respeto de la forma de onda de la señal de entrada en las señales de salida.
Más particularmente y de forma sencilla, dicha función cuantitativa puede ser una función de energía de la señal 55 decorrelacionada.
Esta función respeta correctamente las características mencionadas anteriormente.
De forma más general, la función cuantitativa es de tipo: 60
con p un número entero superior o igual a 1.
En una realización particular, los parámetros de espacialización son un parámetro (R) de relación de energía entre los canales de la señal multicanal y un parámetro (I) de correlación intercanal de la señal multicanal, siendo un intervalo de valor el intervalo en el que el parámetro de correlación intercanal es negativo.
5 De este modo, la invención se aplica, más particularmente, para las señales multicanal que presentan correlaciones intercanal negativas.
La invención puede implementarse, por lo tanto, únicamente para los valores del parámetro de correlación intercanal negativos o para cualquier valor de este parámetro.
10 En otra realización, se selecciona una función cuantitativa diferente como intervalo de valor de los parámetros de espacialización.
Entonces es posible modular la importancia relativa que se le quiere dar a las diferentes matrices de síntesis. De
15 este modo, es posible dar un peso importante a una matriz tal como se define en el estado de la técnica, para un intervalo particular de parámetros y a la inversa dar un peso importante a la matriz de síntesis en el sentido de la invención para otro intervalo de parámetro. De este modo, puede conservarse una compatibilidad con los sistemas existentes en cierto intervalo de funcionamiento y mejorar la calidad del sistema en un intervalo particular. Además, la posibilidad de utilizar varias matrices de síntesis obtenidas según diferentes criterios permite optimizar la calidad
20 global del sistema para todo el intervalo de funcionamiento.
La invención también se refiere a un dispositivo de síntesis espacial de una señal de suma que genera al menos dos señales de salida, obteniéndose la señal de suma, así como los parámetros de espacialización, de un dispositivo de codificación paramétrica que emplea una matrización de una señal multicanal original. Comprendiendo el dispositivo:
-
medios de decorrelación (510) de la señal de suma para obtener una señal decorrelacionada,
-
medios de aplicación (520) de una matriz de síntesis (M Minq), cuyos coeficientes dependen de los parámetros de espacialización, a la señal decorrelacionada y a la señal de suma para obtener dichas señales de salida;
30 caracterizado porque para al menos un intervalo de valor de al menos un parámetro de espacialización, los coeficientes de la matriz de síntesis se determinan según un criterio de minimización de una función cuantitativa, relativa a la cantidad de señal decorrelacionada en cada una de las señales de salida obtenidas por los medios de aplicación de la matriz de síntesis, siendo la función cuantitativa tal que el aumento en valor absoluto de los
35 coeficientes de la matriz de síntesis aplicados a la señal decorrelacionada hace aumentar el valor de dicha función aplicada a estos mismos coeficientes.
Se refiere a un decodificador que comprende un dispositivo de síntesis tal como se ha descrito anteriormente.
40 La invención también se refiere a un equipo multimedia que comprende un decodificador tal como se ha descrito anteriormente.
De forma no limitante, dicho equipo puede ser, por ejemplo, un teléfono móvil, una agenda electrónica o lector de contenido digital, un ordenador, un decodificador de salón (“set-top box”).
45 Finalmente, la invención se refiere a un programa informático que comprende instrucciones de código para la implementación de las etapas del procedimiento tal como se ha descrito anteriormente, cuando estas instrucciones son ejecutadas por un procesador.
50 Otras características y ventajas de la invención quedarán más claras con la lectura de la siguiente descripción, dada únicamente a título de ejemplo no limitante, y realizada en referencia a los dibujos adjuntos, en los que:
la figura 1 ilustra un sistema de codificación/decodificación paramétrica convencional del estado de la técnica, tal como se ha descrito anteriormente;
55 las figuras 2 y 3 ilustran ejemplos de árboles de codificación, tal como se han descrito anteriormente, según la norma MPEG Surround en el caso de una señal multicanal de tipo 5.1;
la figura 4 ilustra un sistema de decodificación del estado de la técnica de un bloque TTO tal como se ha descrito 60 anteriormente;
la figura 5 ilustra un dispositivo de síntesis de acuerdo con la invención para la decodificación de un bloque TTO;
la figura 6 ilustra un dispositivo de síntesis para la decodificación de un bloque TTO de acuerdo con una realización 65 particular; la figura 7 ilustra un decodificador de acuerdo con la invención en el caso de señales multicanal de tipo 5.1; y
la figura 8 ilustra un ejemplo de equipo multimedia que comprende al menos un dispositivo de síntesis de acuerdo con la invención.
5 La figura 5 ilustra una realización de la invención. La figura ilustra un dispositivo de síntesis para la decodificación de un bloque TTO (TTO-1). Este dispositivo comprende un módulo de decorrelación 510, adecuado para realizar una etapa de decorrelación de la señal recibida s que es una señal de suma obtenida en la codificación mediante una matrización de señales multicanal.
10 Esta etapa de decorrelación es, por ejemplo, la descrita en la norma MPEG Surround mencionada anteriormente.
Esta señal decorrelacionada d y la señal de suma s son tenidas en cuenta en un módulo de síntesis 520 que utiliza una matriz M Minq cuyos coeficientes dependen de parámetros de espacialización R e I recibidos y que produce 15 señales de salida l y r.
Más exactamente, las señales l y r se generan mediante la siguiente matrización:
respetando las siguientes condiciones:
-
la energía total se conserva, es decir:
-
la relación de energía entre l y r vale R, es decir:
-
la intercorrelación normalizada entre l y r vale I, es decir:
35 Utilizando las dos primeras condiciones, tenemos:
Las soluciones pueden escribirse, por lo tanto, de la forma:
La tercera condición, se escribe entonces:
es decir cos(a-b) = I.
Se ve, por lo tanto, que las matrices soluciones del problema son el conjunto de las matrices parametrizadas por 50 β∈[0,2π) de la forma:
5 De este modo, son posibles dos valores de α. El valor de β está en función de R e I y se selecciona de acuerdo con una realización de la invención para limitar la cantidad de la señal decorrelacionada d introducida en las señales reconstruidas, sean cuales sean los valores de correlación I, incluyendo para valores negativos.
De este modo, la elección del valor β puede formalizarse introduciendo una función cuantitativa q relativa a la 10 cantidad de señal decorrelacionada tenida en cuenta en la matrización para la reconstrucción de las señales.
De forma general, la función cuantitativa q es tal que el aumento en valor absoluto de los coeficientes de la matriz de síntesis aplicados a la señal decorrelacionada, hace aumentar el valor de la función q aplicada a estos mismos coeficientes.
15 De este modo, esta función cuantitativa q es tal que cumple las siguientes condiciones:
-
para todos los números reales x, x', y si |x'| � |x| entonces q (x', y) � q(x, y)
20 - y de forma simétrica, para todos los números reales x, y, y' si |y'|�|y| entonces q(x, y') � q(x, y). Para I y R fijos, el valor de β se selecciona entonces mediante minimización de la función:
25
Pueden seleccionarse numerosas funciones cuantitativas que cumplen las condiciones descritas anteriormente y permitirán realizar una elección satisfactoria de β.
30
De este modo, la función q puede ser por ejemplo de tipo:
con p un número entero superior o igual a 1.
35 En una realización particular, la función cuantitativa q es una función de energía de la señal decorrelacionada. La función q es por lo tanto tal que:
De este modo, los valores de β que garantizan una reconstrucción satisfactoria de acuerdo con la realización de la invención descrita en este documento se seleccionan para minimizar la energía total de la señal decorrelacionada d en las señales reconstruidas.
45 Se busca entonces β minimizando:
es decir
lo que supone maximizar:
La derivada de g es:
Ésta se anula cuando:
El valor de β adoptado se selecciona, por lo tanto, entre los valores que cumplen
y que corresponden de hecho a un valor máximo de g.
20 De este modo, la figura 5 representa un dispositivo de síntesis para la decodificación de un bloque TTO, llamado en este documento TTO-1 que comprende un módulo de decorrelación 510 de la señal de suma, un módulo de síntesis 520 adecuado para aplicar una matriz de síntesis a la señal decorrelacionada y a la señal de suma. Los coeficientes de esta matriz de síntesis se determinan según un criterio de minimización de una función cuantitativa q relativa a la cantidad de señal decorrelacionada tal como se ha descrito anteriormente.
25 La figura 5, ilustra también las etapas del procedimiento de síntesis espacial de acuerdo con la invención en el que a partir de una señal de suma s, se obtienen al menos dos señales de salida 1 y r. La señal de suma procede de una codificación paramétrica mediante matrización de una señal multicanal que proporciona también parámetros de espacialización.
30 El procedimiento implementado por el dispositivo de síntesis comprende las etapas de:
-
decorrelación (Decorr.) de la señal de suma para obtener una señal decorrelacionada d;
35 - aplicación (Sint.) de una matriz de síntesis (M Minq) cuyos coeficientes dependen de los parámetros de espacialización (I, R), a la señal decorrelacionada (d) y a la señal de suma (s) para obtener dichas señales de salida.
Este procedimiento es tal que, para al menos un intervalo de valor de al menos un parámetro de espacialización, los coeficientes de la matriz de síntesis se determinan según un criterio de minimización de una función cuantitativa, 40 relativa a la cantidad de señal decorrelacionada tenida en cuenta en la etapa de aplicación de la matriz de síntesis.
En la realización descrita anteriormente en referencia a la figura 5, los parámetros de espacialización son parámetros que designan la relación de energía R entre los canales de la señal multicanal original y una medida de correlación intercanal de esta misma señal.
45 Otros parámetros de espacialización procedentes de la codificación paramétrica también pueden seleccionarse. Estos parámetros pueden ser, por ejemplo, parámetros que designan el desfase entre los canales de la señal multicanal, o parámetros de envuelta temporal de los canales de audio.
50 La figura 6 ilustra otra realización de la invención en la que, en función de un intervalo de valor de al menos uno de los parámetros de espacialización recibidos, en este caso el parámetro de correlación intercanal I, se selecciona una matriz de síntesis diferente.
El ejemplo ilustrado en la figura 6 muestra dos tipos de matriz de síntesis.
5 La primera matriz de síntesis M es, por ejemplo, la descrita en el estado de la técnica en la norma MPEG Surround. El módulo de síntesis correspondiente se ilustra en 630. Esta matriz de síntesis se aplica, en este caso, a la señal de suma s y a la señal decorrelacionada d cuando el parámetro I es positivo.
Cuando el parámetro I es negativo, la matriz de síntesis M Minq es la descrita en referencia a la figura 5. El módulo de síntesis correspondiente se representa en 620.
De este modo, el procedimiento implementado por esta realización permite procesar eficazmente señales multicanal que presentan correlaciones intercanal negativas.
15 Este tipo de señal multicanal es, por ejemplo, una señal de tipo ambiofónico. En efecto, este tipo de señal presenta canales en oposición de fase. Este elemento característico de las señales procedentes de una toma de sonido ambiofónico se ilustra en los artículos de M. Gerzon titulados “Hierarchical System of Surround Sound Transmission for HDTV” o “Ambisonic Decoders for HDTV”.
En una variante de realización, varias matrices de síntesis pueden estar previstas para intervalos de valores diferentes de los parámetros de espacialización.
De este modo, puede modularse la importancia relativa que se quiere dar a las diferentes matrices de síntesis en función de los valores de parámetros recibidos.
25 Por ejemplo, de este modo es posible dar un peso importante a una matriz M tal como se describe en el estado de la técnica para un intervalo particular de parámetros y, a la inversa, dar un peso importante a la matriz de síntesis MMinq en el sentido de la invención para otro intervalo de parámetro.
La compatibilidad con los sistemas existentes en cierto intervalo de funcionamiento se conserva entonces. Una mejora de la calidad de la síntesis en un intervalo particular de valor de parámetros de espacialización es aportada entonces en esta realización.
Además, la posibilidad de utilizar varias matrices de síntesis obtenidas según diferentes criterios permite optimizar la 35 calidad global de la síntesis para todo el intervalo de funcionamiento.
Pueden utilizarse, por ejemplo, diferentes matrices de síntesis según que el valor de al menos un parámetro de espacialización sea reducido o, por el contrario, importante.
De este modo, en esta variante de la realización, se utilizarán dos matrices de síntesis tales que, para los valores positivos del índice de correlación I, se utilizará la matriz M tal como se describe en el estado de la técnica y, para los valores negativos del índice de correlación I, se utilizará la matriz MMinq.
También se podrán definir diferentes intervalos de funcionamiento, como por ejemplo: 45
para I > 0, se utiliza una matriz Minter = M
para 0 I>-0,25, se utilizará una interpolación de las dos matrices Minter = α M + (1- α) MMinq
para -0,25 I>-1, se utilizará la matriz Minter = MMinq
Este dispositivo TTO-1 tal como se representa en la figura 5 o en la figura 6 está, por ejemplo, integrado en un decodificador de señal digital. Dicho tipo de decodificador se ilustra, por ejemplo, en referencia a la figura 7.
55 El decodificador representado en esta figura está típicamente previsto para decodificar señales multicanal de tipo
5.1. De este modo, este decodificador comprende una pluralidad de dispositivos TTO-1 (TTO0-1, TTO1-1, TTO2-1, TTO3-1, TTO4-1) de acuerdo con la invención para, a partir de una señal S recibida, obtener una señal multicanal que comprende 6 canales (L, R, C, LFE, Ls, Rs).
El módulo de decodificación 730 que comprende esta pluralidad de dispositivos de síntesis puede, por supuesto, estar configurado de forma diferente según el árbol de codificación que ha sido utilizado para la señal multicanal original.
El decodificador tal como se representa en la figura 7 comprende un módulo de análisis QMF (por “quadrature Mirror
65 Filter” en inglés) adecuado para realizar una transformación de la señal temporal de suma (o downmix) S procedente del codificador en una señal frecuencial por sub-banda. La señal por banda de frecuencia es suministrada entonces en la entrada del módulo de decodificación 730. A la salida del módulo de decodificación, las señales procesadas entran en el módulo de síntesis QMF 720 adecuado para realizar una transformación inversa y devolver a la señal multicanal obtenida al dominio temporal.
5 Estos módulos de análisis QMF y de síntesis QMF pueden ser, por ejemplo, aquellas tales como se describe en la norma MPEG Surround.
El decodificador, tal como se representa en la figura 7, recibe, procedentes del codificador, parámetros P de espacialización que proceden de la codificación paramétrica de la señal multicanal original.
10 Típicamente, estos parámetros pueden ser parámetros de relación de energía entre los canales, de medición de correlación entre los canales o también de desfase entre los canales o finalmente de envuelta temporal.
Este decodificador 700 puede estar integrado en un equipo multimedia de tipo decodificador de salón o “set-top box”, 15 ordenador o también teléfono móvil, lector de contenido digital, agenda electrónica personal, etc.
La figura 8 representa un ejemplo de dicho equipo multimedia que comprende particularmente un módulo de entrada E adecuado para recibir señales sonoras multicanal comprimidas por una red de comunicación, por ejemplo, o por medio de una toma de sonido multicanal.
20 Estas señales multicanal han sido comprimidas mediante un método de codificación paramétrica que por, matrización de la señal original, genera una señal de suma S y parámetros de espacialización P. Esta codificación puede, en una realización alternativa, estar previsto en el equipo multimedia.
25 Este equipo comprende uno o más dispositivos de síntesis de acuerdo con la invención representado materialmente en este caso por un procesador PROC que coopera con un bloque de memoria BM que comprende una memoria de almacenamiento y/o de trabajo MEM.
El bloque de memoria pueden comprender, ventajosamente, un programa informático que comprende instrucciones
30 de código para la implementación de las etapas del procedimiento en el sentido de la invención, cuando estas instrucciones son ejecutadas por el procesador PROC, y particularmente una etapa de decorrelación de una señal de suma recibida para obtener una señal decorrelacionada y una etapa de aplicación de una matriz de síntesis cuyos coeficientes dependen de los parámetros de espacialización, a la señal decorrelacionada y a la señal de suma para obtener al menos dos señales de salida. La matriz de síntesis es tal que, para al menos un intervalo de valor de
35 al menos un parámetro de espacialización, sus coeficientes se determinan según un criterio de minimización de una función cuantitativa, relativa a la cantidad de señal decorrelacionada tenida en cuenta en la etapa de aplicación de la matriz de síntesis.
Típicamente, la descripción de la figura 5 retoma las etapas de un algoritmo de dicho programa informático. El
40 programa informático también puede almacenarse en un soporte de memoria legible por un lector del dispositivo o ser descargable en el espacio de memoria del equipo.
El bloque de memoria comprende de este modo los coeficientes de la matriz de síntesis tal como se ha definido anteriormente.
45 Este bloque de memoria puede comprender en otra realización de la invención tal como se describe en referencia a la figura 6, coeficientes que definen varias matrices de síntesis que se aplican a la señal de suma y a la señal decorrelacionada en función del intervalo de valores de los parámetros de espacialización recibidos.
50 Del mismo modo, el procesador del equipo también puede comprender instrucciones para la implementación de las etapas de análisis y de síntesis del decodificador, tal como se describe en referencia a la figura 7.
El equipo multimedia tal como se ilustra comprende también una salida S para suministrar la señal multicanal reconstruida S' mediante medios de restitución de tipo altavoz o mediante medios de comunicación adecuados para
55 transmitir esta señal multicanal.

Claims (8)

  1. REIVINDICACIONES
    1. Procedimiento de síntesis espacial de una señal de suma para obtener al menos dos señales de audio digitales de salida, procediendo la señal de suma, así como los parámetros de espacialización, de una codificación
    5 paramétrica mediante matrización de una señal de audio digital multicanal original, comprendiendo el procedimiento las etapas de:
    -
    decorrelación (Decorr.) de la señal de suma (s) para obtener una señal decorrelacionada (d),
    10 - aplicación (Sint.) de una matriz de síntesis (M Minq) cuyos coeficientes dependen de los parámetros de espacialización (R, I), a la señal decorrelacionada y a la señal de suma para obtener dichas señales de salida;
    caracterizado porque, para al menos un intervalo de valor de al menos un parámetro de espacialización, los coeficientes de la matriz de síntesis se determinan según un criterio de minimización de una función cuantitativa (q),
    15 relativa a la cantidad de señal decorrelacionada en cada una de las señales de salida obtenidas mediante la etapa de aplicación de la matriz de síntesis, siendo la función cuantitativa tal que el aumento en valor absoluto de los coeficientes de la matriz de síntesis aplicados a la señal decorrelacionada hace aumentar el valor de dicha función aplicada a estos mismos coeficientes.
    20 2. Procedimiento de acuerdo con la reivindicación 1, caracterizado porque la función cuantitativa es una función de energía de la señal decorrelacionada.
  2. 3.
    Procedimiento de acuerdo con la reivindicación 1, caracterizado porque la función cuantitativa es de tipo:
    con p un número entero superior o igual a 1.
  3. 4.
    Procedimiento de acuerdo con la reivindicación 1, caracterizado porque los parámetros de espacialización son un
    30 parámetro (R) de relación de energía entre los canales de la señal multicanal y un parámetro (I) de correlación intercanal de la señal multicanal, siendo un intervalo de valor el intervalo en el que el parámetro de correlación intercanal es negativo.
  4. 5. Procedimiento de acuerdo con la reivindicación 1, caracterizado porque se selecciona una función cuantitativa 35 diferente como intervalo de valor de los parámetros de espacialización.
  5. 6. Dispositivo de síntesis espacial de una señal de suma que genera al menos dos señales de audio digitales de salida, procediendo la señal de suma, así como los parámetros de espacialización, de un dispositivo de codificación paramétrica que implementa una matrización de una señal de audio digital multicanal original, comprendiendo el
    40 dispositivo:
    -
    medios de decorrelación (510) de la señal de suma para obtener una señal decorrelacionada,
    -
    medios de aplicación (520) de una matriz de síntesis (M Minq) cuyos coeficientes dependen de los parámetros de 45 espacialización, a la señal decorrelacionada y a la señal de suma para obtener dichas señales de salida;
    caracterizado porque, para al menos un intervalo de valor de al menos un parámetro de espacialización, los coeficientes de la matriz de síntesis se determinan según un criterio de minimización de una función cuantitativa, relativa a la cantidad de señal decorrelacionada en cada una de las señales de salida obtenidas por los medios de
    50 aplicación de la matriz de síntesis, siendo la función cuantitativa tal que el aumento en valor absoluto de los coeficientes de la matriz de síntesis aplicados a la señal decorrelacionada hace aumentar el valor de dicha función aplicada a estos mismos coeficientes.
  6. 7. Decodificador de señal de audio digital que comprende al menos un dispositivo de síntesis de acuerdo con la 55 reivindicación 6.
  7. 8.
    Equipo multimedia que comprende un decodificador de acuerdo con la reivindicación 7.
  8. 9.
    Programa informático que comprende instrucciones de código para la implementación de las etapas del
    60 procedimiento de acuerdo con una de las reivindicaciones 1 a 5, cuando estas instrucciones son ejecutadas por un procesador.
ES09794018T 2008-06-26 2009-06-16 Síntesis espacial de señales de audio multicanal Active ES2387867T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0854282 2008-06-26
FR0854282 2008-06-26
PCT/FR2009/051146 WO2010004155A1 (fr) 2008-06-26 2009-06-16 Synthese spatiale de signaux audio multicanaux

Publications (1)

Publication Number Publication Date
ES2387867T3 true ES2387867T3 (es) 2012-10-03

Family

ID=40328191

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09794018T Active ES2387867T3 (es) 2008-06-26 2009-06-16 Síntesis espacial de señales de audio multicanal

Country Status (7)

Country Link
US (1) US8583424B2 (es)
EP (1) EP2304721B1 (es)
JP (1) JP5366104B2 (es)
CN (1) CN102077276B (es)
AT (1) ATE557386T1 (es)
ES (1) ES2387867T3 (es)
WO (1) WO2010004155A1 (es)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2362376A3 (en) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
KR101756838B1 (ko) 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
JP6133422B2 (ja) * 2012-08-03 2017-05-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法
EP2717263B1 (en) 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
SG11201600466PA (en) * 2013-07-22 2016-02-26 Fraunhofer Ges Forschung Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
KR20160081844A (ko) * 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
CN111407268B (zh) * 2020-03-27 2021-05-14 华南理工大学 一种基于相关函数的多通道脑电信号压缩方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5835375A (en) * 1996-01-02 1998-11-10 Ati Technologies Inc. Integrated MPEG audio decoder and signal processor
DE19632734A1 (de) * 1996-08-14 1998-02-19 Thomson Brandt Gmbh Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
US6199039B1 (en) * 1998-08-03 2001-03-06 National Science Council Synthesis subband filter in MPEG-II audio decoding
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
DE60311794T2 (de) * 2002-04-22 2007-10-31 Koninklijke Philips Electronics N.V. Signalsynthese
BRPI0305746B1 (pt) * 2002-08-07 2018-03-20 Dolby Laboratories Licensing Corporation Tradução espacial de canal de áudio
KR100923297B1 (ko) * 2002-12-14 2009-10-23 삼성전자주식회사 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치

Also Published As

Publication number Publication date
EP2304721B1 (fr) 2012-05-09
ATE557386T1 (de) 2012-05-15
US20110106543A1 (en) 2011-05-05
CN102077276A (zh) 2011-05-25
EP2304721A1 (fr) 2011-04-06
JP2011525999A (ja) 2011-09-29
US8583424B2 (en) 2013-11-12
WO2010004155A1 (fr) 2010-01-14
JP5366104B2 (ja) 2013-12-11
CN102077276B (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
ES2387867T3 (es) Síntesis espacial de señales de audio multicanal
ES2733878T3 (es) Codificación mejorada de señales de audio digitales multicanales
ES2398573T3 (es) Número reducido de decodificación de canales
ES2376889T3 (es) Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal
US7822616B2 (en) Time slot position coding of multiple frame types
ES2314706T3 (es) Metodo y dispositivo para generar señal multicanal o conjunto de datos de parametros.
ES2913849T3 (es) Concepto para codificación y decodificación de audio para canales de audio y objetos de audio
ES2362920T3 (es) Método mejorado para la conformación de señales en reconstrucción de audio multicanal.
ES2513265T3 (es) Procedimiento y aparato para procesar una señal de medios
KR101315077B1 (ko) 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들
ES2401554T3 (es) Aparato, procedimiento y programa de computadora para mezclar hacia arriba una señal de audio mezclada hacia abajo
ES2636808T3 (es) Codificación de escenas de audio
KR101599554B1 (ko) Sac 부가정보를 이용한 3d 바이노럴 필터링 시스템 및 방법
KR20080047446A (ko) 오디오 코딩
ES2709117T3 (es) Codificador y decodificador de audio
US8885854B2 (en) Method, medium, and system decoding compressed multi-channel signals into 2-channel binaural signals
TW201528253A (zh) 用於合併多聲道編碼之方法與裝置
ES2654792T3 (es) Procedimiento y decodificador para codificación de objeto de audio espacial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal
ES2624668T3 (es) Codificación y descodificación de objetos de audio
KR101467159B1 (ko) 멀티 스테이지 구조 기반의 uhd 다채널 오디오 변환 방법 및 시스템
RU2406262C2 (ru) Декодирование уменьшенного количества каналов