ES2659019T3 - Estructura de descorrelacionador para la reconstrucción paramétrica de señales de audio - Google Patents
Estructura de descorrelacionador para la reconstrucción paramétrica de señales de audio Download PDFInfo
- Publication number
- ES2659019T3 ES2659019T3 ES14790039.3T ES14790039T ES2659019T3 ES 2659019 T3 ES2659019 T3 ES 2659019T3 ES 14790039 T ES14790039 T ES 14790039T ES 2659019 T3 ES2659019 T3 ES 2659019T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- coefficients
- mix
- wet
- audio signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 183
- 238000013507 mapping Methods 0.000 claims abstract description 76
- 230000000630 rising effect Effects 0.000 claims abstract description 70
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000012545 processing Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 75
- 230000001174 ascending effect Effects 0.000 claims description 13
- 239000000047 product Substances 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 239000013589 supplement Substances 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 229940050561 matrix product Drugs 0.000 claims description 4
- 239000000203 mixture Substances 0.000 description 212
- 230000000875 corresponding effect Effects 0.000 description 22
- 230000009466 transformation Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 102220047090 rs6152 Human genes 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Un método para reconstruir una pluralidad de señales de audio (X) que comprende: recibir una teja de tiempo/frecuencia de una señal de mezcla descendente (Y) junto con coeficientes de mezcla ascendente húmeda y seca asociados, en donde la señal de mezcla descendente comprende menos canales que el número de señales de audio a reconstruir; computar una señal intermedia (W) como un mapeado lineal de la señal de mezcla descendente, en donde se aplica un primer juego de coeficientes (Q) a los canales de la señal de mezcla descendente; generar una señal descorrelacionada (Z) procesando uno o más canales de la señal intermedia; computar una señal de mezcla ascendente húmeda como un mapeado lineal de la señal descorrelacionada, en donde se aplica un segundo juego de coeficientes (P) a uno o más canales de la señal intermedia descorrelacionada; computar una señal de mezcla ascendente seca como un mapeado lineal de la señal de mezcla descendente, en donde se aplica un tercer juego de coeficientes (C) a los canales de la señal de mezcla descendente; y combinar las señales de mezcla ascendente húmeda y seca para obtener una señal reconstruida multidimensional (X ) correspondiente a una teja de tiempo/frecuencia de dicha pluralidad de señales de audio a reconstruir, en el que dichos juegos segundo y tercero de coeficientes coinciden con los coeficientes de mezcla ascendente húmeda y seca recibidos, respectivamente, o se derivan de éstos, en el que el método comprende computar dicho primer juego de coeficientes en base a los coeficientes de mezcla ascendente húmeda y seca recibidos de tal manera que la señal intermedia que debe transformarse en la señal descorrelacionada se obtenga por un mapeado lineal de la señal de mezcla ascendente seca.
Description
5
10
15
20
25
30
35
40
45
50
DESCRIPCION
Estructura de descorrelacionador para la reconstrucción paramétrica de señales de audio.
Referencia cruzada a solicitudes relacionadas
Esta solicitud reivindica la prioridad de las solicitudes de patente provisionales U.S. Nos. 61/973,646, presentada el 1 de abril de 2014, y 61/893,770, presentada el 21 de octubre de 2013.
Campo técnico
La invención divulgada en esta memoria se refiere en general a la codificación y descodificación de señales de audio y, en particular, a la reconstrucción paramétrica de una pluralidad de señales de audio a partir de una señal de mezcla descendente y metadatos asociados.
Antecedentes
Se utilizan frecuentemente sistemas de reproducción de audio que comprenden múltiples altavoces para reproducir una escena de audio representada por una pluralidad de señales de audio, en los que las respectivas señales de audio se reproducen en respectivos altavoces. Las señales de audio pueden haberse registrado, por ejemplo, a través de una pluralidad de transductores acústicos o pueden haberse generado por un equipo de creación de audio. En muchas situaciones, existen limitaciones de ancho de banda para transmitir las señales de audio al equipo de reproducción y/o un espacio limitado para almacenar las señales de audio en una memoria de ordenador o en un dispositivo de almacenamiento portátil. Existen sistemas de codificación de audio para la codificación paramétrica de señales de audio a fin de reducir el ancho de banda o el tamaño de almacenamiento necesario. En un lado codificador estos sistemas realizan típicamente una mezcla descendente de las señales de audio para obtener una señal de mezcla descendente, que típicamente es una mezcla descendente mono (un canal) o una mezcla descendente estéreo (dos canales), y extraen información de lado que describe las propiedades de las señales de audio por medio de parámetros tales como diferencias de nivel y correlación cruzada. La mezcla descendente y la información de lado son después codificadas y enviadas a un lado descodificador. En el lado descodificador se reconstruye, es decir, se aproxima, la pluralidad de señales de audio a partir de la mezcla descendente bajo el control de los parámetros de la información de lado. Se emplean frecuentemente descorrelacionadores como parte de una reconstrucción paramétrica para aumentar la dimensionalidad del contenido de audio proporcionado por la mezcla descendente a fin de permitir una reconstrucción más fiel de la pluralidad de señales de audio. Los modos de diseñar e implementar descorrelacionadores pueden ser factores clave para aumentar la fidelidad de la reconstrucción.
En vista de la amplia gama de diferentes tipos de dispositivos y sistemas disponibles para la reproducción de una pluralidad de señales de audio que representan una escena de audio, incluyendo un segmento emergente destinado a usuarios finales en sus hogares, hay necesidad de modos nuevos y alternativos para codificar eficazmente una pluralidad de señales de audio a fin de reducir los requisitos de ancho banda y/o el tamaño de memoria referido para almacenamiento, y/o facilitar la reconstrucción de la pluralidades de audio en un lado descodificador.
El Informe de Búsqueda Internacional citó como “documento de particular relevancia” el siguiente artículo del Journal of the Audio Engineering Society: ENGDEGARD J ET AL, “Spatial Audio Object Coding (SAOC) - The Upcoming MPEG Standard on Parametric Object Based Audio Coding”, JOURNAL OF THE AUDIO ENGINEERING SOCIETY, AUDIO ENGINEERING SOCIETY, NUEVA YORK, NY, US, (20080517), Número de Documento no.: 7377, ISSN 0004-7554, páginas 1 - 16, XP002685475 [X] 1,9,10,18,19 * Sección 3.3.2; figuras 2b, 3 * [I] 2-7,11,12,20. El artículo concierne a la codificación espacial de objetos de audio (SAOC) y describe la arquitectura del modelo de referencia elegido, la asociación entre los diferentes modos operacionales y aplicaciones y el estado entonces corriente del proceso de estandarización.
Breve descripción de los dibujos
En lo que sigue se describirán ejemplos de realización con mayor detalle y con referencia a los dibujos que se acompañan, en los que:
La figura 1 es un diagrama de bloques generalizado de una sección de reconstrucción paramétrica para reconstruir una pluralidad de señales de audio en base a una señal de mezcla descendente y coeficientes de mezcla ascendente húmeda y seca asociados según un ejemplo de realización;
La figura 2 es un diagrama de bloques generalizado de un sistema de descodificación de audio que comprende la sección de reconstrucción paramétrica ilustrada en la figura 1 según un ejemplo de realización;
La figura 3 es un diagrama de bloques generalizado de una sección de codificación paramétrica para codificar una pluralidad de señales de audio como datos adecuados para la reconstrucción paramétrica según un ejemplo de
5
10
15
20
25
30
35
40
45
50
55
realización; y
La figura 4 es un diagrama de bloques generalizado de un sistema de codificación de audio que comprende la sección de codificación paramétrica ilustrada en la figura 3 según un ejemplo de realización.
Todas las figuras son esquemáticas y muestran en general solamente partes que son necesarias para dilucidar la invención, mientras que otras partes pueden omitirse o meramente sugerirse.
Descripción de ejemplos de realización
Tal como se utiliza en esta memoria, una señal de audio puede ser una señal de audio pura, una parte de audio de una señal audiovisual o una señal multimedia o cualquiera de éstas en combinación con metadatos.
Tal como se utiliza en esta memoria, un canal es una señal de audio asociada con una posición/orientación espacial predefinida/fija o con una posición espacial indefinida tal como “izquierda” o “derecha”.
Tal como se utiliza en esta memoria, un objeto de audio o una señal de objeto de audio es una señal de audio asociada con una posición espacial susceptible de ser variable en el tiempo, es decir, una posición espacial cuyo valor puede ser reasignado o actualizado a lo largo del tiempo.
I. Visión general
Según un primer aspecto, algunos ejemplos de realización proponen sistemas de descodificación de audio, así como métodos y productos de programas informáticos para reconstruir una pluralidad de señales de audio. Los sistemas de descodificación, los métodos y los productos de programas informáticos propuestos según el primer aspecto pueden compartir generalmente las mismas características y ventajas.
Según algunos ejemplos de realización, se proporciona un método para reconstruir una pluralidad de señales de audio. El método comprende: recibir una teja de tiempo/frecuencia de una señal de mezcla descendente junto con coeficientes de mezcla ascendente húmeda y seca asociados, en donde la señal de mezcla descendente comprende menos canales que el número de señales de audio que se deben reconstruir; computar una primera señal con uno o más canales, denominada señal intermedia, como un mapeado lineal de la señal de mezcla descendente, en donde se aplica un primer juego de coeficientes a los canales de la señal de mezcla descendente como parte de la computación de la señal intermedia; generar una segunda señal con uno o más canales, denominada señal descorrelacionada, procesando uno o más canales de la señal intermedia; computar una tercera señal con una pluralidad de canales, denominada señal de mezcla ascendente húmeda, como un mapeado lineal de la señal descorrelacionada, en donde se aplica un segundo juego de coeficientes a uno o más canales de la señal descorrelacionada como parte de la computación de la señal de mezcla ascendente húmeda; computar una cuarta señal con una pluralidad de canales, denominada señal de mezcla ascendente seca, como un mapeado lineal de la señal de mezcla descendente, en donde se aplica un tercer juego de coeficientes a los canales de la señal de mezcla descendente como parte de la computación de la señal de mezcla ascendente seca; y combinar las señales de mezcla ascendente húmeda y seca para obtener una señal reconstruida multidimensional correspondiente a una teja de tiempo/frecuencia de la pluralidad de señales de audio que se deben reconstruir. En el presente ejemplo de realización los juegos segundo y tercero de coeficientes corresponden a los coeficientes de mezcla ascendente húmeda y seca recibidos, respectivamente; y el primer juego de coeficientes se computa según una regla predefinida en base a los coeficientes de mezcla ascendente húmeda y seca.
La adición de la señal descorrelacionada sirve para aumentar la dimensionalidad del contenido de la señal reconstruida multidimensional, tal como es percibida por un oyente, y para aumentar la fidelidad de la señal reconstruida multidimensional. Cada uno de los uno o más canales de la señal descorrelacionada puede tener al menos aproximadamente el mismo espectro que un canal correspondiente de los uno o más canales de la señal intermedia, o puede tener espectros correspondientes a una versión reescalada/normalizada del espectro del canal correspondiente de los uno o más canales de la señal intermedia, y los uno o más canales de la señal descorrelacionada pueden estar al menos aproximadamente sin correlación mutua. Los uno o más canales de la señal descorrelacionada pueden estar de preferencia al menos aproximadamente sin correlacionar con los uno o más canales de la señal intermedia y los canales de la señal de mezcla descendente. Aunque es posible sintetizar señales carentes de correlación mutua con un espectro dado de, por ejemplo, ruido blanco, los uno o más canales de la señal descorrelacionada según el presente ejemplo de realización se generan procesando la señal intermedia, por ejemplo incluyendo aplicar respectivos filtros pasatodo a los respectivos uno o más canales de la señal intermedia o a porciones recombinantes de los respectivos uno o más canales de la señal intermedia, a fin de preservar tantas propiedades como sea posible de la señal intermedia, en especial propiedades localmente estacionarias, incluyendo propiedades psicoacústicamente acondicionadas relativamente más sutiles de la señal intermedia, tal como el timbre.
Los inventores han verificado que la elección de la señal intermedia de la cual se deriva la señal descorrelacionada puede afectar a la fidelidad de las señales de audio reconstruida y que, si cambian ciertas propiedades de las
5
10
15
20
25
30
35
40
45
50
55
señales de audio a reconstruir, por ejemplo si las señales de audio a reconstruir son objetos de audio con posiciones variables en el tiempo, se puede aumentar la fidelidad de las señales de audio reconstruidas si se adaptan de manera correspondientes las computaciones a través de las cuales se obtiene la señal intermedia. En el presente ejemplo de realización la computación de la señal intermedia incluye aplicar el primer juego de coeficientes a los canales de las señales de mezcla descendente, y, por tanto, el primer juego de coeficientes permite al menos cierto control sobre el modo en que se computa la señal intermedia, lo que permite aumentar la fidelidad de las señales de audio reconstruidas.
Los inventores han verificado, además, que los coeficientes de mezcla ascendente húmeda y seca recibidos, empleados para la computación de las señales de mezcla ascendente húmeda y seca, respectivamente, llevan información que puede emplearse para computar valores adecuados para el primer juego de coeficientes. Computando los primeros juegos de coeficientes según una regla predefinida en base a los coeficientes de mezcla ascendente húmeda y seca se reduce la cantidad de información necesaria para posibilitar la reconstrucción de la pluralidad de señales de audio, permitiendo una reducción de la cantidad de metadatos transmitidos junto con la señal de mezcla descendente desde un lado codificador. Reduciendo la cantidad de datos necesarios para la reconstrucción paramétrica se puede reducir el ancho de banda requerido para la transmisión de una representación paramétrica de la pluralidad de señales de audio a reconstruir y/o se puede reducir el tamaño de memoria necesario para almacenar tal representación.
Por el segundo y el tercer juego de coeficientes correspondientes a los coeficientes de mezcla ascendente húmeda y seca recibidos, respectivamente, se quiere dar a entender que los juegos segundo y tercero de coeficientes coinciden con los coeficientes de mezcla ascendente húmeda y seca, respectivamente, o que los juegos segundo y tercero de coeficientes son singularmente controlables por los coeficientes de mezcla ascendente húmeda y seca, respectivamente (o son derivables de los mismos). Por ejemplo, el segundo juego de coeficientes puede ser derivable de los coeficientes de mezcla ascendente húmeda incluso si el número de coeficientes de mezcla ascendente húmeda es más bajo que el número de coeficientes en el segundo juego de coeficientes, por ejemplo si se conocen en el lado descodificador unas fórmulas predefinidas para determinar el segundo juego de coeficientes a partir de los coeficientes de mezcla ascendente húmeda.
La combinación de las señales de mezcla ascendente húmeda y seca puede incluir añadir contenido de audio de respectivos canales de la señal de mezcla ascendente húmeda a contenido de audio de los respectivos canales correspondientes de la señal de mezcla ascendente seca, tal como un mezclado aditivo sobre una base por muestra o por coeficiente de transformación.
Por la mención de que la señal intermedia es una mapeado lineal de la señal de mezcla descendente se quiere dar a entender que la señal intermedia se obtiene aplicando una primera transformación lineal a la señal de mezcla descendente. Esta primera transformación toma como entrada un número predefinido de canales y proporciona como salida un número predefinido de uno o más canales, y el primer juego de coeficientes incluye coeficientes que definen las propiedades cuantitativas de la primera transformación lineal.
Por la mención de que la señal de mezcla ascendente húmeda es un mapeado lineal de la señal descorrelacionada se quiere dar a entender que la señal de mezcla ascendente húmeda se obtiene aplicando una segunda transformación lineal a la señal descorrelacionada. Esta segunda transformación toma como entrada un número predefinido de uno o más canales y proporciona como salida un (segundo) número predefinido de canales, y el segundo juego de coeficientes incluye coeficientes que definen las propiedades cuantitativas de esta segunda transformación lineal.
Por la mención de que la señal de mezcla ascendente seca es un mapeado lineal de la señal de mezcla descendente se quiere dar a entender que la señal de mezcla ascendente seca se obtiene aplicando una tercera transformación lineal a la señal de mezcla descendente. Esta tercera transformación toma como entrada un (tercer) número predefinido de canales y proporciona como salida un número predefinido de canales, y el tercer juego de coeficientes incluye coeficientes que definen las propiedades cuantitativas de esta tercera transformación lineal.
Los sistemas de codificación/descodificación de audio dividen típicamente el espacio tiempo-frecuencia en tejas de tiempo/frecuencia, por ejemplo aplicando bancos de filtros adecuados a las señales de audio de entrada. Por teja de
tiempo/frecuencia se quiere dar a entender generalmente una porción del espacio tiempo-frecuencia
correspondiente a un intervalo de tiempo y a una subbanda de frecuencia. El intervalo de tiempo puede corresponder típicamente a la duración de un cuadro de tiempo utilizado en el sistema de
codificación/descodificación de audio. La subbanda de frecuencia puede corresponder típicamente a una o varias subbandas de frecuencia vecinas definidas por el banco de filtros utilizado en el sistema de
codificación/descodificación. En caso de que la subbanda de frecuencia corresponda a varias subbandas de frecuencia vecinas definidas por el banco de filtros, esto permite tener subbandas de frecuencia no uniformes en el proceso de descodificación/reconstrucción de la señal de audio, por ejemplo subbandas de frecuencia más anchas para frecuencias más altas de la señal de audio en un caso de banda ancha, en el que el sistema de codificación/descodificación de audio opera en toda la gama de frecuencia, la subbanda de frecuencia de la teja de tiempo/frecuencia puede corresponder a la gama de frecuencia completa. El método según el presente
4
5
10
15
20
25
30
35
40
45
50
55
ejemplo de realización se describe en términos de operaciones para reconstruir la pluralidad de señales de audio para una teja de tiempo/frecuencia de esta clase. Sin embargo, ha de entenderse que el método puede repetirse para cada teja de tiempo/frecuencia del sistema de codificación/descodificación de audio. Asimismo, ha de entenderse que se pueden reconstruir simultáneamente varias tejas de tiempo/frecuencia. Típicamente, las tejas de tiempo/frecuencia vecinas pueden estar desunidas o pueden solaparse parcialmente.
En un ejemplo de realización la señal intermedia que debe transformarse en la señal descorrelacionada puede ser obtenible por un mapeado lineal de la señal de mezcla ascendente seca, es decir que la señal intermedia puede ser obtenible aplicando una transformación lineal a la señal de mezcla ascendente seca. Empleando una señal intermedia obtenible por un mapeado lineal de la señal de mezcla ascendente seca que se computa como un mapeado lineal de la señal de mezcla descendente, se puede reducir la complejidad de las computaciones requeridas para obtener la señal descorrelacionada, permitiendo una reconstrucción computacionalmente más eficiente de las señales de audio. En al menos algunos ejemplos de realización los coeficientes de mezcla ascendente seca pueden haberse determinado en un lado codificador de tal manera que la señal de mezcla ascendente seca en el lado descodificador se aproxime a las señales de audio a reconstruir. La generación de la señal descorrelacionada en base a una señal intermedia obtenible por un mapeado lineal de tal aproximación puede aumentar la fidelidad de las señales de audio reconstruidas.
En un ejemplo de realización la señal intermedia puede ser obtenible aplicando a la señal de mezcla ascendente seca un juego de coeficientes que sean valores absolutos de los coeficientes de mezcla ascendente húmeda. La señal intermedia puede ser obtenible, por ejemplo, formando los unos o más canales de la señal intermedia como una o más respectivas combinaciones lineales de los canales de la señal de mezcla ascendente seca, en donde se pueden aplicar los valores absolutos de los coeficientes de mezcla ascendente húmeda a los respectivos canales de señal de mezcla ascendente seca como ganancia en las una o más combinaciones lineales. Empleando una señal intermedia obtenible mapeando la señal de mezcla ascendente seca mediante la aplicación de un juego de coeficientes que sean valores absolutos de los coeficientes de mezclas ascendente húmeda se puede reducir el riesgo de que se produzca una cancelación en la señal intermedia entre contribuciones de los respectivos canales de la señal de mezcla ascendente seca debido a que los coeficientes de mezcla ascendente húmeda tienen signos diferentes. Reduciendo el riesgo de cancelación en la señal intermedia, la energía/amplitud de la señal descorrelacionada generada a partir de la señal intermedia casa con la de las señales de audio reconstruidas, y se pueden evitar repentinas fluctuaciones en los coeficientes de mezcla ascendente húmeda o éstas pueden ocurrir con menos frecuencia.
En un ejemplo de realización el primer juego de coeficientes puede computarse procesando los coeficientes de mezcla ascendente húmeda según una regla predefinida y multiplicando los coeficientes de mezcla ascendente húmeda procesados y los coeficientes de mezcla ascendente seca. Por ejemplo, los coeficientes de mezcla ascendente húmeda procesados y los coeficientes de mezcla ascendente seca pueden disponerse como respectivas matrices, y el primer juego de coeficientes puede corresponder a una matriz computada como un producto matricial de estas dos matrices.
En un ejemplo de realización la regla predefinida para procesar los coeficientes de mezcla ascendente húmeda pueden incluir una operación de valor absoluto por elementos.
En un ejemplo de realización los coeficientes de mezcla ascendente húmeda y seca pueden disponerse como respectivas matrices, y la regla predefinida para procesar los coeficientes de mezcla ascendente húmeda puede incluir, en cualquier orden, la computación elemento a elemento de valores absolutos de todos los elementos y la reorganización de los elementos para reducir una multiplicación matricial directa por la matriz de coeficientes de mezcla ascendente seca. En el presente ejemplo de realización las señales de audio a reconstruir contribuyen a los uno o más canales de la señal descorrelacionada a través de la señal de mezcla descendente en la que se basa la señal intermedia, y los uno o más canales de la señal descorrelacionada contribuyen a las señales de audio reconstruidas a través de la señal de mezcla ascendente húmeda. Los inventores han verificado que, con el fin de aumentar la fidelidad de las señales de audio reconstruidas, puede ser deseable esforzarse por observar el principio siguiente: las señales de audio a las que contribuye un canal dado de la señal descorrelacionada en la reconstrucción paramétrica deberán contribuir, a través de la señal de mezcla descendente, al mismo canal de la señal de audio intermedia a partir de la cual se genera el canal dado de la señal descorrelacionada, y esto preferiblemente en una cantidad pareja/equivalente. Puede decirse que la regla predefinida según el presente ejemplo de realización refleja este principio.
Incluyendo una operación de valor absoluto por elementos en la regla predefinida para procesar los coeficientes de mezcla ascendente húmeda se puede reducir el riesgo de que ocurra una cancelación en la señal intermedia entre contribuciones de los respectivos canales de la señal de mezcla ascendente seca debido a que los coeficientes de mezcla ascendente húmeda tienen signos diferentes. Reduciendo el riesgo de cancelación en la señal intermedia, la energía/amplitud de la señal descorrelacionada generada a partir de la señal intermedia casa con la de las señales de audio reconstruidas, y se pueden evitar repentinas fluctuaciones en los coeficientes de mezclas ascendente húmeda o éstas pueden ocurrir con menos frecuencia.
5
10
15
20
25
30
35
40
45
50
55
60
En un ejemplo de realización las operaciones de computación y combinación pueden realizarse en una representación de las señales dentro del dominio de filtros espejo en cuadratura (QMF).
En un ejemplo de realización se puede recibir una pluralidad de valores de los coeficientes de mezcla ascendente húmeda y seca, en donde cada valor está asociado con un punto de anclaje específico. En el presente ejemplo de realización el método puede comprender además: computar, en base a valores de los coeficientes de mezcla ascendente húmeda y seca asociados con dos puntos de anclaje consecutivos, valores correspondientes del primer juego de coeficientes, e interpolar luego un valor del primer juego de coeficientes para al menos un instante comprendido entre los puntos de anclaje consecutivos en base a los valores del primer juego de coeficientes ya computados. En otras palabras, los valores del primer juego de coeficientes computados para los dos puntos de anclaje consecutivos se emplean para interpolación entre los dos puntos de anclaje consecutivos a fin de obtener un valor del primer juego de coeficientes para al menos un instante comprendido entre los dos puntos de anclaje consecutivos. Esto evita una repetición innecesaria de la computación relativamente más costosa del primer juego de coeficientes en base a los coeficientes de mezcla ascendente húmeda y seca.
Según algunos ejemplos de realización, se proporciona un sistema de descodificación de audio con una sección de reconstrucción paramétrica adaptada para recibir una teja de tiempo/frecuencia de una señal de mezcla descendente y coeficientes de mezcla ascendente húmeda y seca asociados, y para reconstruir una pluralidad de señales de audio, en donde la señal de mezcla descendente tiene menos canales que el número de señales de audio a reconstruir. La sección de reconstrucción paramétrica comprende: un premultiplicador configurado para recibir la teja de tiempo/frecuencia de la señal de mezcla descendente y para emitir una señal intermedia computada mapeando linealmente la señal de mezcla descendente según un primer juego de coeficientes, es decir, formando una o más combinaciones lineales de los canales de la señal de mezcla descendente mediante el empleo del primer juego de coeficientes; una sección de descorrelación configurada para recibir la señal intermedia y emitir, basándose en ella, una señal descorrelacionada; una sección de mezcla ascendente húmeda configurada para recibir los coeficientes de mezcla ascendente húmeda y la señal descorrelacionada, y para computar una señal de mezcla ascendente húmeda mapeando linealmente la señal descorrelacionada según los coeficientes de mezcla ascendente húmeda, es decir, formando combinaciones lineales de los uno o más canales de la señal descorrelacionada mediante el empleo de los coeficientes de mezcla ascendente húmeda; una señal de mezcla ascendente seca configurada para recibir los coeficientes de mezcla ascendente seca y, en paralelo con el premultiplicador, la teja de tiempo/frecuencia de la señal de mezcla descendente, y para emitir una señal de mezcla ascendente seca computada mapeando linealmente la señal de mezcla descendente según los coeficientes de mezcla ascendente seca, es decir, formando combinaciones lineales de los canales de la señal de mezcla descendente mediante el empleo de los coeficientes de mezcla ascendente seca; y una sección de combinación configurada para recibir la señal de mezcla ascendente húmeda y la señal de mezcla ascendente seca y para combinar estas señales a fin de obtener una señal reconstruida multidimensional correspondiente a una teja de tiempo/frecuencia de la pluralidad de señales de audio a reconstruir. La sección de reconstrucción paramétrica comprende, además, un convertidor configurado para recibir los coeficientes de mezcla ascendente húmeda y seca, para computar el primer juego de coeficientes según una regla predefinida y para suministrar éste, es decir, el primer juego de coeficientes, al premultiplicador.
Conforme a un segundo aspecto, algunos ejemplos de realización proponen sistemas de codificación de audio, así como métodos y productos de programas informáticos para modificar una pluralidad de señales de audio. Los sistemas de codificación, métodos y productos de programas informáticos propuestos conforme al segundo aspecto pueden compartir generalmente las mismas características y ventajas. Además, las ventajas presentadas anteriormente para características de sistemas de descodificación, métodos y productos de programas informáticos según el primer aspecto pueden ser generalmente válidas para las características correspondientes de sistemas de codificación, métodos y productos informáticos conforme al segundo aspecto.
Según algunos ejemplos de realización, se proporciona un método para codificar una pluralidad de señales de audio como datos adecuados para una reconstrucción paramétrica. El método comprende: recibir una teja de tiempo/frecuencia de la pluralidad de señales de audio; computar una señal de mezcla descendente formando combinaciones lineales de las señales de audio según una regla de mezclado descendente, en donde la señal de mezcla descendente comprende menos canales que el número de señales de audio a reconstruir; determinar coeficientes de mezcla ascendente seca a fin de definir un mapeado lineal de la señal de mezcla descendente que se aproxime a las señales de audio a codificar en la teja de tiempo/frecuencia; determinar coeficientes de mezcla ascendente húmeda en base a una covarianza de las señales de audio recibidas y una covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente; y emitir la señal de mezcla descendente junto con los coeficientes de mezcla ascendente húmeda y seca, cuyos coeficientes posibilitan por sí solos una computación según una regla predefinida de un juego adicional de coeficientes que definen un mapeado lineal de predescorrelación como parte de la reconstrucción paramétrica de la señal de audio. En este contexto, el mapeado lineal de predescorrelación puede posibilitar, por ejemplo, una restauración completa o parcial de la covarianza de las señales de audio.
El hecho de que los coeficientes de mezcla ascendente húmeda y seca posibiliten por sí solos una computación
5
10
15
20
25
30
35
40
45
50
55
según la regla predefinida del juego adicional de coeficientes significa que, una vez que se conocen (los valores de) los coeficientes de mezcla ascendente húmeda y seca, se puede computar el juego adicional de coeficientes según la regla predefinida sin acceso a (valores de) cualesquiera coeficientes adicionales enviados desde el lado codificador. Por ejemplo, el método puede incluir la emisión de solamente la señal de mezcla descendente, los coeficientes de mezcla ascendente húmeda y los coeficientes de mezcla ascendente seca.
En un lado descodificador la reconstrucción paramétrica de las señales de audio puede incluir típicamente combinar una señal de mezcla ascendente seca, obtenida a través del mapeado lineal de la señal de mezcla descendente, con contribuciones de una señal descorrelacionada generada en base a la señal de mezcla descendente. Por el juego adicional de coeficientes que definen un mapeado lineal de predescorrelación como parte de la reconstrucción paramétrica de las señales de audio se quiere dar a entender que el juego adicional de coeficientes incluye coeficientes que definen las propiedades cuantitativas de una transformación lineal tomando la señal de mezcla descendente como entrada y emitiendo una señal con uno o más canales, denominada señal intermedia, en la que se realiza un procedimiento de descorrelación para generar la señal descorrelacionada.
Dado que el juego adicional de coeficientes puede computarse según la regla predefinida en base a los coeficientes de mezcla ascendente húmeda y sea, se reduce la cantidad de información necesaria para posibilitar la reconstrucción de la pluralidad de señales de audio, permitiendo una reducción de la cantidad de metadatos transmitidos junto con la señal de mezcla descendente a un lado descodificador. Reduciendo la cantidad de datos necesarios para la reconstrucción paramétricas se puede reducir el ancho de banda requerido para la transmisión de una representación paramétrica de la pluralidad de señales de audio a reconstruir y/o se puede reducir también el tamaño de memoria requerido para almacenara tal representación.
La regla de mezclado descendente empleado cuando se computa la señal de mezcla descendente define las propiedades cuantitativas de las combinaciones lineales de las señales de audio, es decir, los coeficientes que deben aplicar a las respectivas señales de audio cuando se forman las combinaciones lineales.
Por los coeficientes de mezcla ascendente seca que definen un mapeado lineal de la señal de mezcla descendente que se aproxima a las señales de audio a codificar se quiere dar a entender que los coeficientes de mezcla ascendente seca son coeficientes que definen las propiedades cuantitativas de una transformación lineal tomando la señal de mezcla descendente como entrada y emitiendo un juego de señales de audio que se aproximan a las señales de audio a codificar. El juego determinado de coeficientes de mezcla ascendente seca puede definir, por ejemplo, un mapeado lineal de la señal de mezcla descendente correspondiente a una aproximación de la señal de audio con un error mínimos medios cuadrados, es decir que entre el juego de mapeados lineales de la señal de mezcla descendente el juego determinado de coeficientes de mezcla ascendente seca puede definir el mapeado lineal que se aproxima de forma óptima a la señal de audio en un sentido de mínimos medios cuadrados.
Los coeficientes de mezcla ascendente húmeda pueden determinarse, por ejemplo, en base a una diferencia entre una covarianza de las señales de audio recibidas y una covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente o bien mediante una comparación de dichas covarianzas.
En un ejemplo de realización se puede recibir una pluralidad de tejas de tiempo/frecuencia de las señales de audio y se puede computar uniformemente la señal de mezcla descendente según una regla de mezclado descendente predefinida. En otras palabras, los coeficientes aplicados a las respectivas señales de audio cuando se forman las combinaciones lineales de las señales de audio están predefinidos y son constantes a lo largo de cuadros de tiempo consecutivos. Por ejemplo, la regla de mezclado descendente puede adaptarse para proporcionar una señal de mezcla descendente compatible hacia atrás, es decir, para proporcionar una señal de mezcla descendente que puede reproducirse en un equipo de reproducción heredado empleando una configuración de canal estandarizada.
En un ejemplo de realización se puede recibir una pluralidad de tejas de tiempo/frecuencia de las señales de audio y se puede computar la señal de mezcla descendente según una regla de mezclado descendente adaptativa en materia de señales. En otras palabras, al menos uno de los coeficientes aplicados cuando se forman las combinaciones lineales de la señal de audio es adaptativo en materia de señales, es decir que el valor de al menos uno y preferiblemente varios de los coeficientes puede ser ajustado/seleccionado por el sistema de codificación en base al contenido de audio de una o más de las señales de audio.
En un ejemplo de realización los coeficientes de mezcla ascendente húmeda pueden determinarse: ajustando una covarianza diana para suplementar la covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente; descomponiendo la covarianza diana como un producto de una matriz y su transpuesta propia, en donde los elementos de la matriz, después de un reescalado opcional por columnas, corresponden a los coeficientes de matriz ascendente húmeda. En el presente ejemplo de realización la matriz en la que se descompone la covarianza diana, es decir, la que, cuando se multiplica por su propia transpuesta, produce la covarianza diana, puede ser una matriz cuadrada o una matriz no cuadrada. Según al menos algunos ejemplos de realización, la covarianza diana puede determinarse en base a uno o más vectores propios de una matriz formada como una diferencia entre una matriz de covarianzas de las señales de audio recibidas y una matriz de covarianzas
5
10
15
20
25
30
35
40
45
50
55
de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente.
En un ejemplo de realización el método puede comprender, además, un reescalado por columnas de la matriz en la que se descompone la covarianza diana, es decir que la covarianza diana se descompone como un producto de una matriz y su propia transpuesta, en donde los elementos de la matriz, después del reescalado por columnas, corresponden a los coeficientes de mezcla ascendente húmeda. En el presente de realización el reescalado por columnas puede asegurar que la varianza de cada señal resultante de una aplicación del mapeado lineal de predescorrelación a la señal de mezcla descendente sea igual al cuadrado inverso de un factor de reescalado correspondiente empleado para el reescalado por columnas, a condición de que los coeficientes que definen el mapeado lineal de predescorrelación se computen de acuerdo con la regla predefinida. El mapeado lineal de predescorrelación puede emplearse en un lado descodificador para generar una señal descorrelacionada destinada a suplementar la señal de mezcla descendente en la reconstrucción paramétrica de las señales de audio a reconstruir. Con el reescalado por columnas según el presente ejemplo de realización los coeficientes de mezcla ascendente húmeda definen un mapeado lineal de la señal descorrelacionada que proporciona una covarianza correspondiente a la covarianza diana.
En un ejemplo de realización la regla predefinida puede implicar una relación de escalado lineal entre el juego adicional de coeficientes y los coeficientes de mezcla ascendente húmeda, y el reescalado por columnas puede equivaler a una multiplicación por la parte diagonal del producto matricial
elevado a la potencia -1/4, en donde abs V denota el valor absoluto por elementos de la matriz en la que se descompone la covarianza diana, y CRyyCT es una matriz correspondiente a la covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente. Por la parte diagonal de una matriz dada, por ejemplo del producto matricial anterior, se quiere dar a entender la matriz diagonal obtenida ajustando a cero todos los elementos fuera de la diagonal en la matriz dada. Por elevar tal matriz diagonal a la potencia -1/4 se quiere dar a entender que cada uno de los elementos de la matriz diagonal se eleva a la potencia -1/4. La relación de escalado lineal entre el juego adicional de coeficientes y los coeficientes de mezcla ascendente húmeda puede, por ejemplo, ser tal que el reescalado por columnas de la matriz en la que se descompone la covarianza diana corresponda a una reescalado por filas o por columnas de una matriz que tenga el juego adicional de coeficientes como elementos de matriz, en donde el reescalado por filas o por columnas de la matriz que tiene el juego adicional de coeficientes como elementos de matriz emplea los mismos factores de reescalado empleados en el reescalado por columnas de la matriz en la que se descompone la covarianza diana.
El mapeado lineal de predescorrelación puede emplearse en un lado descodificador para generar una señal descorrelacionada destinada a suplementar la señal de mezcla descendente en la reconstrucción paramétrica de las señales de audio a reconstruir. Con el reescalado por columnas según el presente ejemplo de realización los coeficientes de mezcla ascendente húmeda definen un mapeado lineal de la señal descorrelacionada que proporciona una covarianza correspondiente a la covarianza diana, a condición de que los coeficientes que definen el mapeado lineal de predescorrelación se computen de acuerdo con la regla predefinida.
En un ejemplo de realización puede elegirse la covarianza diana para que la suma de la covarianza diana y la covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente se aproxime a la covarianza de las señales de audio recibidas o al menos coincida sustancialmente con ella, permitiendo que las señales de audio paramétricamente reconstruidas en un lado descodificador, en base a la señal de mezcla descendente y a los parámetros de mezcla ascendente húmeda y seca, tengan una covarianza que se aproxime a la covarianza de las señales de audio recibidas o al menos coincida sustancialmente con ella.
En un ejemplo de realización el método puede comprender, además, la realización de una compensación de energía mediante las operaciones de: determinar una relación de una energía total estimada de las señales de audio recibidas y una energía total estimada de las señales de audio paramétricamente reconstruidas en base a la señal de mezcla descendente, los coeficientes de mezcla ascendente húmeda y los coeficientes de mezcla ascendente seca; y reescalar los coeficientes de mezcla ascendente seca por la raíz cuadrada inversa de la relación. En el presente ejemplo de realización los coeficientes de mezcla ascendente seca reescalados pueden emitirse junto con la señal de mezcla descendente y los coeficientes de mezcla ascendente húmeda. En al menos algunos ejemplos de realización la regla predefinida puede implicar una relación de escalado lineal entre el juego adicional de coeficientes y los coeficientes de mezcla ascendente seca, de modo que la compensación de energía realizada en los coeficientes de mezcla ascendente seca tenga un efecto correspondiente en el juego adicional de coeficientes. La compensación de energía según el presente ejemplo de realización permite que las señales de audio paramétricamente reconstruidas en el lado descodificador, en base a la señal de mezcla descendente y los parámetros de mezcla ascendente húmeda y seca, tengan una energía total que se aproxime a una energía total de las señales de audio recibidas.
5
10
15
20
25
30
35
40
45
En al menos en algunos ejemplos de realización los coeficientes de mezcla ascendente húmeda pueden determinarse antes de realizar la compensación de energía, es decir que los coeficientes de mezcla ascendente húmeda pueden determinarse en base a coeficientes de mezcla ascendente húmeda que todavía no han sido compensados en energía.
Según algunos ejemplos de realización, se proporciona un sistema de codificación de audio que incluye una sección de codificación paramétrica adaptada para codificar una pluralidad de señales de audio como datos adecuados para una reconstrucción paramétrica. La sección de codificación paramétrica comprende: una sección de mezcla descendente configurada para recibir una teja de tiempo/frecuencia de la pluralidad de señales de audio y para computar una señal de mezcla descendente formando combinaciones lineales de las señales de audio según una regla de mezclado descendente, en donde la señal de mezcla descendente comprende menos canales que el número de señales de audio a reconstruir; una primera sección de análisis configurada para determinar coeficientes de mezcla ascendente seca a fin de definir un mapeado lineal de la señal de mezcla descendente que se aproxima a las señales de audio a codificar en la teja de tiempo/frecuencia; y una segunda sección de análisis configurada para determinar coeficientes de mezcla ascendente húmeda en base a una covarianza de las señales de audio recibidas y a una covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente. En el presente ejemplo de realización la sección de codificación paramétrica está configurada para emitir la señal de mezcla descendente junto con los coeficientes de mezcla ascendente húmeda y seca, en donde los coeficientes de mezcla ascendente húmeda y seca posibilitan por sí solos una computación según una regla predefinida de un juego adicional de coeficientes que definen un mapeado lineal de predescorrelación como parte de la reconstrucción paramétrica de las señales de audio.
Según algunos ejemplos de realización, se proporciona un producto de programa informático que comprende un medio legible por ordenador con instrucciones para realizar cualquiera de los métodos dentro de los aspectos primero y segundo.
Según un ejemplo de realización, al menos una de la pluralidad de señales de audio puede referirse a una señal de objeto de audio asociada con un localizador espacial o puede utilizarse para representar tal señal de objeto de audio, es decir que, aunque la pluralidad de señales de audio puede incluir, por ejemplo, canales asociados con posiciones/orientaciones espaciales estáticas, la pluralidad de señales de audio puede incluir también uno o más objetos de audio asociados con una posición espacial variable en el tiempo.
En las reivindicaciones subordinadas se definen más ejemplos de realización. Se hace notar que los ejemplos de realización incluyen todas las combinaciones de características, aun cuando éstas se expongan en reivindicaciones mutuamente diferentes.
II. Ejemplos de realización
Se proporciona más abajo una descripción matemática de la codificación y la descodificación. Para un antecedente teórico más detallado, véase el documento “A Backward-Compatible Multichannel Audio Codec”, de Hotho et al., en IEEE Transactions on Audio, Speech, and Language Processing, Vol. 16, No. 1, enero de 2008.
En un lado codificador, que se describirá con referencia a las figuras 3 y 4, se computa una señal de mezcla descendente Y = [yi... yM]Tformando combinaciones lineales de una pluralidad de señales de audio Xn, n = 1, ..., N, según
en donde dn,m son coeficientes de mezcla descendente representados por una matriz de mezcla descendente D, y en donde las señales de audio Xn, n = 1, ... , N se han recogido en una matriz X = [xi ... xn]t. La señal de mezcla descendente Y incluye M canales y la pluralidad de señales de audio X incluye N señales de audio, en donde N > M > 1. En un lado descodificador, que se describirá con referencia a las figuras 1 y 2, se realiza una reconstrucción paramétrica de la pluralidad de señales de audio Xsegún
en donde cn,m son coeficientes de mezclas ascendente seca representados por una matriz de mezcla ascendente
9
5
10
15
20
25
30
35
40
45
seca C, pn,k son coeficientes de mezcla ascendente húmeda representados por una matriz de mezcla ascendente húmeda P, y Zk son los K canales de una señal descorrelacionada Z = [zi ... zk]t en donde K > 1. La señal descorrelacionada Z se genera en base a una señal intermedia W = [wi... wk]' obtenida como
en donde los coeficientes qk,m se representan por una matriz predescorrelación Q que define un mapeado lineal de predescorrelación de la señal de mezcla descendente Y. Los K canales de la señal descorrelacionada Z se obtienen a partir de los respectivos K canales de la señal intermedia W a través de una operación de descorrelación que preserva las energías/varianzas de los respectivos canales de la señal intermedia W,pero que hace que los canales de la señal descorrelacionada Z no estén mutuamente correlacionados, es decir que la señal descorrelacionada Z puede expresarse como
Z = descorr(W) (4)
en donde descorr() denota esta operación de descorrelación.
Como puede verse en las ecuaciones (1), (3) y (4), las señales de audio a reconstruir X contribuyen a los canales de la señal descorrelacionada Z a través de la señal de mezcla descendente Y y la señal intermedia W, y, como puede verse en la ecuación (2), los canales de la señal descorrelacionada Z contribuyen a las señales de audio
reconstruidas XX a través de la señal de mezcla ascendente húmeda DZ. Los inventores han verificado que, para
aumentar la fidelidad de las señales de audio reconstruidas XX, puede ser deseable esforzarse por observar el principio siguiente:
las señales de audio a las cuales contribuye en la reconstrucción paramétrica un canal dado de la señal descorrelacionada Z deberán contribuir, a través de la señal de mezcla descendente Y, al mismo canal de la señal de audio intermedio W a partir de la cual se general el canal dado de la señal descorrelacionada Z, y preferiblemente deberán contribuir en una cantidad correspondiente/pareja.
Un enfoque para observar este principio es computar los coeficientes de predescorrelación Q según
Q = (abs P)TC (5)
en donde abs P denota la matriz obtenida tomando valores absolutos de los elementos de la matriz de mezcla ascendente húmeda P. Las ecuaciones (3) y (5) implican que la señal intermedia W que debe transformarse en la señal descorrelacionada Z se obtiene por un mapeado lineal de la señal de mezcla ascendente “seca” CY, la cual puede considerarse como una aproximación de las señales de audio X a reconstruir. Esto refleja el principio anteriormente descrito para derivar la señal descorrelacionada Z. La regla (5) para computar coeficientes de predescorrelación Q implica solamente computaciones con una complejidad relativamente baja y, por tanto, puede emplearse convenientemente en un lado descodificador. Se contemplan modos alternativos para computar los coeficientes de predescorrelación Q en base a los coeficientes de mezcla ascendente seca C y los coeficientes de mezcla ascendente húmeda P. Por ejemplo, esto puede computarse como Q = (abs Po)T C, en donde la matriz P0 se obtiene normalizando cada columna de P. Un efecto de este modo alternativo para computar los coeficientes de predescorrelación Q es que la reconstrucción paramétrica proporcionada a través de la ecuación (2) se escala linealmente con la magnitud de la matriz de mezcla ascendente húmeda P.
Los coeficientes de mezcla ascendente seca C pueden determinarse, por ejemplo, computando la mejor señal de mezcla ascendente “seca” posible CY en el sentido de mínimos cuadrados, es decir, resolviendo las ecuaciones normales
CYY7 = XYt.
(6)
La matriz de covarianzas de las señales de audio aproximadas por la mezcla ascendente seca CY puede compararse con la matriz de covarianzas Rxx de las señales de audio X a reconstruir, formando
AR = Rxx - CRyyC1
(7)
10
15
20
25
30
35
40
45
en donde Ryy es la matriz de covarianzas de la señal de mezcla descendente Y y AR es la covarianza “ausente”, que puede ser total o parcialmente proporcionada por la señal de matriz ascendente “húmeda” PZ. La covarianza ausente AR puede analizarse mediante una descomposición propia, es decir, en base a sus valores propios y vectores propios asociados. Si se ha de realizar una reconstrucción paramétrica según la ecuación (2) en un lado descodificador empleando no más de K descorrelacionadores, es decir, con una señal descorrelacionada Z que tenga K canales, se puede ajustar una covarianza diana Rhúmeda para la señal de mezcla ascendente húmeda PZ manteniendo solamente las partes de la descomposición propia de AR que corresponden a los K vectores propios asociados con las magnitudes de valor propio más grandes, es decir, retirando las partes de la covarianza ausente AR correspondientes a los otros vectores propios. Si la matriz de mezcla descendente D empleada en el lado codificador según la ecuación (1) es una matriz no degenerada, puede demostrarse que la covarianza ausente AR tiene un rango de a lo sumo N - M y que se necesitan no más de K = N - M descorrelacionadores para proporcionar la covariana ausente completa AR. Para prueba, véase, por ejemplo, el documento “A Backward-Compatible Multichannel Audio Codec”, de Hotho et al., en IEEE Transactions on Audio, Speech, and Language Processing, Vol. 16, No. 1, enero de 2008. Manteniendo las contribuciones asociadas con los valores propios más grandes se pueden reproducir porciones perceptualmente importantes/significativas de la covarianza ausente AR por medio de la señal de mezcla ascendente húmeda PZ aun cuando solamente se emplee un número menor K < N - M de descorrelacionadores en el lado descodificador. En particular, ya el uso de un solo descorrelacionador, es decir, K - 1, proporciona una mejora significativa de la fidelidad de las señales de audio reconstruidas, en comparación con la reconstrucción paramétricas sin descorrelación, con un coste adicional relativamente bajo en complejidad computacional en el lado descodificador. Aumentando, es decir, aumentando el número de descorrelacionadores, se puede aumentar la fidelidad de las señales de audio reconstruidas al coste de tener que transmitir parámetros de mezcla ascendente húmeda adicionales P. El número de canales de mezcla descendente M empleados y el número de descorrelacionadores K empleados pueden escogerse, por ejemplo, en base a una tasa de bits diana para transmitir datos a un lado descodificador y a la fidelidad/calidad requerida de las señales de audio reconstruidas.
Dado que la covarianza diana Rhúmeda se ha ajustado en base a partes de la covarianza ausente AR asociadas con K valores propios, la covarianza diana Rhúmeda puede descomponerse como
Rhúmeda = VVT (8)
en donde V es una matriz con N filas y K columnas, y la matriz de mezcla ascendente húmeda P puede obtenerse en la forma de
P = 1/5, (9)
en donde S es una matriz diagonal con elementos positivos que proporcionan un reescalado por columnas de la matriz V. Para una matriz de mezcla ascendente húmeda P que tenga la fórmula (9) y para una matriz de mezcla
ascendente seca C que resuelva la ecuación (6), la matriz de covarianzas de las señales reconstruidas X puede expresarse como
R - CRyyCT + VS diag(QRyyQ)STVT = Rseca + Rhúmeda
en donde diag() denota la operación de ajuste a cero de todos los elementos fuera de la diagonal de una matriz. Por tanto, la condición para que la señal de mezcla ascendente húmeda PZ satisfaga la covarianza diana Rhúmeda puede expresarse como
lo que se cumple si el reescalado por columnas proporcionado por la matriz S asegura que la varianza de cada señal resultante de una aplicación del mapeado lineal de predescorrelación a la señal de mezcla descendente Y, es decir, los canales de la señal intermedia W obtenidos a través de la ecuación (3) que tienen los elementos diagonales de QRyyQT como varianzas, es igual al cuadrado inverso de un factor de reescalado por columnas correspondiente en la matriz S. Con una matriz de predescorrelación Q que tenga la forma (5), existe una relación de escalado lineal entre los coeficientes de mezcla ascendente húmeda P y los coeficientes de predescorrelación Q que permite que se agrupen múltiples instancias de la matriz S en la ecuación (10), dando como resultado la condición suficiente
54diag^(abs V)TCRyyCT(abs 1/)^ = /,
en donde I es la matriz de identidades. Por tanto, los coeficientes de mezcla ascendente húmeda P pueden
5
10
15
20
25
30
35
40
45
50
55
obtenerse como P = VS, en donde
La figura 3 es un diagrama de bloques generalizado de una sección de codificación paramétrica 300 según un ejemplo de realización. La sección de codificación paramétrica 300 está configurada para codificar una pluralidad de señales de audio X = [xi... xn]t como datos adecuados para una reconstrucción paramétrica según la ecuación (2). La sección de codificación paramétrica 300 comprende una sección de mezcla descendente 301 que recibe una teja de tiempo/frecuencia de la pluralidad de señales de audio Xy computa una señal de mezcla descendente Y = [yi... yw]T formando combinaciones lineales de las señales de audio X según la ecuación (1), en donde la señal de mezcla descendente Y comprende menos canales M que el número N de señales de audio X a reconstruir. En el presente ejemplo de realización la pluralidad de señales de audio X incluye señales de objeto de audio asociadas con posiciones espaciales variables en el tiempo, y la señal de mezcla descendente Y se computa de acuerdo con una regla adaptativa en materia de señales, es decir que los coeficientes de mezcla descendente D empleados cuando se forman las combinaciones lineales según la ecuación (1) dependen de las señales de audio X. En el presente ejemplo de realización los coeficientes de mezcla descendente D son determinados por la sección de mezcla descendente 301 en base a las posiciones espaciales asociadas con los objetos de audio incluidos en la pluralidad de señales de audio X a fin de asegurar que los objetos situados relativamente lejos uno de otro sean codificados en canales diferentes de la señal de mezcla descendente Y, mientras que los objetos situados relativamente cerca uno de otro pueden ser codificados en el mismo canal de la señal de mezcla descendente Y. Un efecto de tal regla de mezclado descendente adaptativa en materia de señales es que facilita la reconstrucción de las señales de objetos de audio en un lado descodificador y/o posibilita una reconstrucción más fiel de las señales de objeto de audio percibidas por un oyente.
En el presente ejemplo de realización una primera sección de análisis 302 determina coeficientes de mezcla ascendente seca, representados por la matriz de mezcla ascendente seca C, a fin de determinar un mapeado lineal de la señal de mezcla descendente Y que se aproxime a las señales de audio X a reconstruir. Este mapeado lineal de la señal de mezcla descendente Y está denotado por CY en la ecuación (2). En el presente ejemplo de realización los coeficientes de mezcla ascendente seca C se determinan según la ecuación (6) de tal manera que el mapeado lineal CY de la señal de mezcla descendente Y corresponda a una aproximación de mínimos cuadrados medios de las señales de audio X a reconstruir. Una segunda sección de análisis 303 determina coeficientes de mezcla ascendente húmeda, representados por una matriz de mezcla ascendente húmeda P, en base a la matriz de covarianzas de la señal de audio X recibida y a la matriz de covarianzas de la señal de audio aproximada por el mapeado lineal CY de la señal de mezcla descendente Y, es decir, en base a la covarianza ausente AR en la ecuación (7). En el presente ejemplo de realización una primera sección de procesamiento 304 computa la matriz de covarianzas de la señal de audio X recibida. Una sección de multiplicación 305 computa el mapeado lineal CY de la señal de mezcla descendente Y multiplicando la señal de mezcla descendente Y y la matriz de mezcla ascendente húmeda C, y le proporciona a una segunda sección de procesamiento 306 que computa la matriz de covarianzas de la señal de audio aproximada por el mapeado lineal CY de la señal de mezcla descendente Y.
En el presente ejemplo de realización los coeficientes de mezcla ascendente húmeda determinados P están destinados a la reconstrucción paramétrica según la ecuación (2), con una señal descorrelacionada Z que tiene K canales. Por tanto, la segunda sección de análisis 303 ajusta la covarianza diana Rhúmeda en base a K vectores propios asociados con los más grandes valores propios (magnitudes de éstos) de la covarianza ausente AR en la ecuación (7) y descompone la covarianza diana Rhúmeda según la ecuación (8). Los coeficientes de mezcla ascendente húmeda P se obtienen entonces a partir de la matriz V en la que se descompuso la covarianza diana Rhúmeda, después de un reescalado por columnas mediante la matriz S, según las ecuaciones (9) y (11). En el presente ejemplo de realización un juego adicional de coeficientes Q, denominados coeficientes de predescorrelación, son derivables de los coeficientes de mezcla ascendente seca C y los coeficientes de mezcla ascendente húmeda P según la ecuación (5) y definen el mapeado lineal de predescorrelación de la señal de mezcla descendente Y proporcionado por la ecuación (3).
En el presente ejemplo de realización, K < N - M, de modo que la señal de mezcla ascendente húmeda PZ no
proporciona la covarianza ausente completa AR en la ecuación (7). Por tanto, las señales de audio reconstruidas XX tienen típicamente una menor energía que la de las señales de audio a reconstruir X, y la primera sección de análisis 302 puede realizar opcionalmente una compensación de energía reescalando los coeficientes de mezcla ascendente seca CY después de que los coeficientes de mezcla ascendente húmeda hayan sido determinados por la segunda sección de análisis 303. En ejemplos de realización en los que, por el contrario, K = N - M, la señal de mezcla ascendente húmeda PZ puede proporcionar la covarianza ausente completa AR en la ecuación (7) y puede no haber necesidad de utilizar una compensación de energía.
Si ha de realizarse una compensación de energía, la primera sección de análisis 302 determina una relación de una energía total estimada de las señales de audio recibidas X y una energía total estimada de las señales de audio
5
10
15
20
25
30
35
40
45
50
55
60
reconstruidas XX según la ecuación (2), es decir, en base a la señal de mezcla descendente Y, los coeficientes de mezcla ascendente húmeda P y los coeficientes de mezcla ascendente seca C. La primeras sección de análisis 302 reescala entonces los coeficientes de mezcla ascendente seca previamente determinados C por medio de la raíz cuadrada inversa de la relación determinada. La sección de codificación paramétrica 300 emite entonces la señal de mezcla descendente Y junto con los coeficientes de mezcla ascendente húmeda P y los coeficientes de mezcla ascendente seca reescalados C. Dado que los coeficientes de predescorrelación Q se determinan según la regla predefinida proporcionada por la ecuación (5), existe una relación de escalado lineal entre los coeficientes de mezcla ascendente seca C y los coeficientes de predescorrelación Q. Por tanto, el reescalado de los coeficientes de mezcla ascendente seca C produce un reescalado de tanto la señal de mezcla ascendente seca CY como las señales de mezcla ascendente húmeda PZ durante la reconstrucción paramétrica en un lado descodificador según la ecuación (2).
La figura 4 es un diagrama de bloques generalizado de un sistema de codificación de audio 400 según un ejemplo de realización, que comprende la sección de codificación paramétrica 300 descrita con referencia a la figura 3. En el presente ejemplo de realización el contenido de audio, por ejemplo registrado por uno o más transductores acústicos 401 o generado por un equipo de creación de audio 401, es suministrado en forma de una pluralidad de señales de audio X. Una sección 402 de análisis por filtros espejo en cuadratura (QMF) transforma la señal de audio X, segmento de tiempo a segmento de tiempo, en un dominio QMF para procesamiento por la sección de codificación paramétrica 300 de la señal de audio X en forma de tejas de tiempo/frecuencia. El uso de un dominio QMF es adecuado para procesar las señales de audio, por ejemplo para realizar un mezclado ascendente/descendente y una reconstrucción paramétrica, y permite una reconstrucción aproximadamente sin pérdidas de señales de audio en un lado descodificador.
La señal de mezcla descendente Y emitida por la sección de codificación paramétrica 300 es transformada de nuevo para sacarla del dominio QMF por una sección de síntesis QMF 403 y es transformada en un dominio de transformada de coseno discreta modificada (MDCT) por una sección de transformada 404. Unas secciones de cuantización 405 y 406 cuantizan los coeficientes de mezcla ascendente seca C y los coeficientes de mezcla ascendente húmeda C, respectivamente. Por ejemplo, se puede emplear una cuantización uniforme con un tamaño de escalón de 0,1 o 0,2 (adimensional), seguido por una codificación de entropía en forma de codificación de Huffman. Se puede emplear, por ejemplo, una cuantización más basta con un tamaño de escalón de 0,2 para economizar ancho de banda de transmisión, y se puede emplear, por ejemplo, una cuantización más fina con un tamaño de escalón de 0,1 para mejorar la fidelidad de la reconstrucción en un lado descodificador. La señal de mezcla descendente Y transformada en MDCT y los coeficientes de mezcla ascendente seca C y los coeficientes de mezcla ascendente húmeda P cuantizados se combinan después en una corriente de bits B por un multiplexor 407 para su transmisión a un lado descodificador. El sistema de codificación de audio 400 puede comprender también un codificador de núcleo (no mostrado en la figura 4) configurado para codificar la señal de mezcla descendente Y utilizando un codec de audio perceptual, tal como un Dolby Digital o un MPEG AAC, antes de que la señal de mezcla descendente Y sea suministrada al multiplexor 407.
Dado que la pluralidad de señales de audio X incluye señales de objetos de audio asociadas con posiciones espaciales o localizadores espaciales variables en el tiempo, los metadatos de renderización R que incluyen tales localizadores espaciales pueden codificarse, por ejemplo, en la corriente de bits B por el sistema de codificación de audio 400 para renderizar las señales de objetos de audio en un lado descodificador. Los metadatos de renderización R pueden ser suministrados, por ejemplo, al multiplexor 407 por el equipo de creación de audio 401 empleado para generar la pluralidad de señales de audio X.
La figura 1 es un diagrama de bloques generalizado de una sección de reconstrucción paramétrica 100 según un ejemplo de realización adaptada para reconstruir la pluralidad de señales de audio X en base a la señal de mezcla descendente Y y los coeficientes de mezcla ascendente húmeda P y los coeficientes de mezcla ascendente seca C asociados. Un premultiplicador 101 recibe una teja de tiempo/frecuencia de la señal de mezcla descendente Y y emite una señal intermedia W computada mapeando linealmente la señal de mezcla descendente de acuerdo con un primer juego de coeficientes, es decir, según la ecuación (3), en donde el primer juego de coeficientes es el juego de coeficientes de predescorrelación representados por la matriz de predescorrelación Q. Una sección de descorrelación 102 recibe la señal intermedia Wy, basándose en ella, emite una señal descorrelacionada Z = [zi... zk ]r En el presente ejemplo de realización los K canales de la señal correlacionada Z se derivan procesando los K canales de la señal intermedia W, incluyendo la aplicación de respectivos filtros pasatodo a los canales de la señal intermedia W, a fin de proporcionar canales que carezcan de una correlación mutua, y con un contenido de audio que sea espectralmente similar al de la señal de audio intermedia W y sea también percibido como similar por un
oyente. La señal descorrelacionada Z sirve para aumentar la dimensionalidad de la versión reconstruida XX de la pluralidad de señales de audio X percibidas por un oyente. En el presente ejemplo de realización los canales de la señal descorrelacionada Z tienen al menos aproximadamente las mismas energías o varianzas que las de los respectivos canales de la señal de audio intermedia W. Una sección de mezcla ascendente húmeda 103 recibe los coeficientes de mezcla ascendente húmeda P, así como la señal descorrelacionada Z, y computa una señal de mezcla ascendente húmeda mapeando linealmente la señal descorrelacionada Z de acuerdo con los coeficientes de
5
10
15
20
25
30
35
40
45
50
55
60
mezcla ascendente húmeda P, es decir, según la ecuación (2), en donde la señal de mezcla ascendente húmeda está denotada por PZ. Una sección de mezcla ascendente seca 104 recibe los coeficientes de mezcla ascendente seca C y, en paralelo con el premultiplicador 101, recibe también la teja de tiempo/frecuencia de la señal de mezcla descendente Y. La sección de mezcla ascendente seca 103 emite una señal de mezcla ascendente seca, denotada por CY en la ecuación (2), computada mapeando linealmente la señal de mezcla descendente Y de acuerdo con el juego de coeficientes de mezcla ascendente seca C. Una sección de combinación 105 recibe la señal de mezcla ascendente seca CY y la señal de mezcla ascendente húmeda PZ, y combina estas señales para obtener una señal
reconstruida multidimensional XX correspondiente a una teja de tiempo/frecuencia de la pluralidad de señales de audio X a reconstruir. En el presente ejemplo de realización la sección de combinación 105 obtiene la señal
reconstruida multidimensional XX combinando el contenido de audio de los respectivos canales de la señal de mezcla ascendente seca CY con los respectivos canales de la señal de mezcla ascendente húmeda PZ según la ecuación (2). La sección de reconstrucción paramétrica 100 comprende, además, un convertidor 106 que recibe los coeficientes de mezcla ascendente húmeda P y los coeficientes de mezcla ascendente seca C y que computa, según la regla predefinida proporcionada por la ecuación (5), el primer juego de coeficientes, es decir, los coeficientes de predescorrelación Q, y suministra el primer juego de coeficientes Q al premultiplicador 101.
En el presente ejemplo de realización la sección de reconstrucción paramétrica 100 puede opcionalmente emplear interpolación. Por ejemplo, la sección de reconstrucción paramétrica 100 puede recibir una pluralidad de valores de los coeficientes de mezcla ascendente húmeda y seca P, C, en donde cada valor está asociado con un punto de anclaje específico. El convertidor 106, basándose en valores de los coeficientes de mezcla ascendente húmeda y seca P, C asociados con dos puntos de anclaje consecutivos, computa valores correspondientes del primer juego de coeficientes Q. Los valores computados se suministran a un primer interpolador 107 que realiza una interpolación del primer juego de coeficientes Q entre los dos puntos de anclaje consecutivos, por ejemplo interpolando un valor del primer juego de coeficientes Q durante al menos un instante comprendido entre los puntos de anclaje consecutivos en base a los valores del primer juego de coeficientes Q ya computados. El esquema de interpolación empleado puede ser, por ejemplo, una interpolación lineal. Como alternativa, se puede emplear una interpolación en pendiente, en donde los valores viejos para el primer juego de coeficientes Q se mantienen en uso hasta un cierto instante, por ejemplo indicado en los metadatos codificados en la corriente de bits B, en el que valores nuevos para el primer juego de coeficientes Q han de sustituir a los valores viejos. La interpolación puede emplearse también en los propios coeficientes de mezcla ascendente húmeda y seca P, C. Un segundo interpolador 108 puede recibir múltiples valores de los coeficientes de mezcla ascendente húmeda y puede realizar una interpolación temporal antes de suministrar los coeficientes de mezcla ascendente húmeda P a la sección de mezcla ascendente húmeda 103. Análogamente, un tercer interpolador 109 puede recibir múltiples valores de los coeficientes de mezcla ascendente seca C y puede realizar una interpolación temporal antes de suministrar los coeficientes de mezcla ascendente seca C a la sección de mezcla ascendente seca 104. El esquema de interpolación empleado para los coeficientes de mezcla ascendente húmeda y seca P, C puede ser el mismo esquema de interpolación empleado para el primer juego de coeficientes Q o puede ser un esquema de interpolación diferente.
La figura 2 es un diagrama de bloques generalizado de un sistema de descodificación de audio 200 según un ejemplo de realización. El sistema de descodificación de audio 200 comprende la sección de reconstrucción paramétrica 100 descrita con referencia a la figura 1. Una sección de recepción 201, por ejemplo incluyendo un desmultiplexor, recibe la corriente de bits B transmitida desde el sistema de codificación de audio 400 descrito con referencia a la figura 4 y extrae la señal de mezcla descendente Y y los coeficientes de mezcla ascendente seca C y los coeficientes de mezcla ascendente húmeda P asociados de la corriente de bits B. En caso de que la señal de mezcla descendente Y se codifique en la corriente de bits B utilizando un codec de audio perceptual, tal como un Dolby Digital o un MPEG AAC, el sistema de descodificación de audio 200 puede comprender un descodificador de núcleo (no mostrado en la figura 2) configurado para descodificar la señal de mezcla descendente Y cuando se la extrae de la corriente de bits B. Una sección de transformación 202 transforma la señal de mezcla descendente Y realizando una MDCT inversa y una sección de análisis QMF 203 transforma la señal de mezcla descendente Y en un dominio QMF para procesamiento por la sección de reconstrucción paramétrica 100 de la señal de mezcla descendente Y en forma de tejas de tiempo/frecuencia. Unas secciones de descuantización 204 y 205 descuantizan los coeficientes de mezcla ascendente seca C y los coeficientes de mezcla ascendente húmeda P, por ejemplo partiendo de un formato codificado en entropía, antes de suministrarlos a la sección de reconstrucción paramétrica 100. Como se ha descrito con referencia a la figura 4, la cuantización puede haberse realizado con uno de dos tamaños de escalón diferentes, por ejemplo 0,1 o 0,2. El tamaño de escalón real empleado puede predefinirse o puede ser señalado al sistema de descodificación de audio 200 desde el lado codificador, por ejemplo a través de la corriente de bits B.
En el presente ejemplo de realización la señal de audio reconstruida multidimensional XX emitida por la sección de reconstrucción paramétrica 100 es transformada de nuevo para sacarla del dominio QMF por una sección de síntesis QMF 206 y es luego proporcionada a un renderizador 207. En el presente ejemplo de realización las señales de audio X a reconstruir incluyen señales de objetos de audio asociadas con posiciones espaciales variables en el tiempo. Los metadatos de renderización R, incluyendo localizadores espaciales para los objetos de audio, pueden
5
10
15
20
25
30
35
40
haberse codificado en la corriente de bits B en un lado codificador, y la sección de recepción 201 puede extraer los metadatos de renderización R y proporcionarlos al renderizador 207. Basándose en las señales de audio
reconstruidas XX y los metadatos de renderización R, el renderizador 207 renderiza las señales de audio
reconstruidas XX para convertirlas en canales de salida del renderizador 207 en un formato adecuado para su reproducción en un sistema 208 de múltiples altavoces. El renderizador 207 puede, por ejemplo, estar incluido en el sistema de descodificación de audio 200 o puede ser un dispositivo separado que reciba datos de entrada del sistema de descodificación de audio 200.
111. Equivalentes, extensiones, alternativas y misceláneas
Otras realizaciones de la presente divulgación resultarán evidentes para un experto en la materia después de estudiar la descripción anterior. Aun cuando la presente descripción y dibujos divulgan realizaciones y ejemplos, la divulgación no queda restringida a estos ejemplos específicos. Pueden hacerse numerosas modificaciones y variaciones sin apartarse del alcance de la presente divulgación, que viene definido por las reivindicaciones adjuntas. Cualesquiera símbolos de referencia que aparezcan en las reivindicaciones no han de entenderse como limitativos de su alcance.
Además, ciertas variaciones de las realizaciones divulgadas pueden ser entendidas y efectuadas por el experto al poner en práctica la divulgación por el estudio de los dibujos, la divulgación y las reivindicaciones adjuntas. En las reivindicaciones las palabras “que comprende” no excluyen otros elementos u operaciones, y el artículo indefinido “un” no excluye una pluralidad. El mero hecho de que ciertas medidas se mencionen en reivindicaciones subordinadas mutuamente diferentes no indica que no pueda utilizarse ventajosamente una combinación de estas medidas.
Los dispositivos y métodos divulgados anteriormente pueden implementarse como software, firmware, hardware o una combinación de los mismos. En una implementación de hardware la división de tareas entre unidades funcionales mencionadas en la descripción anterior no se corresponde necesariamente con la división en unidades físicas; por el contrario, un componente físico puede tener múltiples funcionalidades y una tarea puede ser realizada por varios componentes físicos en cooperación. Ciertos componentes o todos los componentes pueden ser implementados como software ejecutado por un procesador o microprocesador de señales digitales o pueden ser implementados como hardware o como un circuito integrado de aplicaciones específicas. Tal software puede ser distribuido en medios legibles por ordenador, que pueden comprender medios de memoria de ordenador (o medios no transitorios) y medios de comunicación (o medios transitorios). Como es bien conocido para un experto en la materia, el término medios de memoria de ordenador incluye medios tanto volátiles como no volátiles, desmontables y no desmontables, implementados en cualquier método o tecnología de almacenamiento de información, tal como instrucciones legibles por ordenador, estructuras de datos, módulos de programa u otros datos. Los medios de almacenamiento de ordenador incluyen, pero sin limitación, tecnología RAM, ROM, EEPROM, memoria flash u otra memoria, CD-ROM, discos versátiles digitales (DVD) y otro almacenamiento de disco óptico, casetes magnéticos, cinta magnética, almacenamiento de disco magnético u otros dispositivos de almacenamiento magnético, o cualquier otro medio que pueda utilizarse para almacenar la información deseada y al que pueda acceder un ordenador. Además, es bien conocido para el experto en la materia que los medios de comunicación incorporan típicamente instrucciones legibles por ordenador, estructuras de datos, módulos de programa y otros datos en una señal de datos modulada, tal como una onda portadora u otro mecanismo de transporte, e incluyen cualquier medio de suministro de información.
Claims (15)
- 51015202530354045REIVINDICACIONES1. Un método para reconstruir una pluralidad de señales de audio (X) que comprende:recibir una teja de tiempo/frecuencia de una señal de mezcla descendente (Y) junto con coeficientes de mezcla ascendente húmeda y seca asociados, en donde la señal de mezcla descendente comprende menos canales que el número de señales de audio a reconstruir;computar una señal intermedia (W) como un mapeado lineal de la señal de mezcla descendente, en donde se aplica un primer juego de coeficientes (Q) a los canales de la señal de mezcla descendente;generar una señal descorrelacionada (Z) procesando uno o más canales de la señal intermedia;computar una señal de mezcla ascendente húmeda como un mapeado lineal de la señal descorrelacionada, en donde se aplica un segundo juego de coeficientes (P) a uno o más canales de la señal intermedia descorrelacionada;computar una señal de mezcla ascendente seca como un mapeado lineal de la señal de mezcla descendente, en donde se aplica un tercer juego de coeficientes (C) a los canales de la señal de mezcla descendente; ycombinar las señales de mezcla ascendente húmeda y seca para obtener una señal reconstruida multidimensional (XX ) correspondiente a una teja de tiempo/frecuencia de dicha pluralidad de señales de audio a reconstruir,en el que dichos juegos segundo y tercero de coeficientes coinciden con los coeficientes de mezcla ascendente húmeda y seca recibidos, respectivamente, o se derivan de éstos,en el que el método comprende computar dicho primer juego de coeficientes en base a los coeficientes de mezcla ascendente húmeda y seca recibidos de tal manera que la señal intermedia que debe transformarse en la señal descorrelacionada se obtenga por un mapeado lineal de la señal de mezcla ascendente seca.
- 2. El método de la reivindicación 1, en el que la señal intermedia puede ser obtenida por mapeado de la señal de mezcla ascendente seca aplicando un juego de coeficientes que son valores absolutos de los coeficientes de mezcla ascendente húmeda.
- 3. El método de cualquiera de las reivindicaciones anteriores, en el que el primer juego de coeficientes se computa procesando los coeficientes de mezcla ascendente húmeda de acuerdo con otra regla predefinida y multiplicando los coeficientes de mezcla ascendente húmeda procesados y los coeficientes de mezcla ascendente seca.
- 4. El método de la reivindicación 3, en el que dicha regla predefinida para procesar los coeficientes de mezcla ascendente húmeda incluye una operación de valor absoluto por elementos y opcionalmente en el que los coeficientes de mezcla ascendente húmeda y seca se disponen como respectivas matrices, y dicha regla predefinida para procesar los coeficientes de mezcla ascendente húmeda incluye computar elemento a elemento los valores absolutos de todos los elementos y reorganizar los elementos para permitir una multiplicación matricial directa por la matriz de coeficientes de mezcla ascendente seca.
- 5. El método de cualquiera de las reivindicaciones anteriores, en el que dichas operaciones de computar y combinar se realizan en una representación de las señales dentro del dominio de filtros espejo en cuadratura, QMF.
- 6. El método de cualquiera de las reivindicaciones anteriores, en el que se reciben una pluralidad de valores de dichos coeficientes de mezcla ascendente húmeda y seca, estando asociado cada valor con un punto de anclaje, comprendiendo el método además:computar, basándose en valores de los coeficientes de mezcla ascendente húmeda y seca asociados con dos puntos de anclaje consecutivos, unos valores correspondientes de dicho primer juego de coeficientes,interpolar luego un valor del primer juego de coeficientes para al menos un instante comprendido entre dichos puntos de anclaje consecutivos en base a los valores del primer juego de coeficientes ya computados.
- 7. Un sistema de descodificación de audio (200) con una sección de reconstrucción paramétrica (100) adaptada para recibir una teja de tiempo/frecuencia de una señal de mezcla descendente (Y) y coeficientes de mezcla ascendente húmeda y seca asociados (P, C), y para reconstruir una pluralidad de señales de audio (X), en donde la señal de mezcla descendente tiene menos canales que el número de señales de audio a reconstruir, comprendiendo la sección de reconstrucción paramétrica:un premultiplicador (101) configurado para recibir una teja de tiempo/frecuencia de la señal de mezcla descendente y para emitir una señal intermedia (W) computada mapeado linealmente la señal de mezcla descendente de acuerdo51015202530354045con un primer juego de coeficientes (Q);una sección de descorrelación (102) configurada para recibir la señal intermedia y emitir, basándose en ella, una señal descorrelacionada (Z);una sección de mezcla ascendente húmeda (103) configurada para recibir los coeficientes de mezcla ascendente húmeda (P), así como la señal descorrelacionada, y para computar una señal de mezcla ascendente húmeda mapeando linealmente la señal descorrelacionada de acuerdo con los coeficientes de mezcla ascendente húmeda;una sección de mezcla ascendente seca (104) configurada para recibir los coeficientes de mezcla ascendente seca (C) y, en paralelo con el premultiplicador, la teja de tiempo/frecuencia de la señal de mezcla descendente, y para emitir una señal de mezcla ascendente seca computada mapeando linealmente la señal de mezcla descendente de acuerdo con los coeficientes de mezcla ascendente seca; yuna sección de combinación (105) configurada para recibir la señal de mezcla ascendente húmeda y la señal de mezcla ascendente seca y para combinar estas señales a fin de obtener una señal reconstruida multidimensional(X) correspondiente a una teja de tiempo/frecuencia de dicha pluralidad de señales de audio a reconstruir,en el que la sección de reconstrucción paramétrica comprende, además, un convertidor (106) configurado para recibir los coeficientes de mezcla ascendente húmeda y seca, computar, según una regla predefinida, el primer juego de coeficientes y suministrar éste al premultiplicador, yen el que el premultiplicador está configurado, además, para obtener la señal intermedia por medio de un mapeado lineal de la señal de mezcla ascendente seca.
- 8. Un método para codificar una pluralidad de señales de audio (X) como datos adecuados para realizar una reconstrucción paramétrica, que comprende:recibir una teja de tiempo/frecuencia de dicha pluralidad de señales de audio;computar una señal de mezcla descendente (Y) formando combinaciones lineales de las señales de audio de acuerdo con una regla de mezclado descendente, en donde la señal de mezcla descendente comprende menos canales que el número de señales de audio a reconstruir;determinar coeficientes de mezcla ascendente seca (C) a fin de definir un mapeado lineal de la señal de mezcla descendente que se aproxime a las señales de audio a codificar en la teja de tiempo/frecuencia;determinar coeficientes de mezcla ascendente húmeda (P) en base a una covarianza de las señales de audio recibidas y una covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente; yemitir la señal de mezcla descendente junto con los coeficientes de mezcla ascendente húmeda y seca, cuyos coeficientes posibilitan por sí solos la computación en el lado descodificador de acuerdo con una regla predefinida de un juego adicional de coeficientes (Q) que definen un mapeado lineal de predescorrelación como parte de la reconstrucción paramétrica de las señales de audio,en el que los coeficientes de mezcla ascendente húmeda se determinan:ajustando una covarianza diana para suplementar la covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente; ydescomponiendo la covarianza diana como un producto de una matriz y su transpuesta propia, en donde los elementos de dicha matriz, después de un reescalado por columnas, corresponden a los coeficientes de mezcla ascendente húmeda.
- 9. El método de la reivindicación 8, en el que se recibe una pluralidad de tejas de tiempo/frecuencia de las señales de audio, y la señal de mezcla descendente i) se computa uniformemente de acuerdo con una regla de mezclado descendente predefinida o ii) se computa de acuerdo con una regla de mezclado descendente adaptativa en materia de señales.
- 10. El método de la reivindicación 8 o 9, que comprende además reescalar por columnas dicha matriz en la que se descompone la covarianza diana, en donde el reescalado por columnas asegura que la varianza de cada señal resultante de una aplicación de dicho mapeado lineal de predescorrelación a la señal de mezcla descendente sea igual al cuadrado inverso de un factor de reescalado correspondiente empleado en el reescalado por columnas, a condición de que los coeficientes que definen el mapeado lineal de predescorrelación se computen de acuerdo con la regla predefinida.51015202530354045
- 11. El método de la reivindicación 10, en el que dicha regla predefinida implica una relación de escalado lineal entre el juego adicional de coeficientes y los coeficientes húmedos, en donde el reescalado por columnas equivale a una multiplicación por la parte diagonal del producto matricial
imagen1 elevado a la potencia -1/4, en donde abs V denota el valor absoluto por elementos de la matriz en la que se descompone la covarianza diana, y CRyyCT es una matriz correspondiente a la covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente. - 12. El método de cualquiera de las reivindicaciones 8 a 11, en el que la covarianza diana se escoge para que la suma de la covarianza diana y la covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente se aproxime a la covarianza de las señales de audio recibidas.
- 13. El método de cualquiera de las reivindicaciones 8 a 11, que comprende, además, realizar una compensación de energía mediante las acciones de:determinar una relación de una energía total estimada de las señales de audio recibidas y una energía total estimada de las señales de audio paramétricamente reconstruidas en base a la señal de mezcla descendente, los coeficientes de mezcla ascendente húmeda y los coeficientes de mezcla ascendente seca; yreescalar los coeficientes de mezcla ascendente seca por la raíz cuadrada inversa de dicha relación,en el que los coeficientes de mezcla ascendente seca reescalados se emiten junto con la señal de mezcla descendente y los coeficientes de mezcla ascendente húmeda.
- 14. Un sistema de codificación de audio (400) que incluye una sección de codificación paramétrica (300) adaptada para codificar una pluralidad de señales de audio (X) como datos adecuados para realizar una reconstrucción paramétrica, comprendiendo la sección de codificación paramétrica:una sección de mezcla descendente (301) configurada para recibir una teja de tiempo/frecuencia de dicha pluralidad de señales de audio y para computar una señal de mezcla descendente (Y) formando combinaciones lineales de las señales de audio de acuerdo con una regla de mezclado descendente, en donde la señal de mezcla descenderte comprende menos canales que el número de señales de audio a reconstruir;una primera sección de análisis (302) configurada para determinar coeficientes de mezcla ascendente seca (C) a fin de definir un mapeado lineal de la señal de mezcla descendente que se aproxime a las señales de audio a codificar en la teja de tiempo/frecuencia; yuna segunda sección de análisis (303) configurada para determinar coeficientes de mezcla ascendente húmeda (P) en base a una covarianza de las señales de audio recibidas y una covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente,en el que la sección de codificación paramétrica está configurada para emitir la señal de mezcla descendente junto con los coeficientes de mezcla ascendente húmeda y seca, cuyos coeficientes posibilitan por sí solos una computación en el lado descodificador de acuerdo con una regla predefinida de un juego adicional de coeficientes (Q) que definen un mapeado lineal de predescorrelación como parte de la reconstrucción paramétrica de las señales de audio, yen el que la segunda sección de análisis (303) está configurada, además, para determinar los coeficientes de mezcla descendente húmeda mediante las acciones de:ajustar una covarianza diana para suplementar la covarianza de las señales de audio aproximadas por el mapeado lineal de la señal de mezcla descendente; ydescomponer la covarianza diana como un producto de una matriz y su transpuesta propia, en donde los elementos de dicha matriz, después de un reescalado por columnas, corresponden a los coeficientes de mezcla ascendente húmeda.
- 15. Un producto de programa informático que comprende un medio legible por ordenador con instrucciones para ejecutar el método de cualquiera de las reivindicaciones 1 a 6 y 8 a 13.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201361893770P | 2013-10-21 | 2013-10-21 | |
| US201361893770P | 2013-10-21 | ||
| US201461973646P | 2014-04-01 | 2014-04-01 | |
| US201461973646P | 2014-04-01 | ||
| PCT/EP2014/072568 WO2015059152A1 (en) | 2013-10-21 | 2014-10-21 | Decorrelator structure for parametric reconstruction of audio signals |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2659019T3 true ES2659019T3 (es) | 2018-03-13 |
Family
ID=51830286
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES14790039.3T Active ES2659019T3 (es) | 2013-10-21 | 2014-10-21 | Estructura de descorrelacionador para la reconstrucción paramétrica de señales de audio |
Country Status (15)
| Country | Link |
|---|---|
| US (1) | US9848272B2 (es) |
| EP (1) | EP3061088B1 (es) |
| JP (1) | JP6201047B2 (es) |
| KR (1) | KR101805327B1 (es) |
| CN (1) | CN105637581B (es) |
| AU (1) | AU2014339065B2 (es) |
| BR (1) | BR112016008426B1 (es) |
| CA (1) | CA2926243C (es) |
| ES (1) | ES2659019T3 (es) |
| IL (1) | IL244785B (es) |
| MX (1) | MX354832B (es) |
| RU (1) | RU2641463C2 (es) |
| SG (1) | SG11201602628TA (es) |
| UA (1) | UA117258C2 (es) |
| WO (1) | WO2015059152A1 (es) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018162472A1 (en) | 2017-03-06 | 2018-09-13 | Dolby International Ab | Integrated reconstruction and rendering of audio signals |
| CN110447243B (zh) | 2017-03-06 | 2021-06-01 | 杜比国际公司 | 基于音频数据流渲染音频输出的方法、解码器系统和介质 |
| PL3984028T3 (pl) * | 2019-06-14 | 2024-08-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enkodowanie oraz dekodowanie parametrów |
| FR3112015A1 (fr) * | 2020-06-30 | 2021-12-31 | Orange | Codage optimisé d’une information représentative d’une image spatiale d’un signal audio multicanal |
| KR20230116895A (ko) | 2020-12-02 | 2023-08-04 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응적 다운믹스 전략을 통한 몰입형 음성 및 오디오서비스(ivas) |
Family Cites Families (45)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| US6252965B1 (en) * | 1996-09-19 | 2001-06-26 | Terry D. Beard | Multichannel spectral mapping audio apparatus and method |
| GB2343347B (en) | 1998-06-20 | 2002-12-31 | Central Research Lab Ltd | A method of synthesising an audio signal |
| ES2300567T3 (es) | 2002-04-22 | 2008-06-16 | Koninklijke Philips Electronics N.V. | Representacion parametrica de audio espacial. |
| US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
| ATE355590T1 (de) | 2003-04-17 | 2006-03-15 | Koninkl Philips Electronics Nv | Audiosignalsynthese |
| US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
| ATE527654T1 (de) | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
| SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
| SE0402649D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
| SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
| EP1810279B1 (en) * | 2004-11-04 | 2013-12-11 | Koninklijke Philips N.V. | Encoding and decoding of multi-channel audio signals |
| EP1902443B1 (en) | 2005-07-14 | 2009-06-03 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
| US8626503B2 (en) | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
| EP1921606B1 (en) | 2005-09-02 | 2011-10-19 | Panasonic Corporation | Energy shaping device and energy shaping method |
| KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
| BRPI0706285A2 (pt) | 2006-01-05 | 2011-03-22 | Ericsson Telefon Ab L M | métodos para decodificar um fluxo de bits de áudio envolvente de multicanal paramétrico e para transmitir dados digitais representando som a uma unidade móvel, decodificador envolvente paramétrico para decodificar um fluxo de bits de áudio envolvente de multicanal paramétrico, e, terminal móvel |
| KR100803212B1 (ko) | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
| KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
| CN101401455A (zh) * | 2006-03-15 | 2009-04-01 | 杜比实验室特许公司 | 使用子带滤波器的立体声呈现技术 |
| US7965848B2 (en) | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
| RU2439719C2 (ru) | 2007-04-26 | 2012-01-10 | Долби Свиден АБ | Устройство и способ для синтезирования выходного сигнала |
| KR101464977B1 (ko) | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
| PL2198632T3 (pl) * | 2007-10-09 | 2014-08-29 | Koninklijke Philips Nv | Sposób i urządzenie do generowania dwuusznego sygnału audio |
| US8091836B2 (en) * | 2007-12-19 | 2012-01-10 | Pratt & Whitney Rocketdyne, Inc. | Rotary wing system with ion field flow control |
| MX2010012580A (es) | 2008-05-23 | 2010-12-20 | Koninkl Philips Electronics Nv | Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico. |
| EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
| KR101108061B1 (ko) * | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
| EP2169665B1 (en) * | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
| EP2175670A1 (en) | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
| EP2214162A1 (en) * | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Upmixer, method and computer program for upmixing a downmix audio signal |
| CN103325374B (zh) * | 2009-04-08 | 2017-06-06 | 弗劳恩霍夫应用研究促进协会 | 使用相位值平滑对下混频音频信号进行上混频的装置、方法和计算机程序 |
| EP2422344A1 (en) | 2009-04-21 | 2012-02-29 | Koninklijke Philips Electronics N.V. | Audio signal synthesizing |
| CN102460573B (zh) | 2009-06-24 | 2014-08-20 | 弗兰霍菲尔运输应用研究公司 | 音频信号译码器、对音频信号译码的方法 |
| US9105264B2 (en) | 2009-07-31 | 2015-08-11 | Panasonic Intellectual Property Management Co., Ltd. | Coding apparatus and decoding apparatus |
| TWI431611B (zh) * | 2009-10-20 | 2014-03-21 | Dolby Int Ab | 用以基於下混信號表示型態提供上混信號表示型態之裝置、用以提供表示多聲道音訊信號的位元串流之裝置、使用失真控制發訊之方法、電腦程式與位元串流 |
| EP2360681A1 (en) | 2010-01-15 | 2011-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information |
| TWI516138B (zh) * | 2010-08-24 | 2016-01-01 | 杜比國際公司 | 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品 |
| CN103460282B (zh) * | 2010-08-25 | 2015-08-19 | 弗兰霍菲尔运输应用研究公司 | 用于利用传送的相位信息产生去相关信号的装置 |
| CN103262159B (zh) | 2010-10-05 | 2016-06-08 | 华为技术有限公司 | 用于对多声道音频信号进行编码/解码的方法和装置 |
| EP2477188A1 (en) | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
| JP6049762B2 (ja) | 2012-02-24 | 2016-12-21 | ドルビー・インターナショナル・アーベー | オーディオ処理 |
| US9042867B2 (en) | 2012-02-24 | 2015-05-26 | Agnitio S.L. | System and method for speaker recognition on mobile devices |
| CN105393304B (zh) | 2013-05-24 | 2019-05-28 | 杜比国际公司 | 音频编码和解码方法、介质以及音频编码器和解码器 |
| CN111192592B (zh) | 2013-10-21 | 2023-09-15 | 杜比国际公司 | 音频信号的参数化重构 |
-
2014
- 2014-10-21 ES ES14790039.3T patent/ES2659019T3/es active Active
- 2014-10-21 SG SG11201602628TA patent/SG11201602628TA/en unknown
- 2014-10-21 CN CN201480056084.9A patent/CN105637581B/zh active Active
- 2014-10-21 BR BR112016008426-8A patent/BR112016008426B1/pt active IP Right Grant
- 2014-10-21 US US15/029,023 patent/US9848272B2/en active Active
- 2014-10-21 MX MX2016004918A patent/MX354832B/es active IP Right Grant
- 2014-10-21 RU RU2016115360A patent/RU2641463C2/ru active
- 2014-10-21 AU AU2014339065A patent/AU2014339065B2/en active Active
- 2014-10-21 UA UAA201604348A patent/UA117258C2/uk unknown
- 2014-10-21 JP JP2016524453A patent/JP6201047B2/ja active Active
- 2014-10-21 WO PCT/EP2014/072568 patent/WO2015059152A1/en not_active Ceased
- 2014-10-21 KR KR1020167010187A patent/KR101805327B1/ko active Active
- 2014-10-21 CA CA2926243A patent/CA2926243C/en active Active
- 2014-10-21 EP EP14790039.3A patent/EP3061088B1/en active Active
-
2016
- 2016-03-28 IL IL244785A patent/IL244785B/en active IP Right Grant
Also Published As
| Publication number | Publication date |
|---|---|
| EP3061088A1 (en) | 2016-08-31 |
| IL244785A0 (en) | 2016-04-21 |
| US9848272B2 (en) | 2017-12-19 |
| EP3061088B1 (en) | 2017-12-27 |
| WO2015059152A1 (en) | 2015-04-30 |
| JP2016539358A (ja) | 2016-12-15 |
| CN105637581B (zh) | 2019-09-20 |
| MX2016004918A (es) | 2016-07-11 |
| BR112016008426A2 (es) | 2017-08-01 |
| CA2926243C (en) | 2018-01-23 |
| SG11201602628TA (en) | 2016-05-30 |
| CN105637581A (zh) | 2016-06-01 |
| US20160261967A1 (en) | 2016-09-08 |
| IL244785B (en) | 2019-02-28 |
| BR112016008426B1 (pt) | 2022-09-27 |
| AU2014339065A1 (en) | 2016-04-21 |
| RU2641463C2 (ru) | 2018-01-17 |
| RU2016115360A (ru) | 2017-11-28 |
| CA2926243A1 (en) | 2015-04-30 |
| JP6201047B2 (ja) | 2017-09-20 |
| KR20160056324A (ko) | 2016-05-19 |
| UA117258C2 (uk) | 2018-07-10 |
| MX354832B (es) | 2018-03-21 |
| KR101805327B1 (ko) | 2017-12-05 |
| AU2014339065B2 (en) | 2017-04-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2733878T3 (es) | Codificación mejorada de señales de audio digitales multicanales | |
| ES2922451T3 (es) | Indicación de la reusabilidad de parámetros de un marco para la codificación de vectores | |
| KR102340930B1 (ko) | 잡음 감소를 위한 다채널 hoa 오디오 신호를 인코딩하는 방법 및 장치와, 잡음 감소를 위한 다채널 hoa 오디오 신호를 디코딩하는 방법 및 장치 | |
| ES2636808T3 (es) | Codificación de escenas de audio | |
| ES2660778T3 (es) | Reconstrucción paramétrica de señales de audio | |
| ES2773795T3 (es) | Aparato y método para llenado estéreo en codificación multicanal | |
| ES2524428T3 (es) | Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio | |
| ES2452348T3 (es) | Aparato y procedimiento para sintetizar una señal de salida | |
| KR20200091880A (ko) | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 | |
| ES2659019T3 (es) | Estructura de descorrelacionador para la reconstrucción paramétrica de señales de audio | |
| KR102201027B1 (ko) | 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스 | |
| ES2714275T3 (es) | Determinación entre cuantificación escalar y vectorial en coeficientes ambisónicos de orden superior | |
| CN102844808B (zh) | 用于编码多通道音频信号的参数编码器 | |
| US11776552B2 (en) | Methods and apparatus for decoding encoded audio signal(s) | |
| CN107077861B (zh) | 音频编码器和解码器 | |
| US20120072207A1 (en) | Down-mixing device, encoder, and method therefor | |
| EP4372741A2 (en) | Packet loss concealment for dirac based spatial audio coding | |
| ES2965084T3 (es) | Determinación de correcciones a aplicar a una señal de audio multicanal, codificación y decodificación asociadas | |
| Zhang et al. | Maximal coherence rotation for stereo coding |