ES2452569T3 - Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase - Google Patents

Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase Download PDF

Info

Publication number
ES2452569T3
ES2452569T3 ES10716780.1T ES10716780T ES2452569T3 ES 2452569 T3 ES2452569 T3 ES 2452569T3 ES 10716780 T ES10716780 T ES 10716780T ES 2452569 T3 ES2452569 T3 ES 2452569T3
Authority
ES
Spain
Prior art keywords
phase
smoothed
value
input
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10716780.1T
Other languages
English (en)
Inventor
Matthias Neusinger
Julien Robilliard
Johannes Hilpert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2452569T3 publication Critical patent/ES2452569T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

Un aparato (100; 200) para mezclar en forma ascendente una señal de audio con mezcla descendente(110;210) que describe uno o más canales de audio de mezcla descendente en una señal de audio mezclada enforma ascendente (120;214) que describe una pluralidad de canales de audio mezclada en forma ascendente, elaparato comprende: un mezclador ascendente (130;230) configurado para aplicar parámetros de mezcla ascendente temporalmentevariables (144; 262) para mezclar en forma ascendente la señal de audio con mezcla descendente, para obtener laseñal de audio mezclada en forma ascendente, donde los parámetros de mezcla ascendente temporalmentevariables comprenden valores de fase suavizados temporalmente variables (144a; 270); un determinador de parámetro (140; 250), donde el determinador de parámetro está configurado para obtener uno omás parámetros de mezcla ascendente temporalmente suavizados (αn) para usa por el mezclador ascendente(130;230) teniendo en cuenta una información de entrada de parámetro cuantizada (142; 212), donde el determinador de parámetro (140;250) está configurado para combinar una versión ajustada a escala ((1-α) &alpha ~n-1) de un valor de fase suavizado previo ( α ~n-1) con una versión ajustada a escala (αn) de una información defase de entrada (αn) utilizando un algoritmo de limitación de cambio de fase, para determinar un valor de fasesuavizado actual ( α ~n) teniendo en cuenta el valor de fase suavizado previo y la información de fase de entrada.donde el determinador de parámetro está configurado para obtener un valor de fase suavizado actual α ~ n deacuerdo con las siguiente ecuación:**Fórmula**

Description

Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase.
Campo Técnico
[0001] Las formas de realización de acuerdo con la invención se relacionan con un aparato, un procedimiento, y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente.
[0002] Algunas formas de realización de acuerdo con la invención se relacionan con suavización de parámetros de fase adaptativa para la codificación de audio paramétrica con múltiples canales.
Antecedentes de la Invención
[0003] A continuación, se describe el contexto de la invención. Recientes desarrollos en el área de la codificación de audio paramétrica otorga técnicas para la codificación conjunta de señales de audio con múltiples canales (Ej. 5,1) en uno (o más) canales de mezcla descendente más una corriente de información complementaria. Estas técnicas se conocen como Codificación de pistas binaural, Estéreo Paramétrico, y Envolvente MPEG etc.
[0004] Muchas publicaciones describen el procedimiento de codificación paramétrico con múltiples canales
denominado “Codificación de pistas binaural”, ver por ejemplo referencias [1][2][3][4][5].
[0005] “Estéreo Paramétrico” es una técnica relacionada con la codificación paramétrica de una señal estéreo de
dos canales basada en una señal mono transmitida más información complementaria del parámetro, ver, por ejemplo, referencias [6][7].
[0006] “Envolvente MPEG” es una norma ISO para la codificación paramétrica con múltiples canales, ver, por ejemplo, referencia [8].
[0007] Las técnicas mencionadas anteriormente se basan en la transmisión de pistas relevantes perceptuales para la audición espacial humana en forma compacta al receptor junto con una señal de mezcla descendente asociada, mono o estéreo. La pistas típicas pueden ser diferencias de nivel entre canales (ILD, por su sigla en inglés), correlación o coherencia entre canales (ICC, por su sigla en inglés), como también diferencias de tiempo entre canales (ITD, por su sigla en inglés), diferencias de fase entre canales (IPD, por su sigla en inglés), y diferencias de fase totales (OPD, por su sigla en inglés).
[0008] Estos parámetros son, en algunos casos, transmitidos en una frecuencia y resolución de tiempo adaptadas a la resolución auditiva humana.
[0009] Para la transmisión, los parámetros son típicamente cuantizados (o, en algunos casos, deben ser cuantizados), donde a menudo (especialmente para escenarios de baja secuencia de bits) se usa una cuantización gruesa.
[0010] El intervalo de actualización en el tiempo lo determina el codificador, dependiendo de las características de una señal. Por lo tanto, no se transmiten parámetros para cada muestra de señal con mezcla descendente,. En otras palabras en algunos casos una velocidad de transmisión (o frecuencia de transmisión, o velocidad de actualización) de parámetros que describen las pistas mencionadas anteriormente puede ser menor a la velocidad de transmisión (o frecuencia de transmisión, o velocidad de actualización) de muestras de audio (o grupos de muestras de audio).
[0011] En vez de transmitir diferencias de fase entre canales (IPDs, por su sigla en inglés) y diferencias de fase totales (OPDs, por su sigla en inglés), es también posible sólo transmitir diferencias de fase entre canales (IPDs, por su sigla en inglés) y estimar las diferencias de fase totales (OPDs, por su sigla en inglés) en el decodificador.
[0012] Como el decodificador puede, en algunos casos, aplicar parámetros en forma continua con el tiempo sin espacios, Ej. para cada muestra (o muestra de audio), se necesitan parámetros intermedios para ser derivados del lado del decodificador, típicamente mediante interpolación entre grupos de parámetros pasados y actuales.
[0013] Algunos procedimientos de interpolación convencionales, sin embargo, resultan en una pobre calidad de audio.
[0014] A continuación se describe un esquema genérico de codificación de pistas binaural, haciendo referencia a la Fig. 7. La Fig. 7 muestra un diagrama de bloque esquemático de un sistema de transmisión de codificación de pista binaural 800, que comprende un codificador de pista binaural 810 y decodificador de pista binaural 820. El codificador de pista binaural 810 puede, por ejemplo, recibir una pluralidad de señales de audio 812a, 812b, y 812c. Además, el codificador de pista binaural 810 está configurado para mezclar en forma descendente las señales de entrada de audio 812a-812c utilizando un mezclador descendente 814 para obtener una señal con mezcla
descendente 816, que puede, por ejemplo, ser una señal suma, y puede ser designada como “AS” o “X”. Además, el
codificador de pista binaural 810 está configurado para analizar señales de entrada de audio 812a-812c utilizando
un analizador 818 para obtener una señal de información complementaria 819 (“SI”, por su sigla en inglés). Una
señal suma 816 y señal de información complementaria 819 se transmiten desde el codificador de pista binaural 810 al decodificador de pista binaural 820. El decodificador de pista binaural 820 puede ser configurado para sintetizar una señal de entrada de audio con múltiples canales que comprende, por ejemplo, canales de audio y1, y2, … , yN teniendo en cuenta una señal suma 816 y pistas entre canales 824. Para tal fin, el decodificador de pista binaural 820 puede comprender un sintetizador de pista binaural 822, que recibe la señal suma 816 y pistas entre
canales 824, y provee las señales de audio y1, y2,…, yN.
[0015] El decodificador de pista binaural 820 además comprende un procesador de información complementaria 826, configurado para recibir información complementaria 819 y, opcionalmente, una entrada de usuario 827. El procesador de información complementaria 826 está configurado para proveer pistas entre canales 824 teniendo en cuenta la información complementaria 819 y entrada de usuario opcional 827.
[0016] Para sintetizar, las señales de entrada de audio se analizan y se mezclan en forma descendente. La señal suma más la información complementaria se transmiten al decodificador. Las pistas entre canales se generan desde la información complementaria y entrada de usuario local. La sintetización de codificación de pistas binaural genera una señal de salida de audio con múltiples canales.
[0017] Para detalles, se hace referencia a los artículos “Codificación de pista binaural Parte II: Esquemas y
aplicaciones," por C. Faller y F. Baumgarte (publicado en: IEEE Transacciones sobre Discurso y Procesamiento de Audio vol. 11, no. 6, Nov. 2003).
[0018] El documento " MPEG4-Ext2: CE on Low Complexity parametric stereo " ( MPEG2003 / M 10366 , la Organización Internacional para la Estandarización ) comprende una descripción técnica de un experimento básico en estéreo paramétrico de baja complejidad. Dicho documento describe una visión de alto nivel de la alternativa de baja complejidad basada en QMF a la síntesis estéreo paramétrico basada en FFT. En lugar de FFT , se emplean bancos de filtros basadosen QMF complejos híbridos. Estos bancos de filtros complejos híbridos operan en un filtro de bancos QMF complejo de 64 bandas como se emplea en la tecnología de replicación de banda espectral. Las subbandas QMF no procesadas se retrasan para sincronizarse con las sub-bandas de QMF filtradas híbridas complejas. Esta representación en el dominio de frecuencia se alimenta a un procedimiento de decorrelación para proporcionar una componente de señal correlacionada y una componente de señal no correlacionada. Estas señales se alimentan a continuación a un módulo de procesamiento estéreo donde se aplican diferencias de intensidad , diferencias de tiempo (fase) y correlaciones , lo que resulta en una representación espectral izquierda y una representación espectral derecha de las señales temporales izquierda y derecha , respectivamente. Estas últimas se obtienen por medio de dos bancos de filtros de síntesis QMF que se extienden de nuevo con filtros de síntesis híbridos en las sub-bandas inferiores QMF. En la síntesis , los filtros híbridos se implementan como simples adiciones. El módulo alternativo de estéreo paramétrico basado en QMF sustituye al módulo basado en FFT existente. Exactamente de la misma forma proporciona la interfaz entre la señal sintetizada M paramétrica monoaural y las señales de salida estéreo L y R, respectivamente.
[0019] El documento WO 2005 / 086139 describe una codificación de audio multi-canal. Múltiples canales de audio se combinan o bien con una señal compuesta monofónica o múltiples canales de audio junto con información auxiliar relacionada a partir de la cual se reconstruyen múltiples canales de audio, incluyendo una mejor mezcla descendente de múltiples canales de audio a una señal de audio monofónica o a múltiples canales de audio y mejora de descorrelación de múltiples canales de audio derivados de un canal de audio monofónico o de múltiples canales de audio. Unos aspectos dados a conocer en dicho documento se pueden usar en los codificadores de audio , decodificadores, sistemas de codificación / decodificación , downmixers , upmixers y decorrelacionadores.
[0020] El documento EP 2 169 666 A 1 describe un procedimiento y un aparato para procesar una señal. El procedimiento de tratamiento de una señal incluye la recepción de una señal de mezcla descendente generada a partir de una señal de canal plural e información espacial que indica el atributo de la señal del canal plural de mezcla para realizar la mezcla ascendente de la señal descendente. El procedimiento también comprende la obtención de una bandera de codificación diferencia de fase entre canales que indica si un valor de diferencia de fase entre canales se utiliza para la información espacial de la cabecera de la información espacial. El procedimiento también comprende la obtención de una bandera de codificación de diferencia de fase entre canales basada en la bandera de codificación de diferencia de fase entre canales de la trama de la información espacial , donde la bandera de modo IPD indica si el valor de IPD se utiliza para una trama de la información espacial. El procedimiento también comprende obtener el valor de IPD de una banda de parámetro de un intervalo de tiempo de parámetro en el marco basado en la bandera de modo de diferencia de fase entre canales. El procedimiento comprende suavizar el valor de la diferencia de fase entre canales mediante la modificación del valor de la diferencia de fase entre canales mediante el valor de diferencia de fase entre canales de un intervalo de tiempo de parámetro anterior. El procedimiento también comprende la generación de una señal de canal plural mediante la aplicación del valor de la diferencia de fase entre canales suavizada a la señal de mezcla descendente.
[0021] El artículo "Enhanced Stereo Coding with Phase Parameters for MPEG Unified Speech and Audio Coding" de Junghoe Kim y otros. (Audi Engineering Society Convention Paper 7875 , presentado en la 127 Convención , 9 a 12 oct, 2009 ) describe una codificación estéreo mejorada con los parámetros de fase para discurso unificado MPEG y codificación de audio. La tecnología propuesta tiene que ver con una forma eficiente en bits para entregar información de fase. Esta tecnología consiste en codificar sólo un parámetro de diferencia de fase inter - canal ( IPD ) y estimar un parámetro de desfase global ( OPD) en el decodificador con una diferencia de fase entre canales de transmitida y una diferencia de nivel de canal. La tecnología propuesta reduce la velocidad de bits de parámetros de fase en comparación con el caso en que ambos parámetros IPD y parámetros de OPD se transmiten tal como se especifica en estéreo paramétrico de MPEG. El esquema de codificación de entropía de parámetros de fase se mejora mediante la utilización de la propiedad de envoltura de los parámetros de fase. El suavizado de fase en el decodificador y el control adaptativo de la posición de cuantificación para los parámetros de fase se introducen para minimizar los artefactos molestos debidos a los cambios bruscos de parámetros de fase cuantificados. La codificación fase propuesta se utiliza como parte del discurso unificado MPEG - D y de codificación de audio estándar.
[0022] Sin embargo, se descubrió que muchos decodificadores convencionales de pistas binaurales proveen señales de salida de audio con múltiples canales con calidad degradada si la información complementaria es cuantizada en forma gruesa o con resolución insuficiente.
[0023] Considerando este problema, existe la necesidad de un mejor concepto para mezclar en forma ascendente una señal de audio con mezcla descendente en una señal de audio mezclada en forma ascendente, que reduce la degradación de impresión auditiva si la información complementaria que describe una relación de fase entre diferentes canales de la señal de mezcla ascendente es cuantizada con comparativamente baja resolución.
Síntesis de la Invención
[0024] Una forma de realización de acuerdo con la invención crea un aparato para mezclar en forma ascendente una señal de audio con mezcla descendente que describe uno o más canales de audio de mezcla descendente en una señal de audio mezclada en forma ascendente que describe una pluralidad de canales de audio mezclados en forma ascendente. El aparato comprende un mezclador ascendente configurado para aplicar parámetros de mezcla ascendente temporalmente variables para mezclar en forma ascendente una señal con mezcla descendente para obtener una señal mezclada en forma ascendente. Los parámetros de mezcla ascendente temporalmente variables comprenden valores de fase suavizados temporalmente variables. El aparato también comprende un determinador de parámetro, configurado para obtener uno o más parámetros de mezcla ascendente temporalmente suavizados para usar por el mezclador ascendente teniendo en cuenta información de entrada del parámetro de mezcla ascendente cuantizada. El determinador de parámetro está configurado para combinar una versión ajustada a escala de un valor de fase previo suavizado con una versión ajustada a escala de información de fase de entrada utilizando un algoritmo de limitación de cambio de fase, para determinar un valor de fase suavizado actual teniendo en cuenta el valor de fase suavizado previo e información de fase de entrada.
[0025] Esta forma de realización de acuerdo con la invención se basa en el hecho que los artefactos auditivos en las señales con mezcla ascendente pueden reducirse o evitarse combinando una versión ajustada a escala de valores de fase suavizados previos con una versión ajustada a escala de información de fase de entrada utilizando un algoritmo de limitación de cambio de fase, ya que la consideración del valor de fase suavizado previo junto con un algoritmo de limitación de cambio de fase permite mantener menores discontinuidades de valores de fase suavizados. Una reducción de discontinuidades entre subsecuentes valores de fase suavizados (por ejemplo, valor de fase suavizado previo y el valor de fase suavizado actual), a la vez, evita (o se mantiene lo suficientemente bajo) una variación de frecuencia auditiva en una transición entre porciones de señal de audio a la cual se aplican los valores de fase subsecuentes (Ej. valor de fase suavizado previo y valor de fase suavizado actual).
[0026] Para sintetizar lo anterior, la invención crea un concepto general de procesamiento de fase adaptativa para la codificación de audio paramétrica con múltiples canales. Las formas de realización de acuerdo con la invención reemplazan otras técnicas reduciendo artefactos en la señal de salida causados por la cuantización gruesa o cambios rápidos de parámetros de fase.
[0027] En una forma de realización preferida, el determinador de parámetro está configurado para combinar la versión ajustada a escala del valor de fase suavizado previo con la versión ajustada a escala de la información de fase de entrada, de modo que el valor de fase suavizado actual se encuentra en una región de ángulo menor entre la primera región de ángulo y la segunda región de ángulo, donde la primera región de ángulo se extiende, en dirección matemáticamente positiva, desde una primera dirección de comienzo definida por el valor de fase suavizado previo hasta una primera dirección final definida por la información de fase de entrada, y donde la segunda región de ángulo se extiende, en dirección matemáticamente positiva, desde una segunda dirección de comienzo definida por la información de fase de entrada hasta una segunda dirección final definida por el valor de fase suavizado previo. En consecuencia, en algunas formas de realización de la invención, una variación de fase, introducida por suavización recursiva (tipo de respuesta de impulso infinita) de valores de fase, se mantiene de la menor manera posible. En consecuencia, los artefactos auditivos se mantienen de la menor manera posible. Por ejemplo, el aparato puede ser configurado para asegurar que el valor de fase suavizado actual se encuentre dentro de un rango de ángulo menor entre dos rangos de ángulos, donde uno de los dos rangos de ángulo cubre más de 180° y donde el segundo de los rangos de ángulo cubre menos de 180°, y donde los dos rangos de ángulos juntos cubren 360°. En consecuencia, se asegura por el algoritmo de limitación de cambio de fase que la diferencia de fase entre el valor de fase suavizado previo y el valor de fase suavizado actual sea menor a 180° y, preferentemente, menor a 90°. Se mantienen así los menores artefactos auditivos posibles.
[0028] En una forma de realización preferida, el determinador de parámetro está configurado para seleccionar una regla de combinación entre una pluralidad de diferentes reglas de combinación en dependencia de una diferencia entre la información de fase de entrada y valor de fase suavizado previo, y para determinar el valor de fase suavizado actual utilizando la regla de combinación seleccionada. En consecuencia, se puede elegir una regla de combinación adecuada, que asegure que el cambio de fase entre el valor de fase suavizado previo y el valor de fase suavizado actual sea menor a un valor umbral predeterminado o, más en general, suficientemente menor o lo menos posible. En consecuencia, el aparato de invención supera a otros aparatos, con regla de combinación fija.
[0029] En una forma de realización preferida, el determinador de parámetro está configurado para seleccionar una regla de combinación básica si la diferencia entre la información de fase de entrada y el valor de fase suavizado previo se encuentra entre -π y + π, y para seleccionar una o más reglas de combinación con diferente adaptación de fase. La regla de combinación básica define una combinación lineal sin sumando constante de la versión ajustada a escala de información de fase de entrada y versión ajustada a escala del valor de fase suavizado previo. La una o más reglas de combinación con diferente adaptación de fase definen una combinación lineal, teniendo en cuenta un sumando de adaptación de fase constante de la versión ajustada a escala de la información de fase de entrada y la versión ajustada a escala del valor de fase suavizado previo. En consecuencia, se puede realizar una combinación lineal beneficiosa y de fácil implementación del valor de fase suavizado previo e información de fase de entrada, donde un sumando adicional puede aplicarse en forma selectiva si la diferencia entre el valor de fase suavizado previo y la información de fase de entrada toma un valor comparativamente mayor (mayor a π o menor a-π). En consecuencia, los casos problemáticos donde exista una gran diferencia entre el valor de fase suavizado previo e información de fase de entrada pueden manejarse con reglas de combinación de adaptación de fase específicamente adaptadas, que mantienen los cambios de fase entre subsecuentes valores de fase suavizados los suficientemente menores.
[0030] En una forma de realización preferida, el determinador de parámetro comprende un controlador de suavización, donde el controlador de suavización está configurado para desactivar en forma selectiva una funcionalidad de suavización de valor de fase si una diferencia entre la cantidad de fase suavizada y cantidad de fase de entrada correspondiente es mayor a un valor umbral predeterminado. En consecuencia, la funcionalidad de suavización de valor de fase puede ser desactivada si existe un gran cambio en la información de fase de entrada. Típicamente, los grandes cambios de información de fase de entrada indican en realidad que se desea realizar un cambio de fase no suavizado, ya que comparativamente los grandes cambios de información de fase de entrada (significativamente mayores a la etapa de cuantización) son a menudo relacionados con eventos sonoros específicos dentro de una señal de audio. Por lo tanto, una suavización de valores de fase, que mejore la impresión auditiva en muchos casos, sería perjudicial en este caso específico. En consecuencia, la impresión auditiva puede mejorarse desactivando en forma selectiva la funcionalidad de suavización de valor de fase.
[0031] En una forma de realización preferida, el controlador de suavización está configurado para evaluar, como la cantidad de fase suavizada, una diferencia entre dos valores de fase suavizados y para evaluar, como cantidad de fase de entrada correspondiente, una diferencia entre dos valores de fase de entrada correspondientes a los dos valores de fase suavizados. Se halló que en algunos casos, una diferencia entre valores de fase, asociados con diferentes (mezclados en forma ascendente) canales de señal de audio con múltiples canales, es una cantidad particularmente significante para decidir si la funcionalidad de suavización de valor de fase debería ser activara o desactivada.
[0032] En una forma de realización preferida, el mezclador ascendente está configurado para aplicar, para una porción de tiempo dada, diferentes rotaciones de fase temporalmente suavizadas, definidas por diferentes valores de fase suavizados, para obtener señales de canales de audio mezclados en forma ascendente con diferencia de fase entre canales si una función de suavización (o funcionalidad de suavización de valor de fase) es activada, y para aplicar rotaciones de fase temporalmente no suavizadas, definidas por diferentes valores de fase no suavizados, para obtener señales de diferentes canales de audio mezclados en forma ascendente con diferencia de fase entre canales si la función de suavización (o funcionalidad de suavización de valor de fase) es desactivada. En este caso, el determinador de parámetro comprende un controlador de suavización, cuyo controlador de suavización está configurado para selectivamente activar o desactivar la funcionalidad de suavización de valor de fase si una diferencia entre los valores de fase suavizados aplicada para obtener señales de diferentes canales de audio mezclados en forma ascendente difiere de un valor de diferencia de fase no suavizado canales, recibida por el mezclador ascendente o derivada de información recibida por el mezclador ascendente, por más de un valor umbral predeterminado. Se halló que la desactivación selectiva de la funcionalidad de suavización de valor de fase es particularmente útil para mejorar la impresión auditiva di un valor de diferencia de fase entre canales es evaluado como criterio para activar y desactivar la funcionalidad de suavización de valor de fase.
[0033] En una forma de realización preferida, el determinador de parámetro está configurado para ajustar la constante de tiempo de filtrado para determinar una secuencia de valores de fase suavizados en dependencia de la diferencia actual entre un valor de fase suavizado y valor de fase de entrada correspondiente. Al ajustar la constante de tiempo de filtrado, se puede obtener un tiempo de estabilización suficientemente menor para grandes cambios de valor de fase de entrada, manteniendo las características de suavización lo suficientemente buenas para cambios menores y medianos del valor de fase de entrada. Esta funcionalidad trae lugar a particulares ventajas, ya que un cambio comparativamente menor (o, como mucho mediano) del valor de fase de entrada es a menudo causado por una granularidad de cuantización. En otras palabras, un cambio gradual del valor de fase de entrada, causado por granularidad de cuantización, puede resultar en operación de suavización eficiente. En dicho caso, la funcionalidad de suavización puede ser particularmente ventajosa, donde una constante de tiempo de filtrado comparativamente larga arroja buenos resultados. En contraposición, un gran cambio del valor de fase de entrada, significativamente mayor a la etapa de cuantización, típicamente corresponde a un cambio grande deseado del valor de fase. En este caso, una constante de tiempo de filtrado comparativamente corta arroja buenos resultados. En consecuencia, al ajustar la constante de tiempo de filtrado en dependencia con la diferencia actual de valor de fase suavizado y valor de fase de entrada correspondiente, se pueden lograr grandes cambios y que el valor de fase de entrada resulte en rápidos cambios de valores de fase suavizados, mientras que los cambios menores del valor de fase de entrada, que toma el tamaño de la etapa de cuantización, resulta en una transición lenta y suavizada del valor de fase suavizado. En consecuencia, una buena impresión auditiva se obtiene para los grandes e intencionales cambios del valor de fase deseado y para cambios menores del valor de fase deseado (que sin embargo, puede causar un cambio del valor de fase de entrada por una etapa de cuantización).
[0034] En una forma de realización preferida, el determinador de parámetro está configurado para ajustar una constante de tiempo de filtrado para determinar una secuencia de valores de fase suavizados dependiendo de diferencias entre diferencia de fase suavizada entre canales definida por una diferencia entre dos valores de fase suavizados asociados con diferentes canales de la señal de audio mezclada en forma ascendente, y diferencia de fase no suavizada entre canales, definida por la información de diferencia de fase suavizada entre canales. Se halló que el concepto de ajustar en forma selectiva la constante de tiempo de filtrado puede usarse con ventaja junto con un procesamiento de diferencias de fase entre canales.
[0035] En una forma de realización preferida, el aparato para mezclar en forma ascendente está configurado para selectivamente activar o desactivar una funcionalidad de suavización de valor de fase en dependencia de una información extraída de una corriente de bits de audio. Se halló que una mejor impresión auditiva puede obtenerse al activar o desactivar, bajo control del codificador de audio, una funcionalidad de suavización de valor de fase en un decodificador de audio.
[0036] Una forma de realización de acuerdo con la invención crea un procedimiento que implementa la funcionalidad del aparato antes analizado para mezclar en forma ascendente una señal de audio con mezcla descendente en una señal de audio mezclada en forma ascendente. Dicho procedimiento se basa en las mismas ideas del aparato antes analizado.
[0037] Además, las formas de realización de acuerdo con la invención crean un programa de computación para desarrollar dicho procedimiento.
Breve Descripción de las Figs.
[0038] Las formas de realización de acuerdo con la invención serán descriptas a continuación con referencia a las Figs. adjuntas, donde:
La Fig. 1muestra un diagrama de bloque esquemático de un aparato para mezclar en forma ascendente una señal de audio con mezcla descendente, de acuerdo con una forma de realización de la invención;
Las Figs. 2a y 2b muestran un diagrama de bloque esquemático de un aparato para mezclar en forma ascendente una señal de audio con mezcla descendente, de acuerdo con otra forma de realización de la invención;
La Fig. 3muestra una representación esquemática de diferencias de fase totales OPD1, OPD2 y diferencia de fase entre canales IPD;
Las Figs. 4a y 4b muestran representaciones gráficas de relaciones de fase para un primer caso del algoritmo de limitación de cambio de fase;
Las Figs. 5a y 5b muestran representaciones gráficas de relaciones de fase para un segundo caso del algoritmo de limitación de cambio de fase;
La Fig. 6muestra un diagrama de flujo de un procedimiento para mezclar en forma ascendente una señal de audio con mezcla descendente en señal de audio mezclada en forma ascendente, de acuerdo con una forma de realización de la invención; y
La Fig. 7muestra un diagrama de bloque esquemático que representa un esquema de codificación de pistas binaural genérico
Descripción Detallada de las Formas de realización
1. Forma de realización de acuerdo con la Fig. 1
[0039] La Fig. 1 muestra un diagrama de bloque esquemático de un aparato 100 para mezclar en forma ascendente una señal de audio con mezcla descendente, de acuerdo con una forma de realización de la invención. El aparato 100 está configurado para recibir una señal de audio con mezcla descendente 110 que describe uno o más canales de audio de mezcla descendente y para proveer una señal de audio mezclada en forma ascendente 120 que describe una pluralidad de canales de audio mezclados en forma ascendente. El aparato 100 comprende un mezclador ascendente 130 configurado para aplicar parámetros de mezcla ascendente temporalmente variables para la mezcla ascendente de la señal de audio con mezcla descendente 110 para obtener la señal de audio mezclada en forma ascendente 120. El aparato 100 además comprende un determinador de parámetro 140 configurado para recibir información de entrada de parámetro cuantizada 142. El determinador de parámetro 140 está configurado para obtener uno o más parámetros de mezcla ascendente temporalmente suavizados 144 para usar por el mezclador ascendente 130 teniendo en cuenta la información de entrada del parámetro cuantizada 142.
[0040] El determinador de parámetro 140 está configurado para combinar una versión ajustada a escala de un valor de fase suavizado previo con una versión ajustada a escala de información de fase de entrada 142a, incluida en la información de entrada del parámetro cuantizada 142, utilizando un algoritmo de limitación de cambio de fase 146, para determinar un valor de fase suavizado actual 144a teniendo en cuenta el valor de fase suavizado previo e información de fase de entrada. El valor de fase suavizado actual 144a se incluye en los parámetros de mezcla ascendente suavizados temporalmente variables, 144.
[0041] A continuación se describen detalles concernientes a la funcionalidad del aparato 100. La señal de audio con mezcla descendente 110 ingresa al mezclador ascendente 130, por ejemplo, en forma de secuencia de grupos de valores complejos que representan la señal de audio con mezcla descendente en dominio de tiempo y frecuencia (describiendo bandas de frecuencia superpuestas o no o sub-bandas de frecuencia en una velocidad de actualización determinada por el codificador que no se muestra acá). El mezclador ascendente 130 está configurado para combinar en forma lineal múltiples canales de la señal de audio con mezcla descendente 110 en dependencia de parámetros de mezcla ascendente suavizados temporalmente variables y/o para combinar en forma lineal un canal de la señal de audio con mezcla descendente 110 con una señal auxiliar (Ej. señal descorrelacionada) (donde la señal auxiliar puede ser derivada desde el mismo canal de audio de la señal de audio con mezcla descendente 110, desde uno o más canales de audio de la señal de audio con mezcla descendente 110, o desde una combinación de canales de audio de la señal de audio con mezcla descendente 110). Por lo tanto, los parámetros de mezcla ascendente suavizados temporalmente variables 144 pueden usarse por el mezclador ascendente 130 para decidir sobre el ajuste a escala de amplitud /o rotación de fase (o retardo de tiempo) usado en una generación de señal de audio mezclada en forma ascendente 120 (o canal de la misma) teniendo en cuenta la señal de audio con mezcla descendente 110.
[0042] El determinador de parámetro 140 está típicamente configurado para proveer parámetros de mezcla ascendente suavizados temporalmente variables 144 a una velocidad de actualización, igual a (o, en algunos casos, mayor a) la velocidad de actualización de la información complementaria descripta por la información de entrada del parámetro cuantizada 142. El determinador de parámetro 140 puede ser configurado para evitar (o, al menos, reducir) artefactos que surgen de la (ahorro de secuencia de bits) cuantización gruesa de información de entrada de parámetro cuantizada 142. Para tal fin, el determinador de parámetro 140 puede aplicar una suavización de la información de fase descripta, por ejemplo, diferencias de fase entre canales. Esta suavización de información de fase de entrada 142a, incluida en la información de entrada del parámetro cuantizada 142, se realiza utilizando un algoritmo de limitación de cambio de fase 143, de modo que se evitan los cambios de fase grandes y abruptos, que darían por resultado artefactos auditivos (o, al menos, limitados a un grado tolerable).
[0043] La suavización es preferentemente realizada al combinar un valor de fase suavizado previo con un valor de información de fase de entrada 142a, de modo que un valor de fase suavizado actual depende del valor de fase suavizado previo y el valor actual de información de fase de entrada 142a. De este modo, se obtiene una transición particularmente suave utilizando una simple estructura del algoritmo de suavización. En otras palabras, se pueden evitar as desventajas de la suavización de respuesta por impulso finita al proveer una suavización de respuesta por impulso infinita donde se considera el valor de fase suavizado previo.
[0044] Opcionalmente, el determinador de parámetro 140 puede comprender una funcionalidad de interpolación adicional, ventajosa si la información de entrada del parámetro cuantizada 142 se transmite a intervalos temporales comparativamente largos (por ejemplo, menos de una vez por grupo de valores espectrales de la señal de audio con mezcla descendente 110).
[0045] Para sintetizar, el aparato 100 permite proveer valores de fase suavizados temporalmente variables 144a teniendo en cuenta la información de entrada del parámetro cuantizada 142, de modo que los valores de fase suavizados temporalmente variables 144a sean apropiados para la derivación de la señal de audio mezclada en forma ascendente 120 desde la señal de audio con mezcla descendente 110 utilizando el mezclador ascendente
130.
[0046] Los artefactos auditivos son reducidos (o hasta eliminados) al proveer valores de fase suavizados 144a utilizando el concepto anterior, donde una consideración de un valor de fase suavizado previo se combina con la limitación de cambio de fase. En consecuencia, se logra una buena impresión auditiva de la señal de audio mezclada en forma ascendente 120.
2. Forma de realización de acuerdo con la Fig. 2
2.1. Visión general de la Forma de realización de la Fig. 2
[0047] Otros detalles sobre la estructura y operación de un aparato para mezclar en forma ascendente una señal de audio serán descriptos con referencia a las Figs. 2a y 2b. Las Figs. 2a y 2b muestran un diagrama de bloque esquemático en detalle de un aparato 200 para mezclar una señal de audio con mezcla descendente, de acuerdo con otra forma de realización de la invención.
[0048] El aparato 200 puede ser considerado como decodificador para generar una (Ej. 5,1) señal de audio de múltiples canales teniendo en cuenta una señal de audio con mezcla descendente 210 e información complementaria SI. El aparato 200 implementa las funcionalidades, descriptas con respecto al aparato 100.
[0049] El aparato 200 puede, por ejemplo, servir para decodificar una señal de audio de múltiples canales
codificada de acuerdo la denominada “Codificación de pistas binaural”, “Estéreo Paramétrico” o “Envolvente MPEG”.
Naturalmente, el aparato 200 puede de modo similar ser usado para mezclar en forma ascendente canales de señales de audio codificada de acuerdo con otros sistemas utilizando pistas espaciales.
[0050] Para simplificar, se describe el aparato 200, que realiza una mezcla en forma ascendente de una señal de audio con un solo canal con mezcla descendente en una señal con dos canales. Sin embargo, el concepto descripto acá puede extenderse fácilmente a casos donde la señal de audio con mezcla descendente comprende más de un canal, y a casos donde la señal de audio mezclada en forma ascendente comprende más de dos canales.
2.2. Señales de Entrada y Tiempo de Entrada de la Forma de realización de la Fig. 2
[0051] El aparato 200 está configurado para recibir la señal de audio con mezcla descendente 210 e información complementaria 212. Además, el aparato 200 está configurado para proveer una señal de audio mezclada en forma ascendente 214 que comprende, por ejemplo, múltiples canales.
[0052] La señal de audio con mezcla descendente 210 puede, por ejemplo, ser una señal suma generada por un codificador (Ej. por el codificador BCC 810 de la Fig. 7). La señal de audio con mezcla descendente 210 puede, por ejemplo, ser representada en dominio de tiempo y frecuencia, por ejemplo, en forma de descomposición de frecuencia de valor complejo. Por ejemplo, los contenidos de audio de una pluralidad de sub-bandas de frecuencia (que pueden estar superpuestas o no) de la señal de audio pueden ser representados por los correspondientes valores complejos. Para una banda de frecuencia dada, la señal de audio con mezcla descendente puede ser representada por una secuencia de valores complejos que describen el contenido de audio en la sub-banda de frecuencia bajo consideración para subsecuentes intervalos de tiempo (superpuestos o no). Los subsecuentes valores complejos para subsecuentes intervalos de tiempo pueden obtenerse, por ejemplo, utilizando un banco de filtro (Ej. banco de filtro QMF), Transformada Rápida de Fourier, o similar, en el aparato 100 (que puede ser parte de un decodificador de señal de audio con múltiples canales), o en dispositivo adicional acoplado al aparato 100. Sin embargo, la representación de la señal de audio con mezcla descendente 210 descripta acá es típicamente no idéntica a la representación de la señal con mezcla descendente usada para la transmisión de señal de audio con mezcla descendente desde el codificador de señal de audio con múltiples canales hasta el decodificador de señal de audio con múltiples canales o hasta el aparato 100. En consecuencia, la señal de audio con mezcla descendente 210 puede ser representada por una corriente de grupos o vectores de valores complejos.
[0053] A continuación se presume que los intervalos de tiempo subsecuentes de la señal de audio con mezcla descendente 210 se designan con un índice de valor entero k. También se presume que el aparato 200 recibe un grupo o vector de valores complejos por intervalo k y por canal de la señal de audio con mezcla descendente 210. Por lo tanto, una muestra (grupo o vector de valores complejos) es recibida para cada intervalo de actualización de muestra de audio descripta por el índice de tiempo k.
[0054] En otras palabras, las muestras de audio (“AS” por su sigla en inglés) de la señal de audio con mezcla descendente 210 son recibidas por el aparato 210, de modo que una sola muestra de audio AS se asocia con cada intervalo de actualización de muestra de audio k.
[0055] El aparato 200 además recibe información complementaria 212 que describe los parámetros de mezcla ascendente. Por ejemplo, la información complementaria 212 puede describir uno o más de los siguientes parámetros de mezcla ascendente: Diferencia de nivel entre canales (ILD, por su sigla en inglés), correlación entre canales (o coherencia) (ICC, por su sigla en inglés), diferencia de tiempo entre canales (ITD, por su sigla en inglés), diferencia de fase entre canales (IPD, por su sigla en inglés) o diferencia de fase total entre canales (OPD, por su sigla en inglés). Típicamente, la información complementaria 212 comprende parámetros ILD y al menos uno de los parámetros ICC, ITD, IPD, OPD. Sin embargo, para salvar el ancho de banda, la información complementaria 212 es, en algunas formas de realización, sólo transmitida hacia, o recibida por, el aparato 200 una vez por múltiples intervalos de actualización k de muestras de audio de la señal de audio con mezcla descendente 210 (o la transmisión de un solo grupo de información complementaria puede ser temporalmente expandida por una pluralidad de intervalos de actualización k de muestras de audio). De este modo, en algunos casos, existe un solo grupo de parámetros de información complementaria para una pluralidad de intervalos de actualización k de muestras de audio. Sin embargo, en otros casos, puede haber un grupo de parámetros de información complementaria para cada intervalo de actualización k de muestra de audio.
[0056] Los intervalos donde la información complementaria se actualiza se designan con el índice n, donde, para simplificar, se presume a continuación que los subsecuentes intervalos de tiempo de la señal de audio con mezcla descendente 210, designados con el índice de valor entero k, so idénticos a los intervalos de tiempo donde la información complementaria SI 212 es actualizada, de modo que la relación k=n se mantiene. Sin embargo, si una actualización de la información complementaria SI 212 se realiza sólo una vez por pluralidad de subsecuentes intervalos de tiempo k de la señal de audio con mezcla descendente 210, se puede realizar una interpolación, por ejemplo, entre valores subsecuentes de información de fase de entrada αn o subsecuentes valores de fase
~
suavizados an.
[0057] Por ejemplo, la información complementaria puede ser transmitida a (o recibida por) el aparato 200 en los intervalos de actualización de muestra de audio k=4, k=8 y k=16. En contraposición, no se puede transmitir información complementaria 212 a (o recibir por) el aparato entre dichos intervalos de actualización de muestra de audio. Por lo tanto, los intervalos de actualización de la información complementaria 212 pueden variar con el tiempo, como el codificador puede, por ejemplo, decidir si proveer actualización de información complementaria sólo cuando sea necesario (Ej. cuando el decodificador reconoce que la información complementaria cambia por más de un valor predeterminado). Por ejemplo, la información complementaria recibida por el aparato 200 para el intervalo de actualización de muestra de audio k=4 puede estar asociado con los intervalos de actualización de muestra de audio k=3, 4, 5. De modo similar, la información complementaria recibida por el aparato 200 para el intervalo de actualización de muestra de audio k=8 puede estar asociado con los intervalos de actualización de muestra de audio k=6, 7, 8, 9, 10, etc. Sin embargo, una diferente asociación es naturalmente posible y los intervalos de actualización para la información complementaria pueden naturalmente ser mayores o menores a lo analizado.
2.3. Señales de salida y Tiempo de salida de la Forma de realización de la Fig. 2
[0058] Sin embargo, el aparato 200 sirve para proveer señales de audio mezcladas en forma ascendente en una composición de frecuencia de valor complejo. Por ejemplo, el aparato 200 puede ser configurado para proveer señales de audio mezcladas en forma ascendente 214, de modo que las señales de audio mezcladas en forma ascendente comprendan los mismos intervalos de actualización de muestras de audio o velocidad de actualización de señal de audio que la señal de audio con mezcla descendente 210. En otras palabras, para cada muestra (o intervalos de actualización de muestras de audio k) de la señal de audio con mezcla descendente 210, una muestra de señal de audio mezclada en forma ascendente 214 es generada en algunas formas de realización.
2.4. Mezcla Ascendente
[0059] A continuación se describe en detalle como se obtiene la actualización de parámetros de mezcla ascendente, usados para mezclar en forma ascendente la señal de audio con mezcla descendente 210, para cada intervalo de actualización k de muestra de audio aunque la información complementaria que ingresa al decodificador 212 pueda ser actualizada, en algunas formas de realización, sólo a grandes intervalos de actualización. A continuación, se describe el procesamiento para una sola sub-banda, pero el concepto puede naturalmente extenderse a múltiples sub-bandas.
[0060] El aparato 200 comprende, como componente clave, un mezclador ascendente 230, configurado para operar como combinador lineal de valor complejo. El mezclador ascendente 230 está configurado para recibir una muestra x(t) o x(k) de la señal de audio con mezcla descendente 210 (Ej. representando cierta banda de frecuencia) asociada con el intervalo de actualización k de muestra de audio. La señal x(t) o x(k) es a veces designada como
“señal seca”. Además, el mezclador ascendente 230 está configurado para recibir muestras q(t) o q(k) que
representa una versión descorrelacionada de la señal de audio con mezcla descendente.
[0061] Además, el aparato 200 comprende un descorrelacionador (Ej. retardador o reflector) 240, configurado para recibir muestras x(k) de la señal de audio con mezcla descendente y para proveer teniendo en cuenta las mismas, muestras q(k) de una versión descorrelacionada de la señal de audio con mezcla descendente (representada por x(k)). La versión descorrelacionada (muestras q(k)) de la señal de audio con mezcla descendente (muestras x(k))
puede ser designada como “señal húmeda”.
[0062] El mezclador ascendente 230 comprende, por ejemplo, un multiplicador de matriz y vector 232, configurado
para realizar una combinación lineal de valor real (o, en algunos casos, valor complejo) de la “señal seca” (representada por x(k)) y “señal húmeda” (representada por q(k)) para obtener una primera señal de canal mezclado
en forma ascendente (representado por muestras y1(k)) y una segunda señal de canal mezclado en forma ascendente (representado por muestras y2(k)). El multiplicador de matriz y vector 232 puede, por ejemplo, ser configurado para realizar la siguiente multiplicación de matriz y vector para obtener las muestras y1(k) y y2(k) de las señales de canal mezcladas en forma ascendente:
[y1(k) ][x(k)]
=H(k)
y2(k) q(k)
[0063] El multiplicador de matriz y vector 232, o combinador lineal de valor complejo 230, puede además comprender un ajustador de fase 233, está configurado para ajustar fases de las muestras y1(k) y y2(k) que representan las señales de canal mezcladas en forma ascendente. Por ejemplo, el ajustador de fase 233 puede ser configurado para obtener la primera señal de canal mezclada en forma ascendente con ajuste de fase, representada
~
por las muestras y 1(k) de acuerdo con
~ ja1(k)
y1��ke 1�� = yk ,
y para obtener la segunda señal de canal mezclada en forma ascendente con ajuste de fase, representada por las
~
muestras y 2(k), de acuerdo con
~ ja2(k)
y2��=ey2��.
kk
[0064] En consecuencia, la señal de audio mezclada en forma ascendente 214, cuyas muestras se designan con
~~
y 1(k) y y 2(k), es obtiene teniendo en cuenta la señal seca y señal húmeda, por medio del combinador lineal de
valor complejo 230 utilizando los parámetros de mezcla ascendente temporalmente variables. Los valores de fase
~
suavizados temporalmente variables an se usan para determinar fases (o diferencias de fase entre canales) de las
~~
señales de audio mezcladas en forma ascendente y 1(k) y y 2(k). Por ejemplo, el ajustador de fase 232 puede ser
configurado para aplicar los valores de fase suavizados temporalmente variables. Sin embargo, alternativamente, los valores de fase suavizados temporalmente variables pueden ser usados por el multiplicador de matriz y vector 232 (o hasta en la generación de entradas de la matriz H). En este caso, el ajustador de fase 233 puede ser omitido por completo.
2.5 Actualización de Parámetros de Mezcla Ascendente
[0065] Como se observa de las ecuaciones anteriores, es deseable actualizar la matriz del parámetro de mezcla ascendente H(k) y valores de fase del canal de mezcla ascendente α1(k), α2(k) para cada intervalo de actualización k de muestra de audio. Al actualizar la matriz del parámetro de mezcla ascendente para cada intervalo de actualización k surge la ventaja que la matriz del parámetro de mezcla ascendente esté siempre adaptada al ambiente acústico real. Al actualizar la matriz del parámetro de mezcla ascendente para cada intervalo de actualización k además permite mantener los cambios graduales de la matriz del parámetro de mezcla ascendente H (o ingresos de la misma) entre subsecuentes intervalos de muestra de audio k menores, a medida que los cambios de la matriz del parámetro de mezcla ascendente se distribuyen por múltiples intervalos de actualización de muestras de audio aunque la información complementaria 212 se actualice sólo una vez por múltiples intervalos de actualización de muestras de audio k. Además es deseable suavizar los cambios de la matriz del parámetro de mezcla ascendente H que surjan de la cuantización de información complementaria SI, 212. De modo similar, es deseable actualizar los valores de fase del canal de mezcla ascendente α1(k) y α2(k) a menudo, para evitar, al menos durante una señal de audio continua, cambios graduales de dichos valores de fase del canal de mezcla ascendente. Además, es deseable temporalmente suavizar los valores de fase del canal de mezcla ascendente, para reducir o evitar artefactos causados por la cuantización de información complementaria SI, 212.
[0066] El aparato 200 comprende una unidad de procesamiento de información complementaria 250, configurada para proveer parámetros de mezcla ascendente temporalmente variables 262, por ejemplo, ingresos Hij (k) de la matriz H(k) y valores de fase del canal de mezcla ascendente α1(k), α2(k), teniendo en cuenta la información complementaria 212. La unidad de procesamiento de información complementaria 250 está, por ejemplo, configurada para proveer un grupo actualizado de parámetros de mezcla ascendente para cada intervalo de actualización k de muestra de audio, aunque la información complementaria 212 se actualice sólo una vez por múltiples intervalos de actualización de muestra de audio k. Sin embargo, en algunas formas de realización la unidad de procesamiento de información complementaria 250 puede ser configurada para proveer un grupo actualizado de parámetros de mezcla ascendente suavizados temporalmente variables menos a menudo, por ejemplo sólo una vez por actualización de información complementaria SI, 212.
[0067] La unidad de procesamiento de información complementaria 250 comprende un determinador de información de entrada del parámetro de mezcla ascendente 252, configurado para recibir información complementaria 212 y derivar, teniendo en cuenta la misma, uno o más parámetros de mezcla ascendente (por ejemplo en forma de secuencia 254 de valores de magnitud de parámetros de mezcla ascendente y una secuencia 256 de valores de fase de parámetros de mezcla ascendente), que pueden ser considerados como información de entrada del parámetro de mezcla ascendente (que comprende, por ejemplo, información de magnitud de entrada 254 e información de fase de entrada 256). Por ejemplo, el determinador de información de entrada del parámetro de mezcla ascendente 252 puede combinar una pluralidad de pistas (Ej., ILD, ICC, ITD, IPD, OPD) para obtener información de entrada del parámetro de mezcla ascendente 254, 256, o puede individualmente evaluar una o más pistas. El determinador de información de entrada del parámetro de mezcla ascendente 252 está configurado para describir los parámetros de mezcla ascendente en forma de secuencia 254 de valores de magnitud de entrada (también designados como información de magnitud de entrada) y secuencia separada 256 de valores de fase de entrada (designados también como información de fase de entrada). Los elementos de la secuencia 256 de valores de fase de entrada pueden ser considerados como información de fase de entrada αn. Los valores de magnitud de entrada de las secuencia 254 pueden, por ejemplo, representar un valor absoluto de un número complejo y los valores de fase de entrada de la secuencia 256 pueden, por ejemplo, representar un valor de ángulo (o valor de fase) del número complejo (medido por ejemplo, con respecto al eje de parte real en un sistema de coordenadas ortogonal de parte real y parte imaginaria).
[0068] De esta manera, el determinador de información de entrada del parámetro de mezcla ascendente 252 puede proveer la secuencia 254 de valores de magnitud de entrada de parámetros de mezcla ascendente y la secuencia 256 de valores de fase de entrada de parámetros de mezcla ascendente. El determinador de información de entrada del parámetro de mezcla ascendente 252 puede estar configurado para derivar desde un grupo de información complementaria un grupo completo de parámetros de mezcla ascendente (por ejemplo, un grupo completo de elementos de matriz de la matriz H y un grupo completo de valores de fase α1, α2). Puede haber una asociación entre un grupo de información complementaria 212 y un grupo de parámetros de entrada de mezcla ascendente 254,256. En consecuencia, el determinador de información de entrada del parámetro de mezcla ascendente 252 puede estar configurado para actualizar los parámetros de entrada de mezcla ascendente de las secuencias 254, 256 una vez por intervalo de actualización del parámetro de mezcla ascendente, es decir, una vez por actualización del grupo de información complementaria.
[0069] La unidad de procesamiento de información complementaria además comprende un suavizador de parámetro
(a veces denominado “determinador de parámetro”) 260, descripto en detalle a continuación. El suavizador de
parámetro 260 está configurado para recibir la secuencia 254 de los valores de magnitud de entrada (valor real) de los parámetros de mezcla ascendente (o elementos de matriz) y la secuencia 256 de los (valor real) de los valores de fase de entrada de los parámetros de mezcla ascendente (o elementos de matriz), que pueden ser considerados como información de fase de entrada αn. Además, el suavizador de parámetro está configurado para proveer una secuencia de parámetros de mezcla ascendente suavizados temporalmente variables 262 teniendo en cuenta una suavización de la secuencia 254 y la secuencia 256.
[0070] El suavizador de parámetro 260 comprende un suavizador de valor de magnitud 270 y suavizador de valor de fase 272.
[0071] El suavizador de valor de magnitud está configurado para recibir las secuencia 254 y proveer, teniendo en cuenta la misma, una secuencia 274 de valores de magnitud suavizados de parámetros de mezcla ascendente (o de
~
elementos de matriz Hn). El suavizador de valor de magnitud 270 puede, por ejemplo, ser configurado para suavizar un valor de magnitud, analizado en detalle a continuación.
[0072] De modo similar, el suavizador de valor de fase 272 puede ser configurado para recibir la secuencia 256 y proveer, teniendo en cuenta la misma, una secuencia 276 de valores de fase suavizados temporalmente variables de parámetros de mezcla ascendente (o de valores de matriz). El suavizador de valor de fase 272 puede, por ejemplo, ser configurado para suavizar un algoritmo analizado en detalle a continuación.
[0073] En algunas formas de realización, el suavizador de valor de magnitud 270 y suavizador de valor de fase se configura para suavizar el valor de magnitud y valor de fase en forma separada o independiente. De esta manera, los valores de magnitud de la secuencia 254 no afectan la suavización del valor de fase, y los valores de fase de la secuencia 256 no afectan la suavización del valor de magnitud. Sin embargo, se presume que el suavizador de valor de magnitud 270 y suavizador de valor de fase 272 operan de modo sincronizado de manera que las secuencias 274, 276 comprenden pares correspondientes de valores de magnitud suavizados y valores de fase suavizados de parámetros de mezcla ascendente.
[0074] Típicamente, el suavizador de parámetro 260 actúa por separado en diferentes parámetros de mezcla ascendente o elementos de matriz. De esta manera, el suavizador de parámetro 260 puede recibir una secuencia 254 de valores de magnitud para cada parámetro de mezcla ascendente (entre una pluralidad de parámetros de mezcla ascendente) o elemento de matriz de la matriz H. De modo similar, el suavizador de parámetro 260 puede recibir una secuencia 256 de valores de fase de entrada αn para el ajuste de fase de cada canal de audio mezclado en forma ascendente.
2.6 Detalles Concernientes a la Suavización de Parámetros
[0075] A continuación se describen detalles de una forma de realización de la presente invención, que reducen los artefactos de procesamiento de fase causados por la cuantización de IPDs/OPDs y/o estimación de OPDs en un decodificador. Para simplificar, la siguiente descripción se restringe a una mezcla ascendente desde uno a dos canales sólo, sin restringir el caso general case de mezcla ascendente de m a n canales, donde se podrían aplicar las mismas técnicas.
[0076] El procedimiento de mezcla ascendente del decodificador, por ejemplo, de uno a dos canales se realiza mediante multiplicación de matriz de un vector con señal de mezcla descendente x (también designada x(k)), llamada señal seca, y una versión descorrelacionada de la señal de mezcla descendente q (también designada q(k)), llamada señal húmeda, con una matriz de mezcla ascendente H. La señal húmeda q ha sido generada alimentando la señal de mezcla descendente x por el filtro de descorrelación 240. La señal de mezcla ascendente y es un vector con el primer y segundo canal (Ej., y1(k) y y2(k)) de la salida. Todas las señales x, q, y pueden estar disponibles en una descomposición de frecuencia de valor complejo (Ej., representación de dominio de tiempo y frecuencia).
[0077] Esta operación de matriz se realiza (por ejemplo, en forma separada) para todas las muestras de sub bandas de cada banda de frecuencia (o al menos para algunas muestras de sub bandas de algunas bandas de frecuencia). Por ejemplo, la operación de matriz puede realizarse de acuerdo con la siguiente ecuación:
[
y y
][x]
= H
q .
[0078] Los coeficientes de la matriz de mezcla ascendente H derivan de las pistas espaciales, típicamente ILDs y ICCs, dando por resultado elementos de matriz de valor real que básicamente realizan una mezcla de las señales seca y húmeda para cada canal basado en ICCs, y ajustan los niveles de salida de los canales de salida como lo determinan las ILDs.
[0079] Para la transmisión pistas espaciales (Ej., ILD, ICC, ITD, IPD y/o OPD) es deseable (o necesario) cuantizar algunos o todos los tipos de parámetros en el codificador. Especialmente para escenarios de baja secuencia de bits es a menudo deseable (o necesario) usar una cuantización gruesa para reducir la cantidad de datos transmitidos. Sin embargo, para ciertas señales, una cuantización gruesa puede resultar en artefactos auditivos. Para reducir estos artefactos, se puede aplicar una suavización a los elementos de la matriz de mezcla ascendente H para suavizar la transición entre etapas de cuantizador adyacentes, que causan los artefactos.
[0080] La suavización se realiza, por ejemplo, mediante un simple filtrado paso bajo de los elementos de matriz:
~
~
Hn = δ Hn+(1- δ) Hn-1
[0081] Esta suavización puede, por ejemplo, realizarla el suavizador de valor de magnitud 270, donde la información de magnitud de entrada actual Hn (Ej. provista por el determinador de información de entrada del parámetro de
~
~
mezcla ascendente 252 y designada con 254) puede ser combinada con valores de magnitud suavizados previos (o matriz de magnitud) Hn-1, para obtener un valor de magnitud suavizado actual (o matriz de magnitud) Hn.
12 [0082] Como la suavización puede tener un efecto negativo en las porciones de señal, donde los parámetros espaciales cambian rápidamente, la suavización puede ser controlada por información adicional complementaria transmitida desde el codificador.
[0083] A continuación se describen la aplicación y determinación de valores de fase con mayor detalle. Si se usan IPDs y/o OPDs, se puede aplicar un desplazamiento de fase adicional a las señales de salida (por ejemplo, a
~
señales definidas por las muestras y1 (k) y y2 (k)). La IPD describe la diferencia de fase entre los dos canales (por ejemplo, la primera señal con canal de mezcla ascendente de fase ajustada definida por las muestras y 1 (k) y la
segunda señal con canal de mezcla ascendente de fase ajustada definida por las muestras definida por las muestras y 2 (k)) mientras que la OPD describe una diferencia de fase entre un canal y la mezcla descendente.
[0084] A continuación se explica la definición de IPDs y OPDs con referencia a la Fig. 3, que muestra una representación esquemática de las relaciones de fase entre la señal de mezcla descendente y una pluralidad de señales del canal. Con referencia a la Fig. 3, una fase de la señal de mezcla descendente (o de coeficiente espectral
~
x(k) de la misma) se representa por un primer indicador 310. Una fase de la primera señal de canal mezclada en1 (k) de la misma) se representa por un segundo
~ forma ascendente con fase ajustada (o de coeficiente espectral y
indicador 320. Una diferencia de fase entre la señal de mezcla descendente (o valor espectral o coeficiente de la misma) y primera señal de canal mezclada en forma ascendente con fase ajustada (o coeficiente espectral de la
misma) se designa con OPD1. Una segunda señal de canal mezclada en forma ascendente con fase ajustada (o de coeficiente espectral y 2 (k) de la misma) se representa por un tercer indicador 330. Una diferencia de fase entre la señal de mezcla descendente (o coeficiente espectral de la misma) y segunda señal de canal mezclada en forma
ascendente con fase ajustada (o de coeficiente espectral) se designa con OPD2. Una diferencia de fase entre primera señal de canal mezclada en forma ascendente con fase ajustada (o coeficiente espectral de la misma) y segunda señal de canal mezclada en forma ascendente con fase ajustada señal (o coeficiente espectral de la misma) se designa con IPD.
[0085] Para reconstruir las propiedades de fase de la señal original señal (por ejemplo, para proveer la primera señal de canal mezclada en forma ascendente con fase ajustada y segunda señal de canal mezclada en forma ascendente con fase ajustada con fases apropiadas teniendo en cuenta la señal seca) las OPDs para ambos canales deberían ser conocidas. A menudo, la IPD se transmite junto con una OPD (la segunda OPD puede ser
~
calculada de estas). Para reducir la cantidad de datos transmitidos, es posible sólo transmitir IPDs y estimar las OPDs en el decodificador, utilizando la información de fase de la señal de mezcla descendente junto con las ILDs y IPDs transmitidas. Este proceso puede, por ejemplo, realizarlo el determinador de información de entrada del parámetro de mezcla ascendente 252.
[0086] La reconstrucción de fase en el decodificador (por ejemplo, en el aparato 200) se realiza mediante rotación compleja de señales de sub banda de salida (por ejemplo de señales descriptas por el coeficiente espectral y1 (k), y2 (k)) de acuerdo con la siguiente ecuación:
[0087] En la ecuación anterior, los ángulos α1 y α2 son iguales a OPDs para los dos canales (o, por ejemplo, OPDs suavizados).
[0088] Como se describe antes, la cuantización gruesa de parámetros (por ejemplo parámetros ILD y/o parámetros ICC) pueden resultar en artefactos auditivos, verdaderos para la cuantización de IPDs y OPDs. A medida que se aplica la suavización anterior a los elementos de matriz de mezcla ascendente Hn, sólo se reducen los artefactos causados por la cuantización de ILDs y ICCs, mientras que los causados por la cuantización de parámetros de fase no se ven afectados .
[0089] Asimismo, los artefactos adicionales pueden ser introducidos por la rotación de fase con variante de tiempo arriba descripta, aplicada a cada canal de salida. Se halló que si los ángulos de desplazamiento de fase α1 y α2 fluctúan rápidamente con el tiempo, la el ángulo de rotación aplicado puede causar una inclinación corta o cambio de frecuencia de señal instantánea.
[0090] Ambos problemas pueden ser reducidos significativamente aplicando una versión modificada de la suavización anterior a los ángulos α1 y α2. Como en este caso, el filtro de suavización se aplica a ángulos, que se despliegan cada 2π, es preferible modificar el filtro de suavización con un denominado despliegue. En consecuencia,
~
un valor de fase suavizado an se computa de acuerdo con el siguiente algoritmo, que típicamente provee una limitación de cambio de fase:
5a( -2) (1-5a mod2d2 if aa
J+ ) J >J
nn-1111 nn-111
{
{
n (1 5) else
5a+
[0091] A continuación se analiza la funcionalidad del algoritmo anterior con referencia a las Figs. 4a, 4b, 5a y 5b.
~
Con referencia a la ecuación anterior o algoritmo para la computación del valor de fase suavizado actual an, se
~
puede observar que el valor de fase suavizado actual an se obtiene mediante combinación lineal ponderada, sin
~
sumando adicional de la información de fase de entrada actual αn y el valor de fase suavizado previo an-1, si una
~
diferencia entre los valores αn y an-1 es menor a o igual a π (“otro” caso de la ecuación anterior). Asumiendo que δ es un parámetro entre cero y uno (excluyendo cero y uno), que determina (o representa) una constante de tiempo
~~
del proceso de suavización, el valor de fase suavizado actual an estará entre los valores αn y an-1. Por ejemplo, si
~~
δ = 0,5, el valor de an es el promedio (media aritmética) entre αn y an-1.
~
[0092] Sin embargo, si la diferencia entre αn y an-1 es mayor a π, el primer caso (línea) de la ecuación anterior
~
queda cumplido. En este caso, el valor de fase suavizado actual an se obtiene mediante combinación lineal de αn y
~
an-1, considerando un término de modificación de fase constante -2πδ. En consecuencia, se logra mantener la
~~
diferencia entre an y an-1 lo suficientemente baja. Un ejemplo de esta situación se muestra en la Fig. 4a, donde la
~~
fase an-1 se ilustra por un primer indicador 410, la fase αn se ilustra por un segundo indicador 412 y la fase an se ilustra con un tercer indicador 414.
~~
[0093] La Fig. 4b ilustra la misma situación para diferentes valores an-1 y αn. nuevamente, los valores de fase an-1,
~
αn y an se ilustran por los indicadores 450, 452, 454.
~~
[0094] Nuevamente, se logra que la diferencia de ángulo entre an y an-1 se mantenga baja. En ambos casos, la
~
dirección definida por el valor de fase an es el menor de dos regiones de ángulo, donde la primera de las dos regiones de ángulo sería cubierta al rotar el indicador 410, 450 hacia el indicador 412, 452 en dirección matemáticamente positiva (contra las agujas del reloj), y donde la segunda de las dos regiones de ángulo sería cubierta al rotar el indicador 412, 452 hacia los indicadores 410, 450 en dirección matemáticamente positiva (contra las agujas del reloj).
~~
[0095] Sin embargo, se descubrió que la diferencia entre valores de fase αn y an-1 es menor a -π, el valor de an se
~
obtiene utilizando el segundo caso (línea) de la ecuación anterior. El valor de fase an se obtiene mediante
~
combinación lineal de los valores de fase αn y an-1, con término de adaptación de fase constante 2πδ. Ejemplos de
~
este caso, donde αn -an-1 es menor a -π, se ilustran en las Figs. 5a y 5b.
[0096] Para sintetizar, el suavizador de valor de fase 272 puede ser configurado para seleccionar diferentes reglas de cálculo de valor de fase (que pueden ser reglas de combinación lineal) dependiendo de la diferencia entre los
~
valores αn y an-1.
2.7 Extensiones Opcionales del Concepto de Suavización
[0097] A continuación se analizan algunas extensiones opcionales de la suavización de valor de fase anterior. Como para los demás parámetros (Ej., ILD, ICC, ITD) puede haber señales, donde sea necesario un rápido cambio de ángulo de rotación, por ejemplo, si el IPD de la señal original (por ejemplo una señal procesada por codificador) cambia rápidamente. Para tales señales, la suavización, realizada por el suavizador de valor de fase 272, (en algunos casos) tendría efectos negativos en la calidad de salida y no se aplicarían en tales casos. Para evitar posibles márgenes libres en secuencias de bits necesarios para controlar la suavización desde el codificador para cada banda de procesamiento de señal, un control de suavización adaptativo (por ejemplo, implementado utilizando un controlador de suavización) puede usarse en el decodificador (por ejemplo en el aparato 200): la IPD final (es decir, la diferencia entre los dos ángulos suavizados, por ejemplo entre los ángulos α1 (k) y α2 (k)) es computa y compara con la IPD transmitida (por ejemplo diferencia de fase entre canales descripta por la información de fase de entrada αn). Si una diferencia es mayor a cierto valor umbral, la suavización puede ser desactivada y los ángulos no
procesados (por ejemplo ángulos αn descriptos por la información de fase de entrada y provistos por el determinador
de información de entrada de parámetro de mezcla ascendente) puede usarse (por ejemplo por el ajustador de fase 233), y el ángulo con filtrado paso bajo (Ej., valores de fase suavizados
~ a
n provistos por el suavizador de valor de
fase 272) puede aplicarse a la señal de salida (por ejemplo mediante el ajustador de fase 233).
[0098] En una versión avanzada (opcional), el algoritmo, aplicado al suavizador de valor de fase 272, podría extenderse utilizando una constante de tiempo de filtrado variable, modificada teniendo en cuenta la diferencia actual
~ a
entre IPDs procesadas y no procesadas. Por ejemplo, el valor del parámetro δ (que determina la constante de tiempo de filtrado) puede ajustarse en dependencia de una diferencia entre el valor de fase suavizado actual
n y
valor de fase de entrada actual αn, o en dependencia de la diferencia entre el valor de fase suavizado previos
~ a
n-1 y
valor de fase de entrada actual αn.
[0099] En algunas formas de realización, además se puede transmitir un solo bit (opcionalmente) en la corriente de bits (que representa la señal de audio con mezcla descendente 210 e información complementaria 212) para activar
o desactivar por completo la suavización desde el codificador para todas las bandas en caso de ciertas señales críticas, para las cuales el control de suavización adaptativo no arroja óptimos resultados.
3.
Conclusión
[0100] Para sintetizar lo anterior, se ha descripto un concepto general de procesamiento de fase adaptativo para la codificación de audio paramétrica con múltiples canales. Las formas de realización de acuerdo con la invención reemplaza otras técnicas reduciendo artefactos en la señal de salida causados por cuantización gruesa o rápidos cambios de parámetros de fase.
4.
Procedimiento
[0101] Una forma de realización de acuerdo con la invención comprende un procedimiento para mezclar en forma ascendente una señal de audio con mezcla descendente que describe uno o más canales de audio de mezcla descendente en una señal de audio mezclada en forma ascendente que describe una pluralidad de canales de audio mezclados en forma ascendente. La Fig. 6 muestra un diagrama de flujo de dicho procedimiento, designado en su totalidad como 700.
[0102] El procedimiento 700 comprende un paso 710 que combina una versión ajustada a escala de un valor de fase suavizado previo con una versión ajustada a escala de información de fase de entrada actual utilizando un algoritmo de limitación de cambio de fase, para determinar un valor de fase suavizado actual teniendo en cuenta el valor de fase suavizado previo y la información de fase de entrada.
[0103] El procedimiento 700 además comprende un paso 720 que aplica parámetros de mezcla ascendente temporalmente variables a una señal de audio de mezcla descendente para obtener una señal de audio mezclada en forma ascendente, donde el parámetro con mezcla ascendente temporalmente variable comprende valores de fase temporalmente suavizados.
[0104] Naturalmente, el procedimiento 700 puede reemplazarse por las características y funcionalidades, descriptas en la presente con respecto al aparato de la invención.
5. Alternativas de Implementación
[0105] Aunque se analizaron aspectos del contexto de un aparato, queda claro que estos aspectos también representan una descripción del procedimiento correspondiente, donde un bloque o dispositivo corresponde a un paso del procedimiento o rasgo del paso del procedimiento. En forma análoga, los aspectos del contexto del procedimiento también representan una descripción de un bloque correspondiente o ítem o rasgo de un aparato correspondiente. Algunos o todos los pasos del procedimiento pueden ser ejecutados (o utilizando) un aparato de hardware, como por ejemplo, microprocesador, computadora programable o circuito electrónico. En algunas formas de realización, uno o más de los pasos más importantes del procedimiento pueden ser ejecutados por tal aparato.
[0106] Dependiendo de ciertos requisitos de implementación, las formas de realización de la invención pueden implementarse en hardware o software. La implementación puede realizarse utilizando un medio de almacenamiento digital por ejemplo un disco blando, DVD, Blue-Ray, CD, ROM, PROM, EPROM, EEPROM o memoria FLASH, con señales de control legibles en forma electrónica almacenadas en los mismos, que cooperan (o pueden cooperar) con un sistema de computación programable de modo que el respectivo procedimiento pueda implementarse. Por lo tanto, el medio de almacenamiento digital puede ser legible por computadora.
[0107] Algunas formas de realización de acuerdo con la invención comprenden un portador de datos con señales de control legibles en forma electrónica, capaces de cooperar con un sistema de computación programable, de modo que el respectivo procedimiento pueda implementarse.
[0108] Generalmente, las formas de realización de la presente invención pueden implementarse como producto de programa de computación con un código de programa, el código de programa es operativo para realizar uno de los procedimientos cuando el producto de programa de computación opera en una computadora. El código de programa puede por ejemplo ser almacenado en un portador legible por máquina.
[0109] Otras formas de realización comprenden el programa de computación para desarrollar uno de los procedimientos descriptos en la presente, almacenados en un portador legible por máquina.
[0110] En otras palabras, una forma de realización del procedimiento de invención, es por lo tanto un programa de computación con un código de programa para desarrollar uno de los procedimientos de la presente, cuando el programa de computación opera en una computadora.
[0111] Otra forma de realización del procedimiento de invención es, por lo tanto, un portado de datos (o medio de almacenamiento digital o medio legible por computadora) que comprende, grabado en los mismos, el programa de computación para desarrollar uno de los procedimientos de la presente.
[0112] Otra forma de realización del procedimiento es, por lo tanto, una corriente de datos o secuencia de señales que representa el programa de computación para desarrollar uno de los procedimientos de la presente. La corriente de datos o secuencia de señales puede por ejemplo ser configurado para ser transferido por conexión de comunicación de datos, por ejemplo vía Internet.
[0113] Otra forma de realización comprende un medio de procesamiento, por ejemplo una computadora, o dispositivo lógico programable, configurado para o adaptado para desarrollar uno de los procedimientos de la presente.
[0114] Otra forma de realización comprende una computadora con un programa de computación para desarrollar uno de los procedimientos de la presente.
[0115] En algunas formas de realización, un dispositivo lógico programable (por ejemplo una matriz de puertas programables por campo) puede usarse para desarrollar algunas o todas las funcionalidades de los procedimientos de la presente. En algunas formas de realización, una matriz de puertas programables por campo puede cooperar con un microprocesador para desarrollar uno de los procedimientos de la presente. Generalmente, los procedimientos son preferentemente desarrollados por un aparato de hardware.
[0116] Las formas de realización anteriores son meramente ilustrativas para los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descriptos en la presente resultarán evidentes para los expertos en la técnica. Por lo tanto se intenta quedar limitado sólo por el alcance de las reivindicaciones de la patente y no por los detalles específicos presentados a modo de descripción y explicación de las formas de realización de la presente.
Referencias
[0117]
[l]C. Faller y F. Baumgarte, "Representación eficiente de audio espacial utilizando parametrización perceptual ", IEEE WASPAA, Mohonk, NY, Octubre 2001
[2]F. Baumgarte y C. Faller, "Estimación de pistas espaciales auditivas para la codificación de pista binaural", ICASSP, Orlando, FL, Puede 2002
[3]C. Faller y F. Baumgarte, "Codificación de pista binaural: nueva y eficiente representación de audio espacial," ICASSP, Orlando, FL, Puede 2002
[4]C. Faller y F. Baumgarte, "Codificación de pista binaural aplicada a compresión de audio con rendimiento flexible", Convención AES 113º, Los Angeles, Preimpresión 5686, Octubre 2002
[5]C. Faller y F. Baumgarte, "Codificación de pista binaural - Parte II: Esquemas y aplicaciones," IEEE Trans, sobre discurso y audio Proc., vol. 11, no. 6, Nov. 2003
[6]J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, " Codificación de audio espacial paramétrica de alta calidad con baja secuencia de bits", Convención AES 116º, Berlin, Preimpresión 6072, Puede 2004
[7]E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, " Codificación estéreo paramétrica con baja complejidad", Convención AES 116º, Berlin, Preimpresión 6073, Puede 2004
[8]ISO/IEC JTC 1/SC 29/WG 11, 23003-1, Envolvente MPEG
[9]J. Blauert, Audición espacial: Psicofísica de localización de sonido humano, The MIT Press, Cambridge, MA, edición revisada 1997

Claims (12)

  1. REIVINDICACIONES
    1. Un aparato (100; 200) para mezclar en forma ascendente una señal de audio con mezcla descendente (110;210) que describe uno o más canales de audio de mezcla descendente en una señal de audio mezclada en forma ascendente (120;214) que describe una pluralidad de canales de audio mezclada en forma ascendente, el aparato comprende:
    un mezclador ascendente (130;230) configurado para aplicar parámetros de mezcla ascendente temporalmente variables (144; 262) para mezclar en forma ascendente la señal de audio con mezcla descendente, para obtener la señal de audio mezclada en forma ascendente, donde los parámetros de mezcla ascendente temporalmente variables comprenden valores de fase suavizados temporalmente variables (144a; 270);
    un determinador de parámetro (140; 250), donde el determinador de parámetro está configurado para obtener uno o más parámetros de mezcla ascendente temporalmente suavizados (αn) para usa por el mezclador ascendente (130;230) teniendo en cuenta una información de entrada de parámetro cuantizada (142; 212),
    donde el determinador de parámetro (140;250) está configurado para combinar una versión ajustada a escala ((1
    ~~
    δ)an-1) de un valor de fase suavizado previo (an-1) con una versión ajustada a escala (δαn) de una información de fase de entrada (αn) utilizando un algoritmo de limitación de cambio de fase, para determinar un valor de fase
    ~
    suavizado actual (an) teniendo en cuenta el valor de fase suavizado previo y la información de fase de entrada.
    ~
    donde el determinador de parámetro está configurado para obtener un valor de fase suavizado actual an de acuerdo con las siguiente ecuación:
    5a J+ )
    ( -2) (1-5a mo J if aa >J
    nn-1111 nn-111
    {
    n (1 5) else
    5a+
    donde
    ~
    an-1 designa el valor de fase suavizado previo; αn designa la información de fase de entrada;
    “mod” designa un operador de MÓDULO; y
    δ designa el parámetro de suavización, cuyo valor es un intervalo entre cero y uno, excluyendo los límites
    del intervalo.
  2. 2. El aparato (100;200) de acuerdo con la reivindicación 1, donde el determinador de parámetro (140;250) está
    ~~
    configurado para combinar la versión ajustada a escala (1-δ)an-1) del valor de fase suavizado previo (an-1) con la versión ajustada a escala (δαn) de la información de fase de entrada (αn), de modo que el valor de fase suavizado
    ~
    actual (an) se encuentra en una región de ángulo menor entre una primera región de ángulo y una segunda región de ángulo, donde la primera región de ángulo se extiende, en una dirección matemáticamente positiva, desde una
    ~
    primera dirección de inicio definida por el valor de fase suavizado previo ( an-1) hasta una primera dirección final definida por la información de fase de entrada (αn), y donde la segunda región de ángulo se extiende en una dirección matemáticamente positiva, desde una segunda dirección de inicio definida por la información de fase de
    ~
    entrada (αn) hasta una segunda dirección final definida por el valor de fase suavizado previo (an-1).
  3. 3. El aparato (100;200) de acuerdo con la reivindicación 1 o reivindicación 2, donde el determinador de parámetro (140;250) está configurado para seleccionar una regla de combinación entre una pluralidad de diferentes
    ~
    reglas de combinación dependiendo de una diferencia (αn-an-1) entre la información de fase de entrada (αn) y el
    ~~
    valor de fase suavizado previo (an-1), y para determinar el valor de fase suavizado actual ( an) utilizando la regla de combinación seleccionada.
  4. 4. El aparato (100;200) de acuerdo con la reivindicación 3, donde el determinador de parámetro (140;250) está configurado para seleccionar una regla de combinación de fase básica, si la diferencia entre la información de fase
    ~
    de entrada (αn) y el valor de fase suavizado previo ( an-1) se encuentra entre –π y +π, y para seleccionar por otro lado una o más regla de combinación de fase de adaptación diferente;
    donde la regla de combinación de fase básica define una combinación lineal, sin sumando constante de la versión
    ~
    ajustada a escala (δαn) de la información de fase de entrada y versión ajustada a escala ((1-δ)
    a
    n-1) del valor de
    fase suavizado previo; y
    donde la una o más regla de combinación de adaptación de fase definen una combinación lineal, tomando en cuenta un sumando de adaptación de fase constante (+π, -π), de la versión ajustada a escala de la información de fase de entrada y la versión ajustada a escala del valor de fase suavizado previo.
  5. 5. El aparato (100;200) de acuerdo con una de las reivindicaciones 1 a 4, donde el determinador de parámetro (140;250) comprende un controlador de suavización,
    donde el controlador de suavización está configurado para desactivar una funcionalidad de suavización de valor de
    ~
    fase en forma selectiva si la diferencia entre una cantidad de fase suavizada (
    a
    n) y la cantidad de fase de entrada
    correspondiente (αn) es mayor a un valor umbral predeterminado.
  6. 6.
    El aparato (100;200) de acuerdo con la reivindicación 5, donde el controlador de suavización está configurado para evaluar, como la cantidad de fase suavizada, una diferencia entre dos valores de fase suavizados (α1, α2), y para evaluar, como la cantidad de fase de entrada correspondiente, una diferencia entre dos valores de fase de entrada (256) correspondiente a los dos valores de fase suavizados (α1, α2).
  7. 7.
    El aparato (100;200) de acuerdo con una de las reivindicaciones 1 a 6, donde el mezclador ascendente (130;230) está configurado para aplicar, para una porción de tiempo dada, diferentes rotaciones de fase temporalmente suavizadas (α1, α2), definidas por diferentes valores de fase suavizados (α1, α2), para obtener
    ~~
    señales ( y (k),y (k)) de diferentes canales de audio mezclados en forma ascendente con diferencia de fase
    12 entre canales, si se activa una función de suavización, y para aplicar rotaciones de fase no suavizadas en forma temporal (256), definidas por diferentes valores de fase no suavizados, para obtener señales de diferentes canales de audio mezclados en forma ascendente con diferencia de fase entre canales, si se desactiva una función de suavización;
    donde el determinador de parámetro (140;250) comprende un controlador de suavización; y
    donde el controlador de suavización está configurado para desactivar una función de suavización del valor de fase en forma selectiva si una diferencia entre los valores de fase suavizados (α1, α2) aplicados para obtener las señales
    ~~
    ( y (k),y (k)) de los diferentes canales de audio mezclados en forma ascendente difiere de un valor de diferencia
    12 de fase entre canales no suavizado (212), recibido por el aparato (100;200) o derivado (252) de la información recibida (212) por el aparato, por más de un valor umbral predeterminado.
  8. 8. El aparato (100;200) de acuerdo con una de las reivindicaciones 1 a 7, donde el determinador de parámetro (140;250) está configurado para ajustar una constante de tiempo de filtrado (δ) para determinar una secuencia (262)
    ~~
    de valores de fase suavizados (
    a
    n) dependiendo de una diferencia actual entre un valor de fase suavizado (
    a
    n) y
    el correspondiente valor de fase de entrada (αn).
  9. 9. El aparato (100;200) de acuerdo con una de las reivindicaciones 1 a 8, donde el determinador de
    parámetro (140;250) está configurado para ajustar una constante de tiempo de filtrado (δ) para determinar una
    ~
    secuencia (262) de valores de fase suavizados (
    a
    n) dependiendo de una diferencia entre diferencia de fase
    suavizada entre canales definida por la diferencia entre dos valores de fase suavizados (α1, α2) asociados con diferentes canales de la señal de audio mezclada en forma ascendente, y una diferencia de fase entre canales no suavizada, definida por una información de diferencia de fase entre canales no suavizada (212).
  10. 10.
    El aparato (100;200) de acuerdo con una de las reivindicaciones 1 a 9, donde el aparato para mezclar en forma ascendente está configurado para activar y desactivar una función de suavización de valor de fase en forma selectiva dependiendo de una información extraída de una corriente de bits de audio.
  11. 11.
    Un procedimiento (700) para mezclar en forma ascendente una señal de audio con mezcla descendente que describe uno o más canales de audio de mezcla descendente en una señal de audio mezclada en forma ascendente que describe una pluralidad de canales de audio mezclados en forma ascendente, el procedimiento comprende:
    Combinar (710) una versión ajustada a escala del valor de fase suavizado previo con una versión ajustada a escala de una información de fase de entrada actual utilizando un algoritmo de limitación de cambio de fase, para determinar un valor de fase actual temporalmente suavizado teniendo en cuenta el valor de fase suavizado previo y la información de fase de entrada; y
    aplicar (720) parámetros de mezcla ascendente temporalmente variables, para mezclar en forma ascendente una señal de audio con mezcla descendente para obtener una señal de audio mezclada en forma ascendente, donde los parámetros de mezcla ascendente temporalmente variables comprenden valores de fase temporalmente suavizados.
    ~
    5 donde el valor de fase suavizado actual an se obtiene de acuerdo con las siguiente ecuación:
    5a J+ )
    ( -2) (1-5a mo J if aa >J
    nn-1111 nn-111
    {
    n (1 5) else
    5a+
    donde 10
    ~
    an-1 designa el valor de fase suavizado previo; αn designa la información de fase de entrada;“mod” designa un operador de MÓDULO; y δ designa el parámetro de suavización, cuyo valor es un intervalo entre cero y uno, excluyendo los límites 15 del intervalo.
  12. 12. Un programa de computación para desarrollar el procedimiento de acuerdo con la reivindicación 11, cuando el programa de computación se ejecuta en una computadora.
ES10716780.1T 2009-04-08 2010-04-01 Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase Active ES2452569T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16760709P 2009-04-08 2009-04-08
US167607P 2009-04-08
PCT/EP2010/054448 WO2010115850A1 (en) 2009-04-08 2010-04-01 Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing

Publications (1)

Publication Number Publication Date
ES2452569T3 true ES2452569T3 (es) 2014-04-02

Family

ID=42335156

Family Applications (2)

Application Number Title Priority Date Filing Date
ES10716780.1T Active ES2452569T3 (es) 2009-04-08 2010-04-01 Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase
ES11183975.9T Active ES2511390T3 (es) 2009-04-08 2010-04-01 Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor de fase

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES11183975.9T Active ES2511390T3 (es) 2009-04-08 2010-04-01 Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor de fase

Country Status (20)

Country Link
US (6) US9053700B2 (es)
EP (2) EP2405425B1 (es)
JP (1) JP5358691B2 (es)
KR (1) KR101356972B1 (es)
CN (2) CN102257563B (es)
AR (1) AR076238A1 (es)
AU (1) AU2010233863B2 (es)
BR (1) BRPI1004215B1 (es)
CA (1) CA2746524C (es)
CO (1) CO6501150A2 (es)
ES (2) ES2452569T3 (es)
HK (2) HK1163915A1 (es)
MX (1) MX2011006248A (es)
MY (1) MY160545A (es)
PL (2) PL2405425T3 (es)
RU (1) RU2550525C2 (es)
SG (1) SG174117A1 (es)
TW (1) TWI420512B (es)
WO (1) WO2010115850A1 (es)
ZA (1) ZA201103703B (es)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
WO2011039668A1 (en) * 2009-09-29 2011-04-07 Koninklijke Philips Electronics N.V. Apparatus for mixing a digital audio
US9424852B2 (en) 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
ITTO20120067A1 (it) * 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
EP2834814B1 (en) 2012-04-05 2016-03-02 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
RU2625945C2 (ru) 2013-01-29 2017-07-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
SG11201600466PA (en) * 2013-07-22 2016-02-26 Fraunhofer Ges Forschung Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
CN105531761B (zh) * 2013-09-12 2019-04-30 杜比国际公司 音频解码系统和音频编码系统
CN105531928B (zh) 2013-09-12 2018-10-26 杜比实验室特许公司 音频编解码器的系统方面
EP2854133A1 (en) 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
KR102244379B1 (ko) 2013-10-21 2021-04-26 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
SG11201602628TA (en) 2013-10-21 2016-05-30 Dolby Int Ab Decorrelator structure for parametric reconstruction of audio signals
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
KR102486338B1 (ko) 2014-10-31 2023-01-10 돌비 인터네셔널 에이비 멀티채널 오디오 신호의 파라메트릭 인코딩 및 디코딩
WO2016168408A1 (en) 2015-04-17 2016-10-20 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
KR102372931B1 (ko) 2015-06-26 2022-03-11 칸도우 랩스 에스에이 고속 통신 시스템
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
AU2017357453B2 (en) * 2016-11-08 2021-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
CN110419079B (zh) 2016-11-08 2023-06-27 弗劳恩霍夫应用研究促进协会 用于下混频至少两声道的下混频器和方法以及多声道编码器和多声道解码器
US10366695B2 (en) 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
KR102452390B1 (ko) 2017-12-28 2022-10-06 칸도우 랩스 에스에이 동기식으로 스위칭된 다중 입력 복조 비교기
US11523238B2 (en) * 2018-04-04 2022-12-06 Harman International Industries, Incorporated Dynamic audio upmixer parameters for simulating natural spatial variations
CN108770120B (zh) * 2018-05-25 2021-03-23 上海乘讯信息科技有限公司 一种智能通道状态灯
EP3671741A1 (en) 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
EP3726730B1 (en) * 2019-04-17 2021-08-25 Goodix Technology (HK) Company Limited Peak current limiter
CN110491366B (zh) * 2019-07-02 2021-11-09 招联消费金融有限公司 音频平滑处理方法、装置、计算机设备和存储介质
TWI805019B (zh) * 2020-10-09 2023-06-11 弗勞恩霍夫爾協會 使用參數平滑處理編碼音頻場景的裝置、方法或電腦程式
MX2023003962A (es) * 2020-10-09 2023-05-25 Fraunhofer Ges Forschung Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una conversion de parametros.
US11533576B2 (en) * 2021-03-29 2022-12-20 Cae Inc. Method and system for limiting spatial interference fluctuations between audio signals

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6737572B1 (en) * 1999-05-20 2004-05-18 Alto Research, Llc Voice controlled electronic musical instrument
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
ES2261637T3 (es) 2001-04-09 2006-11-16 Koninklijke Philips Electronics N.V. Sistema de codificacion del habla adpcm, con filtros de difuminado de fase y difuminado de fase inverso.
US20050228648A1 (en) * 2002-04-22 2005-10-13 Ari Heikkinen Method and device for obtaining parameters for parametric speech coding of frames
US8340302B2 (en) 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
WO2007091845A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
CN101379555B (zh) * 2006-02-07 2013-03-13 Lg电子株式会社 用于编码/解码信号的装置和方法
RU2343563C1 (ru) * 2007-05-21 2009-01-10 Федеральное государственное унитарное предприятие "ПЕНЗЕНСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ ИНСТИТУТ" (ФГУП "ПНИЭИ") Способ передачи и приема закодированной речи
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
EP2169665B1 (en) 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8346379B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal

Also Published As

Publication number Publication date
US10580418B2 (en) 2020-03-03
JP2012512438A (ja) 2012-05-31
CA2746524A1 (en) 2010-10-14
CN103325374B (zh) 2017-06-06
CN102257563B (zh) 2013-09-25
HK1163915A1 (en) 2012-09-14
PL2394268T3 (pl) 2014-06-30
SG174117A1 (en) 2011-10-28
RU2550525C2 (ru) 2015-05-10
RU2011123124A (ru) 2012-12-20
US20200168233A1 (en) 2020-05-28
US20220358939A1 (en) 2022-11-10
EP2394268B1 (en) 2014-01-08
ZA201103703B (en) 2012-02-29
CA2746524C (en) 2015-03-03
HK1166174A1 (en) 2012-10-19
US20180358026A1 (en) 2018-12-13
US20110255714A1 (en) 2011-10-20
TWI420512B (zh) 2013-12-21
US10056087B2 (en) 2018-08-21
AU2010233863A1 (en) 2010-10-14
MY160545A (en) 2017-03-15
KR20110095339A (ko) 2011-08-24
US9053700B2 (en) 2015-06-09
EP2394268A1 (en) 2011-12-14
AR076238A1 (es) 2011-05-26
PL2405425T3 (pl) 2014-12-31
CN102257563A (zh) 2011-11-23
BRPI1004215A2 (pt) 2016-12-06
US20170301356A1 (en) 2017-10-19
KR101356972B1 (ko) 2014-02-05
US20150131801A1 (en) 2015-05-14
ES2511390T3 (es) 2014-10-22
US9734832B2 (en) 2017-08-15
MX2011006248A (es) 2011-07-20
BRPI1004215B1 (pt) 2021-08-17
CO6501150A2 (es) 2012-08-15
US11430453B2 (en) 2022-08-30
EP2405425B1 (en) 2014-07-23
JP5358691B2 (ja) 2013-12-04
TW201118860A (en) 2011-06-01
CN103325374A (zh) 2013-09-25
AU2010233863B2 (en) 2013-09-26
WO2010115850A1 (en) 2010-10-14
EP2405425A1 (en) 2012-01-11

Similar Documents

Publication Publication Date Title
ES2452569T3 (es) Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase
JP7269279B2 (ja) 無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム
ES2768052T3 (es) Aparatos y procedimientos para codificar o decodificar una señal de audio multicanal usando sincronización de control de trama
ES2934646T3 (es) Sistema de procesamiento de audio
ES2910658T3 (es) Codificador de audio para la codificación de una señal de múltiples canales y un decodificador de audio para la decodificación de una señal de audio codificada
JP6735053B2 (ja) マルチチャネル符号化におけるステレオ充填装置及び方法
ES2706490T3 (es) Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales
CA2572805C (en) Audio signal decoding device and audio signal encoding device
ES2952871T3 (es) Concepto para puentear el espacio entre codificación parámetrica de audio multicanal y codificación multicanal envolvente matricial
ES2899286T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
ES2703327T3 (es) Codificador, decodificador y métodos para codificación espacial de objetos de audio de multirresolución retrocompatible