MX2013002188A - Aparato para generar una señal decorrelacionada utilizando informacion de fase transmitida. - Google Patents

Aparato para generar una señal decorrelacionada utilizando informacion de fase transmitida.

Info

Publication number
MX2013002188A
MX2013002188A MX2013002188A MX2013002188A MX2013002188A MX 2013002188 A MX2013002188 A MX 2013002188A MX 2013002188 A MX2013002188 A MX 2013002188A MX 2013002188 A MX2013002188 A MX 2013002188A MX 2013002188 A MX2013002188 A MX 2013002188A
Authority
MX
Mexico
Prior art keywords
signal
transient
component
phase
signal component
Prior art date
Application number
MX2013002188A
Other languages
English (en)
Inventor
Juergen Herre
Sascha Disch
Achim Kuntz
Fabian Kuech
Johannes Hilpert
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44509236&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MX2013002188(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2013002188A publication Critical patent/MX2013002188A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Abstract

Un aparato para generar una señal decorrelacionada que comprende una unidad receptora (650) para recibir información de fase, un separador de componentes transitorios (310; 410; 510; 610; 710; 910), un deorreIacionador de componentes transitorios (320; 420; 520; 620; 720; 920), un segundo decorrelacionador (330; 430; 530; 630; 730; 930) y una unidad combinadora (340; 440; 540; 640; 740; 940), en donde el separador de componentes transitorios (310; 410; 510; 610; 710; 910) está adaptado para separar una señal de entrada en un primer componente de señal y un segundo componente de señal tal que el primer componente de señal comprende porciones de señal transitorias de la señal de entrada y tal que el segundo componente de señal comprende porciones de señal no transitorias de la señal de entrada El decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) está adaptado para aplicar la información de fase recibida por la unidad receptora (650) a un componente de señal transitorio.

Description

Aparato para Generar una Señal Decorrelacionada usando información de Fase transmitida CAMPO DE LA INVENCIÓN El presente invento se refiere al campo de procesamiento de audio y decodificación de audio, en particular a decodificar una señal que comprende componentes transitorios.
BREVE DESCRIPCIÓN DE LA INVENCIÓN En los últimos años avanzó de muchas maneras el procesamiento y/o la decodificación de audio. En particular, se hacen cada vez más importantes las aplicaciones de audio espacial. Con frecuencia se usa procesamiento de señal de audio para decorrelacionar o reproducir señales. Asimismo, la decorrelación y la reproducción de señales se emplean en el proceso de mezclado hacia arriba mono a estéreo, mezclado hacia arriba mono/estéreo a multicanal, reverberación artificial, ampliación de estéreo o mezclado/reproducción interactivo con el usuario.
Diversos sistemas de procesamiento de señal de audio emplean decorrelacionadores. Un ejemplo importante es la aplicación de sistemas decorrelacionadores en decodificadores de audio espacial paramétricos para recuperar propiedades de decorrelación específicas entre dos o más señales que son reconstruidas a partir de una o varias señales mezcladas hacia abajo. La aplicación de decorrelacionadores mejora significativamente la calidad perceptual de la señal de salida, por ejemplo, cuando se compara con estéreo de intensidad. Específicamente, el uso de decorrelacionadores permite la correcta síntesis de sonido espacial con una amplia imagen de sonido, varios objetos de sonido concurrentes y/o atmósfera. Sin embargo, también se sabe que los decorrelacionadores introducen artefactos como cambios en la estructura temporal de la señal, timbre, etc.
Otros ejemplos de aplicación de decorrelacionadores en procesamiento de audio son, por ejemplo, la generación de reverberación artificial para cambiar la impresión espacial o el uso de decorrelacionadores en sistemas de cancelación de eco acústico multicanal para mejorar el comportamiento de convergencia.
En la Figura 1 se ilustra una típica aplicación de un decorrelacionador del estado actual de la técnica en un mezclador hacia arriba mono a estéreo, por ejemplo, aplicado en Estéreo Paramétrico (PS), donde se provee una señal de entrada mono M (una señal "seca") a un decorrelacionador 110. El decorrelacionador 110 decorrelaciona la señal de entrada mono M de acuerdo con un método de decorrelación para proveer una señal decorrelacionada D (una señal "mojada") en su salida. La señal decorrelacionada D es alimentada a un mezclador 120 como una primera señal de entrada de mezclador junto con la señal mono seca M como una segunda señal de entrada de mezclador. Además, una unidad de control de mezcla hacia arriba 130 alimenta parámetros de control de mezcla hacia arriba al mezclador 120. El mezclador 120 entonces genera dos canales de salida L y R (L = canal de salida estéreo izquierdo; R = canal de salida estéreo derecho) de acuerdo con una matriz de mezclado H. Los coeficientes de la matriz de mezclado pueden ser fijos, dependientes de la señal o controlados por un usuario.
Alternativamente, la matriz de mezclado es controlada por información lateral que es transmitida junto con el mezclado hacia abajo que contiene una descripción paramétrica sobre cómo mezclar hacia arriba las señales del mezclado hacia abajo para formar la salida multicanal deseada. Esta información lateral espacial usualmente es generada durante el proceso de mezclado hacia abajo mono en un codificador de señal compatible.
Este principio se aplica ampliamente en codificación de audio espacial, por ejemplo, Estéreo Paramétrico, ver por ejemplo, de J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, "Codificación de Audio Espacial Paramétrico de Alta Calidad a baja cantidad de bits transmitidos" ("High-Quality Parametric Spatial Audio Coding at Low Bitrates") en Actas de la 116° Convención de AES, Berlín, Preimpresión 6072, mayo de 2004.
Otra típica estructura del estado actual de la técnica, de un decodificador estéreo paramétrico está ilustrada en la Figura 2, en donde el proceso de decorrelación se realiza en el dominio de la transformación. Un banco de filtros de análisis 210 transforma una señal de entrada mono a un dominio de la transformación, por ejemplo, al dominio de la frecuencia. La decorrelación de la señal de entrada mono transformada M luego es realizada por un decorrelacionador 220 el cual genera una señal decorrelacionada D. Tanto la señal de entrada mono transformada M como la señal decorrelacionada D, son alimentadas a una matriz de mezclado 230. La matriz de mezclado 230 luego genera dos señales de salida L y R tomando en cuenta parámetros de mezclado hacia arriba, las cuales son provistas por la unidad de modificación de parámetros 240, la cual está provista con párámetros espaciales y está acoplada a una unidad de control de parámetros 250. En la Figura 2, los parámetros espaciales pueden ser modificados por un usuario o herramientas adicionales, por ejemplo, post-procesamiento para reproducción/presentación binaural. En este ejemplo, los parámetros de mezclado hacia arriba son combinados con los parámetros provenientes de los filtros binaurales para formar los parámetros de entrada para la matriz de mezclado hacia arriba. Finalmente, las señales de salida generadas por la matriz de mezclado 230 son alimentadas al banco de filtros de síntesis 260, el cual determina la señal de señal de salida estéreo.
La salida L/R de la matriz de mezclado 230 es computada a partir de la señal de entrada modo M y la señal decorrelacionada D de acuerdo con una regla de mezclado, por ejemplo, aplicando la siguiente fórmula: En la matriz de mezclado, la magnitud del sonido decorrelacionado alimentado a la salida es controlada sobre la base de los parámetros transmitidos, por ejemplo, Correlación/Coherencia Inter-Canal (ICC) y/o configuraciones fijas o definidas por el usuario.
Conceptualmente, la señal de salida de la salida del decorrelacionador D reemplaza una señal residual que idealmente permitiría una decodificación perfecta de las señales LJR originales. Utilizar la salida de decorrelacionador D en lugar de una señal residual en el mezclador hacia arriba da por resultado un ahorro de cantidad de bits transmitidos que de otra manera se hubiera requerido para transmitir la señal residual.
El objetivo del decorrelacionador es entonces generar una señal D a partir de la señal mono M, la cual exhiba propiedades similares a la señal residual que es reemplazada por D.
Correspondientemente, del lado del codificador, se extraen dos tipo de parámetros espaciales: Un primer grupo de parámetros comprende parámetros de correlación/coherencia (por ejemplo, ICCs = parámetros de Correlación/Coherencia Inter-Canal) que representan la coherencia o la correlación cruzada entre dos canales de entrada que serán conectados. Un segundo grupo de parámetros comprende parámetros de diferencia de nivel (por ejemplo, ILDs = parámetros de Diferencia de Nivel Inter-Canal) que representan la diferencia de nivel entre los dos canales.
Además, una seña mezclada hacia abajo es generada mezclando hacia abajo los dos canales de entrada. Asimismo se genera una señal residual. Señales residuales son señales que pueden ser usadas para regenerar las señales originales empleando adicionalmente la señal mezclada hacia abajo y una matriz de mezclado hacia arriba. Por ejemplo, cuando N señales son mezcladas hacia abajo a 1 señal, el mezclado hacia abajo típicamente es 1 de los N componentes que resultan del mapeo de las N señales de entrada. Los componentes restantes que resultan del mapeo (por ejemplo, N-1 componentes) son señales residuales y permiten reconstruir las N señales originales mediante un mapeo inverso. El mapeo puede ser, por ejemplo, una rotación. El mapeo debe ser conducido tal que la señal mezclada hacia abajo sea maximizada y las señales residuales sean minimizadas, por ejemplo, similar a una transformación de eje principal. Por ejemplo, la energía de la señal mezclada hacia abajo debe ser maximizada y las energías de las señales residuales deben ser minimizadas. Cuando se mezclan hacia abajo dos señales a 1 señal, el mezclado hacia abajo es normalmente una de las dos componentes que resultan del mapeo de las 2 señales de entrada. El componente restante que resulta del mapeo es la señal residual y permite reconstruir las 2 señales originales mediante un mapeo inverso.
En algunos casos, la señal residual puede representar un error asociado con representar las dos señales mediante sus parámetros de mezclado hacia abajo y asociados. Por ejemplo, la señal residual puede ser una señal de error la cual representa el error entre los canales originales L, R y los canales L\ R', resultantes de mezclar hacia arriba la señal mezclada hacia abajo que fue generada en base a los canales originales L y R.
En otras palabras, una señal {{PCT}} en el cual la señal residual puede ser considerada como una señal en el dominio del tiempo o un dominio de la frecuencia o un dominio sub-banda, que junto con la señal mezclada hacia abajo sola o con la señal mezclada hacia abajo y la información paramétrica permite una reconstrucción correcta o casi correcta de un canal original. Casi correcto se debe entender como que la reconstrucción con la señal residual teniendo una energía mayor que cero es más cercana al canal original comparado con una reconstrucción usando el mezclado hacia abajo sin la señal residual o usando el mezclado hacia abajo y la información paramétrica sin la señal residual.
Considerando MPEG Surround (MPS), se emplean estructuras similares a PS llamadas cajas Uno a Dos (cajas OTT) en árboles de decodificación de audio espacial. Esto se puede ver como una generalización del concepto de mezclado hacia arriba mono a estéreo a esquemas de codificación/decodificación de audio espacio multicanal. En MPS, también existen sistemas de mezclado hacia arriba de dos a tres (cajas TTT) que pueden aplicar decorrelacionadores dependiendo del modo de operación TTT. En el documento de J. Herré, K. Kjórling, J. Breebaart, et al., "MPEG surround -la norma ISO/MPEG para codificación de audio multicanal eficiente y compatible" ("MPEG surround— the ISO/MPEG standard for efficient and compatible multi-channel audio coding") de las Actas de la 122° Convención de AES, Viena, Austria, mayo de 2007, se describen detalles.
Con respecto a la Codificación de Audio Direccional (DirAC), la DirAC se refiere a un esquema de codificación de campo de sonido paramétrico que no está ligado a un número fijo de canales de salida de audio con posiciones de altavoz fijas. La DirAC aplica decorrelacionadores en el reproductor DriAC, esto es, en el decodificador de audio espacial para sintetizar componentes no coherentes de campos de sonido. Se puede hallar más información relacionada con codificación de audio direccional en el documento de Pulkki, Ville: Reproducción de Sonido Espacial con Codificación de Audio Direccional" ("Spatial Sound Reproduction with Directional Audio Coding") en J. Audio Eng. Soc, Vol. 55, No. 6, 2007.
Con respecto a decorrelacionadores del estado actual de la técnica en decodificadores de audio espacial, se hace referencia á la Norma Internacional SO/IEC "Tecnología de Información-tecnologías de audio MPEG" ("Information Technology- MPEG audio technologies) - Parte 1 : MPEG Surround", ISO/IEC 23003-1 :2007 y también al documento de J. Engdegard, H. Purnhagen, J. Róden, L.Liljeryd, "Atmósfera Sintética en Codificación Paramétrica de Estéreo" ("Synthetic Ambience ¡n Parametric Stereo Coding") en Actas de la 116° de AES Convention, Berlín, Preimpresión, mayo de 2004. Se usan estructuras reticulares pasa todo (lattice allpass structures) MR como decorrelacionadores en decodificadores de audio espacial tipo MPS como se describe en el documento de J. Herré, K. Kjórling, J. Breebaart, et a|., "MPEG Surround - la norma ISO/MPEG para codificación de audio multicanal eficiente y compatible" ("MPEG surround— the ISO/MPEG standard for efficient and compatible multi-channel audio coding") de las Actas de la 122° Convención de AES, Viena, Austria, mayo de 2007, y se describen en la Norma Internacional ISO/IEC "Tecnología de Información - tecnologías de audio MPEG - Parte 1 : MPEG Surround" ("Information Technology- MPEG audio technologies - Partí : MPEG Surround"), ISO/IEC 23003-1 :2007. Otros decorrelacionadores del estado actual de la técnica aplican demoras (potencialmente dependientes de la frecuencia) para decorrelacionar señales o convolucionar las señales de entrada, por ejemplo, con erupciones de ruido que decaen exponencialmente. Para un panorama de los decorrelacionadores para sistemas de mezclado hacia arriba de audio espacial del estado actual de la técnica, ver "Atmósfera Sintética en Codificación Estéreo Paramétrica" ("Synthetic Ambience in Parametric Stereo Coding") en Actas de la 116° Convention de AÉS, Berlín, Preimpresión, mayo de 2004.
Otra técnica de procesar señales es "procesamiento de mezclado hacia arriba semántico" (semantic upmix processing"). El procesamiento de mezclado hacia arriba semántico es una técnica para descomponer señales en componentes con diferentes propiedades semánticas (esto es, clases de señal) y aplicar diferentes estrategias de mezclado hacia arriba a los diferentes componentes de señal. Los diferentes algoritmos de mezclado hacia arriba pueden ser optimizados de acuerdo con las diferentes propiedades semánticas para mejorar el esquema de procesamiento de señal global. Este concepto se describe en el documento WO/2010/017967, "Un aparato para determinar una señal de audio multicanal-canal de salida espacal" (An apparatus for determining a spatial output multichannel-channel audio signal), solicitud de patente internacional PCT/EP2009/005828, 1 1.8.2009, 1 1 .6.2010 (FH090802PCT).
Otro esquema de codificación de audio espacial es el "método de permutación temporal", según se describe en el documento de Hotho, G., van de Par, S., y Breebaart, J.: "Codificación multicanal de señales de aplauso" ("Multichannel coding of applause signáis"), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI=http://dx.doi.org/10.1 155/2008/. En este documento se propone un esquema de codificación de audio espacial que se adecúa a medida a la codificación/decodificación de señales de tipo aplauso. Este esquema se basa en la similaridad perceptual de segmentos de una señal de audio monofónica, especialmente una señal mezclada hacia abajo de un codificador de audio espacial. La señal de audio monofónica es segmentada en segmentos de tiempo que se superponen. Estos segmentos son permutados temporalmente seudo aleatoriamente (mutuamente independientes para n canales de salida) dentro de un "superbloque" para formar los canales de salida decorrelacionados.
Otra técnica de codificación de audio espacial es el "método demora temporal e intercambio" ("temporal delay and swapping method"). En el documento " DE 10 2007 018032 A: 20070417, Erzeugung dekorrelierter Sígnale", 17.4.2007, 23.10.2008 (FH070414PDE), se propone un esquema que también se adecúa a medida para codificación/decodificación de señales de ti po aplauso para presentación binaural. Este esquema también se basa en la similaridad perceptual de segmentos de una señal de audio monofónica y demora canales de salida uno con respecto a otro. Para evitar una influencia de localización hacia el canal central, son barridos periódicamente los canales delantero y posterior.
En general, se sabe que las señales de tipo aplauso estéreo o multicanal codificadas/decodif ¡cadas en codificadores de audio, espacial paramétricos dan por resultado reducida calidad de señal (ver, por ejemplo, Hotho, G., van de Par, S., y Breebaart, J.:"Codificación multicanal de señales de aplauso" ("Multichannel coding of applause signáis"), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693, ver también DE 10 2007 018032 A). Las señales de tipo aplauso se caracterizan por contener mezclas temporalmente densas de componentes transitorios provenientes de diferentes direcciones. Ejemplos de tales señales son aplausos, el sonido de la lluvia, caballos galopando, etc. Las señales de tipo aplauso con frecuencia también contienen componentes de sonido provenientes de fuentes de sonido distantes, que se funden perceptualmente en un campo de sonido de fondo, suave, tipo ruido.
Las técnicas de decorrelación del estado actual de la técnica empladas en decodificadores de audio espacial tipo MPEG Surround contienen estructuras reticulares pasa todo. Estas actúan como generadores de reverberación y consecuentemente son adecuadas para generar sonidos homogéneos, suaves, de tipo ruido, inmersivos (como colas de reverberación del ambiente) Sin embargo, hay ejemplos de campos de sonido con una estructura espacio-temporal no homogénea que aun son inmersores para el oyente: un ejemplo prominente son campos de sonido de tipo aplauso que crean envolvimiento del oyente no sólo mediante campos de tipo ruido homogéneos, sino también mediante secuencias bastante densas de palmadas singulares provenientes de diferentes direcciones. Por ende, el componente no homogéneo de los campos de sonido de aplauso puede estar caracterizado por una mezcla espacialmente distribuida de componentes transitorios. Obviamente, estas palmadas separadas no son homogéneas, suaves y de tipo ruido en absoluto.
Debido a su comportamiento de tipo reverberación, los decorrelacionadores de retícula pasa todo son incapaces de generar un campo de sonido inmersivo con las características, por ejemplo, del aplauso. En cambio, cuando se aplica a señales de tipo aplauso, tienden a embadurnar temporalmente los componentes transitorios de la señales. El resultado no deseado es una campo de sonido inmersivo de tipo ruido sin la estructura espacio-temporal distintiva de los campos de sonido de tipo aplauso. Además, eventos transitorios como un aplauso aislado podría evocar artefactos campanilla (N. del T. fenómeno de Gibbs) de los filtros del decorrelacionador.
Un sistema de acuerdo con Hotho, G., van de Par, S., y Breebaart, J.: "Codificación multicanal de señales de aplauso" ("Multichannel coding of applause signáis"), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693, exhibirá degradación perceptible del sonido de salida debido a una cierta cualidad repetitiva en la señales de audio de salida. Eso ocurre por el hecho de uno y el mismo segmento de la señal de entrada aparece inalterado en cada canal de salida (aunque en un punto de tiempo diferente). Asimismo, para evitar densidad de aplauso aumentada, hay que dejar caer algunos canales originales en el mezclado hacia arriba y por ende podría faltar algún evento auditivo importante en el mezclado hacia arriba resultante. El método sólo es aplicable si es posible hallas segmentos de señal que comparten las mismas propiedades perceptuales, esto es, segmentos de señal que suenan similares. El método en general difícilmente cambia la estructura temporal de las señales, lo cual podría ser aceptable sólo para muy pocas señales. En el caso de aplicar el esquema a señales que no son del tipo aplauso (por ejemplo, debido a mala clasificación de señal), la permutación temporal mayormente conducirá a resultados inaceptables. La permutación temporal además limita la aplicabilidad a casos donde se pueden mezclar varios segmentos de señal juntos sin artefactos como ecos o filtrado peine. Desventajas similares valen para el método descrito en el documento DE 10 2007 018032 A.
El procesamiento semántico descrito en el documento WO/2010/017967 separa los componentes transitorios de las señales antes de la aplicación de decorrelacionadores. La señal remanente (sin componentes transitorios) es alimentada a la decorrelación convencional y al procesador de mezclado hacia arriba, mientras las señales transitorias son manejadas de diferente manera; estas últimas son distribuidas (por ejemplo aleatoriamente) a diferentes canales de la señal de> salida estéreo o multicanal mediante aplicación de técnicas de paneo de amplitud. El paneo de amplitud muestras varias desventajas: El paneo de amplitud no necesariamente produce una señal de salida que es cercana a la original. La señal de salida puede ser cercana a la original si la distribución de los componentes transitorios en la señal original pueden ser descritos por las leyes de paneo de amplitud. Esto es: El paneo de amplitud sólo puede reproducir eventos puramente paneados en amplitud correctamente, pero sin diferencias de fase o tiempo entre componentes transitorios en diferentes canales de salida.
Asimismo, la aplicación del enfoque de paneo de amplitud en MPS requeriría puentear no sólo el decorrelacionador sino también la matriz de mezclado hacia arriba. Como la matriz de mezclado hacia arriba refleja los parámetros espaciales (correlaciones intercanal: ICCs, diferencias de nivel intercanal ILDs) que son necesarios para sintetizar una salida mezclada hacia arriba que muestra las correctas propiedades espaciales, el sistema de paneo en sí mismo tiene que aplicar alguna regla para sintetizar señales de salida con las correctas propiedades espaciales. No se conoce una regla genérica para hacerlo. Además, esta estructura agrega complejidad ya que hay que cuidar los parámetros espaciales dos veces: uno, para parte no transitoria de la señal y, segundo, para la parte transitoria paenada en amplitud de la señal.
Por lo tanto es un objetivo del presente invento proveer un concepto mejorado para generar una señal decorrelacionada. El objetivo del presente invento es resuelto mediante un aparato para generar una señal decorrelacionada de acuerdo con la reivindicación 1 , mediante un aparato para codificar una señal de audio de acuerdo con la reivindicación 11 , mediante un método para generar una señal decorrelacionada de acuerdo con la realizaciones 14 y mediante un programa de computadora de acuerdo con la reivindicación 15.
Un aparato de acuerdo con una realización comprende un separador de componentes transitorios para separar una señal de entrada en un primer componente de señal y un segundo componente de señal tal que el primer componente de señal comprende porciones de señal transitorias de la señal de entrada y tal que el segundo componente de señal comprende porciones de señal no transitorias de la señal de entrada. El separador de componentes transitorios puede separar los diferentes componentes de señal uno de otro para permitir que los componentes de señal que contienen transitorios puedan ser procesados de manera diferente que los componentes de señal que no contienen transitorios.
El aparato comprende además un decorrelacionador de componentes transitorios para decorrelacionar componentes de la señal que contienen transitorios de acuerdo con un método de decorrelación el cual es particularmente adecuado para decorrelacionar componentes de la señal que contienen transitorios. Asimismo, el aparato comprende un segundo decorrelacionador para decorrelacionar los componentes de la señal que no contienen transitorios.
Así, el aparato es capaz de procesar componentes de la señal usando un decorrelacionador estándar o bien, alternativamente procesar componentes de la señal usando el decorrelacionador de componentes transitorios particularmente adecuado para procesar componentes de la señal transitorios. En una realización, el separador de componentes transitorios decide si un componente de la señal es alimentado al decorrelacionador estándar o al decorrelacionador de transitorios.
Asimismo, el aparato puede estar adaptado para separar un componente de señal tal que el componente de señal es alimentado parcialmente al decorrelacionador de transitorios y parcialmente es alimentado al segundo decorrelacionador.
Asimismo, el aparato comprende una unidad combinadora para combinar los componentes de señal entregados por el decorrelacionador estándar y el decorrelacionador de transitorios para generar una señal combinación decorrelacionada.
En una realización, el aparato comprende una unidad receptora para recibir información de fase, en donde el decorrelacionador de transitorio está adaptado para aplicar la información de fase al primer componente de la señal. La información de fase podría ser generada por un codificador adecuado.
En una realización, el separador de componentes transitorios está adaptado para, o bien alimentar una porción de señal considerada de una señal de entrada de aparato en el decorrelacionador de transitorio, o alimentar la porción de señal considerada en el segundo decorrelacionador dependiendo de información de separación de componente transitorio la cual, o bien indica que la porción de señal considerada contiene un transitorio, o la cual indica que la porción de señal considerada no contiene un transitorio. Üna realización así permite fácil procesamiento de información de separación de componente transitorio.
En otra realización, el separador de componentes transitorios está adaptado para alimentar parcialmente una porción de señal considerada de una señal de entrada de aparato, al decorrelacionador de transitorio y para alimentar parcialmente la porción de señal considerada al segundo decorrelacionador. La magnitud de la porción de señal considerada que es alimentada al separador de componentes transitorios y la magnitud de porción de señal considerada que es alimentada al segundo decorrelacionador dependen de la información de separación de componentes transitorios. Por este medio se puede tomar en cuenta la intensidad de un componente transitorio.
En otra realización, el separador de componentes transitorios está adaptado para separar una señal de entrada de aparato la cual está representada en un dominio de la frecuencia. Esto permite el procesamiento (separación y decorrelación) de componente transitorio dependiente de la frecuencia. Así, ciertas componentes de señal de una primera banda de frecuencia pueden ser procesadas de acuerdo con un método de decorrelación de componente transitorio, mientras componentes de señal, de otra banda de frecuencia pueden ser procesados de acuerdo con otro método, por ejemplo, decorrelación convencional. Consiguientemente, en una realización el separador de componentes transitorios está adaptado para separar una señal de entrada de aparato en base a información de separación de componentes transitorios dependientes de la frecuencia. Sin embargo, en una realización el separador de componentes transitorios está adaptado para separar una señal de entrada de aparato en base a información de separación independiente de la frecuencia. Esto permite procesamiento más eficiente de señal con componente transitorio.
En otra realización, el separador de componentes transitorios puede estar adaptado para separar una señal de entrada de aparato la cual está representada en un dominio de la frecuencia tal que todas las porciones de señal de la señal de entrada de aparato dentro de un primer rango de frecuencia son alimentadas al segundo decorrelacionador. Un correspondiente aparato, por lo tanto, está adaptado para restringir procesamiento de señal transitoria a componentes de señal con frecuencias de señal en uh segundo rango de frecuencia, mientras ninguna componente de señal con frecuencias de señal en el primer rango de frecuencia es alimentada al decorrelacionador de transitorio (sino en el segundo decorrelacionador).
En una realización adicional, el decorrelacionador de transitorio puede estar adaptado para decorrelacionar la primera componente de señal aplicando información de fase que representa una diferencia de fase entre una señal residual y una señal mezclada hacia abajo. Del lado del codificador se puede emplear una matriz de mezclado "reversa" para crear una señal mezclada hacia abajo y una señal residual, por ejemplo, desde los dos canales de una señal estéreo, como se ha explicado arriba. Mientras la señal mezclada hacia abajo puede ser transmitida al decodificador, la señal residual puede ser descartada. De acuerdo con una realización, la diferencia de fase empleada por el decorrelacionador de transitorio puede ser la diferencia de fase entre la señal residual y la señal mezclada hacia abajo. Así puede ser posible reconstruir una señal residual "artificial" aplicando la fase original de la residual a la mezclada hacia abajo. En una realización, la diferencia de fase puede relacionarse con una cierta banda de frecuencia, esto es, puede ser dependiente de la frecuencia. Alternativamente, una diferencia de fase no se relaciona con ciertas bandas de frecuencias pero puede ser aplicada como un parámetro de banda ancha independiente de la frecuencia.
En otra realización se podría aplicar el término de fase al primer componente de señal multiplicando el término de fase con el primer componente de señal.
En otra realización el segundo decorrelacionador puede ser un decorrelacionador convencional, por ejemplo, un decorrelacionador MR de retícula.
En una realización, el aparato comprende un mezclador que está adaptado para recibir señales de entrada y también está adaptado para generar señales de salida en base a las señales de entrada y a una regla de mezclado. Se alimenta una señal de entrada de aparato a un separador de componentes transitorios y luego es decorrelacionada por un separador de componentes transitorios y/o un segundo decorrelacionador como se describe arriba. La unidad combinadora y el mezclador pueden ser acomodados de modo que la señal combinación decorrelacionada sea alimentada al mezclador como una primera señal de entrada de mezclador. Una segunda señal de entrada de mezclados puede ser la señal de entrada de aparato o una señal derivada de la señal de entrada de aparato. Como el proceso de decorrelación ya está completo cuando la señal de combinación decorrelacionada es alimentada al mezclado, el mezclador no tiene que tomar en cuenta la decorrelación del componente transitorio. Por lo tanto, se puede emplear un mezclador convencional.
En una realización adicional, el mezclador está adaptado para recibir datos de parámetro de correlación/coherencia indicando una correlación o coherencia entre dos señales y está adaptado para generar las señales de salida en base a los datos de parámetro de correlación/coherencia. En otra realización adicional, el mezclador está adaptado para recibir datos de parámetro de diferencia de nivel indicando una diferencia de energía entre dos señales y está adaptado para generar las señales de salida en base a los datos de parámetro de diferencia de nivel. En una realización así, el decorrelacionador de componente transitorio, el segundo decorrelacionador y la unidad combinadora no tiene que estar adaptados para procesar tales datos de parámetros, ya que el mezclador se ocupará de procesar los datos correspondientes. Por el otro lado' en una realización así se puede usar un mezclador convencional con procesamiento de parámetros de correlación/coherencia y diferencia de nivel.
BREVE DESCRIPCIÓN DE LAS FIGURAS Ahora se explicarán las realizaciones en más detalle cón respecto a las figuras, en donde: la Figura 1 ¡lustra una aplicación del estado actual de la técnica, de un decorrelacionador en un mezclador hacia arriba mono a estéreo; la Figura 2 representa otra aplicación del estado actual de la técnica, de un decorrelacionador en un mezclador hacia arriba mono a estéreo; la Figura 3 ilustra un aparato para generar una señal decorrelacionada de acuerdo con una realización; la Figura 4 ilustra un aparato para decodificar una señal de acuerdo con una realización; la Figura 5 es una vista global de un sistema uno a dos (OTT) de acuerdo con una realización; la Figura 6 ilustra un aparato para generar una señal decorrelacionada que comprende una unidad receptora de acuerdo con una realización adicional; la Figura 7 es una vista global de un sistema uno a dos de acuerdo con otra realización adicional; la Figura 8 ilustra mapeos ejemplares desde medidas de consistencia de fase a intensidad de separación de componente transitorio; la Figura 9 es una vista global de un sistema uno a dos de acuerdo con otra realización adicional; la Figura 10 ilustra un aparato para codicar una señal de audio que tiene una pluralidad de canales.
La Figura 3 ilustra un aparato para generar una señal decorrelacionada de acuerdo con una realización. El aparato comprende un separador de componentes transitorios 310, un decorrelacionador de componentes transitorios 320, un decorrelacionador convencional 330 y una unidad combinadora 340. El enfoque de manejo de componente transitorio de esta realización apunta a generar señales decorrelacionadas a partir de señales de audio de tipo aplauso, por ejemplo, para la aplicación en el proceso de mezclado hacia arriba de decodificadores de audio espacial.
En la Figura 3, una señal de entrada es alimentada al separado de componente transitorio 310. La señal de entrada puede haber sido transformada a un dominio de la frecuencia, por ejemplo, aplicando un banco de filtro QMF híbrido. El separador de componentes transitorios 310 puede decidir para cada componente de señal considerada de la señal de entrada, si ésta contiene un componente transitorio o no. Asimismo, El separador de comprende una porción de señal con componente transitorio 310 puede estar dispuesto para alimentar la porción de señal considerada, ya sea al decorrelacjonador de componentes transitorios 320, si la porción de señal considerada contiene un componente transitorio (componente de señal s1), o puede alimentar la porción de señal considerada al decorrelacionador convencional 330, si la porción de señal considerada no contiene un componente transitorio (componente de señal s2). El separador de componentes transitorios 310 también púede estar dispuesto para dividir la porción de señal considerada dependiendo de la existencia de un componente transitorio en la porción de señal considerada y proveerlos parcialmente al decorrelacionador de componentes transitorios 320 y parcialmente al decorrelacionador convencional 330.
En una realización, el decorrelacionador de componentes transitorios 320 decorrelaciona el componente de señal s1 de acuerdo con un método de decorrelación de componente transitorio el cual es particularmente adecuado para decorrelacionar componentes de señal transitorios. Por ejemplo, la decorrelación de los componentes de señal transitorios puede ser llevada a cabo aplicando información de fase, por ejemplo aplicando términos de fase. Se explica un método de decorrelación donde se aplican términos de fase sobre componentes de señal transitorios abajo, con relación a la realización de la Figura 5. También se puede emplear un método de decorrelación así como método de decorrelación de componente transitorio del decorrelacionador de componentes transitorios 320 de la realización de la Figura 3.
El componente de señal s2, el cual no contiene porciones de señal transitorias, es alimentado al decorrelacionador convencional 330. El decorrelacionador convencional 330 entonces puede decorrelacionar el componente de señal s2 de acuerdo con un método de deéorrelación convencional, por ejemplo, aplicando estructuras reticulares pasa todo, por ejemplo, un filtro (de respuesta de impulso infinito) IRR reticular.
Después de ser decorrelacionado mediante el decorrelacionador convencional 330, el componente de señal decorrelacionado proveniente del decorrelacionador convencional 330 es alimentado a la unidad combinadora 340. El componente de señal transitorio decorrelacionado proveniente del decorrelacionador de componentes transitorios 320 también es alimentado a la unidad combinadora 340. La unidad combinadora 340 entonces combina ambos componentes de señal decorrelacionados, por ejemplo, sumando ambos componentes de señal, para obtener una señal combinación decorrelácionada.
En general, un método que decorrelaciona una señal que contiene componentes transitorios de acuerdo con una realización, puede realizarse como sigue: En un paso de separación, la señal de entrada es separada en dos componentes: un componente s1 contiene los transitorios de la , señal de entrada, otro componente s2 contiene la parte restante (no transitoria) de la señal de entrada. El componente no transitorio s2 de la señal puede ser procesado como en sistemas sin aplicar el método de decorrelación del decorrelacionador de componentes transitorios de esta realización. Esto es, la señal sin transitorios s2 puede ser alimentada a una o varias estrücturas de procesamiento de señal que decorrelacionan en forma convencional como estructuras pasa todo de MR reticulares.
Asimismo, el componente de señal que contiene los transitorios (la transmisión de transitorios s1) es alimentado a una estructura de "decorrelacionador de componentes transitorios" que decorrelaciona la transmisión de transitorios mientras que mantiene las propiedades especiales de señal mejor que la estructuras decorrelacionadoras convencionales. La decorrelación de la transmisión de transitorios es llevada a cabo aplicando información de fase a una alta resolución temporal. Preferiblemente, la información de fase comprende términos de fase. Asimismo, se prefiere que la información de fase pueda ser provista por un codificador.
Asimismo, las señales de salida de ambos, el decorrelacionador convencional y el decorrelacionador de componentes transitorios, son combinadas para formar la señal decorrelacionada que podría ser utilizada en el proceso de mezclado hacia arriba de codificadores de audio espacial. Los elementos (h11 , h12, h21 , h22) de la matriz de mezclado (Mmix) del decodificador de audio espacial pueden permanecer sin cambio.
La Figura 4 ilustra un aparato para decodificar una señal de entrada de aparato de acuerdo con una realización, en donde la señal de entrada de aparato es alimentada al separador de componentes transitorios 410. El aparato comprende un separador de componentes transitorios 410, un decorrelacionador de componentes transitorios 420, un decorrelacionador convencional 430, una unidad combinadora 440 y un mezclador 450. El separador de componentes transitorios 410, el decorrelacionador de componentes transitorios 420, el decorrelacionador convencional 430 y la unidad combinadora 440 de esta realización pueden ser similares al separador 310, el decorrelacionador de componentes transitorios 320, el decorrelacionador convencional 330 y la unidad combinadora 340 de la realización de la Figura 3, respectivamente. Una señal combinación decorrelacionada generada por la unidad combinadora 440 es alimentada a un mezclador 450 como una primera señal de entrada de mezclador. Además, la señal de entrada de aparato que ha sido alimentada al separador de componentes transitorios 410, también es alimentada al mezclador 450 como una segunda señal de entrada de mezclador. Alternativamente, la señal de entrada de aparato no es alimentada directamente al mezclador 45Ó, sino que se alimenta una señal derivada de la señal de entrada de aparato al mezclador 450. Se puede derivar una señal a partir de la señal de entrada de aparato, por ejemplo, aplicando un método de procesamiento de señal convencional a la señal de entrada de entrada de aparato, por ejemplo, aplicando un filtro. El mezclador 450 de la realización de la Figura 4 está adaptado para generar señales de salida en base a las señales de entrada y una regla de mezclado. Una tal regla de mezclado puede ser, por ejemplo, multiplicar las señales de entrada y una matriz de mezclado, por ejemplo aplicando la fórmula El mezclador 450 puede generar canales de salida L, R sobre la base de datos de parámetro de correlación/coherencia, por ejemplo, Correlación/Coherencia Inter-Canal (ICC) y/o datos de parámetro de diferencia de nivel, por ejemplo, Diferencia de Nivel Inter Canal (ILD). Por ejemplo, los coeficientes de una matriz de mezclado pueden depender de los datos de parámetro de correlación/coherencia y/o de los datos de parámetro de diferencia de nivel. En la realización de la Figura 4, el mezclador 450 genera dos canales de salida L y R. Sin embargo, en realizaciones alternativas, el mezclado puede generar una pluralidad de señales de salida, por ejemplo, 2, 4, 5 o 9 señales de salida, las cuales pueden ser señales de sonido surround.
La Figura 5 representa una vista global del sistema del enfoque de manejo de componente transitorio en un sistema de mezclado hacia arriba 1 a 2 (OTT), por ejemplo, un decodificador de audio espacial MPS (MPEG Surround). La trayectoria de señal paralela para los componentes transitorios separados de acuerdo con una realización, está comprendida en una caja de manejo de componente transitorio en forma de U. Se alimenta una señal de entrada de aparato DMX en un separador de componentes transitorios 510. La señal de entrada de aparato puede ser representada en un dominio de la frecuencia Por ejemplo, una señal de entrada del dominio del tiempo puede haber sido transformada a un dominio de la frecuencia aplicando un banco de filtros QMF como se usa en MPEG Surround. El separador de componentes transitorios 510 luego puede alimentar los componentes de la señal de entrada de aparato DMX en un decorrelacionador de componentes transitorios 520 y/o en un decorrelacionador reticular MR. Los componentes de la señal de entrada de aparato entonces son decorrelacionado por el decorrelacionador de componentes transitorios 520 y/o el decorrelacionador reticular MR 530. Luego de ellos, los componentes de señal decorrelacionados D1 y D2 son combinados mediante una unidad combinadora 540, por ejemplo, sumando ambos componentes de señal, para obtener una señal combinación decorrelacionada D. La señal combinación decorrelacionada es alimentada en un mezclador 552 como una primera señal de entrada de mezclador D. Asimismo, la señal de entrada de aparato DMX (o alternativamente: una señal derivada de la señal de entrada de aparato DMX) también es alimentada al mezclador 552 como una segunda señal de entrada de mezclador. El mezclador 552 entonces generar una primera y una segunda señal "seca", dependiendo de la señal de entrada de aparato DMX. El mezclador 552 también generar una primera y una segunda señal "mojada" dependiendo de la señal combinación decorrelacionada D. Las señales, generadas por el mezclador 552 también pueden ser generadas en base a parámetros transmitidos, por ejemplo, Correlación/Coherencia Inter-Canal (ICC) y/o datos de parámetro de diferencia de nivel, por ejemplo, Diferencia de Nivel Inter Canal (ILD).
En una realización, las señales generadas por el mezclador 552 pueden ser provistas a una unidad modeladora 554 las cual modela las señales provistas en base a datos de modelado temporal provistos. En otras realizaciones no tiene lugar moldeado de señal. Las señales generadas luego son provistas a una primera 556 y una segunda unidad sumadora las cuales combinan las señales provistas para generar una primera señal de salida L y una segunda señal de salida R, respectivamente.
Los principios de procesamiento mostrados en la Figura 5 pueden ser aplicados en sistemas de mezclado hacia arriba mono a estéreo (por ejemplo, codificadores de audio estéreo) así como también en disposiciones multicanal (por ejemplo, MPEG Surround). En realizaciones, el esquema de manipulación de componente transitorio propuesto puede ser aplicado como un mejoramiento de calidad a sistemas de mezclado hacia arriba existentes, ya que sólo se introduce una trayectoria de señal de decorrelacionador paralela sin alterar el proceso de mezclado hacia arriba en sí mismo.
La separación de señal en componentes transitorios y componentes no transitorios es controlada mediante parámetros que podrían ser generados en un codificador y/o el decodificador de audio espacial. El decorrelacionador de componentes transitorios 520 utiliza información de fase, por ejemplo, términos de fase que podrían ser obtenidos en un codificador o en un decodificador de audio espacial. Abajo se describen posibles variantes para obtener parámetros de manejo de componentes transitorios (esto es, parámetros de separación de componentes transitorios como posiciones de componentes transitorios o intensidad de separación y parámetros de decorrelación de componentes transitorios como información de fase).
La señal de entrada puede ser representada en un dominio de la frecuencia Por ejemplo, una señal puede haber sido transformada a un dominio de la frecuencia empleando un banco de filtros de análisis. Se puede aplicar un banco de filtros QMF para obtener una pluralidad de señales sub-banda a partir de una señal del dominio del tiempo.
Para la mejor calidad perceptual, el procesamiento de señal transitoria puede ser restringido, preferiblemente, a frecuencias de señal en un rango de frecuencia limitado. Un ejemplo sería limitar el rango de procesamiento a índices de banda de frecuencia k > 8 de un bando de filtros QMF híbrido como se usa en MPS, similar a la limitación de banda de frecuencia de modelado de envolvente guiado (GES) en MPS.
En lo que sigue se explicarán en más detalle realizaciones de un separador de componentes transitorios 520. El separador de componentes transitorios 510 divide la señal de entrada DMX en componentes transitorios y no transitorios s1 y s2, respectivamente. El separador de componentes transitorios 510 puede emplear información de separación de componentes transitorios para dividir la señal de entrada DMX, por ejemplo, un parámetro de separación de componente transitorio ß[?]. La división de la señal de entrada DMX se puede hacer de manera tal que la suma de los componentes s1+s2, sea igual a la señal de entrada DMX: sl[n] =DMX[ ?] · ß[?] s2 n]=DMX[ri - -Rri§ donde n es el índice tiempo de señales subbanda muestreadas hacia abajo y valores válidos para el parámetro de separación de componente transitorio que varía en el tiempo P[n].están en el rango [0, 1]. ß[?] puede ser un parámetro independiente de la frecuencia. Un separador de componentes transitorios 510 que está adaptado para separar una señal de entrada de aparato en base a un parámetro de separación independiente de la frecuencia puede alimentar todas las porciones de señal subbanda con índice de tiempo n ya sea al decorrelacionador de componentes transitorios 520 o al segundo decorrelacionador dependiendo del valor de ß[?].
Alternativamente, ß[?] puede ser un parámetro dependiente de la frecuencia. Un separador de componentes transitorios 510 que está adaptado para separar una señal de entrada de aparato en base a una información de separación de componentes transitorio dependiente de la frecuencia puede procesar porciones de señal subbanda Asimismo, la dependencia de la frecuencia puede ser usada, por ejemplo, para limitar el rango de frecuencia del procesamiento de componente transitorio como se menciona en la sección de arriba.
En una realización, la información de separación de componentes transitorios puede ser un parámetro que o bien indica que una porción de señal considerada de una señal de entrada DMX contiene un componente transitorio, o bien que indica que la porción de señal considerada no contiene un componente transitorio. El separador de componentes transitorios 510 alimenta la porción de señal considerada al decorrelacionador de componentes transitorios 520, si la información de separación de componente transitorio indica que la porción de señal considerada contiene un componente transitorio. Alternativamente, el separador de componentes transitorios 510 alimenta la porción de señal considerada al segundo decorrelacionador, por ejemplo, el decorrelacionador de retícula MR 530, si la información de separación de componente transitorio indica que la porción de señal considerada contiene un componente transitorio.
Por ejemplo, se puede emplear un parámetro de separación de componentes transitorios ß[?] como una información de separación de componente transitorio que puede ser un parámetro binario, n es el índice de tiempo de una porción de señal considerada de la señal de entrada DMX. ß[?] puede ser 1 (indicando que la porción de señal considerada será alimentada al decorrelacionador de componentes transitorios) o 0 (indicando que la porción de señal considerada será alimentada al segundo decorrelacionador). Restringiendo ß[?] a ß {0, 1} resultan ser difíciles las decisiones componente transitorio/no transitorio, esto es: componentes que son tratadas como transitorios son completamente separadas de la entrada (ß = 1 ).
En otra realización, el separador de componentes transitorios 510 está adaptado para alimentar parcialmente una porción de señal considerada de la señal de entrada de aparato, al decorrelacionador de componentes transitorios 520 y para alimentar parcialmente la porción de señal considerada al segundo decorrelacionador 530. La magnitud de la porción de señal considerada que es alimentada al separador de componentes transitorios 520 y la magnitud de porción de señal considerada que es alimentada l segundo decorrelacionador 530 depende de la información de separación de componentes transitorios. En una realización, ß[?] tiene que estar en el intervalo [0, 1]. En otra realización, ß[?] puede estar restringido a ß[?] [0, ß??3?], donde ß?t??? <1 , resulta una separación parcial de los componentes transitorios, conduciendo a un efecto menos pronunciado del esquema de manejo de componentes transitorios. Por lo tanto, cambiar ß?-nax permite que sea indistinto entre la salida del procesamiento de mezclado hacia arriba convencional sin manejo de componentes transitorios y el procesamiento de mezclado hacia arriba que incluye el manejo de componentes transitorios.
En lo que sigue se explicará en más detalle un decorrelacionador de componentes transitorios 520 de acuerdo con una realización.
Un decorrelacionador de componentes transitorios 520 de acuerdo con una realización crea una señal de salida que está suficientemente decorrelacionada de la entrada. No altera la estructura temporal de aplausos singulares/componentes transitorios (sin dispersión horizontal en el tiempo, sin demora). En cambio, conduce a una distribución espacial de los componentes de señal transitoria (después del proceso de mezclado hacia arriba), que es similar a la distribución espacial en la señal original (no codificada). El decorrelacionador de componentes transitorios 520 puede encargarse de compromisos de cantidad de bits transmitidos en contraste con calidad (por ejemplo, distribución de transitorio espacial a baja cantidad de bits transmitidos <? cerca de la original (casi transparente) a alta cantidad de bits transmitidos. Asimismo, esto se logra con baja complejidad computacional.
Como se explicó arriba, del lado del codificador se puede emplear * una matriz de mezclado "reversa" para crear una señal mezclada hacia abajo y una señal residual, por ejemplo, desde los dos canales de una señal estéreo. Mientras la señal mezclada hacia abajo puede ser transmitida al decodificador, la señal residual puede ser descartada. De acuerdo con una realización, la diferencia de fase entre la señal residual y la señal mezclada hacia abajo puede ser determinada, por ejemplo, mediante un decodificador, y puede ser empleada por un decodificador cuando decorrelaciona una señal. Por este medio puede ser posible entonces reconstruir una señal residual "artificial" aplicando la fase original de la residual a la mezclada hacia abajo.
A continuación se explicará un correspondiente método de decorrelación del decorrelacionador de componentes transitorios 520 de acuerdo con una realización: De acuerdo con un método de decorrelación de componente transitorio, se puede emplear un término de fase. Se logra la decorrelación simplemente multiplicando la transmisión transitoria por términos de fase a alta resolución temporal, por ejemplo, a resolución de tiempo de señal subbanda en sistemas del dominio de la transformación como MPS: En esta ecuación, n es el índice de tiempo de señales subbanda muestreadas hacia abajo. ?f idealmente refleja la diferencia de fase entre mezclado hacia abajo y residual. Por lo tanto, los transitorios residuales son reemplazados por una copia de los transitorios provenientes del mezclado hacia abajo, modificados tal que exhiban la fase original.
Aplicar la información de fase inherentemente da por resultado un paneo de los componentes transitorios a la posición original en el proceso de mezclado hacia arriba. Como ejemplo ilustrativo, considere el caso ICC=0, ILD=0: La parte transitoria de las señales de salida entonces dicen: R[n] = c - (s{n] - D\[n ) = c¦ s[n]¦ (l - e Para ?f=0 resulta L=2c*s, R=0, mientras ?f=p conduce a L=0, R=2c*s. Otros valores de ?f, ICC, e ILD conducen a diferentes relaciones de nivel y fase entre los componentes transitorios reproducidos.
Los valores de ?f[?] pueden ser aplicados como parámetros de banda ancha independientes de la frecuencia o como parámetros dependientes de la frecuencia. En caso de señales de tipo aplaudo sin componentes tonales, pueden ser ventajosos valores de ?f[?] de banda ancha debido a menores demandas de velocidad de datos y manejo consistente de componentes transitorios de banda ancha (consistencia sobre la frecuencia).
La estructura de manejo de componente transitorio de la Figura 5 está acomodada tal que sólo el decorrelacionador convencional 530 es puenteado con relación a los componentes de señal transitorios mientras la matriz de mezclado permanece inalterada. Así, los parámetros espaciales (ICC, ILD) también son inherentemente tomados en cuenta para las señales transitorias, por ejemplo, la ICC automáticamente controla el ancho de la distribución de transitorio reproducido.
Considerando el aspecto de cómo obtener información de fase, en una realización, la información de fase puede ser recibida desde un códificador.
La Figura 6 ilustra una realización de un aparato para generar una señal decorrelacionada. El aparato comprende un separador de componentes transitorios 610, un decorrelacionador de componentes transitorios 620, un decorrelacionador convencional 630, una unidad combinadora 640 y una unidad receptora 650. El separador de componentes transitorios 610, el decorrelacionador convencional 630 y la unidad combinadora 640 són similares al separador de componentes transitorios 310, el decorrelacionador convencional 330 y la unidad combinadora 340 de la realización de la Figura 3. Sin embargo, la Figura 6 además ilustra una unidad receptora 650 que está adaptada para recibir información de fase. La información de fase puede haber sido transmitida por un codificador (no mostrado). Por ejemplo, un codificador puede haber computado la diferencia de fase entre señales residual y mezclad hacia abajo (fase relativa de la señal residual con respecto a una mezclada hacia abajo). La diferencia de fase puede haber sido calculada para ciertas bandas de frecuencias o banda ancha (por ejemplo, en un dominio del tiempo). El codificador puede codificar apropiadamente los valores de fase mediante cuantificación uniforme o no uniforme y potencialmente codificar sin pérdidas. Después, el codificador puede transmitir los valores de fase codificados al sistema de decodificación de audio espacial. Obtener la información de fase de un codificador es ventajoso ya que la información de fase original luego está disponible en un decodificador (excepto por el error de cuantificación).
La unidad receptora 650 alimenta la información de fase en el decorrelacionador de componentes transitorios 620 el cual usa la información de fase cuando decorrelaciona un componente de señal. Por ejemplo, la información de fase puede ser un término de fase y el decorrelacionador de componentes transitorios 620 puede multiplicar un componente de señal transitorio recibido por el término de fase.
En caso de transmitir información de fase ?f[?] desde un codificador al decodificador, se puede reducir el ritmo de datos requerido como sigue: La información de fase ?f[?] puede ser aplicada sólo a los componentes transitorios de una señal en el decodificador. Por lo tanto, la información de fase sólo necesita estar disponible en el decodificador en tanto haya componentes transitorios en la señal a ser decorrelacionada. La transmisión de la información de fase puede ser limitada entonces por el codificador, tal que sólo la información necesaria sea transmitida al decodificador. Esto se puede hacer aplicando una detección de transitorios en el codificador como se describe abajo. La información de fase ?f[?] sólo es transmitida para puntos en el tiempo n, para los cuales se han detectado componentes transitorios en el codificador.
Considerando el aspecto de separación de componentes transitorios, en una realización, la separación de componentes transitorios puede ser conducida por el codificador.
De acuerdo con una realización, la información de separación de componentes transitorios (a lo que también se refiere como "información de transitorios") puede obtenerse de un codificador. El codificador puede aplicar métodos de detección de transitorios como se describe en "Uso de Supresión de Transitorios en Algoritmos de Mezcla hacia Arriba Multicanal Ciega" ("Using Transient Suppression in Blind Multi-channel Up-mix Algorithms") de Andreas Walther, Christian Uhle, Sascha Disch, en Proc. 122° Convención de AES, Viena, Austria, mayo de 2007, ya sea para las señales de entrada de codificador o para las señales mezcladas hacia abajo. La información de transitorios luego es transmitida al decodificador y preferiblemente es obtenida, por ejemplo, a la resolución de tiempo de las señales subbanda muestreadas hacia abajo.
La información de transitorios preferiblemente puede comprender una simple decisión binaria (transitorio/no-transitorio) para cada muestra de señal en el tiempo. Esta información puede también, preferiblemente, ser representada mediante las posiciones de transitorio en el tiempo y las duraciones del transitorio.
La información de transitorios puede ser codificada sin pérdidas (por ejemplo, codificación por longitud de series (RLE), codificación entrópica) para reducir el ritmo de datos que es necesario para transmitir la información de transitorios desde el codificador al decodificador.
La información de transitorios puede ser transmitida como información de banda ancha o como información dependiente de la frecuencia a una resolución de frecuencia. Transmitir la información de transitorios como parámetros de banda ancha reduce el ritmo de datos de información de transitorios y potencialmente mejora la calidad de audio debido al manejo consistente de transitorios de banda ancha.
En lugar de la decisión binaria (transitorio/no-transitorio), también puede ser transmitida la intensidad de los transitorios, por ejemplo, cuantificada en dos o cuatro escalones. La intensidad de transitorios entonces puede controlar la separación de los transitorios en el decodificador de audio espacial como sigue: Los transitorios fuertes son separados completamente de la entrada del decorrelacionador reticular MR, mientras que los transitorios más débiles sólo son parcialmente separados.
La información de transitorios sólo puede ser transmitida, si el codificador detecta señales tipo aplauso, por ejemplo usando sistemas de detección de aplauso como se describe en "Detección de Sonido de Aplauso con Baja Latencia" ("Applause Sound Detection with Low Latency") de Christian Uhle, en la 127° Convención de la Sociedad de Ingeniería de Audio, Nueva York, 2009.
El resultado de la detección para la similaridad de señal de entrada a señales de tipo aplauso también puede ser transmitido a menor resolución de tiempo (por ejemplo, al ritmo de actualización de parámetros espaciales en MPS) al decodificador para controlar la intensidad de la separación de transitorios. El resultado de la detección de aplauso puede ser transmitido como un parámetro binario (esto es, como una decisión drástica) o como un parámetro no binario (esto es, como una decisión blanda). Este parámetro controla la intensidad de separación en el decodificador de audio espacial. Por lo tanto, permite encender/apagar (drásticamente o gradualmente) el manejo de transitorios en el decodificador. Esto permite evitar artefactos que podrían ocurrir, por ejemplo, cuando se aplica un esquema de manejo de transitorios de banda ancha a señales que contienen componentes tonales.
La Figura 7 ilustra un aparato para decodificar una señal de acuerdo con una realización. El aparato comprende un separador de transitorios 710, un decorrelacionador de transitorios 720, un decorrelacionador reticular IIR 730, una unidad combinadora 740, un mezclador 752, una unidad modeladora opcional 754, una primera unidad sumadora 756 y una segunda unidad sumadora 758, los cuales corresponden al separador de transitorios 510, el decorrelacionador de transitorios 520, el decorrelacionador reticular MR 530, la unidad combinadora 540, el mezclador 552 la unidad modeladora opcional 554, la primera unidad sumadora 556 y la segunda unidad sumadora 558 de la realización de la Figura 5, respectivamente. En la realización de la Figura 7, un codificador obtiene información de fase e información de posición de transitorio y transmite la información a un aparato para decodificación. No se transmiten señales residuales. La Figura 7 ilustra una configuración de mezclado hacia arriba 1 a 2 como una caja OTT en MPS. Se puede aplicar en un codificador- decodificador estéreo para mezclar hacia arriba a partir de mezcla hacia abajo mono a una salida estéreo de acuerdo con una realización. En la realización de la Figura 7 se transmites tres parámetros de manejo de transitorios como parámetros independientes de la frecuencia desde el codificador al decodificador, como se puede ver en la Figura 7: Un primer parámetro de manejo de transitorio a ser transmitido es la decisión binaria transitorio/no-transitorio de un detector de transitorios que corre en el codificador. Se usa para controlar la separación de transitorios en el decodificador. En un esquema simple, la decisión binaria transitorio/no- transitorio puede ser transmitida como una bandera binaria por muestra de tiempo subbanda sin más codificación.
Otro parámetro de manejo de transitorio a ser transmitido es el valor de fase (o los valores de fase) ?f[?] que se necesita para el , decorrelacionador de transitorios. ?f[?] sólo es transmitida para instantes n, para los cuales se han detectado componentes transitorios en el codificador. Los valores ?f son transmitidos como índices de un cuantificadór con una resolución de, por ejemplo, 3 bit por muestra.
Otro parámetro de manejo de transitorio a ser transmitido es la intensidad de separación (esto es, la intensidad de efecto del esquema de manejo de transitorios). Esta información es transmitida a alguna resolución temporal como los parámetros espaciales ILD, ICC.
La cantidad de bits transmitidos BR necesaria para transmitir decisiones de separación de transitorios e información de fase de banda ancha desde el codificador al decodificador, puede ser estimada por sistemas de tipo MPS según: BR = BRtrmAent separa¡m s + BR (p « {fs 164) + s · Q¦ fs 164 = (l + s ¦ Q)¦ fs 164 donde s es la densidad de transitorios (fracción ranuras de tiempo (=muestras de tiempo de subbanda) que están marcados como transitorios), Q es el número de bits por valor de fase transmitido, y fs es el ritmo de muestreo. Notar que (fs/64) es el ritmo de muestreo de las señales subbanda muestreadas hacia abajo.
Se ha medido ?{s} < 0,25 para un conjunto de diversos ítem de aplauso representativos, donde E{.} denota la medía sobre la duración del ítem. Un compromiso razonable entre exactitud de los valores de fase y cantidad de bits transmitidos de parámetro, es Q=3. Para reducir el ritmo de datos de parámetro, los ICCs y los ILDs pueden ser transmitidos como indicios de banda ancha (broadband cues). La transmisión de los ICCs y los ILDs como indicios de banda ancha es especialmente aplicable para señales no tonales como aplauso.
Adicionalmente, los parámetros para señalizar la intensidad de separación son transmitidos al ritmo de actualización de los ICCs/ILDs. Para cuadros espaciales largos en MPS (32 veces 64 muestras) e intensidades de separación cuantificadas en 4 escalones, este da por resultado una cantidad de bits transmitidos adicional de BR iransienixnaiationsrenah {fs /(64 · 32)) · 2 El parámetro de intensidad de separación puede ser establecido en el codificador a partir de los resultados de algoritmos de análisis de señal que evalúan la similaridad a señales de tipo aplauso, la tonalidad, u otras características de señal que incidan potenciales beneficios o problemas cuando se aplica la decorrelación de componentes transitorios de la realización.
Los parámetros transmitidos para manejo de transitorios pueden ser sometidos codificación sin pérdidas para reducir redundancia, dando por resultado una menor cantidad de bits transmitidos de parámetro (por ejemplo, codificación por longitud de series de información de separación de transitorios, codificación entrópica).
Volviendo al aspecto de obtener información de fase, en una realización, la información de fase puede obtenerse en un decodificador.
En una realización así, el aparato para decodificación no obtiene información de fase de un codificador, sino que puede determinar la información de fase por sí mismo. Por lo tanto, no es necesario transmitir información de fase lo que resulta en un reducido ritmo de transmisión global.
En una realización se obtiene información de fase en un decodificador basado en MPS a partir de datos de "Modulación de Envolvente Guiada (GES)") (Guided Envelope Shaping) Esto sólo es aplicable si se transmiten datos GES, esto es, si la opción GES está activada en un codificador. La opción GES está disponible por ejemplo, en sistemas MPS. El cociente de valores de envolvente GES entre los canales de salida refleja posiciones de paneo para los componentes transitorios a alta resolución temporal. El cociente de envolvente GES (GESR) puede ser mapeado a la información de fase necesaria para el manejo de componentes transitorios. En GES, el mapeo puede ser realizado de acuerdo con una regla de mapeo obtenida empíricamente de estadísticas acumulativas de distribución de fase relativa a GESR para un conjunto representativo de señales de prueba apropiadas. Determinar la regla de mapeo es un paso para diseñar el sistema de manejo de componentes transitorios, no cuando se ejecuta el sistema de manejo de componentes transitorios. Por lo tanto, es ventajoso que no hay necesidad de pagar costos adicionales de transmisión para datos de fase si se necesitan datos DES para la aplicación de la opción GES de alguna manera. Compatibilidad hacia atrás de serie de bits en el tiempo se logra con series de bits en el tiempo/decodificadores MPS. Sin embargo, la información de fase extraída de datos GES no es exacta (por ejemplo, el signo de la fase estimada es desconocido) como la información de fase que podrías ser obtenida en la codificador.
En una realización adicional, la información de fase también puede ser obtenida en un decodificador, pero a partir de residuales de banda no completa transmitidas. Esto es aplicable, por ejemplo, si se transmiten señales residuales de banda limitada (típicamente cubriendo un rango de frecuencia hasta una cierta frecuencia de transición) en un esquema de codificación MPS. En una realización así, se calcula la relación de fase entre la señal mezclada hacia abajo y la residual transmitida en la(s) banda(s) residual(es), esto es, para frecuencias para las cuales son transmitidas las señales residuales. Además, la información de fase proveniente de banda(s) residual(es) a la(s) banda(s) no-residual(es) es extrapolada (y/o posiblemente interpolada). Una posibilidad es mapear la relación de fase obtenida en la(s) banda(s) residual(es) a un valor de la relación de fase independiente de la frecuencia que luego se usa para el decorrelacionador de componentes transitorios. Esto da por resultado el beneficio de que no aparecen costos adicionales de transmisión para datos de fase, si de alguna manera se transmiten residuales de banda no completa. Sin embargo, se debe considerar que la corrección de la estimación de fase depende del ancho de la(s) banda(s) de frecuencia donde se transmiten las señales residuales. La corrección de las estimaciones de fase también depende de la consistencia de la relación de fase entre la señal mezclada hacia abajo y la residual a lo largo del eje de frecuencia. Para señal con componentes claramente transitorios, usualmente se encuentra alta consistencia.
En una realización adicional, la información de fase es obtenida en un decodificador empleando información de corrección adicional transmitida desde el codificador. Una realización así es similar a las dos realizaciones anteriores (fase de GES, fase de residuales) pero adicionalmente es necesario generar datos de corrección en el codificador que se transmiten al decodificador. Los datos de corrección permiten reducir el error de estimación de fase que puede ocurrir en las dos variantes descritas antes (fase de GES, fase de residuales). Asimismo, los datos de corrección pueden ser derivados de estimar el error de estimación de fase del lado decodificador en el codificador. Los datos de corrección pueden ser este error de estimación estimado (potencialmente codificado). Asimismo, con respecto al enfoque de estimación de fase de datos de GES, los datos de corrección simplemente pueden ser el signo correcto de los valores de fase generados por codificador. Esto permite generar términos de fase con el signo correcto en el decodificador. El beneficio de un enfoque así es que debido a los datos de corrección, la exactitud de la información de fase recuperable en el decodificador está mucho más cerca de la información de fase generada en el codificador. Sin embargo, la entropía de la información de corrección es menor que la entropía de la información de fase correcta en sí misma. Así, se disminuye la cantidad de bits transmitidos de parámetros cuando se compara con transmitir directamente la información de fase obtenida en el codificador.
En otra realización, se obtiene información/término de fase de un proceso (seudo) aleatorio en un decodificador. El beneficio de un enfoque así es que no hay necesidad de transmitir información de fase alguna con alta resolución temporal. Esto da por resultado un reducido ritmo de datos. En una realización, un método simple es generar valores de fase con una distribución aleatorio uniforme en un intervalo [- 180°, 180°].
En una realización adicional se miden las propiedades estadísticas de la distribución de fase en el codificador. Estas propiedades son codificadas y luego transmitidas (a baja resolución temporal) al decodificador. Se generan valores de fase aleatorios en el decodificador los cuales son sometidos a las propiedades estadísticas transmitidas. Estas propiedades podrían ser la media, varianzas u otras medidas estadísticas de la distribución dé fase estadística.
Cuando se hace correr más de una instancia de decorrelacionador en paralelo (por ejemplo, para un mezclado hacia arriba multicanál), se debe tener cuidado para asegurar salidas de decorrelacionador mutuamente decorrelacionadas.
En una realización, en donde se generan múltiples vectores de valores de fase (seudo) aleatorios (en lugar de un solo vector) para todas menos para la primera instancia de decorrelacionador, se selecciona un conjunto de vectores que da por resultado la menor correlación del valor de fase a través de todas las instancias de decorrelacionador.
En caso de transmitir información corrección de fase desde un codificador al decodificador, se puede reducir el ritmo de datos requerido como sigue: La información de corrección de fase sólo necesita estar disponible en el decodificador en tanto haya componentes transitorios en la señal a ser decorrelacionada. La transmisión de la información de corrección de fase puede ser limitada entonces por el codificador, tal que sólo la información necesaria sea transmitida al decodificador. Esto se puede hacer aplicando una detección de transitorios en el codificador como se describió arriba. La información de corrección de fase sólo es transmitida para puntos en el tiempo n, para los cuales se han detectado componentes transitorios en el codificador.
Volviendo al aspecto de separación de componentes transitorios, en una realización, la separación de componentes transitorios puede ser conducida por el decodificador.
En una realización así, también se puede obtener infórmación de separación de componentes transitorios en el decodificador, por ejemplo, aplicando un método de detección de componente transitorio como se describe en "Uso de Supresión de Transitorios en Algoritmos de Mezcla hacia Arriba Multicanal Ciega" ("Using Transient Suppression in Blind Multi-channel Up-mix Algorithms") de Andreas Walther, Christian Uhle, Sascha Disch, en Proc. 122° Convención de AES , Viena, Austria, mayo de 2007, para la señal mezclada hacia abajo que está disponible en el decodificador de audio espacial antes de mezclar hacia arriba una señal de salida estéreo o multicanal. En este caso, no se tiene que transmitir información de componente transitorio alguna, lo cual ahora ritmo de datos de transmisión.
Sin embargo, realizar la detección de componente transitorio al decodificar podría causar problemas cuando, por ejemplo se estandariza el esquema de manejo de componentes transitorios: por ejemplo, podría ser difícil hallar un algoritmo de detección de componentes transitorios que dé por resultado exactamente la misma detección de componentes transitorios cuando se implementa en diferentes plataformas/arquitecturas que involucrar» diferentes precisiones numéricas, esquemas de redondeo, etc. Para estandarización, tal comportamiento predecible del décodificador frecuentemente es imprescindible. Asimismo, el algoritmo de detección de componentes transitorios estandarizado podría fallar para algunas señales de entrada, causando distorsiones intolerables en las señales de salida. Entonces podría ser dificultoso corregir el algoritmo que falla después de la estandarización sin construir un décodificador que no se conforme al estándar. Esta cuestión podría ser menos severa si por lo menos se transmitiera un parámetro que controla la separación de componentes transitorios a baja resolución temporal (por ejemplo, al ritmo de actualización de parámetro espacial del MPS) desde el codificador al décodificador.
En una realización adicional, la separación de componentes transitorios también es conducida por décodificador y se transmiten residuales de banda no completa. En esta realización, la separación de componentes transitorios conducida por décodificador puede ser refinada empleando estimaciones de fase obtenidas de residuales de banda o-completa transmitidas (ver arriba). Notar que este refinamiento puede ser aplicado en el decodificador sin transmitir datos adicionales desde el codificador al decodificador.
En esta realización, los términos de fase que son aplicados a un decorrelacionador de componentes transitorios son obtenidos extrapolando los valores de fase correctos desde las bandas residuales a frecuencias donde no hay residuales disponibles. Un método es calcular un valor medio de fase (potencialmente por ejemplo, ponderado por potencia de señal) de los valores de fase que pueden ser calculados para aquellas frecuencias donde hay señales residuales disponibles. El valor medio de fase puede ser aplicado como un parámetro independiente de la frecuencia en el decorrelacionador de componentes transitorios En tanto la relación de fase correcta entre la mezclada hacia abajo y la residual es independiente de la frecuencia, el valor medio de fase representa una buena estimación del valor correcto de fase. Sin embargo, en el caso de una relación de fase que no es consistente e lo largo del eje de frecuencia, el valor medio de fase puede ser una estimación menos correcta, posiblemente que conduce a valores de fase incorrectos y artefactos audibles.
La consistencia de la relación de fase entre la mezclada hacia abajo y la residual transmitida a lo largo del eje de frecuencia, por lo tanto, puede ser usada como una medida de confiabilidad de la estimación de fase extrapolada que se aplica en el decorrelacionador de componentes transitorios Para bajar el riesgo de artefactos audibles, se puede usar la medida de consistencia obtenida en el decodificador para controlar la intensidad de separación de componentes transitorios en el decodificador, por ejemplo, como sigue: Los componentes transitorios para los cuales la correspondiente información de fase (esto es, información de fase para el mismo índice de tiempo n) es consistente a lo largo de la frecuencia, son totalmente separados de la entrada de decorrelacionador convencional y son totalmente alimentados al decorrelacionador de componentes transitorios. Como grandes errores de estimación de fase son improbables, se usa todo el potencial del manejo de componentes transitorios.
Los componentes transitorios para los cuales la correspondiente información de fase es menos consistente a lo largo de la frecuencia, sólo son separados parcialmente, conduciendo a un efecto menos prominente del esquema de manejo de componentes transitorios.
Los componentes transitorios para los cuales la correspondiente información de fase es muy inconsistente a lo largo de la frecuencia, no son separados, conduciendo al comportamiento estándar de un sistema de mezclado hacia arriba convencional sin el manejo de componentes transitorios propuesto. Así, no pueden ocurrir artefactos debido a grandes errores de estimación de fase.
Las medidas de consistencia para la información de fase pueden ser deducidas, por ejemplo, a partir de la varianza (posiblemente ponderada por potencia de señal) de la desviación estándar de la información de fase a lo largo de la frecuencia.
Como sólo unas pocas frecuencias pueden estar disponibles para las cuales se transmiten las señales residuales, la medida de la consistencia puede tener que ser estimada sólo a partir de unas pocas muestras a lo largo de la frecuencia, conduciendo a una medida de la consistencia que sólo rara vez alcanza valores extremos ("perfectamente consistente" o "perfectamente inconsistente"). Así, la medida de la consistencia puede ser linealmente o no linealmente distorsionada antes de ser usada para controlar la intensidad de separación de componentes transitorios. En una realización, se implementa un umbral característico como se ilustra en la Figura 8, ejemplo de la derecha.
La Figura 8 representa diferentes mapeos ejemplares de medidas de consistencia de fase con respecto a intensidad de separación de componentes transitorios, ilustrando el impacto de las variantes para obtener parámetros de manejo de componentes transitorios sobre la robustez a mala clasificación de componentes transitorios. Las variantes para obtener la información de separación de componentes transitorios y la información de fase listada arriba difieren en ritmo de datos de parámetro y por lo tanto representan diferentes puntos operativos en términos de cantidad de bits transmitidos global de un codificador-decodificador que implementa la técnica de manejo de componentes transitorios propuesta. Aparte de esto, la elección de la fuente para obtener la información de fase también afecta aspectos tales como robustez a clasificaciones de componentes transitorios falsas: manejar una señal no transitoria como una transitoria causa mucho menos distorsiones audibles si la información de fase correcta es aplicada para manejar el componente transitorio. Así, un error de clasificación de señal causa artefactos menos severos en el escenario de valores de fase transmitidos cuando se compara con el escenario de generación de fase aleatoria en el decodificador.
La Figura 9 es una vista global de un sistema Uno a Dos con manejo de componentes transitorios de acuerdo con otra realización, en donde se transmiten señales residuales de banda angosta. Se estima el dato de fase ?f de la relación de fase entre la señal mezclada hacia abajo (DMX) y la residual en la(s) banda(s) de frecuencia de la señal residual. Opcionalmente, se transmite dato de corrección de fase para bajar el error d estimación de fase.
La Figura 9 ilustra un separador de transitorios 910, un decorrelacionador de transitorios 920, un decorrelacionador reticular IIR 930, una unidad combinadora 940, un mezclador 952, una unidad modeladora opcional 954, una primera unidad sumadora 956 y una segunda unidad sumadora 958, los cuales corresponden al separador de transitorios 510, el decorrelacionador de transitorios 520, el decorrelacionador reticular MR 530, la unidad combinadora 540, el mezclador 552 la unidad modeladora opcional 554, la primera unidad sumadora 556 y la segunda unidad sumadora 558 de la realización de la Figura 5, respectivamente. La realización de la Figura 8 además comprende una unidad de estimación de fase 960. La unidad de estimación de fase 960 recibe una señal de entrada DMX, una señal residual "residual" y opcionalmente, datos de corrección de fase. En base a la información recibida, la unidad de información de fase calcula los datos de fase ?f. Opcionalmente, la unidad de estimación de fase también determina información de consistencia de fase y pasa la información de consistencia de fase al separador de componentes transitorios 910. Por ejemplo, la información de consistencia de fase puede ser usada por el separador de componentes transitorios para controlar la intensidad de separación de componentes transitorios.
La realización de la Figura 9 aplica el hallazgo de que si se transmiten residuales adentro del esquema de codificación en una manera de banda no-completa, la diferencia de fase media ponderada por potencia de señal entre la residual y la mezclada hacia abajo (A(presidual_bands) puede ser aplicada como información de fase de banda ancha a los componentes transitorios separados (?f = ?f???? residual_bands). En este caso, no hay que transmitir información de fase adicional, bajando la demanda de cantidad de bits transmitidos para el manejo de componentes transitorios. En la realización de la Figura 9, la estimación de fase a partir de las bandas residuales puede desviarse considerablemente de la estimación de fase de banda ancha más precisa que está disponible en el codificador. Una opción es, por lo tanto, transmitir datos de corrección de fase (por ejemplo, Acpcorrection ?f-Acpresidual_bands) de modo la ?f correcta esté disponible en el decodificador. Sin embargo, como la corrección de ?f puede mostrar una menor entropía que ?f, el ritmo de datos de parámetros necesario puede ser menor que el ritmo que sería necesario para transmitir ?f. (Este concepto es similar al uso general de predicción en codificación: en lugar de codificar directamente datos, se codifica un error de predicación con menor entropía. En la realización de la Figura 9, el paso de predicción es la extrapolación de la fase a partir de las bandas de frecuencia de residuales respecto a bandas de no residuales). La consistencia de la diferencia de fase en las bandas de frecuencia de residual (A(pres¡dual_bands) a lo largo del eje de frecuencia puede ser usada para controlar la intensidad de separación de componentes transitorios.
En realizaciones, un decodificador puede recibir información de fase de un codificador, o el decodificador puede determinar por sí mismo la información de fase. Asimismo, el decodificador puede recibir información de separación de componentes transitorios fase de un codificador, o el decodificador puede determinar por sí mismo la información de separación de componentes transitorios.
En realizaciones, un aspecto del manejo de componentes transitorios es la aplicación del concepto de "decorrelación semántica" descrito en el documento WO/2010/017967 junto con el "decorrelacionador de componentes transitorios", el cual está basado en multiplicar la entrada con términos de fase. Se mejora la calidad perceptual de señales de tipo aplauso reproducidas ya que ambos pasos de procesamiento evitan alterar la estructura temporal de las señales con componente transitorio. Asimismo, la distribución espacial de componentes transitorios así como también las relaciones de fase entre componentes transitorios, es reconstruida en los canales de salida. Asimismo, las realizaciones también con computacionalmente eficientes y puede ser integradas fácilmente en sistemas de mezclado hacia arriba de tipo PS o MPS. En realizaciones, el manejo de componentes transitorios no afecta el proceso de matriz de mezclado, de modo que todas las propiedades de reproducción espacial que están definidas por la matriz de mezclado también son aplicadas a la señal con componente transitorio.
En realizaciones se aplica un esquema de decorrelación novel el cual es particularmente adecuado para aplicación en sistemas de mezclado hacia arriba, el cual es particularmente adecuado para aplicación de esquemas de codificación de audio espacial como PS o MPS y el cual mejora la calidad perceptual de las señales de salida en el caso de señales de tipo aplauso, esto es, señales que contienen mezclas densas de componentes transitorios distribuidos espacialmente y/o pueden ser vistas como una ¡mplementación particularmente mejorada del marco de trabajo genérico de "decorrelación . semántica". Asimismo, en realizaciones, un esquema de decorrelación noval reconstruye la distribución espacial/temporal de los componentes transitorios similar a la distribución en la señal original, preserva la estructura temporal de las señales transitorios, permite variar la cantidad de bits transmitidos versus compromiso de calidad y/o es idealmente adecuado para una combinación con opciones MPS como residuales de banda no-completa o GES. Las combinaciones son complementarias, esto es, la información de opciones de MPS estándar es vuelta a usar para el manejo de componentes transitorios. la Figura 10 ilustra un aparato para codificar una señal de audio que tiene una pluralidad de canales. Dos canales de entrada L, R son alimentados a un mezclador hacia abajo 1010 y a un calculador de señal residual 1020. En otras realizaciones, una pluralidad de canales es; alimentada al mezclador 1010 y al calculador de señal residual 1020, por ejemplo, 3, 5 o 9 canales surround. El mezclador hacia abajo 1010 entonces mezcla hacia abajo los dos canales L, R, para obtener una señal mezclada hacia abajo. Por ejemplo, el mezclador hacia abajo 1010 puede emplear una matriz de mezclado y realizar una multiplicación de matriz de la matriz de mezclado y los dos canales de entrada L, R, para obtener una señal mezclada hacia abajo. La señal mezclada hacia abajo puede ser transmitida a un decodificador.
Asimismo, el generador de señal residual 1020 está adaptado para calcular una señal adicional a la cual se refiere como señal residual. Señales residuales son señales que pueden ser usadas para regenerar las señales originales empleando adicionalmente la señal mezclada hacia abajo y una matriz de mezclado hacia arriba. Por ejemplo, cuando N señales son mezcladas hacia abajo a 1 señal, el mezclado hacia abajo típicamente es 1 de los N componentes que resultan del mapeo de las N señales de entrada. Los componentes restantes que resultan del mapeo (por ejemplo, N-1 componentes) son señales residuales y permiten reconstruir las N señales originales mediante un mapeo inverso. El mapeo puede ser, por ejemplo, una rotación. El mapeo debe ser conducido tal que la señal mezclada hacia abajo sea maximizada y las señales residuales sean minimizadas, por ejemplo, similar a una transformación de eje principal. Por ejemplo, la energía de la señal mezclada hacia abajo debe ser maximizada y las energías de las señales residuales deben ser minimizadas. Cuando se mezclan hacia abajo dos señales a 1 señal, el mezclado hacia abajo es normalmente una de las dos componentes que resultan del mapeo de las 2 señales de entrada. El componente restante que resulta del mapeo es la señal residual y permite reconstruir las 2 señales originales mediante un mapeo inverso.
En algunos casos, la señal residual puede representar un error asociado con representar las dos señales mediante sus parámetros de mezclado hacia abajo y asociados. Por ejemplo, la señal residual puede ser una señal de error la cual representa el error entre los canales originales L, R y los canales L', R", resultantes de mezclar hacia arriba la señal mezclada hacia abajo que fue generada en base a los canales originales L y R.
En otras palabras, una señal {{PCT}} en el cual la señal residual puede ser considerada como una señal en el dominio del tiempo o un dominio de la frecuencia o un dominio sub-banda, que junto con la señal mezclada hacia abajo sola o con la señal mezclada hacia abajo y la información paramétrica permite una reconstrucción correcta o casi correcta de un canal original. Casi correcto se debe entender como que la reconstrucción con la señal residual teniendo una energía mayor que cero es más cercana al canal original comparado con una reconstrucción usando el mezclado hacia abajo sin la señal residual o usando el mezclado hacia abajo y la información paramétrica sin la señal residual.
Asimismo, el codificador comprende un calculador de información de fase 1030. La señal mezclada hacia abajo y la señal residual son alimentadas al calculador de información de fase 1030. El calculador de información de fase entonces calcula información sobre la diferencia de fase entre la señal mezclada hacia abajo y la residual para obtener información de fase. Por ejemplo, el calculador de información de fase puede aplicar funciones que calculan una correlación cruzada de la señal mezclada hacia abajo y la residual.
Asimismo, el codificador comprende un generador de salida 1040. La información de fase generada por el calculador de información de fase 1030 es alimentada en el generador de salida 1040. El generador de salida 1040 entonces entrega la información de fase.
En una realización, el aparato además comprende un cuantificador de información de fase para cuantificar la información de fase. La información de fase generada por el calculador de información de fase puede ser alimentada en el cuantificador para cuantificar la información de fase. El cuantificador de información de fase entonces cuantifica la información de fase. Por ejemplo, la información de fase puede ser mapeada a 8 diferentes valores, por ejemplo a uno de los valores 0, 1 , 2, 3, 4, 5, 6 o 7. Los valores pueden representar las diferencias de fases 0, tt/4, p/2, 3p/4, p, 5p/4, 3p/2 y 7p/4, respectivamente. La información de fase cuantificada entonces puede ser alimentada al generador de salida 1040.
En una realización adicional, el aparato además comprende un codificador sin pérdidas. La información de fase proveniente del calculador de información de fase 1040 o la información de fase cuantificada proveniente del cuantificador de información de fase, puede ser alimentada al codificador sin pérdidas. El codificador sin pérdidas está adaptado para codificar información de fase aplicando codificador sin pérdidas. Se puede emplear cualquier esquema de codificación sin pérdidas. Por ejemplo, el codificador puede emplear codificación aritmética. El codificador sin pérdidas entonces alimenta la información de fase codificada sin pérdidas al generador de salida 1040.
Con respecto al decodificador y codificador y los métodos de las realizaciones descritas, se menciona lo siguiente: A pesar de que se han descrito algunos aspectos en el contexto de un aparato, es claro que estos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a un paso de método o a un rasgo de un paso de método. Análogamente, los aspectos descritos en el contexto de una etapa de método también representan una descripción de un correspondiente bloque o componente o rasgo de un correspondiente aparato.
Dependiendo de ciertos requerimientos de implementación, las realizaciones del invento pueden ser implementadas en hardware o en software. La implementación se puede llevar a cabo utilizando un medio de almacenamiento digital, por ejemplo un diskette, un DVD, un CD, una ROM, una EPROM, una EEPROM o una memoria FLASH, los cuales tienen unas señales de control electrónicamente legibles guardadas en ellos, las cuales cooperan (o son capaces de cooperar) con un sistema de computación programable de modo que se ejecuta el respectivo método.
Algunas realizaciones de acuerdo con el invento comprenden un portador de datos que tiene señales de control legibles electrónicamente, las cuales son capaces de cooperar con un sistema de computadora programable, tal que uno de los métodos descrito en la presente sea ejecutado.
Generalmente, realizaciones del presente invento pueden ser implementadas como un programa de computador con un código de programa, siendo código de programa operativo para ejecutar uno de los métodos cuando el producto de programa de computadora corre en una computadora. El código de programa puede ser almacenado, por ejemplo, sobre un portador legible por una máquina.
Otras realizaciones comprenden el programa de computadora para ejecutar uno de los métodos descritos en la presente, almacenado en un portador legible por una máquina o un medio de almacenamiento no transitorio.
En otras palabras, una realización del método inventivo es, por lo tanto, un programa de computadora que un código de programa para ejecutar uno de los métodos descritos en la presente, cuando el programa de computadora corre en una computadora.
Una realización adicional de los métodos inventivos es, por lo tanto, un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, grabado en el mismo, el programa de computadora para ejecutar uno de los métodos descritos en la presente.
Una realización adicional del método inventivo es, por lo tanto, una transmisión de datos o una secuencia de señales que representan él programa de computador para ejecutar uno de los métodos descritos en la presente. La transmisión de datos o la secuencia de señales pueden ser configuradas, por ejemplo, para ser transferidos vía una conexión de comunicación dé datos, por ejemplo, vía Internet.
Una realización adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un dispositivo lógico programable, configurado para o adaptado para ejecutar uno de los métodos descritos en la presente.
. Una realización adicional comprende una computadora que tiene instalado en ella el programa de computadora para ejecutar uno de los métodos descritos en la presente.
En algunas realizaciones se puede usar un dispositivo de lógica programable (por ejemplo un arreglo de compuesta programable de campo) para realizar algunas o todas las funcionalidades de los métodos descritos en la presente. En algunas realizaciones, el arreglo de compuerta programable de campo puede cooperar con un microprocesador para realizar uno de los métodos descritos en la presente. Generalmente, los métodos preferiblemente son realizados mediante algún aparato de hardware.
Las realizaciones que se describieron más arriba son puramente ilustrativas para los principios del presente invento. Se entiende que las modificaciones y variaciones posibles de las disposiciones y de los detalles descritos en la presente serán evidentes para los expertos en la materia. Por lo tanto, es la intención que el invento esté limitado sólo por el alcance de las siguientes reivindicaciones de patente y no por los detalles específicos presentados por la descripción y la explicación de las realizaciones en la presente.

Claims (12)

REIVINDICACIONES
1. Aparato para generar una señal decorrelacionada que comprende: una unidad receptora para recibir información de fase; un separador de componentes transitorios para separar una señal de entrada en un primer componente de señal y un segundo componente de señal tal que el primer componente de señal comprende porciones de señal transitorias de la señal de entrada y tal que el segundo componente de señal comprende porciones de señal no transitorias de la señal de entrada; un decorrelacionador de componentes transitorios para decorrelacionar el primer componente de señal de acuerdo con un primer método de decorrelación para obtener un primer componente de señal decórrelacionado; además un segundo decorrelacionador para decorrelacionar el segundo componente de señal de acuerdo con un segundo método de decorrelación para obtener un segundo componente de señal decórrelacionado, en donde el segundo método de decorrelación es diferente del primer método de decorrelación; y una unidad combinadora para combinar el primer componente de señal decórrelacionado y el segundo componente de señal decórrelacionado para obtener una señal de salida decorrelacionada; en donde del decorrelacionador de componentes transitorios está adaptado para aplicar la información de fase al primer componente de señal. .
2. Aparato de acuerdo con la reivindicación 1 , en donde la unidad receptora está adaptada para recibir la información de fase desde un codificador; y en donde el decorrelacionador de componentes transitorios está adaptado para aplicar la información de fase al primer componente de señal.
3. Aparato de acuerdo con las reivindicaciones 1 o 2, en donde el separador de componentes transitorios está adaptado para separar una señal de entrada la cual está representada en el dominio de la frecuencia.
4. Aparato de acuerdo con una de las reivindicaciones precedentes, en donde la información de fase indica una diferencia de fase entre una señal residual y una señal mezclada hacia abajo, y en donde el decorrelacionador de componentes transitorios está adaptado para decorrelacionar el primer componente de señal para aplicar la información de fase al primer componente de señal.
5. Aparato de acuerdo con la reivindicación 4, en donde la información de fase indica una diferencia de fase entre una señal residual y una señal mezclada hacia abajo con respecto acierta frecuencia de banda y en donde el decorrelacionador de componentes transitorios está adaptado para decorrelacionar el primer componente de señal por aplicación de la información de fase al primer componente de señal.
6. Aparato de acuerdo con cualquiera de las reivindicaciones 1 a 3, en donde la información de fase indica una diferencia de fase entre una residual y una señal mezclada hacia abajo, en donde la diferencia de fase es un parámetro de banda ancha independiente de frecuencia y en donde un decorrelacionador transitorio está adaptado para decorrelacionar el primer componente de señal al aplicar la información de fase al primer componente de señal.
7. Aparato de acuerdo con una de las reivindicaciones precedentes, en donde el decorrelacionador de componentes transitorios está adaptado para establecer un término de fase a partir de la información de fase; y en donde el decorrelacionador de componentes transitorios además está adaptado para aplicar el término de fase al primer componente de señal.
8. Aparato de acuerdo con la reivindicación 7, en donde el decorrelacionador de componentes transitorios está adaptado para aplicar el término de fase al primer componente de señal multiplicando el término de fase con el primer componente de señal.
9. Aparato de acuerdo con cualquiera de las reivindicaciones precedentes, en donde el aparato además está adaptado para recibir información de separación de componentes transitorios indicando si una porción de señal de la señal de entrada comprende un componente transitorio; y en donde el separador de componentes transitorios separa una señal de entrada en el primer componente de señal y en el segundo componente de señal en base a la información de separación de componentes transitorios.
10. Aparato de acuerdo con una de las reivindicaciones precedentes, en donde la unidad combinadora está adaptada para combinar el primer componente de señal decorrelacionado y el segundo componente de señal decorrelacionado por adición del primer componente de señal decorrelacionado y el segundo componente de señal decorrelacionado.
11. Método para generar una señal decorrelacionada que comprende: recibir información de fase; separar una señal de entrada en un primer componente de señal y un segundo componente de señal tal que el primer componente de señal comprende porciones de señal transitorias de la señal de entrada y tal que el segundo componente de señal comprende porciones de señal no transitorias de la señal de entrada; decorrelacionar el primer componente de señal por un decorrelacionador de componentes transitorios de acuerdo con un primer método de decorrelación para obtener un primer componente de señal decorrelacionado; decorrelacionar el segundo componente de señal por además un segundo decorrelacionador de acuerdo con un segundo método de decorrelación para obtener un segundo componente de señal decorrelacionado, en donde el segundo método de decorrelación es diferente del primer método de decorrelación; y combinar el primer componente de señal decorrelacionado y el segundo componente de señal decorrelacionado para obtener una señal de salida decorrelacionada; en donde la información de fase recibida es aplicada al primer componente de señal.
12. Programa de computadora que ¡mplementa un método de acuerdo con la reivindicación 11.
MX2013002188A 2010-08-25 2011-07-06 Aparato para generar una señal decorrelacionada utilizando informacion de fase transmitida. MX2013002188A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US37698010P 2010-08-25 2010-08-25
PCT/EP2011/061361 WO2012025283A1 (en) 2010-08-25 2011-07-06 Apparatus for generating a decorrelated signal using transmitted phase information

Publications (1)

Publication Number Publication Date
MX2013002188A true MX2013002188A (es) 2013-03-18

Family

ID=44509236

Family Applications (2)

Application Number Title Priority Date Filing Date
MX2013002187A MX2013002187A (es) 2010-08-25 2011-07-06 Aparato para decodificar una señal que contiene componentes transitorios usando una unidad combinadora y un mezclador.
MX2013002188A MX2013002188A (es) 2010-08-25 2011-07-06 Aparato para generar una señal decorrelacionada utilizando informacion de fase transmitida.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
MX2013002187A MX2013002187A (es) 2010-08-25 2011-07-06 Aparato para decodificar una señal que contiene componentes transitorios usando una unidad combinadora y un mezclador.

Country Status (21)

Country Link
US (3) US9431019B2 (es)
EP (5) EP2609591B1 (es)
JP (3) JP5775582B2 (es)
KR (2) KR101445291B1 (es)
CN (2) CN103180898B (es)
AR (3) AR082542A1 (es)
AU (2) AU2011295368B2 (es)
BR (2) BR112013004365B1 (es)
CA (3) CA2887939C (es)
ES (3) ES2544077T3 (es)
HK (2) HK1186833A1 (es)
MX (2) MX2013002187A (es)
MY (3) MY180970A (es)
PL (3) PL2609590T3 (es)
PT (2) PT3144932T (es)
RU (3) RU2573774C2 (es)
SG (3) SG187950A1 (es)
TR (1) TR201900417T4 (es)
TW (2) TWI457912B (es)
WO (2) WO2012025282A1 (es)
ZA (1) ZA201302050B (es)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY180970A (en) 2010-08-25 2020-12-14 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information
JP5681290B2 (ja) * 2010-09-28 2015-03-04 ホアウェイ・テクノロジーズ・カンパニー・リミテッド デコードされたマルチチャネルオーディオ信号またはデコードされたステレオ信号を後処理するためのデバイス
US9064318B2 (en) 2012-10-25 2015-06-23 Adobe Systems Incorporated Image matting and alpha value techniques
US9355649B2 (en) * 2012-11-13 2016-05-31 Adobe Systems Incorporated Sound alignment using timing information
US10638221B2 (en) 2012-11-13 2020-04-28 Adobe Inc. Time interval sound alignment
US9201580B2 (en) 2012-11-13 2015-12-01 Adobe Systems Incorporated Sound alignment user interface
US9076205B2 (en) 2012-11-19 2015-07-07 Adobe Systems Incorporated Edge direction and curve based image de-blurring
US10249321B2 (en) 2012-11-20 2019-04-02 Adobe Inc. Sound rate modification
US9451304B2 (en) 2012-11-29 2016-09-20 Adobe Systems Incorporated Sound feature priority alignment
US10455219B2 (en) 2012-11-30 2019-10-22 Adobe Inc. Stereo correspondence and depth sensors
US9135710B2 (en) 2012-11-30 2015-09-15 Adobe Systems Incorporated Depth map stereo correspondence techniques
US10249052B2 (en) 2012-12-19 2019-04-02 Adobe Systems Incorporated Stereo correspondence model fitting
US9208547B2 (en) 2012-12-19 2015-12-08 Adobe Systems Incorporated Stereo correspondence smoothness tool
US9214026B2 (en) 2012-12-20 2015-12-15 Adobe Systems Incorporated Belief propagation and affinity measures
JP6046274B2 (ja) * 2013-02-14 2016-12-14 ドルビー ラボラトリーズ ライセンシング コーポレイション 上方混合されたオーディオ信号のチャネル間コヒーレンスの制御方法
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
US9659569B2 (en) 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
PT3022949T (pt) 2013-07-22 2018-01-23 Fraunhofer Ges Forschung Descodificador de áudio multicanal, codificador de áudio de multicanal, métodos, programa de computador e representação de áudio codificada usando uma descorrelação dos sinais de áudio renderizados
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
WO2015017223A1 (en) 2013-07-29 2015-02-05 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
JP6212645B2 (ja) * 2013-09-12 2017-10-11 ドルビー・インターナショナル・アーベー オーディオ・デコード・システムおよびオーディオ・エンコード・システム
CA2926243C (en) * 2013-10-21 2018-01-23 Lars Villemoes Decorrelator structure for parametric reconstruction of audio signals
KR102231755B1 (ko) 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
JP6235725B2 (ja) 2014-01-13 2017-11-22 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP2980789A1 (en) 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
KR20160101692A (ko) 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
TWI616095B (zh) * 2016-08-26 2018-02-21 配信裝置、配信系統、配信方法、電子機器、播放裝置及接收程式
WO2018086946A1 (en) * 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
CA3042580C (en) 2016-11-08 2022-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
JP7257975B2 (ja) 2017-07-03 2023-04-14 ドルビー・インターナショナル・アーベー 密集性の過渡事象の検出及び符号化の複雑さの低減
AU2018308668A1 (en) 2017-07-28 2020-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter
US10306391B1 (en) 2017-12-18 2019-05-28 Apple Inc. Stereophonic to monophonic down-mixing
EP3550561A1 (en) 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
EP3899929A1 (en) * 2018-12-20 2021-10-27 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for controlling multichannel audio frame loss concealment
FR3136099A1 (fr) * 2022-05-30 2023-12-01 Orange Codage audio spatialisé avec adaptation d’un traitement de décorrélation

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999041947A1 (en) * 1998-02-13 1999-08-19 Koninklijke Philips Electronics N.V. Surround sound reproduction system, sound/visual reproduction system, surround signal processing unit and method for processing an input surround signal
KR101016251B1 (ko) 2002-04-10 2011-02-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호의 코딩
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
CA2992125C (en) * 2004-03-01 2018-09-25 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
US20090299756A1 (en) 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
JP4521633B2 (ja) * 2004-03-12 2010-08-11 直樹 末広 符号分割多重信号の相関分離識別方式
BRPI0509100B1 (pt) * 2004-04-05 2018-11-06 Koninl Philips Electronics Nv Codificador de multicanal operável para processar sinais de entrada, método paracodificar sinais de entrada em um codificador de multicanal
JP5032977B2 (ja) 2004-04-05 2012-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
EP1768107B1 (en) * 2004-07-02 2016-03-09 Panasonic Intellectual Property Corporation of America Audio signal decoding device
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7283634B2 (en) * 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
MX2007015118A (es) 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
RU2393550C2 (ru) * 2005-06-30 2010-06-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ кодирования и декодирования звукового сигнала
KR101277041B1 (ko) 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
PL1999997T3 (pl) * 2006-03-28 2011-09-30 Fraunhofer Ges Forschung Udoskonalony sposób kształtowania sygnału podczas rekonstrukcji wielokanałowego sygnału audio
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
CN101884065B (zh) * 2007-10-03 2013-07-10 创新科技有限公司 用于双耳再现和格式转换的空间音频分析和合成的方法
JP5266332B2 (ja) 2008-01-01 2013-08-21 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
KR101183127B1 (ko) * 2008-02-14 2012-09-19 돌비 레버러토리즈 라이쎈싱 코오포레이션 스테레오 입력을 수정하기 위한 방법 및 음향 재생 시스템
WO2009116280A1 (ja) 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
MY180970A (en) * 2010-08-25 2020-12-14 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information

Also Published As

Publication number Publication date
TWI457912B (zh) 2014-10-21
CN103180898B (zh) 2015-04-08
RU2013112903A (ru) 2014-09-27
WO2012025283A1 (en) 2012-03-01
US20130173273A1 (en) 2013-07-04
EP2924687B1 (en) 2016-11-02
MX2013002187A (es) 2013-03-18
EP3471091A1 (en) 2019-04-17
US8831931B2 (en) 2014-09-09
TW201214414A (en) 2012-04-01
AR098078A2 (es) 2016-04-27
ES2544077T3 (es) 2015-08-27
AU2011295368B2 (en) 2015-05-07
AU2011295368A1 (en) 2013-03-28
ES2585402T3 (es) 2016-10-05
TW201214417A (en) 2012-04-01
SG2014006738A (en) 2014-03-28
EP2609591B1 (en) 2016-06-01
US9431019B2 (en) 2016-08-30
SG187950A1 (en) 2013-03-28
TWI459380B (zh) 2014-11-01
WO2012025282A1 (en) 2012-03-01
PL3144932T3 (pl) 2019-04-30
KR101445291B1 (ko) 2014-09-29
EP2609590B1 (en) 2015-05-20
AU2011295367B2 (en) 2014-07-31
RU2015102326A (ru) 2015-06-10
US20130173274A1 (en) 2013-07-04
CA2809437A1 (en) 2012-03-01
MY156770A (en) 2016-03-31
AR082542A1 (es) 2012-12-12
CA2887939C (en) 2017-11-07
EP2609590A1 (en) 2013-07-03
RU2013112853A (ru) 2014-09-27
BR112013004362A2 (pt) 2017-09-19
HK1186833A1 (en) 2014-03-21
CN103180898A (zh) 2013-06-26
CN103460282B (zh) 2015-08-19
BR112013004362B1 (pt) 2020-12-01
US20140222441A1 (en) 2014-08-07
JP5775583B2 (ja) 2015-09-09
CA2809404A1 (en) 2012-03-01
AR082543A1 (es) 2012-12-12
MY180970A (en) 2020-12-14
CN103460282A (zh) 2013-12-18
ZA201302050B (en) 2013-12-23
AU2011295367A1 (en) 2013-04-11
RU2580084C2 (ru) 2016-04-10
BR112013004365A2 (pt) 2020-06-02
HK1187144A1 (zh) 2014-03-28
PT3144932T (pt) 2019-02-04
JP2013539554A (ja) 2013-10-24
JP2015129953A (ja) 2015-07-16
EP2609591A1 (en) 2013-07-03
JP6196249B2 (ja) 2017-09-13
BR112013004365B1 (pt) 2021-01-12
KR20130079507A (ko) 2013-07-10
CA2887939A1 (en) 2012-03-01
US9368122B2 (en) 2016-06-14
RU2640650C2 (ru) 2018-01-10
SG188254A1 (en) 2013-04-30
JP2013539553A (ja) 2013-10-24
JP5775582B2 (ja) 2015-09-09
ES2706490T3 (es) 2019-03-29
CA2809404C (en) 2016-06-21
EP2924687A1 (en) 2015-09-30
EP3144932B1 (en) 2018-11-07
EP3144932A1 (en) 2017-03-22
PL2609591T3 (pl) 2016-11-30
CA2809437C (en) 2016-06-21
PT2609591T (pt) 2016-07-12
KR20130069770A (ko) 2013-06-26
PL2609590T3 (pl) 2015-10-30
RU2573774C2 (ru) 2016-01-27
TR201900417T4 (tr) 2019-02-21
MY178197A (en) 2020-10-06
KR101445293B1 (ko) 2014-09-29

Similar Documents

Publication Publication Date Title
US9368122B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information

Legal Events

Date Code Title Description
FG Grant or registration