ES2585402T3 - Aparato para generar una señal descorrelacionada usando información de fase transmitida - Google Patents

Aparato para generar una señal descorrelacionada usando información de fase transmitida Download PDF

Info

Publication number
ES2585402T3
ES2585402T3 ES11743459.7T ES11743459T ES2585402T3 ES 2585402 T3 ES2585402 T3 ES 2585402T3 ES 11743459 T ES11743459 T ES 11743459T ES 2585402 T3 ES2585402 T3 ES 2585402T3
Authority
ES
Spain
Prior art keywords
signal
transient
component
signal component
phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11743459.7T
Other languages
English (en)
Inventor
Achim Kuntz
Sascha Disch
Jürgen HERRE
Fabian Kuech
Johannes Hilpert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44509236&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2585402(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2585402T3 publication Critical patent/ES2585402T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Error Detection And Correction (AREA)
  • Optical Communication System (AREA)

Abstract

Un aparato para generar una senal decorrelacionada que comprende: una unidad receptora (650) para recibir informacion de fase; un separador de componentes transitorios (310; 410; 510; 610; 710; 910) para separar una senal de entrada en un primer componente de senal y un segundo componente de senal tal que el primer componente de senal comprende porciones de senal transitorias de la senal de entrada y tal que el segundo componente de senal comprende porciones de senal no transitorias de la senal de entrada; un decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) para decorrelacionar el primer componente de senal de acuerdo con un primer metodo de decorrelacion para obtener un primer componente de senal decorrelacionado; un segundo decorrelacionador (330; 430; 530; 630; 730; 930) para decorrelacionar el segundo componente de senal de acuerdo con un segundo metodo de decorrelacion para obtener un segundo componente de senal decorrelacionado, en el que el segundo metodo de decorrelacion es diferente del primer metodo de decorrelacion; y una unidad combinadora (340; 440; 540; 640; 740; 940) para combinar el primer componente de senal decorrelacionado y el segundo componente de senal decorrelacionado para obtener una senal de salida decorrelacionada; en el que el decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) esta adaptado para aplicar la informacion de fase al primer componente de señal.

Description

5
10
15
20
25
30
35
40
45
50
55
60
Aparato para generar una senal descorrelacionada usando informacion de fase transmitida
DESCRIPCION
La presente invencion se refiere al campo de procesamiento de audio y decodificacion de audio, en particular a decodificar una senal que comprende componentes transitorios.
En los ultimos anos avanzo de muchas maneras el procesamiento y/o la decodificacion de audio. En particular, se hacen cada vez mas importantes las aplicaciones de audio espacial. Con frecuencia se usa procesamiento de senal de audio para decorrelacionar o reproducir senales. Asimismo, la decorrelacion y la reproduccion de senales se emplean en el proceso de mezclado hacia arriba mono a estereo, mezclado hacia arriba mono/estereo a multicanal, reverberacion artificial, ampliacion de estereo o mezclado/reproduccion interactivo con el usuario.
Diversos sistemas de procesamiento de senal de audio emplean decorrelacionadores. Un ejemplo importante es la aplicacion de sistemas decorrelacionadores en decodificadores de audio espacial parametricos para recuperar propiedades de decorrelacion espedficas entre dos o mas senales que son reconstruidas a partir de una o varias senales mezcladas hacia abajo. La aplicacion de decorrelacionadores mejora significativamente la calidad perceptual de la senal de salida, por ejemplo, cuando se compara con estereo de intensidad. Espedficamente, el uso de decorrelacionadores permite la correcta smtesis de sonido espacial con una amplia imagen de sonido, varios objetos de sonido concurrentes y/o atmosfera. Sin embargo, tambien se sabe que los decorrelacionadores introducen artefactos como cambios en la estructura temporal de la senal, timbre, etc.
Otros ejemplos de aplicacion de decorrelacionadores en procesamiento de audio son, por ejemplo, la generacion de reverberacion artificial para cambiar la impresion espacial o el uso de decorrelacionadores en sistemas de cancelacion de eco acustico multicanal para mejorar el comportamiento de convergencia.
En la Figura 1 se ilustra una tfpica aplicacion de un decorrelacionador del estado actual de la tecnica en un mezclador hacia arriba mono a estereo, por ejemplo, aplicado en Estereo Parametrico (PS), donde se provee una senal de entrada mono M (una senal "seca") a un decorrelacionador 110. El decorrelacionador 110 decorrelaciona la senal de entrada mono M de acuerdo con un metodo de decorrelacion para proveer una senal decorrelacionada D (una senal "mojada") en su salida. La senal decorrelacionada D es alimentada a un mezclador 120 como una primera senal de entrada de mezclador junto con la senal mono seca M como una segunda senal de entrada de mezclador. Ademas, una unidad de control de mezcla hacia arriba 130 alimenta parametros de control de mezcla hacia arriba al mezclador 120. El mezclador 120 entonces genera dos canales de salida L y R (L = canal de salida estereo izquierdo; R = canal de salida estereo derecho) de acuerdo con una matriz de mezclado H. Los coeficientes de la matriz de mezclado pueden ser fijos, dependientes de la senal o controlados por un usuario.
Alternativamente, la matriz de mezclado es controlada por informacion lateral que es transmitida junto con el mezclado hacia abajo que contiene una descripcion parametrica sobre como mezclar hacia arriba las senales del mezclado hacia abajo para formar la salida multicanal deseada. Esta informacion lateral espacial usualmente es generada durante el proceso de mezclado hacia abajo mono en un codificador de senal compatible.
Este principio se aplica ampliamente en codificacion de audio espacial, por ejemplo, Estereo Parametrico, ver, por ejemplo, de J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, "Codificacion de Audio Espacial Parametrico de Alta Calidad a baja cantidad de bits transmitidos" (“High-Quality Parametric Spatial Audio Coding at Low Bitrates”) en Actas de la 116° Convencion de AES, Berlin, Preimpresion 6072, mayo de 2004.
Otra tfpica estructura del estado actual de la tecnica, de un decodificador estereo parametrico esta ilustrada en la Figura 2, en el que el proceso de decorrelacion se realiza en el dominio de la transformacion. Un banco de filtros de analisis 210 transforma una senal de entrada mono a un dominio de la transformacion, por ejemplo, al dominio de la frecuencia. La decorrelacion de la senal de entrada mono transformada M luego es realizada por un decorrelacionador 220 el cual genera una senal decorrelacionada D. Tanto la senal de entrada mono transformada M como la senal decorrelacionada D, son alimentadas a una matriz de mezclado 230. La matriz de mezclado 230 luego genera dos senales de salida L y R tomando en cuenta parametros de mezclado hacia arriba, las cuales son provistas por la unidad de modificacion de parametros 240, la cual esta provista con parametros espaciales y esta acoplada a una unidad de control de parametros 250. En la Figura 2, los parametros espaciales pueden ser modificados por un usuario o herramientas adicionales, por ejemplo, post-procesamiento para reproduccion/presentacion binaural. En este ejemplo, los parametros de mezclado hacia arriba son combinados con los parametros provenientes de los filtros binaurales para formar los parametros de entrada para la matriz de mezclado hacia arriba. Finalmente, las senales de salida generadas por la matriz de mezclado 230 son alimentadas al banco de filtros de smtesis 260, el cual determina la senal de senal de salida estereo.
5
10
15
20
25
30
35
40
45
50
55
60
La salida L/R de la matriz de mezclado 230 es computada a partir de la senal de entrada modo M y la senal decorrelacionada D de acuerdo con una regla de mezclado, por ejemplo, aplicando la siguiente formula:
L
hn h12 M
R
_h21 JS- 1_______ D
En la matriz de mezclado, la magnitud del sonido decorrelacionado alimentado a la salida es controlada sobre la base de los parametros transmitidos, por ejemplo, Correlacion/Coherencia Inter-Canal (ICC) y/o configuraciones fijas o definidas por el usuario.
Conceptualmente, la senal de salida de la salida del decorrelacionador D reemplaza una senal residual que idealmente permitina una decodificacion perfecta de las senales L/R originales. Utilizar la salida de decorrelacionador D en lugar de una senal residual en el mezclador hacia arriba da por resultado un ahorro de cantidad de bits transmitidos que de otra manera se hubiera requerido para transmitir la senal residual. El objetivo del decorrelacionador es entonces generar una senal D a partir de la senal mono M, la cual exhiba propiedades similares a la senal residual que es reemplazada por D.
Correspondientemente, del lado del codificador, se extraen dos tipos de parametros espaciales: Un primer grupo de parametros comprende parametros de correlacion/coherencia (por ejemplo, ICCs = parametros de Correlacion/Coherencia Inter-Canal) que representan la coherencia o la correlacion cruzada entre dos canales de entrada que seran conectados. Un segundo grupo de parametros comprende parametros de diferencia de nivel (por ejemplo, ILDs = parametros de Diferencia de Nivel Inter-Canal) que representan la diferencia de nivel entre los dos canales.
Ademas, una sena mezclada hacia abajo es generada mezclando hacia abajo los dos canales de entrada. Asimismo, se genera una senal residual. Senales residuales son senales que pueden ser usadas para regenerar las senales originales empleando adicionalmente la senal mezclada hacia abajo y una matriz de mezclado hacia arriba. Por ejemplo, cuando N senales son mezcladas hacia abajo a 1 senal, el mezclado hacia abajo tipicamente es 1 de los N componentes que resultan del mapeo de las N senales de entrada. Los componentes restantes que resultan del mapeo (por ejemplo, N-1 componentes) son senales residuales y permiten reconstruir las N senales originales mediante un mapeo inverso. El mapeo puede ser, por ejemplo, una rotacion. El mapeo debe ser conducido tal que la senal mezclada hacia abajo sea maximizada y las senales residuales sean minimizadas, por ejemplo, similar a una transformacion de eje principal. Por ejemplo, la energfa de la senal mezclada hacia abajo debe ser maximizada y las energfas de las senales residuales deben ser minimizadas. Cuando se mezclan hacia abajo dos senales a 1 senal, el mezclado hacia abajo es normalmente una de las dos componentes que resultan del mapeo de las 2 senales de entrada. El componente restante que resulta del mapeo es la senal residual y permite reconstruir las 2 senales originales mediante un mapeo inverso.
En algunos casos, la senal residual puede representar un error asociado con representar las dos senales mediante sus parametros de mezclado hacia abajo y asociados. Por ejemplo, la senal residual puede ser una senal de error la cual representa el error entre los canales originales L, R y los canales L', R', resultantes de mezclar hacia arriba la senal mezclada hacia abajo que fue generada en base a los canales originales L y R.
En otras palabras, una senal {{PCT}} en el cual la senal residual puede ser considerada como una senal en el dominio del tiempo o un dominio de la frecuencia o un dominio subbanda, que junto con la senal mezclada hacia abajo sola o con la senal mezclada hacia abajo y la informacion parametrica permite una reconstruccion correcta o casi correcta de un canal original. Casi correcto se debe entender como que la reconstruccion con la senal residual teniendo una energfa mayor que cero es mas cercana al canal original comparado con una reconstruccion usando el mezclado hacia abajo sin la senal residual o usando el mezclado hacia abajo y la informacion parametrica sin la senal residual.
Considerando MPEG Surround (MPS), se emplean estructuras similares a PS llamadas cajas Uno a Dos (cajas OTT) en arboles de decodificacion de audio espacial. Esto se puede ver como una generalizacion del concepto de mezclado hacia arriba mono a estereo a esquemas de codificacion/decodificacion de audio espacio multicanal. En MPS, tambien existen sistemas de mezclado hacia arriba de dos a tres (cajas TTT) que pueden aplicar decorrelacionadores dependiendo del modo de operacion TTT. En el documento de J. Herre, K. Kjorling, J. Breebaart, et al., "MPEG surround - la norma ISO/MPEG para codificacion de audio multicanal eficiente y compatible" (“MPEG surround—the ISO/MPEG standard for efficient and compatible multi-channel audio coding”) de las Actas de la 122° Convencion de AES, Viena, Austria, mayo de 2007, se describen detalles.
Con respecto a la Codificacion de Audio Direccional (DirAC), la DirAC se refiere a un esquema de codificacion de campo de sonido parametrico que no esta ligado a un numero fijo de canales de salida de audio con posiciones de
5
10
15
20
25
30
35
40
45
50
55
60
altavoz fijas. La DirAC aplica decorrelacionadores en el reproductor DriAC, esto es, en el decodificador de audio espacial para sintetizar componentes no coherentes de campos de sonido. Se puede hallar mas informacion relacionada con codificacion de audio direccional en el documento de Pulkki, Ville: Reproduccion de Sonido Espacial con Codificacion de Audio Direccional" (“Spatial Sound Reproduction with Directional Audio Coding”) en J. Audio Eng. Soc., Vol. 55, No. 6, 2007.
Con respecto a decorrelacionadores del estado actual de la tecnica en decodificadores de audio espacial, se hace referencia a la Norma Internacional SO/IEC "Tecnologfa de Informacion-tecnologfas de audio MPEG" (“Information Technology- MPEG audio technologies) - Parte 1: MPEG Surround”, ISO/IEC 23003-1:2007 y tambien al documento de J. Engdegard, H. Purnhagen, J. Roden, L.Liljeryd, "Atmosfera Sintetica en Codificacion Parametrica de Estereo" (“Synthetic Ambience in Parametric Stereo Coding”) en Actas de la 116° de AES Convention, Berlin, Preimpresion, mayo de 2004. Se usan estructuras reticulares pasa todo (lattice allpass structures) IIR como decorrelacionadores en decodificadores de audio espacial tipo MPS como se describe en el documento de J. Herre, K. Kjorling, J. Breebaart, et al., "MPEG Surround - la norma ISO/MPEG para codificacion de audio multicanal eficiente y compatible" (“MPEG surround—the ISO/MPEG standard for efficient and compatible multi-channel audio coding”) de las Actas de la 122° Convencion de AES, Viena, Austria, mayo de 2007, y se describen en la Norma Internacional ISO/IEC "Tecnologfa de Informacion - tecnologfas de audio MPEG - Parte 1: MPEG Surround" (“Information Technology- MPEG audio technologies - Part1: MPEG Surround”), ISO/IEC 23003-1:2007. Otros decorrelacionadores del estado actual de la tecnica aplican demoras (potencialmente dependientes de la frecuencia) para decorrelacionar senales o convolucionar las senales de entrada, por ejemplo, con erupciones de ruido que decaen exponencialmente. Para un panorama de los decorrelacionadores para sistemas de mezclado hacia arriba de audio espacial del estado actual de la tecnica, ver "Atmosfera Sintetica en Codificacion Estereo Parametrica" (“Synthetic Ambience in Parametric Stereo Coding”) en Actas de la 116° Convention de AES, Berlin, Preimpresion, mayo de 2004.
Otra tecnica de procesar senales es "procesamiento de mezclado hacia arriba semantico" (semantic upmix processing"). El procesamiento de mezclado hacia arriba semantico es una tecnica para descomponer senales en componentes con diferentes propiedades semanticas (esto es, clases de senal) y aplicar diferentes estrategias de mezclado hacia arriba a los diferentes componentes de senal. Los diferentes algoritmos de mezclado hacia arriba pueden ser optimizados de acuerdo con las diferentes propiedades semanticas para mejorar el esquema de procesamiento de senal global. Este concepto se describe en el documento WO/2010/017967, "Un aparato para determinar una senal de audio multicanal-canal de salida espacal" (An apparatus for determining a spatial output multichannel-channel audio signal), solicitud de patente internacional PCT/EP2009/005828, 11.8.2009, 11.6.2010 (FH090802PCT).
Otro esquema de codificacion de audio espacial es el "metodo de permutacion temporal", segun se describe en el documento de Hotho, G., van de Par, S., y Breebaart, J.: "Codificacion multicanal de senales de aplauso" (“Multichannel coding of applause signals”), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI=
http://dx.doi.org/10.1155/2008/. En este documento se propone un esquema de codificacion de audio espacial que se adecua a medida a la codificacion/decodificacion de senales de tipo aplauso. Este esquema se basa en la similaridad perceptual de segmentos de una senal de audio monofonica, especialmente una senal mezclada hacia abajo de un codificador de audio espacial. La senal de audio monofonica es segmentada en segmentos de tiempo que se superponen. Estos segmentos son permutados temporalmente seudo aleatoriamente (mutuamente independientes para n canales de salida) dentro de un "superbloque" para formar los canales de salida decorrelacionados.
Otra tecnica de codificacion de audio espacial es el "metodo demora temporal e intercambio" (“temporal delay and swapping method’’). En el documento " DE 10 2007 018032 A: 20070417, Erzeugung dekorrelierter Signale", 17.4.2007, 23.10.2008 (FH070414PDE), se propone un esquema que tambien se adecua a medida para codificacion/decodificacion de senales de ti po aplauso para presentacion binaural. Este esquema tambien se basa en la similaridad perceptual de segmentos de una senal de audio monofonica y demora canales de salida uno con respecto a otro. Para evitar una influencia de localizacion hacia el canal central, son barridos periodicamente los canales delantero y posterior.
En general, se sabe que las senales de tipo aplauso estereo o multicanal codificadas/decodificadas en codificadores de audio espacial parametricos dan por resultado reducida calidad de senal (ver, por ejemplo, Hotho, G., van de Par, S., y Breebaart, J.:"Codificacion multicanal de senales de aplauso" (“Multichannel coding of applause signals”), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI=
http://dx.doi.org/10.1155/2008/531693, ver tambien DE 10 2007 018032 A). Las senales de tipo aplauso se caracterizan por contener mezclas temporalmente densas de componentes transitorios provenientes de diferentes direcciones. Ejemplos de tales senales son aplausos, el sonido de la lluvia, caballos galopando, etc. Las senales de tipo aplauso con frecuencia tambien contienen componentes de sonido provenientes de fuentes de sonido distantes, que se funden perceptualmente en un campo de sonido de fondo, suave, tipo ruido.
5
10
15
20
25
30
35
40
45
50
55
60
Las tecnicas de decorrelacion del estado actual de la tecnica empladas en decodificadores de audio espacial tipo MPEG Surround contienen estructuras reticulares pasa todo. Estas actuan como generadores de reverberacion y consecuentemente son adecuadas para generar sonidos homogeneos, suaves, de tipo ruido, inmersivos (como colas de reverberacion del ambiente) Sin embargo, hay ejemplos de campos de sonido con una estructura espacio- temporal no homogenea que aun son inmersores para el oyente: un ejemplo prominente son campos de sonido de tipo aplauso que crean envolvimiento del oyente no solo mediante campos de tipo ruido homogeneos, sino tambien mediante secuencias bastante densas de palmadas singulares provenientes de diferentes direcciones. Por ende, el componente no homogeneo de los campos de sonido de aplauso puede estar caracterizado por una mezcla espacialmente distribuida de componentes transitorios. Obviamente, estas palmadas separadas no son homogeneas, suaves y de tipo ruido en absoluto.
Debido a su comportamiento de tipo reverberacion, los decorrelacionadores de reticula pasa todo son incapaces de generar un campo de sonido inmersivo con las caractensticas, por ejemplo, del aplauso. En cambio, cuando se aplica a senales de tipo aplauso, tienden a embadurnar temporalmente los componentes transitorios de las senales. El resultado no deseado es un campo de sonido inmersivo de tipo ruido sin la estructura espacio-temporal distintiva de los campos de sonido de tipo aplauso. Ademas, eventos transitorios como un aplauso aislado podna evocar artefactos campanilla de los filtros del decorrelacionador.
Un sistema de acuerdo con Hotho, G., van de Par, S., y Breebaart, J.: "Codificacion multicanal de senales de aplauso" (“Multichannel coding of applause signals”), EURASIP Journal on Advances in Signal Processing, enero de 2008, art. 10. DOI=
http://dx.doi.org/10.1155/2008/531693, exhibira degradacion perceptible del sonido de salida debido a una cierta cualidad repetitiva en las senales de audio de salida. Eso ocurre por el hecho de uno y el mismo segmento de la senal de entrada aparece inalterado en cada canal de salida (aunque en un punto de tiempo diferente). Asimismo, para evitar densidad de aplauso aumentada, hay que dejar caer algunos canales originales en el mezclado hacia arriba y por ende podna faltar algun evento auditivo importante en el mezclado hacia arriba resultante. El metodo solo es aplicable si es posible hallas segmentos de senal que comparten las mismas propiedades perceptuales, esto es, segmentos de senal que suenan similares. El metodo en general diffcilmente cambia la estructura temporal de las senales, lo cual podna ser aceptable solo para muy pocas senales. En el caso de aplicar el esquema a senales que no son del tipo aplauso (por ejemplo, debido a mala clasificacion de senal), la permutacion temporal mayormente conducira a resultados inaceptables. La permutacion temporal ademas limita la aplicabilidad a casos donde se pueden mezclar varios segmentos de senal juntos sin artefactos como ecos o filtrado peine. Desventajas similares valen para el metodo descrito en el documento DE 10 2007 018032 A.
El procesamiento semantico descrito en el documento WO/2010/017967 separa los componentes transitorios de las senales antes de la aplicacion de decorrelacionadores. La senal remanente (sin componentes transitorios) es alimentada a la decorrelacion convencional y al procesador de mezclado hacia arriba, mientras las senales transitorias son manejadas de diferente manera; estas ultimas son distribuidas (por ejemplo, aleatoriamente) a diferentes canales de la senal de salida estereo o multicanal mediante aplicacion de tecnicas de paneo de amplitud. El paneo de amplitud muestras varias desventajas:
El paneo de amplitud no necesariamente produce una senal de salida que es cercana a la original. La senal de salida puede ser cercana a la original si la distribucion de los componentes transitorios en la senal original puede ser descrita por las leyes de paneo de amplitud. Esto es: El paneo de amplitud solo puede reproducir eventos puramente paneados en amplitud correctamente, pero sin diferencias de fase o tiempo entre componentes transitorios en diferentes canales de salida.
Asimismo, la aplicacion del enfoque de paneo de amplitud en MPS requerina puentear no solo el decorrelacionador sino tambien la matriz de mezclado hacia arriba. Como la matriz de mezclado hacia arriba refleja los parametros espaciales (correlaciones intercanal: ICCs, diferencias de nivel intercanal ILDs) que son necesarios para sintetizar una salida mezclada hacia arriba que muestra las correctas propiedades espaciales, el sistema de paneo en sf mismo tiene que aplicar alguna regla para sintetizar senales de salida con las correctas propiedades espaciales. No se conoce una regla generica para hacerlo. Ademas, esta estructura agrega complejidad ya que hay que cuidar los parametros espaciales dos veces: uno, para parte no transitoria de la senal y, segundo, para la parte transitoria penada en amplitud de la senal.
Por lo tanto, es un objetivo del presente invento proveer un concepto mejorado para generar una senal decorrelacionada. El objetivo del presente invento es resuelto mediante un aparato para generar una senal decorrelacionada de acuerdo con la reivindicacion 1, mediante un aparato para codificar una senal de audio de acuerdo con la reivindicacion 11, mediante un metodo para generar una senal decorrelacionada de acuerdo con las realizaciones 14 y mediante un programa de ordenador de acuerdo con la reivindicacion 15.
Un aparato de acuerdo con una realizacion comprende un separador de componentes transitorios para separar una senal de entrada en un primer componente de senal y un segundo componente de senal tal que el primer
5
10
15
20
25
30
35
40
45
50
55
60
componente de senal comprende porciones de senal transitorias de la senal de entrada y tal que el segundo componente de senal comprende porciones de senal no transitorias de la senal de entrada. El separador de componentes transitorios puede separar los diferentes componentes de senal uno de otro para permitir que los componentes de senal que contienen transitorios puedan ser procesados de manera diferente que los componentes de senal que no contienen transitorios.
El aparato comprende ademas un decorrelacionador de componentes transitorios para decorrelacionar componentes de la senal que contienen transitorios de acuerdo con un metodo de decorrelacion el cual es particularmente adecuado para decorrelacionar componentes de la senal que contienen transitorios. Asimismo, el aparato comprende un segundo decorrelacionador para decorrelacionar los componentes de la senal que no contienen transitorios.
Asf, el aparato es capaz de procesar componentes de la senal usando un decorrelacionador estandar o bien, alternativamente procesar componentes de la senal usando el decorrelacionador de componentes transitorios particularmente adecuado para procesar componentes de la senal transitorios. En una realizacion, el separador de componentes transitorios decide si un componente de la senal es alimentado al decorrelacionador estandar o al decorrelacionador de transitorios.
Asimismo, el aparato puede estar adaptado para separar un componente de senal tal que el componente de senal es alimentado parcialmente al decorrelacionador de transitorios y parcialmente es alimentado al segundo decorrelacionador.
Asimismo, el aparato comprende una unidad combinadora para combinar los componentes de senal entregados por el decorrelacionador estandar y el decorrelacionador de transitorios para generar una senal combinacion decorrelacionada.
En una realizacion, el aparato comprende una unidad receptora para recibir informacion de fase, en el que el decorrelacionador de transitorio esta adaptado para aplicar la informacion de fase al primer componente de la senal. La informacion de fase podna ser generada por un codificador adecuado.
En una realizacion, el separador de componentes transitorios esta adaptado para, o bien alimentar una porcion de senal considerada de una senal de entrada de aparato en el decorrelacionador de transitorio, o alimentar la porcion de senal considerada en el segundo decorrelacionador dependiendo de informacion de separacion de componente transitorio la cual, o bien indica que la porcion de senal considerada contiene un transitorio, o la cual indica que la porcion de senal considerada no contiene un transitorio. Una realizacion asf permite facil procesamiento de informacion de separacion de componente transitorio.
En otra realizacion, el separador de componentes transitorios esta adaptado para alimentar parcialmente una porcion de senal considerada de una senal de entrada de aparato, al decorrelacionador de transitorio y para alimentar parcialmente la porcion de senal considerada al segundo decorrelacionador. La magnitud de la porcion de senal considerada que es alimentada al separador de componentes transitorios y la magnitud de porcion de senal considerada que es alimentada al segundo decorrelacionador dependen de la informacion de separacion de componentes transitorios. Por este medio se puede tomar en cuenta la intensidad de un componente transitorio.
En otra realizacion, el separador de componentes transitorios esta adaptado para separar una senal de entrada de aparato la cual esta representada en un dominio de la frecuencia. Esto permite el procesamiento (separacion y decorrelacion) de componente transitorio dependiente de la frecuencia. Asf, ciertas componentes de senal de una primera banda de frecuencia pueden ser procesadas de acuerdo con un metodo de decorrelacion de componente transitorio, mientras componentes de senal de otra banda de frecuencia pueden ser procesados de acuerdo con otro metodo, por ejemplo, decorrelacion convencional. Consiguientemente, en una realizacion el separador de componentes transitorios esta adaptado para separar una senal de entrada de aparato en base a informacion de separacion de componentes transitorios dependientes de la frecuencia. Sin embargo, en una realizacion el separador de componentes transitorios esta adaptado para separar una senal de entrada de aparato en base a informacion de separacion independiente de la frecuencia. Esto permite procesamiento mas eficiente de senal con componente transitorio.
En otra realizacion, el separador de componentes transitorios puede estar adaptado para separar una senal de entrada de aparato la cual esta representada en un dominio de la frecuencia tal que todas las porciones de senal de la senal de entrada de aparato dentro de un primer rango de frecuencia son alimentadas al segundo decorrelacionador. Un correspondiente aparato, por lo tanto, esta adaptado para restringir procesamiento de senal transitoria a componentes de senal con frecuencias de senal en un segundo rango de frecuencia, mientras ninguna componente de senal con frecuencias de senal en el primer rango de frecuencia es alimentada al decorrelacionador de transitorio (sino en el segundo decorrelacionador).
5
10
15
20
25
30
35
40
45
50
55
60
En una realizacion adicional, el decorrelacionador de transitorio puede estar adaptado para decorrelacionar la primera componente de senal aplicando informacion de fase que representa una diferencia de fase entre una senal residual y una senal mezclada hacia abajo. Del lado del codificador se puede emplear una matriz de mezclado "reversa" para crear una senal mezclada hacia abajo y una senal residual, por ejemplo, desde los dos canales de una senal estereo, como se ha explicado arriba. Mientras la senal mezclada hacia abajo puede ser transmitida al decodificador, la senal residual puede ser descartada. De acuerdo con una realizacion, la diferencia de fase empleada por el decorrelacionador de transitorio puede ser la diferencia de fase entre la senal residual y la senal mezclada hacia abajo. Asf puede ser posible reconstruir una senal residual "artificial" aplicando la fase original de la residual a la mezclada hacia abajo. En una realizacion, la diferencia de fase puede relacionarse con una cierta banda de frecuencia, esto es, puede ser dependiente de la frecuencia. Alternativamente, una diferencia de fase no se relaciona con ciertas bandas de frecuencias, pero puede ser aplicada como un parametro de banda ancha independiente de la frecuencia.
En otra realizacion se podna aplicar el termino de fase al primer componente de senal multiplicando el termino de fase con el primer componente de senal.
En otra realizacion el segundo decorrelacionador puede ser un decorrelacionador convencional, por ejemplo, un decorrelacionador IIR de reticula.
En una realizacion, el aparato comprende un mezclador que esta adaptado para recibir senales de entrada y tambien esta adaptado para generar senales de salida en base a las senales de entrada y a una regla de mezclado. Se alimenta una senal de entrada de aparato a un separador de componentes transitorios y luego es decorrelacionada por un separador de componentes transitorios y/o un segundo decorrelacionador como se describe arriba. La unidad combinadora y el mezclador pueden ser acomodados de modo que la senal combinacion decorrelacionada sea alimentada al mezclador como una primera senal de entrada de mezclador. Una segunda senal de entrada de mezclados puede ser la senal de entrada de aparato o una senal derivada de la senal de entrada de aparato. Como el proceso de decorrelacion ya esta completo cuando la senal de combinacion decorrelacionada es alimentada al mezclado, el mezclador no tiene que tomar en cuenta la decorrelacion del componente transitorio. Por lo tanto, se puede emplear un mezclador convencional.
En una realizacion adicional, el mezclador esta adaptado para recibir datos de parametro de correlacion/coherencia indicando una correlacion o coherencia entre dos senales y esta adaptado para generar las senales de salida en base a los datos de parametro de correlacion/coherencia. En otra realizacion adicional, el mezclador esta adaptado para recibir datos de parametro de diferencia de nivel indicando una diferencia de energfa entre dos senales y esta adaptado para generar las senales de salida en base a los datos de parametro de diferencia de nivel. En una realizacion asf, el decorrelacionador de componente transitorio, el segundo decorrelacionador y la unidad combinadora no tiene que estar adaptados para procesar tales datos de parametros, ya que el mezclador se ocupara de procesar los datos correspondientes. Por el otro lado, en una realizacion asf se puede usar un mezclador convencional con procesamiento de parametros de correlacion/coherencia y diferencia de nivel.
Ahora se la Figura
la Figura
la Figura la Figura la Figura la Figura
la Figura la Figura
la Figura
explicaran las realizaciones en mas detalle con respecto a las figuras, en el que:
1 ilustra una aplicacion del estado actual de la tecnica, de un decorrelacionador en un mezclador hacia arriba mono a estereo;
2 representa otra aplicacion del estado actual de la tecnica, de un decorrelacionador en un mezclador hacia arriba mono a estereo;
3 ilustra un aparato para generar una senal decorrelacionada de acuerdo con una realizacion;
4 ilustra un aparato para decodificar una senal de acuerdo con una realizacion;
5 es una vista global de un sistema uno a dos (OTT) de acuerdo con una realizacion;
6 ilustra un aparato para generar una senal decorrelacionada que comprende una unidad receptora de acuerdo con una realizacion adicional;
7 es una vista global de un sistema uno a dos de acuerdo con otra realizacion adicional;
8 ilustra mapeos ejemplares desde medidas de consistencia de fase a intensidad de separacion de componente transitorio;
9 es una vista global de un sistema uno a dos de acuerdo con otra realizacion adicional;
5
10
15
20
25
30
35
40
45
50
55
60
la Figura 10 ilustra un aparato para codificar una senal de audio que tiene una pluralidad de canales.
La Figura 3 ilustra un aparato para generar una senal decorrelacionada de acuerdo con una realizacion. El aparato comprende un separador de componentes transitorios 310, un decorrelacionador de componentes transitorios 320, un decorrelacionador convencional 330 y una unidad combinadora 340. El enfoque de manejo de componente transitorio de esta realizacion apunta a generar senales decorrelacionadas a partir de senales de audio de tipo aplauso, por ejemplo, para la aplicacion en el proceso de mezclado hacia arriba de decodificadores de audio espacial.
En la Figura 3, una senal de entrada es alimentada al separado de componente transitorio 310. La senal de entrada puede haber sido transformada a un dominio de la frecuencia, por ejemplo, aplicando un banco de filtro QMF tnbrido. El separador de componentes transitorios 310 puede decidir para cada componente de senal considerada de la senal de entrada, si esta contiene un componente transitorio o no. Asimismo, El separador comprende una porcion de senal con componente transitorio 310 puede estar dispuesto para alimentar la porcion de senal considerada, ya sea al decorrelacionador de componentes transitorios 320, si la porcion de senal considerada contiene un componente transitorio (componente de senal s1), o puede alimentar la porcion de senal considerada al decorrelacionador convencional 330, si la porcion de senal considerada no contiene un componente transitorio (componente de senal s2). El separador de componentes transitorios 310 tambien puede estar dispuesto para dividir la porcion de senal considerada dependiendo de la existencia de un componente transitorio en la porcion de senal considerada y proveerlos parcialmente al decorrelacionador de componentes transitorios 320 y parcialmente al decorrelacionador convencional 330.
En una realizacion, el decorrelacionador de componentes transitorios 320 decorrelaciona el componente de senal s1 de acuerdo con un metodo de decorrelacion de componente transitorio el cual es particularmente adecuado para decorrelacionar componentes de senal transitorios. Por ejemplo, la decorrelacion de los componentes de senal transitorios puede ser llevada a cabo aplicando informacion de fase, por ejemplo, aplicando terminos de fase. Se explica un metodo de decorrelacion donde se aplican terminos de fase sobre componentes de senal transitorios abajo, con relacion a la realizacion de la Figura 5. Tambien se puede emplear un metodo de decorrelacion asf como metodo de decorrelacion de componente transitorio del decorrelacionador de componentes transitorios 320 de la realizacion de la Figura 3.
El componente de senal s2, el cual no contiene porciones de senal transitorias, es alimentado al decorrelacionador convencional 330. El decorrelacionador convencional 330 entonces puede decorrelacionar el componente de senal s2 de acuerdo con un metodo de decorrelacion convencional, por ejemplo, aplicando estructuras reticulares pasa todo, por ejemplo, un filtro (de respuesta de impulso infinito) IRR reticular.
Despues de ser decorrelacionado mediante el decorrelacionador convencional 330, el componente de senal decorrelacionado proveniente del decorrelacionador convencional 330 es alimentado a la unidad combinadora 340. El componente de senal transitorio decorrelacionado proveniente del decorrelacionador de componentes transitorios 320 tambien es alimentado a la unidad combinadora 340. La unidad combinadora 340 entonces combina ambos componentes de senal decorrelacionados, por ejemplo, sumando ambos componentes de senal, para obtener una senal combinacion decorrelacionada.
En general, un metodo que decorrelaciona una senal que contiene componentes transitorios de acuerdo con una realizacion, puede realizarse como sigue:
En un paso de separacion, la senal de entrada es separada en dos componentes: un componente s1 contiene los transitorios de la senal de entrada, otro componente s2 contiene la parte restante (no transitoria) de la senal de entrada. El componente no transitorio s2 de la senal puede ser procesado como en sistemas sin aplicar el metodo de decorrelacion del decorrelacionador de componentes transitorios de esta realizacion. Esto es, la senal sin transitorios s2 puede ser alimentada a una o varias estructuras de procesamiento de senal que decorrelacionan en forma convencional como estructuras pasa todo de IIR reticulares.
Asimismo, el componente de senal que contiene los transitorios (la transmision de transitorios s1) es alimentado a una estructura de "decorrelacionador de componentes transitorios" que decorrelaciona la transmision de transitorios mientras que mantiene las propiedades especiales de senal mejor que la estructuras decorrelacionadoras convencionales. La decorrelacion de la transmision de transitorios es llevada a cabo aplicando informacion de fase a una alta resolucion temporal. Preferiblemente, la informacion de fase comprende terminos de fase. Asimismo, se prefiere que la informacion de fase pueda ser provista por un codificador.
Asimismo, las senales de salida de ambos, el decorrelacionador convencional y el decorrelacionador de componentes transitorios, son combinadas para formar la senal decorrelacionada que podna ser utilizada en el
5
10
15
20
25
30
35
40
45
50
55
60
proceso de mezclado hacia arriba de codificadores de audio espacial. Los elementos (h11, h12, h21, h22) de la matriz de mezclado (Mmix) del decodificador de audio espacial pueden permanecer sin cambio.
La Figura 4 ilustra un aparato para decodificar una senal de entrada de aparato de acuerdo con una realizacion, en el que la senal de entrada de aparato es alimentada al separador de componentes transitorios 410. El aparato comprende un separador de componentes transitorios 410, un decorrelacionador de componentes transitorios 420, un decorrelacionador convencional 430, una unidad combinadora 440 y un mezclador 450. El separador de componentes transitorios 410, el decorrelacionador de componentes transitorios 420, el decorrelacionador convencional 430 y la unidad combinadora 440 de esta realizacion pueden ser similares al separador 310, el decorrelacionador de componentes transitorios 320, el decorrelacionador convencional 330 y la unidad combinadora 340 de la realizacion de la Figura 3, respectivamente. Una senal combinacion decorrelacionada generada por la unidad combinadora 440 es alimentada a un mezclador 450 como una primera senal de entrada de mezclador. Ademas, la senal de entrada de aparato que ha sido alimentada al separador de componentes transitorios 410, tambien es alimentada al mezclador 450 como una segunda senal de entrada de mezclador. Alternativamente, la senal de entrada de aparato no es alimentada directamente al mezclador 450, sino que se alimenta una senal derivada de la senal de entrada de aparato al mezclador 450. Se puede derivar una senal a partir de la senal de entrada de aparato, por ejemplo, aplicando un metodo de procesamiento de senal convencional a la senal de entrada de entrada de aparato, por ejemplo, aplicando un filtro. El mezclador 450 de la realizacion de la Figura 4 esta adaptado para generar senales de salida en base a las senales de entrada y una regla de mezclado. Una tal regla de mezclado puede ser, por ejemplo, multiplicar las senales de entrada y una matriz de mezclado, por ejemplo aplicando la formula
L
hii h12 M
R
_h21 h22 _ D
El mezclador 450 puede generar canales de salida L, R sobre la base de datos de parametro de correlacion/coherencia, por ejemplo, Correlacion/Coherencia Inter-Canal (ICC) y/o datos de parametro de diferencia de nivel, por ejemplo, Diferencia de Nivel Inter Canal (ILD). Por ejemplo, los coeficientes de una matriz de mezclado pueden depender de los datos de parametro de correlacion/coherencia y/o de los datos de parametro de diferencia de nivel. En la realizacion de la Figura 4, el mezclador 450 genera dos canales de salida L y R. Sin embargo, en realizaciones alternativas, el mezclado puede generar una pluralidad de senales de salida, por ejemplo, 2, 4, 5 o 9 senales de salida, las cuales pueden ser senales de sonido surround.
La Figura 5 representa una vista global del sistema del enfoque de manejo de componente transitorio en un sistema de mezclado hacia arriba 1 a 2 (OTT), por ejemplo, un decodificador de audio espacial MPS (MPEG Surround). La trayectoria de senal paralela para los componentes transitorios separados de acuerdo con una realizacion, esta comprendida en una caja de manejo de componente transitorio en forma de U. Se alimenta una senal de entrada de aparato DMX en un separador de componentes transitorios 510. La senal de entrada de aparato puede ser representada en un dominio de la frecuencia. Por ejemplo, una senal de entrada del dominio del tiempo puede haber sido transformada a un dominio de la frecuencia aplicando un banco de filtros QMF como se usa en MPEG Surround. El separador de componentes transitorios 510 luego puede alimentar los componentes de la senal de entrada de aparato DMX en un decorrelacionador de componentes transitorios 520 y/o en un decorrelacionador reticular IIR. Los componentes de la senal de entrada de aparato entonces son decorrelacionado por el decorrelacionador de componentes transitorios 520 y/o el decorrelacionador reticular IIR 530. Luego de ellos, los componentes de senal decorrelacionados D1 y D2 son combinados mediante una unidad combinadora 540, por ejemplo, sumando ambos componentes de senal, para obtener una senal combinacion decorrelacionada D. La senal combinacion decorrelacionada es alimentada en un mezclador 552 como una primera senal de entrada de mezclador D. Asimismo, la senal de entrada de aparato DMX (o alternativamente: una senal derivada de la senal de entrada de aparato DMX) tambien es alimentada al mezclador 552 como una segunda senal de entrada de mezclador. El mezclador 552 entonces generar una primera y una segunda senal "seca", dependiendo de la senal de entrada de aparato DMX. El mezclador 552 tambien generar una primera y una segunda senal "mojada" dependiendo de la senal combinacion decorrelacionada D. Las senales, generadas por el mezclador 552 tambien pueden ser generadas en base a parametros transmitidos, por ejemplo, Correlacion/Coherencia Inter-Canal (ICC) y/o datos de parametro de diferencia de nivel, por ejemplo, Diferencia de Nivel Inter Canal (ILD). En una realizacion, las senales generadas por el mezclador 552 pueden ser provistas a una unidad modeladora 554 las cual modela las senales provistas en base a datos de modelado temporal provistos. En otras realizaciones no tiene lugar moldeado de senal. Las senales generadas luego son provistas a una primera 556 y una segunda unidad sumadora las cuales combinan las senales provistas para generar una primera senal de salida L y una segunda senal de salida R, respectivamente.
Los principios de procesamiento mostrados en la Figura 5 pueden ser aplicados en sistemas de mezclado hacia arriba mono a estereo (por ejemplo, codificadores de audio estereo) asf como tambien en disposiciones multicanal
5
10
15
20
25
30
35
40
45
50
55
(por ejemplo, MPEG Surround). En realizaciones, el esquema de manipulacion de componente transitorio propuesto puede ser aplicado como un mejoramiento de calidad a sistemas de mezclado hacia arriba existentes, ya que solo se introduce una trayectoria de senal de decorrelacionador paralela sin alterar el proceso de mezclado hacia arriba en sf mismo.
La separacion de senal en componentes transitorios y componentes no transitorios es controlada mediante parametros que podnan ser generados en un codificador y/o el decodificador de audio espacial. El decorrelacionador de componentes transitorios 520 utiliza informacion de fase, por ejemplo, terminos de fase que podnan ser obtenidos en un codificador o en un decodificador de audio espacial. Abajo se describen posibles variantes para obtener parametros de manejo de componentes transitorios (esto es, parametros de separacion de componentes transitorios como posiciones de componentes transitorios o intensidad de separacion y parametros de decorrelacion de componentes transitorios como informacion de fase).
La senal de entrada puede ser representada en un dominio de la frecuencia. Por ejemplo, una senal puede haber sido transformada a un dominio de la frecuencia empleando un banco de filtros de analisis. Se puede aplicar un banco de filtros QMF para obtener una pluralidad de senales subbanda a partir de una senal del dominio del tiempo.
Para la mejor calidad perceptual, el procesamiento de senal transitoria puede ser restringido, preferiblemente, a frecuencias de senal en un rango de frecuencia limitado. Un ejemplo sena limitar el rango de procesamiento a indices de banda de frecuencia k > 8 de un bando de filtros QMF Itibrido como se usa en MPS, similar a la limitacion de banda de frecuencia de modelado de envolvente guiado (GES) en MPS.
En lo que sigue se explicaran en mas detalle realizaciones de un separador de componentes transitorios 520. El separador de componentes transitorios 510 divide la senal de entrada DMX en componentes transitorios y no transitorios si y s2, respectivamente. El separador de componentes transitorios 510 puede emplear informacion de separacion de componentes transitorios para dividir la senal de entrada DMX, por ejemplo, un parametro de separacion de componente transitorio p[n]. La division de la senal de entrada DMX se puede hacer de manera tal que la suma de los componentes s1+s2, sea igual a la senal de entrada DMX:
sl[n] =DMX[n] • fi[n] s2[n] =DMX[n] • (l - P[n])
donde n es el mdice tiempo de senales subbanda muestreadas hacia abajo y valores validos para el parametro de separacion de componente transitorio que vana en el tiempo p[n] estan en el rango [0, 1]. p[n] puede ser un parametro independiente de la frecuencia. Un separador de componentes transitorios 510 que esta adaptado para separar una senal de entrada de aparato en base a un parametro de separacion independiente de la frecuencia puede alimentar todas las porciones de senal subbanda con mdice de tiempo n ya sea al decorrelacionador de componentes transitorios 520 o al segundo decorrelacionador dependiendo del valor de p[n].
Alternativamente, p[n] puede ser un parametro dependiente de la frecuencia. Un separador de componentes transitorios 510 que esta adaptado para separar una senal de entrada de aparato en base a una informacion de separacion de componentes transitorio dependiente de la frecuencia puede procesar porciones de senal subbanda
Asimismo, la dependencia de la frecuencia puede ser usada, por ejemplo, para limitar el rango de frecuencia del procesamiento de componente transitorio como se menciona en la seccion de arriba.
En una realizacion, la informacion de separacion de componentes transitorios puede ser un parametro que o bien indica que una porcion de senal considerada de una senal de entrada DMX contiene un componente transitorio, o bien que indica que la porcion de senal considerada no contiene un componente transitorio. El separador de componentes transitorios 510 alimenta la porcion de senal considerada al decorrelacionador de componentes transitorios 520, si la informacion de separacion de componente transitorio indica que la porcion de senal considerada contiene un componente transitorio. Alternativamente, el separador de componentes transitorios 510 alimenta la porcion de senal considerada al segundo decorrelacionador, por ejemplo, el decorrelacionador de reticula IIR 530, si la informacion de separacion de componente transitorio indica que la porcion de senal considerada contiene un componente transitorio.
Por ejemplo, se puede emplear un parametro de separacion de componentes transitorios p[n] como una informacion de separacion de componente transitorio que puede ser un parametro binario. n es el mdice de tiempo de una porcion de senal considerada de la senal de entrada DMX. p[n] puede ser 1 (indicando que la porcion de senal considerada sera alimentada al decorrelacionador de componentes transitorios) o 0 (indicando que la porcion de senal considerada sera alimentada al segundo decorrelacionador). Restringiendo p[n] a p e {0, 1} resultan ser
5
10
15
20
25
30
35
40
45
50
55
60
diffciles las decisiones componente transitorio/no transitorio, esto es: componentes que son tratadas como transitorios son completamente separadas de la entrada (p = 1).
En otra realizacion, el separador de componentes transitorios 510 esta adaptado para alimentar parcialmente una porcion de senal considerada de la senal de entrada de aparato, al decorrelacionador de componentes transitorios 520 y para alimentar parcialmente la porcion de senal considerada al segundo decorrelacionador 530. La magnitud de la porcion de senal considerada que es alimentada al separador de componentes transitorios 520 y la magnitud de porcion de senal considerada que es alimentada al segundo decorrelacionador 530 depende de la informacion de separacion de componentes transitorios. En una realizacion, p[n] tiene que estar en el intervalo [0, 1]. En otra realizacion, p[n] puede estar restringido a p[n] e [0, pmax], donde pmax <1, resulta una separacion parcial de los componentes transitorios, conduciendo a un efecto menos pronunciado del esquema de manejo de componentes transitorios. Por lo tanto, cambiar pmax permite que sea indistinto entre la salida del procesamiento de mezclado hacia arriba convencional sin manejo de componentes transitorios y el procesamiento de mezclado hacia arriba que incluye el manejo de componentes transitorios.
En lo que sigue se explicara en mas detalle un decorrelacionador de componentes transitorios 520 de acuerdo con una realizacion.
Un decorrelacionador de componentes transitorios 520 de acuerdo con una realizacion crea una senal de salida que esta suficientemente decorrelacionada de la entrada. No altera la estructura temporal de aplausos singulares/componentes transitorios (sin dispersion horizontal en el tiempo, sin demora). En cambio, conduce a una distribucion espacial de los componentes de senal transitoria (despues del proceso de mezclado hacia arriba), que es similar a la distribucion espacial en la senal original (no codificada). El decorrelacionador de componentes transitorios 520 puede encargarse de compromisos de cantidad de bits transmitidos en contraste con calidad (por ejemplo, distribucion de transitorio espacial a baja cantidad de bits transmitidos ^ cerca de la original (casi transparente) a alta cantidad de bits transmitidos. Asimismo, esto se logra con baja complejidad computacional.
Como se explico arriba, del lado del codificador se puede emplear una matriz de mezclado "reversa" para crear una senal mezclada hacia abajo y una senal residual, por ejemplo, desde los dos canales de una senal estereo. Mientras la senal mezclada hacia abajo puede ser transmitida al decodificador, la senal residual puede ser descartada. De acuerdo con una realizacion, la diferencia de fase entre la senal residual y la senal mezclada hacia abajo puede ser determinada, por ejemplo, mediante un decodificador, y puede ser empleada por un decodificador cuando decorrelaciona una senal. Por este medio puede ser posible entonces reconstruir una senal residual "artificial" aplicando la fase original de la residual a la mezclada hacia abajo.
A continuacion, se explicara un correspondiente metodo de decorrelacion del decorrelacionador de componentes transitorios 520 de acuerdo con una realizacion:
De acuerdo con un metodo de decorrelacion de componente transitorio, se puede emplear un termino de fase.
Se logra la decorrelacion simplemente multiplicando la transmision transitoria por terminos de fase a alta
resolucion temporal, por ejemplo, a resolucion de tiempo de senal subbanda en sistemas del dominio de la
transformacion como MPS:
Dl[n] = sl[n] • e1'^[n]
En esta ecuacion, n es el mdice de tiempo de senales subbanda muestreadas hacia abajo. Ap idealmente refleja la diferencia de fase entre mezclado hacia abajo y residual. Por lo tanto, los transitorios residuales son reemplazados por una copia de los transitorios provenientes del mezclado hacia abajo, modificados tal que exhiban la fase original.
Aplicar la informacion de fase inherentemente da por resultado un paneo de los componentes transitorios a la posicion original en el proceso de mezclado hacia arriba. Como ejemplo ilustrativo, considere el caso ICC=0, ILD=0: La parte transitoria de las senales de salida entonces dicen:
L[n] = c • (s[n]+Dl[n]) = c • s[n]- (l + e1'^^)
R[n] = c (s[n]-Dl[n]) = c • s[n](l - e1
Para Ap=0 resulta L=2c*s, R=0, mientras Ap=n conduce a L=0, R=2c*s. Otros valores de Ap, ICC, e ILD conducen a diferentes relaciones de nivel y fase entre los componentes transitorios reproducidos.
Los valores de Ap[n] pueden ser aplicados como parametros de banda ancha independientes de la frecuencia o
5
10
15
20
25
30
35
40
45
50
55
60
como parametros dependientes de la frecuencia. En caso de senales de tipo aplaudo sin componentes tonales, pueden ser ventajosos valores de A9[n] de banda ancha debido a menores demandas de velocidad de datos y manejo consistente de componentes transitorios de banda ancha (consistencia sobre la frecuencia).
La estructura de manejo de componente transitorio de la Figura 5 esta acomodada tal que solo el decorrelacionador convencional 530 es puenteado con relacion a los componentes de senal transitorios mientras la matriz de mezclado permanece inalterada. Asf, los parametros espaciales (ICC, ILD) tambien son inherentemente tomados en cuenta para las senales transitorias, por ejemplo, la ICC automaticamente controla el ancho de la distribucion de transitorio reproducido.
Considerando el aspecto de como obtener informacion de fase, en una realizacion, la informacion de fase puede ser recibida desde un codificador.
La Figura 6 ilustra una realizacion de un aparato para generar una senal decorrelacionada. El aparato comprende un separador de componentes transitorios 610, un decorrelacionador de componentes transitorios 620, un decorrelacionador convencional 630, una unidad combinadora 640 y una unidad receptora 650. El separador de componentes transitorios 610, el decorrelacionador convencional 630 y la unidad combinadora 640 son similares al separador de componentes transitorios 310, el decorrelacionador convencional 330 y la unidad combinadora 340 de la realizacion de la Figura 3. Sin embargo, la Figura 6 ademas ilustra una unidad receptora 650 que esta adaptada para recibir informacion de fase. La informacion de fase puede haber sido transmitida por un codificador (no mostrado). Por ejemplo, un codificador puede haber computado la diferencia de fase entre senales residual y mezclad hacia abajo (fase relativa de la senal residual con respecto a una mezclada hacia abajo). La diferencia de fase puede haber sido calculada para ciertas bandas de frecuencias o banda ancha (por ejemplo, en un dominio del tiempo). El codificador puede codificar apropiadamente los valores de fase mediante cuantificacion uniforme o no uniforme y potencialmente codificar sin perdidas. Despues, el codificador puede transmitir los valores de fase codificados al sistema de decodificacion de audio espacial. Obtener la informacion de fase de un codificador es ventajoso ya que la informacion de fase original luego esta disponible en un decodificador (excepto por el error de cuantificacion).
La unidad receptora 650 alimenta la informacion de fase en el decorrelacionador de componentes transitorios 620 el cual usa la informacion de fase cuando decorrelaciona un componente de senal. Por ejemplo, la informacion de fase puede ser un termino de fase y el decorrelacionador de componentes transitorios 620 puede multiplicar un componente de senal transitorio recibido por el termino de fase.
En caso de transmitir informacion de fase A9[n] desde un codificador al decodificador, se puede reducir el ritmo de datos requerido como sigue:
La informacion de fase A9[n] puede ser aplicada solo a los componentes transitorios de una senal en el decodificador. Por lo tanto, la informacion de fase solo necesita estar disponible en el decodificador en tanto haya componentes transitorios en la senal a ser decorrelacionada. La transmision de la informacion de fase puede ser limitada entonces por el codificador, tal que solo la informacion necesaria sea transmitida al decodificador. Esto se puede hacer aplicando una deteccion de transitorios en el codificador como se describe abajo. La informacion de fase A9[n] solo es transmitida para puntos en el tiempo n, para los cuales se han detectado componentes transitorios en el codificador.
Considerando el aspecto de separacion de componentes transitorios, en una realizacion, la separacion de componentes transitorios puede ser conducida por el codificador.
De acuerdo con una realizacion, la informacion de separacion de componentes transitorios (a lo que tambien se refiere como "informacion de transitorios") puede obtenerse de un codificador. El codificador puede aplicar metodos de deteccion de transitorios como se describe en "Uso de Supresion de Transitorios en Algoritmos de Mezcla hacia Arriba Multicanal Ciega" (“Using Transient Suppression in Blind Multi-channel Up-mix Algorithms”) de Andreas Walther, Christian Uhle, Sascha Disch, en Proc. 122° Convencion de AES, Viena, Austria, mayo de 2007, ya sea para las senales de entrada de codificador o para las senales mezcladas hacia abajo. La informacion de transitorios luego es transmitida al decodificador y preferiblemente es obtenida, por ejemplo, a la resolucion de tiempo de las senales subbanda muestreadas hacia abajo.
La informacion de transitorios preferiblemente puede comprender una simple decision binaria (transitorio/no- transitorio) para cada muestra de senal en el tiempo. Esta informacion puede tambien, preferiblemente, ser representada mediante las posiciones de transitorio en el tiempo y las duraciones del transitorio.
La informacion de transitorios puede ser codificada sin perdidas (por ejemplo, codificacion por longitud de series (RLE), codificacion entropica) para reducir el ritmo de datos que es necesario para transmitir la informacion de
5
10
15
20
25
30
35
40
45
50
55
60
transitorios desde el codificador al decodificador.
La informacion de transitorios puede ser transmitida como informacion de banda ancha o como informacion dependiente de la frecuencia a una resolucion de frecuencia. Transmitir la informacion de transitorios como parametros de banda ancha reduce el ritmo de datos de informacion de transitorios y potencialmente mejora la calidad de audio debido al manejo consistente de transitorios de banda ancha. En lugar de la decision binaria (transitorio/no-transitorio), tambien puede ser transmitida la intensidad de los transitorios, por ejemplo, cuantificada en dos o cuatro escalones. La intensidad de transitorios entonces puede controlar la separacion de los transitorios en el decodificador de audio espacial como sigue: Los transitorios fuertes son separados completamente de la entrada del decorrelacionador reticular IIR, mientras que los transitorios mas debiles solo son parcialmente separados.
La informacion de transitorios solo puede ser transmitida, si el codificador detecta senales tipo aplauso, por ejemplo, usando sistemas de deteccion de aplauso como se describe en "Deteccion de Sonido de Aplauso con Baja Latencia" (“Applause Sound Detection with Low Latency”) de Christian Uhle, en la 127° Convencion de la Sociedad de Ingeniena de Audio, Nueva York, 2009.
El resultado de la deteccion para la similaridad de senal de entrada a senales de tipo aplauso tambien puede ser transmitido a menor resolucion de tiempo (por ejemplo, al ritmo de actualizacion de parametros espaciales en MPS) al decodificador para controlar la intensidad de la separacion de transitorios. El resultado de la deteccion de aplauso puede ser transmitido como un parametro binario (esto es, como una decision drastica) o como un parametro no binario (esto es, como una decision blanda). Este parametro controla la intensidad de separacion en el decodificador de audio espacial. Por lo tanto, permite encender/apagar (drasticamente o gradualmente) el manejo de transitorios en el decodificador. Esto permite evitar artefactos que podnan ocurrir, por ejemplo, cuando se aplica un esquema de manejo de transitorios de banda ancha a senales que contienen componentes tonales.
La Figura 7 ilustra un aparato para decodificar una senal de acuerdo con una realizacion. El aparato comprende un separador de transitorios 710, un decorrelacionador de transitorios 720, un decorrelacionador reticular IIR 730, una unidad combinadora 740, un mezclador 752, una unidad modeladora opcional 754, una primera unidad sumadora 756 y una segunda unidad sumadora 758, los cuales corresponden al separador de transitorios 510, el decorrelacionador de transitorios 520, el decorrelacionador reticular IIR 530, la unidad combinadora 540, el mezclador 552 la unidad modeladora opcional 554, la primera unidad sumadora 556 y la segunda unidad sumadora 558 de la realizacion de la Figura 5, respectivamente. En la realizacion de la Figura 7, un codificador obtiene informacion de fase e informacion de posicion de transitorio y transmite la informacion a un aparato para decodificacion. No se transmiten senales residuales. La Figura 7 ilustra una configuracion de mezclado hacia arriba 1 a 2 como una caja OTT en MPS. Se puede aplicar en un codificador-decodificador estereo para mezclar hacia arriba a partir de mezcla hacia abajo mono a una salida estereo de acuerdo con una realizacion. En la realizacion de la Figura 7 se transmites tres parametros de manejo de transitorios como parametros independientes de la frecuencia desde el codificador al decodificador, como se puede ver en la Figura 7:
Un primer parametro de manejo de transitorio a ser transmitido es la decision binaria transitorio/no-transitorio de un detector de transitorios que corre en el codificador. Se usa para controlar la separacion de transitorios en el decodificador. En un esquema simple, la decision binaria transitorio/no-transitorio puede ser transmitida como una bandera binaria por muestra de tiempo subbanda sin mas codificacion.
Otro parametro de manejo de transitorio a ser transmitido es el valor de fase (o los valores de fase) A9[n] que se necesita para el decorrelacionador de transitorios. A9[n] solo es transmitida para instantes n, para los cuales se han detectado componentes transitorios en el codificador. Los valores A9 son transmitidos como indices de un cuantificador con una resolucion de, por ejemplo, 3 bit por muestra.
Otro parametro de manejo de transitorio a ser transmitido es la intensidad de separacion (esto es, la intensidad de efecto del esquema de manejo de transitorios). Esta informacion es transmitida a alguna resolucion temporal como los parametros espaciales ILD, ICC.
La cantidad de bits transmitidos BR necesaria para transmitir decisiones de separacion de transitorios e informacion de fase de banda ancha desde el codificador al decodificador, puede ser estimada por sistemas de tipo MPS segun:
BR = BRmarcas separacion transientes + BRAp ~{fs /64) ' Q ' fs /64 = (l + ' Q)' fs /64 ,
donde a es la densidad de transitorios (fraccion ranuras de tiempo (=muestras de tiempo de subbanda) que estan marcados como transitorios), Q es el numero de bits por valor de fase transmitido, y fs es el ritmo de muestreo. Notar que (fs/64) es el ritmo de muestreo de las senales subbanda muestreadas hacia abajo.
5
10
15
20
25
30
35
40
45
50
55
60
Se ha medido E{a} < 0,25 para un conjunto de diversos artfculos de aplauso representativos, donde E{.} denota la media sobre la duracion del item. Un compromiso razonable entre exactitud de los valores de fase y cantidad de bits transmitidos de parametro, es Q=3. Para reducir el ritmo de datos de parametro, los ICCs y los ILDs pueden ser transmitidos como indicios de banda ancha (broadband cues). La transmision de los ICCs y los ILDs como indicios de banda ancha es especialmente aplicable para senales no tonales como aplauso.
Adicionalmente, los parametros para senalizar la intensidad de separacion son transmitidos al ritmo de actualizacion de los ICCs/ILDs. Para cuadros espaciales largos en MPS (32 veces 64 muestras) e intensidades de separacion cuantificadas en 4 escalones, este da por resultado una cantidad de bits transmitidos adicional de
BR
resistenciaseparaciontransiente
(fs /(64• 32))-2.
El parametro de intensidad de separacion puede ser establecido en el codificador a partir de los resultados de algoritmos de analisis de senal que evaluan la similaridad a senales de tipo aplauso, la tonalidad, u otras caractensticas de senal que incidan potenciales beneficios o problemas cuando se aplica la decorrelacion de componentes transitorios de la realizacion.
Los parametros transmitidos para manejo de transitorios pueden ser sometidos codificacion sin perdidas para reducir redundancia, dando por resultado una menor cantidad de bits transmitidos de parametro (por ejemplo, codificacion por longitud de series de informacion de separacion de transitorios, codificacion entropica).
Volviendo al aspecto de obtener informacion de fase, en una realizacion, la informacion de fase puede obtenerse en un decodificador.
En una realizacion asf, el aparato para decodificacion no obtiene informacion de fase de un codificador, sino que puede determinar la informacion de fase por sf mismo. Por lo tanto, no es necesario transmitir informacion de fase lo que resulta en un reducido ritmo de transmision global.
En una realizacion se obtiene informacion de fase en un decodificador basado en MPS a partir de datos de "Modulacion de Envolvente Guiada (GES)") (Guided Envelope Shaping) Esto solo es aplicable si se transmiten datos GES, esto es, si la opcion GES esta activada en un codificador. La opcion GES esta disponible, por ejemplo, en sistemas MPS. El cociente de valores de envolvente GES entre los canales de salida refleja posiciones de paneo para los componentes transitorios a alta resolucion temporal. El cociente de envolvente GeS (GESR) puede ser mapeado a la informacion de fase necesaria para el manejo de componentes transitorios. En GES, el mapeo puede ser realizado de acuerdo con una regla de mapeo obtenida empmcamente de estadfsticas acumulativas de distribucion de fase relativa a GESR para un conjunto representativo de senales de prueba apropiadas. Determinar la regla de mapeo es un paso para disenar el sistema de manejo de componentes transitorios, no cuando se ejecuta el sistema de manejo de componentes transitorios. Por lo tanto, es ventajoso que no hay necesidad de pagar costos adicionales de transmision para datos de fase si se necesitan datos dEs para la aplicacion de la opcion GES de alguna manera. Compatibilidad hacia atras de serie de bits en el tiempo se logra con series de bits en el tiempo/decodificadores MPS. Sin embargo, la informacion de fase extrafda de datos GES no es exacta (por ejemplo, el signo de la fase estimada es desconocido) como la informacion de fase que podnas ser obtenida en el codificador.
En una realizacion adicional, la informacion de fase tambien puede ser obtenida en un decodificador, pero a partir de residuales de banda no completa transmitidas. Esto es aplicable, por ejemplo, si se transmiten senales residuales de banda limitada (tfpicamente cubriendo un rango de frecuencia hasta una cierta frecuencia de transicion) en un esquema de codificacion MPS. En una realizacion asf, se calcula la relacion de fase entre la senal mezclada hacia abajo y la residual transmitida en la(s) banda(s) residual(es), esto es, para frecuencias para las cuales son transmitidas las senales residuales. Ademas, la informacion de fase proveniente de banda(s) residual(es) a la(s) banda(s) no-residual(es) es extrapolada (y/o posiblemente interpolada). Una posibilidad es mapear la relacion de fase obtenida en la(s) banda(s) residual(es) a un valor de la relacion de fase independiente de la frecuencia que luego se usa para el decorrelacionador de componentes transitorios. Esto da por resultado el beneficio de que no aparecen costos adicionales de transmision para datos de fase, si de alguna manera se transmiten residuales de banda no completa. Sin embargo, se debe considerar que la correccion de la estimacion de fase depende del ancho de la(s) banda(s) de frecuencia donde se transmiten las senales residuales. La correccion de las estimaciones de fase tambien depende de la consistencia de la relacion de fase entre la senal mezclada hacia abajo y la residual a lo largo del eje de frecuencia. Para senal con componentes claramente transitorios, usualmente se encuentra alta consistencia.
En una realizacion adicional, la informacion de fase es obtenida en un decodificador empleando informacion de correccion adicional transmitida desde el codificador. Una realizacion asf es similar a las dos realizaciones anteriores (fase de GES, fase de residuales) pero adicionalmente es necesario generar datos de correccion en el codificador
5
10
15
20
25
30
35
40
45
50
55
60
que se transmiten al decodificador. Los datos de correccion permiten reducir el error de estimacion de fase que puede ocurrir en las dos variantes descritas antes (fase de GES, fase de residuales). Asimismo, los datos de correccion pueden ser derivados de estimar el error de estimacion de fase del lado decodificador en el codificador. Los datos de correccion pueden ser este error de estimacion estimado (potencialmente codificado). Asimismo, con respecto al enfoque de estimacion de fase de datos de GES, los datos de correccion simplemente pueden ser el signo correcto de los valores de fase generados por codificador. Esto permite generar terminos de fase con el signo correcto en el decodificador. El beneficio de un enfoque asf es que, debido a los datos de correccion, la exactitud de la informacion de fase recuperable en el decodificador esta mucho mas cerca de la informacion de fase generada en el codificador. Sin embargo, la entropfa de la informacion de correccion es menor que la entropfa de la informacion de fase correcta en sf misma. Asf, se disminuye la cantidad de bits transmitidos de parametros cuando se compara con transmitir directamente la informacion de fase obtenida en el codificador.
En otra realizacion, se obtiene informacion/termino de fase de un proceso (seudo) aleatorio en un decodificador. El beneficio de un enfoque asf es que no hay necesidad de transmitir informacion de fase alguna con alta resolucion temporal. Esto da por resultado un reducido ritmo de datos. En una realizacion, un metodo simple es generar valores de fase con una distribucion aleatorio uniforme en un intervalo [- 180°, 180°].
En una realizacion adicional se miden las propiedades estadfsticas de la distribucion de fase en el codificador. Estas propiedades son codificadas y luego transmitidas (a baja resolucion temporal) al decodificador. Se generan valores de fase aleatorios en el decodificador los cuales son sometidos a las propiedades estadfsticas transmitidas. Estas propiedades podnan ser la media, varianzas u otras medidas estadfsticas de la distribucion de fase estadfstica.
Cuando se hace correr mas de una instancia de decorrelacionador en paralelo (por ejemplo, para un mezclado hacia arriba multicanal), se debe tener cuidado para asegurar salidas de decorrelacionador mutuamente decorrelacionadas. En una realizacion, en el que se generan multiples vectores de valores de fase (seudo) aleatorios (en lugar de un solo vector) para todas menos para la primera instancia de decorrelacionador, se selecciona un conjunto de vectores que da por resultado la menor correlacion del valor de fase a traves de todas las instancias de decorrelacionador.
En caso de transmitir informacion correccion de fase desde un codificador al decodificador, se puede reducir el ritmo de datos requerido como sigue:
La informacion de correccion de fase solo necesita estar disponible en el decodificador en tanto haya componentes transitorios en la senal a ser decorrelacionada. La transmision de la informacion de correccion de fase puede ser limitada entonces por el codificador, tal que solo la informacion necesaria sea transmitida al decodificador. Esto se puede hacer aplicando una deteccion de transitorios en el codificador como se describio arriba. La informacion de correccion de fase solo es transmitida para puntos en el tiempo n, para los cuales se han detectado componentes transitorios en el codificador.
Volviendo al aspecto de separacion de componentes transitorios, en una realizacion, la separacion de componentes transitorios puede ser conducida por el decodificador.
En una realizacion asf, tambien se puede obtener informacion de separacion de componentes transitorios en el decodificador, por ejemplo, aplicando un metodo de deteccion de componente transitorio como se describe en "Uso de Supresion de Transitorios en Algoritmos de Mezcla hacia Arriba Multicanal Ciega" (“Using Transient Suppression in Blind Multi-channel Up-mix Algorithms”) de Andreas Walther, Christian Uhle, Sascha Disch, en Proc. 122° Convencion de AES, Viena, Austria, mayo de 2007, para la senal mezclada hacia abajo que esta disponible en el decodificador de audio espacial antes de mezclar hacia arriba una senal de salida estereo o multicanal. En este caso, no se tiene que transmitir informacion de componente transitorio alguna, lo cual ahora ritmo de datos de transmision.
Sin embargo, realizar la deteccion de componente transitorio al decodificar podna causar problemas cuando, por ejemplo, se estandariza el esquema de manejo de componentes transitorios: por ejemplo, podna ser diffcil hallar un algoritmo de deteccion de componentes transitorios que de por resultado exactamente la misma deteccion de componentes transitorios cuando se implementa en diferentes plataformas/arquitecturas que involucran diferentes precisiones numericas, esquemas de redondeo, etc. Para estandarizacion, tal comportamiento predecible del decodificador frecuentemente es imprescindible. Asimismo, el algoritmo de deteccion de componentes transitorios estandarizado podna fallar para algunas senales de entrada, causando distorsiones intolerables en las senales de salida. Entonces podna ser dificultoso corregir el algoritmo que falla despues de la estandarizacion sin construir un decodificador que no se conforme al estandar. Esta cuestion podna ser menos severa si por lo menos se transmitiera un parametro que controla la separacion de componentes transitorios a baja resolucion temporal (por ejemplo, al ritmo de actualizacion de parametro espacial del MpS) desde el codificador al decodificador.
5
10
15
20
25
30
35
40
45
50
55
60
En una realizacion adicional, la separacion de componentes transitorios tambien es conducida por decodificador y se transmiten residuales de banda no completa. En esta realizacion, la separacion de componentes transitorios conducida por decodificador puede ser refinada empleando estimaciones de fase obtenidas de residuales de banda no-completa transmitidas (ver arriba). Notar que este refinamiento puede ser aplicado en el decodificador sin transmitir datos adicionales desde el codificador al decodificador.
En esta realizacion, los terminos de fase que son aplicados a un decorrelacionador de componentes transitorios son obtenidos extrapolando los valores de fase correctos desde las bandas residuales a frecuencias donde no hay residuales disponibles. Un metodo es calcular un valor medio de fase (potencialmente, por ejemplo, ponderado por potencia de senal) de los valores de fase que pueden ser calculados para aquellas frecuencias donde hay senales residuales disponibles. El valor medio de fase puede ser aplicado como un parametro independiente de la frecuencia en el decorrelacionador de componentes transitorios.
En tanto la relacion de fase correcta entre la mezclada hacia abajo y la residual es independiente de la frecuencia, el valor medio de fase representa una buena estimacion del valor correcto de fase. Sin embargo, en el caso de una relacion de fase que no es consistente e lo largo del eje de frecuencia, el valor medio de fase puede ser una estimacion menos correcta, posiblemente que conduce a valores de fase incorrectos y artefactos audibles.
La consistencia de la relacion de fase entre la mezclada hacia abajo y la residual transmitida a lo largo del eje de frecuencia, por lo tanto, puede ser usada como una medida de confiabilidad de la estimacion de fase extrapolada que se aplica en el decorrelacionador de componentes transitorios Para bajar el riesgo de artefactos audibles, se puede usar la medida de consistencia obtenida en el decodificador para controlar la intensidad de separacion de componentes transitorios en el decodificador, por ejemplo, como sigue:
Los componentes transitorios para los cuales la correspondiente informacion de fase (esto es, informacion de fase para el mismo mdice de tiempo n) es consistente a lo largo de la frecuencia, son totalmente separados de la entrada de decorrelacionador convencional y son totalmente alimentados al decorrelacionador de componentes transitorios. Como grandes errores de estimacion de fase son improbables, se usa todo el potencial del manejo de componentes transitorios.
Los componentes transitorios para los cuales la correspondiente informacion de fase es menos consistente a lo largo de la frecuencia, solo son separados parcialmente, conduciendo a un efecto menos prominente del esquema de manejo de componentes transitorios.
Los componentes transitorios para los cuales la correspondiente informacion de fase es muy inconsistente a lo largo de la frecuencia, no son separados, conduciendo al comportamiento estandar de un sistema de mezclado hacia arriba convencional sin el manejo de componentes transitorios propuesto. Asf, no pueden ocurrir artefactos debido a grandes errores de estimacion de fase.
Las medidas de consistencia para la informacion de fase pueden ser deducidas, por ejemplo, a partir de la varianza (posiblemente ponderada por potencia de senal) de la desviacion estandar de la informacion de fase a lo largo de la frecuencia.
Como solo unas pocas frecuencias pueden estar disponibles para las cuales se transmiten las senales residuales, la medida de la consistencia puede tener que ser estimada solo a partir de unas pocas muestras a lo largo de la frecuencia, conduciendo a una medida de la consistencia que solo rara vez alcanza valores extremos ("perfectamente consistente" o "perfectamente inconsistente"). Asf, la medida de la consistencia puede ser linealmente o no linealmente distorsionada antes de ser usada para controlar la intensidad de separacion de componentes transitorios. En una realizacion, se implementa un umbral caractenstico como se ilustra en la Figura 8, ejemplo de la derecha.
La Figura 8 representa diferentes mapeos ejemplares de medidas de consistencia de fase con respecto a intensidad de separacion de componentes transitorios, ilustrando el impacto de las variantes para obtener parametros de manejo de componentes transitorios sobre la robustez a mala clasificacion de componentes transitorios. Las variantes para obtener la informacion de separacion de componentes transitorios y la informacion de fase listada arriba difieren en ritmo de datos de parametro y por lo tanto representan diferentes puntos operativos en terminos de cantidad de bits transmitidos global de un codificador-decodificador que implementa la tecnica de manejo de componentes transitorios propuesta. Aparte de esto, la eleccion de la fuente para obtener la informacion de fase tambien afecta aspectos tales como robustez a clasificaciones de componentes transitorios falsas: manejar una senal no transitoria como una transitoria causa mucho menos distorsiones audibles si la informacion de fase correcta es aplicada para manejar el componente transitorio. Asf, un error de clasificacion de senal causa artefactos menos severos en el escenario de valores de fase transmitidos cuando se compara con el escenario de generacion de fase aleatoria en el decodificador.
5
10
15
20
25
30
35
40
45
50
55
60
La Figura 9 es una vista global de un sistema Uno a Dos con manejo de componentes transitorios de acuerdo con otra realizacion, en el que se transmiten senales residuales de banda angosta. Se estima el dato de fase A9 de la relacion de fase entre la senal mezclada hacia abajo (DMX) y la residual en la(s) banda(s) de frecuencia de la senal residual. Opcionalmente, se transmite dato de correccion de fase para bajar el error d estimacion de fase.
La Figura 9 ilustra un separador de transitorios 910, un decorrelacionador de transitorios 920, un decorrelacionador reticular IIR 930, una unidad combinadora 940, un mezclador 952, una unidad modeladora opcional 954, una primera unidad sumadora 956 y una segunda unidad sumadora 958, los cuales corresponden al separador de transitorios 510, el decorrelacionador de transitorios 520, el decorrelacionador reticular IIR 530, la unidad combinadora 540, el mezclador 552 la unidad modeladora opcional 554, la primera unidad sumadora 556 y la segunda unidad sumadora 558 de la realizacion de la Figura 5, respectivamente. La realizacion de la Figura 8 ademas comprende una unidad de estimacion de fase 960. La unidad de estimacion de fase 960 recibe una senal de entrada DMX, una senal residual "residual" y opcionalmente, datos de correccion de fase. En base a la informacion recibida, la unidad de informacion de fase calcula los datos de fase A9. Opcionalmente, la unidad de estimacion de fase tambien determina informacion de consistencia de fase y pasa la informacion de consistencia de fase al separador de componentes transitorios 910. Por ejemplo, la informacion de consistencia de fase puede ser usada por el separador de componentes transitorios para controlar la intensidad de separacion de componentes transitorios.
La realizacion de la Figura 9 aplica el hallazgo de que si se transmiten residuales adentro del esquema de codificacion en una manera de banda no-completa, la diferencia de fase media ponderada por potencia de senal entre la residual y la mezclada hacia abajo (A9bandas_residuales) puede ser aplicada como informacion de fase de banda ancha a los componentes transitorios separados (A9 = A9low bandas_residuales). En este caso, no hay que transmitir informacion de fase adicional, bajando la demanda de cantidad de bits transmitidos para el manejo de componentes transitorios. En la realizacion de la Figura 9, la estimacion de fase a partir de las bandas residuales puede desviarse considerablemente de la estimacion de fase de banda ancha mas precisa que esta disponible en el codificador. Una opcion es, por lo tanto, transmitir datos de correccion de fase (por ejemplo, A9correccion A9- A9bandas_residuales) de modo la A9 correcta este disponible en el decodificador. Sin embargo, como la correccion de A9 puede mostrar una menor entropfa que A9, el ritmo de datos de parametros necesario puede ser menor que el ritmo que sena necesario para transmitir A9. (Este concepto es similar al uso general de prediccion en codificacion: en lugar de codificar directamente datos, se codifica un error de predicacion con menor entropfa. En la realizacion de la Figura 9, el paso de prediccion es la extrapolacion de la fase a partir de las bandas de frecuencia de residuales respecto a bandas de no residuales). La consistencia de la diferencia de fase en las bandas de frecuencia de residual (A9bandas_residuales) a lo largo del eje de frecuencia puede ser usada para controlar la intensidad de separacion de componentes transitorios.
En realizaciones, un decodificador puede recibir informacion de fase de un codificador, o el decodificador puede determinar por sf mismo la informacion de fase. Asimismo, el decodificador puede recibir informacion de separacion de componentes transitorios fase de un codificador, o el decodificador puede determinar por sf mismo la informacion de separacion de componentes transitorios.
En realizaciones, un aspecto del manejo de componentes transitorios es la aplicacion del concepto de "decorrelacion semantica" descrito en el documento WO/2010/017967 junto con el "decorrelacionador de componentes transitorios", el cual esta basado en multiplicar la entrada con terminos de fase. Se mejora la calidad perceptual de senales de tipo aplauso reproducidas ya que ambos pasos de procesamiento evitan alterar la estructura temporal de las senales con componente transitorio. Asimismo, la distribucion espacial de componentes transitorios, asf como tambien las relaciones de fase entre componentes transitorios, es reconstruida en los canales de salida. Asimismo, las realizaciones tambien con computacionalmente eficientes y puede ser integradas facilmente en sistemas de mezclado hacia arriba de tipo PS o MPS. En realizaciones, el manejo de componentes transitorios no afecta el proceso de matriz de mezclado, de modo que todas las propiedades de reproduccion espacial que estan definidas por la matriz de mezclado tambien son aplicadas a la senal con componente transitorio.
En realizaciones se aplica un esquema de decorrelacion novel el cual es particularmente adecuado para aplicacion en sistemas de mezclado hacia arriba, el cual es particularmente adecuado para aplicacion de esquemas de codificacion de audio espacial como PS o MPS y el cual mejora la calidad perceptual de las senales de salida en el caso de senales de tipo aplauso, esto es, senales que contienen mezclas densas de componentes transitorios distribuidos espacialmente y/o pueden ser vistas como una implementacion particularmente mejorada del marco de trabajo generico de "decorrelacion semantica". Asimismo, en realizaciones, un esquema de decorrelacion noval reconstruye la distribucion espacial/temporal de los componentes transitorios similar a la distribucion en la senal original, preserva la estructura temporal de las senales transitorios, permite variar la cantidad de bits transmitidos versus compromiso de calidad y/o es idealmente adecuado para una combinacion con opciones MPS como residuales de banda no-completa o GES. Las combinaciones son complementarias, esto es, la informacion de opciones de MPS estandar es vuelta a usar para el manejo de componentes transitorios.
5
10
15
20
25
30
35
40
45
50
55
60
La Figura 10 ilustra un aparato para codificar una senal de audio que tiene una pluralidad de canales. Dos canales de entrada L, R son alimentados a un mezclador hacia abajo 1010 y a un calculador de senal residual 1020. En otras realizaciones, una pluralidad de canales es alimentada al mezclador 1010 y al calculador de senal residual 1020, por ejemplo, 3, 5 o 9 canales surround. El mezclador hacia abajo 1010 entonces mezcla hacia abajo los dos canales L, R, para obtener una senal mezclada hacia abajo. Por ejemplo, el mezclador hacia abajo 1010 puede emplear una matriz de mezclado y realizar una multiplicacion de matriz de la matriz de mezclado y los dos canales de entrada L, R, para obtener una senal mezclada hacia abajo. La senal mezclada hacia abajo puede ser transmitida a un decodificador.
Asimismo, el generador de senal residual 1020 esta adaptado para calcular una senal adicional a la cual se refiere como senal residual. Senales residuales son senales que pueden ser usadas para regenerar las senales originales empleando adicionalmente la senal mezclada hacia abajo y una matriz de mezclado hacia arriba. Por ejemplo, cuando N senales son mezcladas hacia abajo a 1 senal, el mezclado hacia abajo tipicamente es 1 de los N componentes que resultan del mapeo de las N senales de entrada. Los componentes restantes que resultan del mapeo (por ejemplo, N-1 componentes) son senales residuales y permiten reconstruir las N senales originales mediante un mapeo inverso. El mapeo puede ser, por ejemplo, una rotacion. El mapeo debe ser conducido tal que la senal mezclada hacia abajo sea maximizada y las senales residuales sean minimizadas, por ejemplo, similar a una transformacion de eje principal. Por ejemplo, la energfa de la senal mezclada hacia abajo debe ser maximizada y las energfas de las senales residuales deben ser minimizadas. Cuando se mezclan hacia abajo dos senales a 1 senal, el mezclado hacia abajo es normalmente una de las dos componentes que resultan del mapeo de las 2 senales de entrada. El componente restante que resulta del mapeo es la senal residual y permite reconstruir las 2 senales originales mediante un mapeo inverso.
En algunos casos, la senal residual puede representar un error asociado con representar las dos senales mediante sus parametros de mezclado hacia abajo y asociados. Por ejemplo, la senal residual puede ser una senal de error la cual representa el error entre los canales originales L, R y los canales L', R', resultantes de mezclar hacia arriba la senal mezclada hacia abajo que fue generada en base a los canales originales L y R.
En otras palabras, una senal {{PCT}} en el cual la senal residual puede ser considerada como una senal en el dominio del tiempo o un dominio de la frecuencia o un dominio subbanda, que junto con la senal mezclada hacia abajo sola o con la senal mezclada hacia abajo y la informacion parametrica permite una reconstruccion correcta o casi correcta de un canal original. Casi correcto se debe entender como que la reconstruccion con la senal residual teniendo una energfa mayor que cero es mas cercana al canal original comparado con una reconstruccion usando el mezclado hacia abajo sin la senal residual o usando el mezclado hacia abajo y la informacion parametrica sin la senal residual.
Asimismo, el codificador comprende un calculador de informacion de fase1030. La senal mezclada hacia abajo y la senal residual son alimentadas al calculador de informacion de fase 1030. El calculador de informacion de fase entonces calcula informacion sobre la diferencia de fase entre la senal mezclada hacia abajo y la residual para obtener informacion de fase. Por ejemplo, el calculador de informacion de fase puede aplicar funciones que calculan una correlacion cruzada de la senal mezclada hacia abajo y la residual.
Asimismo, el codificador comprende un generador de salida 1040. La informacion de fase generada por el calculador de informacion de fase 1030 es alimentada en el generador de salida 1040. El generador de salida 1040 entonces entrega la informacion de fase.
En una realizacion, el aparato ademas comprende un cuantificador de informacion de fase para cuantificar la informacion de fase. La informacion de fase generada por el calculador de informacion de fase puede ser alimentada en el cuantificador para cuantificar la informacion de fase. El cuantificador de informacion de fase entonces cuantifica la informacion de fase. Por ejemplo, la informacion de fase puede ser mapeada a 8 diferentes valores, por ejemplo, a uno de los valores 0, 1, 2, 3, 4, 5, 6 o 7. Los valores pueden representar las diferencias de fases 0, n/4, n/2, 3n/4, n, 5n/4, 3n/2 y 7n/4, respectivamente. La informacion de fase cuantificada entonces puede ser alimentada al generador de salida 1040.
En una realizacion adicional, el aparato ademas comprende un codificador sin perdidas. La informacion de fase proveniente del calculador de informacion de fase 1040 o la informacion de fase cuantificada proveniente del cuantificador de informacion de fase, puede ser alimentada al codificador sin perdidas. El codificador sin perdidas esta adaptado para codificar informacion de fase aplicando codificador sin perdidas. Se puede emplear cualquier esquema de codificacion sin perdidas. Por ejemplo, el codificador puede emplear codificacion aritmetica. El codificador sin perdidas entonces alimenta la informacion de fase codificada sin perdidas al generador de salida 1040.
5
10
15
20
25
30
35
40
45
50
55
Con respecto al decodificador y codificador y los metodos de las realizaciones descritas, se menciona lo siguiente:
A pesar de que se han descrito algunos aspectos en el contexto de un aparato, es claro que estos aspectos tambien representan una descripcion del metodo correspondiente, donde un bloque o dispositivo corresponde a un paso de metodo o a un rasgo de un paso de metodo. Analogamente, los aspectos descritos en el contexto de una etapa de metodo tambien representan una descripcion de un correspondiente bloque o componente o rasgo de un correspondiente aparato.
Dependiendo de ciertos requerimientos de implementacion, las realizaciones del invento pueden ser implementadas en hardware o en software. La implementacion se puede llevar a cabo utilizando un medio de almacenamiento digital, por ejemplo, un diskette, un DVD, un CD, una ROM, una EPROM, una EEPROM o una memoria FLASH, los cuales tienen unas senales de control electronicamente legibles guardadas en ellos, las cuales cooperan (o son capaces de cooperar) con un sistema de computacion programable de modo que se ejecuta el respectivo metodo.
Algunas realizaciones de acuerdo con el invento comprenden un portador de datos que tiene senales de control legibles electronicamente, las cuales son capaces de cooperar con un sistema de computadora programable, tal que uno de los metodos descrito en la presente sea ejecutado.
Generalmente, realizaciones del presente invento pueden ser implementadas como un programa de computador con un codigo de programa, siendo codigo de programa operativo para ejecutar uno de los metodos cuando el producto de programa de ordenador corre en una computadora. El codigo de programa puede ser almacenado, por ejemplo, sobre un portador legible por una maquina.
Otras realizaciones comprenden el programa de ordenador para ejecutar uno de los metodos descritos en la presente, almacenado en un portador legible por una maquina o un medio de almacenamiento no transitorio.
En otras palabras, una realizacion del metodo inventivo es, por lo tanto, un programa de ordenador que un codigo de programa para ejecutar uno de los metodos descritos en la presente, cuando el programa de ordenador corre en una computadora.
Una realizacion adicional de los metodos inventivos es, por lo tanto, un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, grabado en el mismo, el programa de ordenador para ejecutar uno de los metodos descritos en la presente.
Una realizacion adicional del metodo inventivo es, por lo tanto, una transmision de datos o una secuencia de senales que representan el programa de computador para ejecutar uno de los metodos descritos en la presente. La transmision de datos o la secuencia de senales pueden ser configuradas, por ejemplo, para ser transferidos via una conexion de comunicacion de datos, por ejemplo, via Internet.
Una realizacion adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un dispositivo logico programable, configurado para o adaptado para ejecutar uno de los metodos descritos en la presente.
Una realizacion adicional comprende una computadora que tiene instalado en ella el programa de ordenador para ejecutar uno de los metodos descritos en la presente.
En algunas realizaciones se puede usar un dispositivo de logica programable (por ejemplo, un arreglo de compuesta programable de campo) para realizar algunas o todas las funcionalidades de los metodos descritos en la presente. En algunas realizaciones, el arreglo de compuerta programable de campo puede cooperar con un microprocesador para realizar uno de los metodos descritos en la presente. Generalmente, los metodos preferiblemente son realizados mediante algun aparato de hardware.
Las realizaciones que se describieron mas arriba son puramente ilustrativas para los principios del presente invento. Se entiende que las modificaciones y variaciones posibles de las disposiciones y de los detalles descritos en la presente seran evidentes para los expertos en la materia. Por lo tanto, es la intencion que el invento este limitado solo por el alcance de las siguientes reivindicaciones de patente y no por los detalles espedficos presentados por la descripcion y la explicacion de las realizaciones en la presente.

Claims (12)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    REIVINDICACIONES
    1. Un aparato para generar una senal decorrelacionada que comprende:
    una unidad receptora (650) para recibir informacion de fase;
    un separador de componentes transitorios (310; 410; 510; 610; 710; 910) para separar una senal de entrada en un primer componente de senal y un segundo componente de senal tal que el primer componente de senal comprende porciones de senal transitorias de la senal de entrada y tal que el segundo componente de senal comprende porciones de senal no transitorias de la senal de entrada;
    un decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) para decorrelacionar el primer componente de senal de acuerdo con un primer metodo de decorrelacion para obtener un primer componente de senal decorrelacionado;
    un segundo decorrelacionador (330; 430; 530; 630; 730; 930) para decorrelacionar el segundo componente de senal de acuerdo con un segundo metodo de decorrelacion para obtener un segundo componente de senal decorrelacionado, en el que el segundo metodo de decorrelacion es diferente del primer metodo de decorrelacion; y
    una unidad combinadora (340; 440; 540; 640; 740; 940) para combinar el primer componente de senal decorrelacionado y el segundo componente de senal decorrelacionado para obtener una senal de salida decorrelacionada;
    en el que el decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) esta adaptado para aplicar la informacion de fase al primer componente de senal.
  2. 2. Un aparato de acuerdo con la reivindicacion 1,
    en el que la unidad receptora (650) esta adaptada para recibir la informacion de fase desde un codificador; y en el que el decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) esta adaptado para aplicar la informacion de fase al primer componente de senal.
  3. 3. Un aparato de acuerdo con una cualquiera de las reivindicaciones 1 o 2,
    en el que el separador de componentes transitorios (310; 410; 510; 610; 710; 910) esta adaptado para separar una senal de entrada la cual esta representada en el dominio de la frecuencia.
  4. 4. Un aparato de acuerdo con una de las reivindicaciones anteriores,
    en el que la informacion de fase indica una diferencia de fase entre una senal residual y una senal mezclada hacia abajo, y en el que el decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) esta adaptado para aplicar la informacion de fase al primer componente de senal.
  5. 5. Un aparato de acuerdo con la reivindicacion 4,
    en el que la informacion de fase indica una diferencia de fase entre una senal residual y una senal mezclada hacia abajo con respecto a una cierta banda de frecuencia, y en el que el decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) esta adaptado para aplicar la informacion de fase al primer componente de senal.
  6. 6. Un aparato de acuerdo con una de las reivindicaciones 1 a 3,
    en el que la informacion de fase indica una diferencia de fase entre una residual y una senal mezclada, en el que la diferencia de fase es un parametro de banda ancha independiente de la frecuencia, y en el que el decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) esta adaptado para aplicar la informacion de fase al primer componente de senal.
  7. 7. Un aparato de acuerdo con una de las reivindicaciones anteriores,
    en el que el decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) esta adaptado para establecer un termino de fase a partir de la informacion de fase; y en el que el decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) ademas esta adaptado para aplicar el termino de fase al primer componente de senal.
  8. 8. Un aparato de acuerdo con la reivindicacion 7,
    en el que del decorrelacionador de componentes transitorios (320; 420; 520; 620; 720; 920) esta adaptado para aplicar el termino de fase al primer componente de senal multiplicando el termino de fase con el primer componente de senal.
  9. 9. Un aparato de acuerdo con una de las reivindicaciones anteriores,
    en el que el aparato ademas esta adaptado para recibir informacion de separacion de componentes transitorios indicando si una porcion de senal de la senal de entrada comprende un componente transitorio; y en el que el separador de componentes transitorios (310; 410; 510; 610; 710; 910) separa una senal de entrada en el primer componente de senal y en el segundo componente de senal en base a la informacion de separacion de
    5
    10
    15
    20
    25
    componentes transitorios.
  10. 10. Un aparato de acuerdo con una de las reivindicaciones anteriores,
    en el que la unidad combinadora (340; 440; 540; 640; 740; 940) esta adaptada para combinar el primer componente de senal decorrelacionado y el segundo componente de senal decorrelacionado sumando el primer componente de senal decorrelacionado y el segundo componente de senal decorrelacionado.
  11. 11. Un metodo para generar una senal decorrelacionada que comprende: recibir informacion de fase;
    separar una senal de entrada en un primer componente de senal y un segundo componente de senal tal que el primer componente de senal comprende porciones de senal transitorias de la senal de entrada y tal que el segundo componente de senal comprende porciones de senal no transitorias de la senal de entrada; decorrelacionar el primer componente de senal de acuerdo con un primer metodo de decorrelacion para obtener un componente de senal decorrelacionado;
    decorrelacionar el segundo componente de senal de acuerdo con un segundo metodo de decorrelacion para obtener un segundo componente de senal decorrelacionado, en el que el segundo metodo de decorrelacion es diferente del primer metodo de decorrelacion; y
    combinar el primer componente de senal decorrelacionado y el segundo componente de senal decorrelacionado para obtener una senal de salida decorrelacionada;
    en el que la informacion de fase recibida es aplicada al primer componente de senal.
  12. 12. Un programa de ordenador que implementa un metodo de acuerdo con la reivindicacion 11.
ES11743459.7T 2010-08-25 2011-07-06 Aparato para generar una señal descorrelacionada usando información de fase transmitida Active ES2585402T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37698010P 2010-08-25 2010-08-25
US376980P 2010-08-25
PCT/EP2011/061361 WO2012025283A1 (en) 2010-08-25 2011-07-06 Apparatus for generating a decorrelated signal using transmitted phase information

Publications (1)

Publication Number Publication Date
ES2585402T3 true ES2585402T3 (es) 2016-10-05

Family

ID=44509236

Family Applications (3)

Application Number Title Priority Date Filing Date
ES11731316.3T Active ES2544077T3 (es) 2010-08-25 2011-07-06 Aparato para descodificar una señal que comprende transitorios usando una unidad de combinación y un mezclador
ES11743459.7T Active ES2585402T3 (es) 2010-08-25 2011-07-06 Aparato para generar una señal descorrelacionada usando información de fase transmitida
ES16196394T Active ES2706490T3 (es) 2010-08-25 2011-07-06 Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES11731316.3T Active ES2544077T3 (es) 2010-08-25 2011-07-06 Aparato para descodificar una señal que comprende transitorios usando una unidad de combinación y un mezclador

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES16196394T Active ES2706490T3 (es) 2010-08-25 2011-07-06 Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales

Country Status (21)

Country Link
US (3) US8831931B2 (es)
EP (5) EP2924687B1 (es)
JP (3) JP5775583B2 (es)
KR (2) KR101445291B1 (es)
CN (2) CN103180898B (es)
AR (3) AR082542A1 (es)
AU (2) AU2011295367B2 (es)
BR (2) BR112013004365B1 (es)
CA (3) CA2809404C (es)
ES (3) ES2544077T3 (es)
HK (2) HK1186833A1 (es)
MX (2) MX2013002188A (es)
MY (3) MY180970A (es)
PL (3) PL2609590T3 (es)
PT (2) PT3144932T (es)
RU (3) RU2640650C2 (es)
SG (3) SG187950A1 (es)
TR (1) TR201900417T4 (es)
TW (2) TWI459380B (es)
WO (2) WO2012025283A1 (es)
ZA (1) ZA201302050B (es)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2609590T3 (pl) 2010-08-25 2015-10-30 Fraunhofer Ges Forschung Urządzenie do dekodowania sygnału zawierającego transjenty z użyciem jednostki łączenia i miksera
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
US9064318B2 (en) 2012-10-25 2015-06-23 Adobe Systems Incorporated Image matting and alpha value techniques
US9355649B2 (en) * 2012-11-13 2016-05-31 Adobe Systems Incorporated Sound alignment using timing information
US10638221B2 (en) 2012-11-13 2020-04-28 Adobe Inc. Time interval sound alignment
US9201580B2 (en) 2012-11-13 2015-12-01 Adobe Systems Incorporated Sound alignment user interface
US9076205B2 (en) 2012-11-19 2015-07-07 Adobe Systems Incorporated Edge direction and curve based image de-blurring
US10249321B2 (en) 2012-11-20 2019-04-02 Adobe Inc. Sound rate modification
US9451304B2 (en) 2012-11-29 2016-09-20 Adobe Systems Incorporated Sound feature priority alignment
US9135710B2 (en) 2012-11-30 2015-09-15 Adobe Systems Incorporated Depth map stereo correspondence techniques
US10455219B2 (en) 2012-11-30 2019-10-22 Adobe Inc. Stereo correspondence and depth sensors
US9208547B2 (en) 2012-12-19 2015-12-08 Adobe Systems Incorporated Stereo correspondence smoothness tool
US10249052B2 (en) 2012-12-19 2019-04-02 Adobe Systems Incorporated Stereo correspondence model fitting
US9214026B2 (en) 2012-12-20 2015-12-15 Adobe Systems Incorporated Belief propagation and affinity measures
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
BR112015018522B1 (pt) * 2013-02-14 2021-12-14 Dolby Laboratories Licensing Corporation Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix.
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
WO2014174344A1 (en) * 2013-04-26 2014-10-30 Nokia Corporation Audio signal encoder
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP3022949B1 (en) 2013-07-22 2017-10-18 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
JP6242489B2 (ja) 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
EP3044783B1 (en) * 2013-09-12 2017-07-19 Dolby International AB Audio coding
CA2926243C (en) * 2013-10-21 2018-01-23 Lars Villemoes Decorrelator structure for parametric reconstruction of audio signals
KR102231755B1 (ko) * 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
EP2980789A1 (en) 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
KR20160101692A (ko) 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
TWI616095B (zh) * 2016-08-26 2018-02-21 配信裝置、配信系統、配信方法、電子機器、播放裝置及接收程式
CN116741185A (zh) 2016-11-08 2023-09-12 弗劳恩霍夫应用研究促进协会 用于下混频至少两声道的下混频器和方法以及多声道编码器和多声道解码器
CN117676451A (zh) 2016-11-08 2024-03-08 弗劳恩霍夫应用研究促进协会 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法
EP3382704A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
JP7257975B2 (ja) 2017-07-03 2023-04-14 ドルビー・インターナショナル・アーベー 密集性の過渡事象の検出及び符号化の複雑さの低減
PL3659140T3 (pl) * 2017-07-28 2024-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do enkodowania lub dekodowania enkodowanego sygnału wielokanałowego za pomocą sygnału wypełnienia generowanego przez filtr szerokopasmowy
US10306391B1 (en) 2017-12-18 2019-05-28 Apple Inc. Stereophonic to monophonic down-mixing
EP3550561A1 (en) 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
WO2020126120A1 (en) * 2018-12-20 2020-06-25 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for controlling multichannel audio frame loss concealment
FR3136099A1 (fr) * 2022-05-30 2023-12-01 Orange Codage audio spatialisé avec adaptation d’un traitement de décorrélation

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999041947A1 (en) * 1998-02-13 1999-08-19 Koninklijke Philips Electronics N.V. Surround sound reproduction system, sound/visual reproduction system, surround signal processing unit and method for processing an input surround signal
CN100508026C (zh) 2002-04-10 2009-07-01 皇家飞利浦电子股份有限公司 立体声信号编码
CN1307612C (zh) * 2002-04-22 2007-03-28 皇家飞利浦电子股份有限公司 声频信号的编码解码方法、编码器、解码器及相关设备
EP1595247B1 (en) * 2003-02-11 2006-09-13 Koninklijke Philips Electronics N.V. Audio coding
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
JP4867914B2 (ja) * 2004-03-01 2012-02-01 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャンネルオーディオコーディング
JP4521633B2 (ja) 2004-03-12 2010-08-11 直樹 末広 符号分割多重信号の相関分離識別方式
PL1735774T3 (pl) 2004-04-05 2008-11-28 Koninl Philips Electronics Nv Koder wielokanałowy
CN1938760B (zh) * 2004-04-05 2012-05-23 皇家飞利浦电子股份有限公司 多通道编码器
JP4934427B2 (ja) * 2004-07-02 2012-05-16 パナソニック株式会社 音声信号復号化装置及び音声信号符号化装置
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7283634B2 (en) * 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
WO2006132857A2 (en) 2005-06-03 2006-12-14 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
RU2393550C2 (ru) * 2005-06-30 2010-06-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ кодирования и декодирования звукового сигнала
WO2007029412A1 (ja) * 2005-09-01 2007-03-15 Matsushita Electric Industrial Co., Ltd. マルチチャンネル音響信号処理装置
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
TW200742275A (en) * 2006-03-21 2007-11-01 Dolby Lab Licensing Corp Low bit rate audio encoding and decoding in which multiple channels are represented by fewer channels and auxiliary information
WO2007110101A1 (en) * 2006-03-28 2007-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Enhanced method for signal shaping in multi-channel audio reconstruction
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US8064624B2 (en) * 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
WO2009046223A2 (en) * 2007-10-03 2009-04-09 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
JP5266332B2 (ja) 2008-01-01 2013-08-21 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
ES2404563T3 (es) * 2008-02-14 2013-05-28 Dolby Laboratories Licensing Corporation Ampliación estereofónica
WO2009116280A1 (ja) 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
PL2609590T3 (pl) * 2010-08-25 2015-10-30 Fraunhofer Ges Forschung Urządzenie do dekodowania sygnału zawierającego transjenty z użyciem jednostki łączenia i miksera

Also Published As

Publication number Publication date
CA2809437C (en) 2016-06-21
PL3144932T3 (pl) 2019-04-30
KR101445291B1 (ko) 2014-09-29
CA2887939A1 (en) 2012-03-01
AU2011295368B2 (en) 2015-05-07
MX2013002188A (es) 2013-03-18
JP5775582B2 (ja) 2015-09-09
EP2924687A1 (en) 2015-09-30
TW201214414A (en) 2012-04-01
CN103180898B (zh) 2015-04-08
CN103180898A (zh) 2013-06-26
US9431019B2 (en) 2016-08-30
RU2640650C2 (ru) 2018-01-10
BR112013004362B1 (pt) 2020-12-01
EP3144932B1 (en) 2018-11-07
RU2573774C2 (ru) 2016-01-27
MY156770A (en) 2016-03-31
WO2012025283A1 (en) 2012-03-01
JP2013539553A (ja) 2013-10-24
ES2706490T3 (es) 2019-03-29
BR112013004362A2 (pt) 2017-09-19
JP6196249B2 (ja) 2017-09-13
EP2609591B1 (en) 2016-06-01
RU2013112903A (ru) 2014-09-27
TWI457912B (zh) 2014-10-21
EP2609591A1 (en) 2013-07-03
AR098078A2 (es) 2016-04-27
JP2013539554A (ja) 2013-10-24
HK1187144A1 (zh) 2014-03-28
AR082542A1 (es) 2012-12-12
PT3144932T (pt) 2019-02-04
PL2609591T3 (pl) 2016-11-30
MY180970A (en) 2020-12-14
AU2011295367B2 (en) 2014-07-31
TW201214417A (en) 2012-04-01
PL2609590T3 (pl) 2015-10-30
AU2011295368A1 (en) 2013-03-28
TR201900417T4 (tr) 2019-02-21
AU2011295367A1 (en) 2013-04-11
US20130173274A1 (en) 2013-07-04
EP2924687B1 (en) 2016-11-02
CN103460282B (zh) 2015-08-19
CA2887939C (en) 2017-11-07
US9368122B2 (en) 2016-06-14
US20140222441A1 (en) 2014-08-07
RU2015102326A (ru) 2015-06-10
EP3144932A1 (en) 2017-03-22
RU2013112853A (ru) 2014-09-27
WO2012025282A1 (en) 2012-03-01
CA2809404C (en) 2016-06-21
ES2544077T3 (es) 2015-08-27
MY178197A (en) 2020-10-06
US8831931B2 (en) 2014-09-09
ZA201302050B (en) 2013-12-23
KR20130069770A (ko) 2013-06-26
EP2609590B1 (en) 2015-05-20
EP3471091A1 (en) 2019-04-17
AR082543A1 (es) 2012-12-12
JP2015129953A (ja) 2015-07-16
KR101445293B1 (ko) 2014-09-29
CA2809437A1 (en) 2012-03-01
PT2609591T (pt) 2016-07-12
KR20130079507A (ko) 2013-07-10
SG188254A1 (en) 2013-04-30
RU2580084C2 (ru) 2016-04-10
EP2609590A1 (en) 2013-07-03
JP5775583B2 (ja) 2015-09-09
MX2013002187A (es) 2013-03-18
CA2809404A1 (en) 2012-03-01
BR112013004365A2 (pt) 2020-06-02
CN103460282A (zh) 2013-12-18
US20130173273A1 (en) 2013-07-04
HK1186833A1 (en) 2014-03-21
SG187950A1 (en) 2013-03-28
BR112013004365B1 (pt) 2021-01-12
SG2014006738A (en) 2014-03-28
TWI459380B (zh) 2014-11-01

Similar Documents

Publication Publication Date Title
ES2585402T3 (es) Aparato para generar una señal descorrelacionada usando información de fase transmitida
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information