ES2362920T3 - Método mejorado para la conformación de señales en reconstrucción de audio multicanal. - Google Patents

Método mejorado para la conformación de señales en reconstrucción de audio multicanal. Download PDF

Info

Publication number
ES2362920T3
ES2362920T3 ES06742984T ES06742984T ES2362920T3 ES 2362920 T3 ES2362920 T3 ES 2362920T3 ES 06742984 T ES06742984 T ES 06742984T ES 06742984 T ES06742984 T ES 06742984T ES 2362920 T3 ES2362920 T3 ES 2362920T3
Authority
ES
Spain
Prior art keywords
channel
direct
signal
information
reconstructor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06742984T
Other languages
English (en)
Inventor
Sascha Disch
Karsten Linzmeier
Jürgen HERRE
Harald Popp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2362920T3 publication Critical patent/ES2362920T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2217/00Details of magnetostrictive, piezoelectric, or electrostrictive transducers covered by H04R15/00 or H04R17/00 but not provided for in any of their subgroups
    • H04R2217/03Parametric transducers where sound is generated or captured by the acoustic demodulation of amplitude modulated ultrasonic waves
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Reconstructor (30; 60) multicanal para generar un canal (50; 76) de salida reconstruido usando al menos un canal (38; 68) de mezcla descendente derivado mezclando de manera descendente una pluralidad de canales originales y usando una representación (40; 72) de parámetros, incluyendo la representación (40; 72) de parámetros información sobre una estructura temporal de un canal original, que comprende: un generador (32; 62) para generar una componente (42; 64) de señal directa y una componente (44; 66) de señal difusa para el canal (50; 76) de salida reconstruido, basándose en el canal (38; 68) de mezcla descendente; un modificador (34; 69) de señal directa para modificar la componente (42; 64) de señal directa usando la representación (40; 72) de parámetros, usando la información sobre la estructura temporal del canal original; y un combinador (36; 74) para combinar la componente (46) de señal directa modificada y la componente (44; 66) de señal difusa para obtener el canal (50; 76) de salida reconstruido, en el que el modificador de señal directa no altera la componente de señal difusa.

Description

Campo de la invención La presente invención se refiere a un concepto de conformación de señal mejorada en reconstrucción de audio multicanal y en particular a un nuevo enfoque de conformación de envolvente.
Antecedentes de la invención y técnica anterior El desarrollo reciente en la codificación de audio permite la recreación de una representación multicanal de una señal de audio basándose en una señal estéreo (o mono) y datos de control correspondientes. Estos métodos difieren sustancialmente de las soluciones basadas en matrices anteriores, tales como Dolby Prologic, puesto que se transmiten datos de control adicionales para controlar la recreación, a lo que también se hace referencia como mezcla ascendente, de los canales envolventes basándose en los canales estéreo o mono transmitidos. Tales decodificadores de audio multicanal paramétricos reconstruyen N canales basándose en M canales transmitidos, donde N > M, y los datos de control adicionales. El uso de los datos de control adicionales provoca una tasa de transmisión de datos significativamente inferior que la transmisión de todos los N canales, haciendo que la codificación sea muy eficaz, mientras que al mismo tiempo se garantiza la compatibilidad con los dispositivos de M canales y los dispositivos de N canales. Los M canales pueden ser una representación de canal mono único, de canal estéreo o de 5.1 canales. De este modo, es posible tener una señal original de 7.2 canales, mezclada de manera descendente para dar una señal de
5.1 canales compatible hacia atrás, y parámetros de audio espaciales que permiten a un decodificador de audio espacial reproducir una versión muy similar de los 7.2 canales originales, con una sobrecarga de tasa de transmisión de bits adicional pequeña. Estos métodos de codificación de envolvente paramétrica comprenden usualmente una parametrización de la señal envolvente basándose en parámetros ILD (diferencia de nivel entre canales) e ICC (coherencia entre canales), variables en tiempo y frecuencia. Estos parámetros describen, por ejemplo, correlaciones y tasas de energía entre pares de canales de la señal multicanal original. En el proceso de decodificación, la señal multicanal recreada se obtiene distribuyendo la energía de los canales mezclados de manera descendente recibidos entre todos los pares de canales como se describe por los parámetros ILD transmitidos. Sin embargo, puesto que una señal multicanal puede tener una distribución de energía equitativa entre todos los canales, mientras las señales en los diferentes canales son muy diferentes, dando así la impresión respecto a la escucha de un sonido muy amplio, la amplitud correcta se obtiene mezclando señales con versiones decorrelacionadas de las mismas, como se describe por el parámetro ICC. La versión decorrelacionada de la señal, que a menudo se denomina también señal húmeda o difusa, se obtiene pasando la señal a través de un reverberador, tal como un filtro pasa todo. Una forma simple de decorrelación es aplicar un retardo específico a la señal. En general, existen una gran cantidad de reverberadores diferentes conocidos en la técnica, la implementación precisa del reverberador usado es de menor importancia. La salida del decorrelacionador tiene una respuesta de tiempo que usualmente es muy plana. De este modo, una señal de Dirac de entrada proporciona una salida repentina de ruido descendente. Cuando se mezcla la señal decorrelacionada con la señal original, para algunos tipos de señales transitorias, como las señales de aplausos, es importante realizar un procesamiento posterior de la señal para evitar la percepción de artefactos introducidos adicionalmente que pueden dar como resultado la percepción de un tamaño de habitación más grande y artefactos de tipo pre-eco. En general, la invención se refiere a un sistema que representa audio multicanal como una combinación de datos mezclados de manera descendente de audio (por ejemplo, uno o dos canales) y datos multicanal paramétricos relacionados. En tal esquema (por ejemplo, en la codificación de indicadores binaurales) se transmite un flujo de datos de mezcla descendente de audio, en el que puede indicarse que la forma más simple de mezcla descendente es simplemente añadir las señales diferentes de una señal multicanal. Tal señal (señal de suma) va acompañada de un flujo de datos multicanal paramétricos (información secundaria). La información secundaria comprende, por ejemplo, uno o más de los tipos de parámetros presentados anteriormente para describir la interrelación espacial de los canales originales de la señal multicanal. En un sentido, el esquema multicanal paramétrico actúa como un pre/postprocesador respecto al extremo de envío/recepción de los datos de mezcla descendente, por ejemplo, con la señal de suma y la información secundaria. Debe indicarse que la señal de suma de los datos de mezcla descendente puede codificarse de manera adicional usando cualquier codificador de audio o de voz. Como la transmisión de señales multicanal sobre portadoras de bajo ancho de banda está pasando a ser cada vez más popular, estos sistemas, también conocidos como “codificación de audio espacial“, “MPEG envolvente“, se han desarrollado mejor recientemente. Las siguientes publicaciones se conocen en el contexto de estas tecnologías:
[1] C. Faller y F. Baumgarte, “Efficient representation of spatial audio using perceptual parametrization,” en Proc. IEEE WASPAA, Mohonk, NY, octubre de 2001.
[2] F. Baumgarte y C. Faller, “Estimation of auditory spatial cues for binaural cue coding,” en Proc. ICASSP 2002, Orlando, FL, mayo de 2002.
[3] C. Faller y F. Baumgarte, “Binaural cue coding: a novel and efficient representation of spatial audio,” en Proc. ICASSP 2002, Orlando, FL, mayo de 2002.
[4] F. Baumgarte y C. Faller, “Why binaural cue coding is better than intensity stereo coding,” en Proc. AES 112th Conv., Munich, Alemania, mayo de 2002.
[5] C. Faller y F. Baumgarte, “Binaural cue coding applied to stereo and multi-channel audio compression,” en Proc. AES 112th Conv., Munich, Alemania, mayo de 2002.
[6] F. Baumgarte y C. Faller, “Design and evaluation of binaural cue coding,” en AES 113th Conv., Los Angeles, CA, octubre de 2002.
[7] C. Faller y F. Baumgarte, “Binaural cue coding applied to audio compression with flexible rendering,” en Proc. AES 113th Conv., Los Angeles, CA, octubre de 2002.
[8] J. Breebaart, J. Herre, C. Faller, J. Rödén, F. Myburg, S. Disch, H. Purnhagen, G. Hoto, M. Neusinger, K. Kjörling, W. Oomen: “MPEG Spatial Audio Coding / MPEG Surround: Overview and Current Status”, 119th AES Convention, Nueva York 2005, Preprint 6599
[9] J. Herre, H. Purnhagen, J. Breebaart, C. Faller, S. Disch, K. Kjörling, E. Schuijers, J. Hilpert, F. Myburg, “The Reference Model Architecture for MPEG Spatial Audio Coding”, 118th AES Convention, Barcelona 2005, Preprint 6477
[10] J. Herre, C. Faller, S. Disch, C. Ertel, J. Hilpert, A. Hoelzer, K. Linzmeier, C. Spenger, P. Kroon: “Spatial Audio Coding: Next-Generation Efficient and Compatible Coding of Multi-Channel Audio”, 117th AES Convention, San Francisco 2004, Preprint 6186
[11] J. Herre, C. Faller, C. Ertel, J. Hilpert, A Hoelzer, C. Spenger: “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio”, 116th AES Convention, Berlín 2004, Preprint 6049. Una técnica relacionada, que se centra en la transmisión de dos canales a través de una señal mono transmitida se denomina “estéreo paramétrico” y por ejemplo se describe más ampliamente en las siguientes publicaciones:
[12] J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, “High-Quality Parametric Spatial Audio Coding at Low Bitrates”, AES 116th Convention, Berlín, Preprint 6072, mayo de 2004
[13] E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, “Low Complexity Parametric Stereo Coding”, AES 116th Convention, Berlín, Preprint 6073, mayo de 2004. En un decodificador de audio espacial, la mezcla ascendente multicanal se calcula a partir de una parte de señal directa y una parte de señal difusa, que se deriva por medio de la decorrelación de la parte directa, como ya se mencionó anteriormente. De este modo, en general, la parte difusa tiene una envolvente temporal diferente que la parte directa. El término “envolvente temporal” describe en este contexto la variación de la energía o amplitud de la señal en el tiempo. La envolvente temporal diferente lleva a artefactos (pre y post-ecos, “manchado” temporal) en las señales mezcladas de manera ascendente para señales de entrada que tienen una imagen estéreo amplia y, al mismo tiempo, una estructura de envolvente transitoria. Las señales transitorias son generalmente señales que varían intensamente en un corto periodo de tiempo. Los ejemplos probablemente más importantes para esta clase de señales son las señales de tipo aplauso, que con frecuencia están presentes en las grabaciones en tiempo real. Para evitar artefactos causados por la introducción de sonido difuso/decorrelacionado con una envolvente temporal inapropiada en la señal de mezcla ascendente, se han propuesto varias técnicas: La solicitud de estadounidense 11/006.492 (“Diffuse Sound Shaping for BCC Schemes and The Like”) muestra que la calidad perceptual de señales transitorias críticas puede mejorarse conformando la envolvente temporal de la señal difusa para coincidir con la envolvente temporal de la señal directa. Este enfoque ya se ha introducido en la tecnológica de MPEG envolvente por medio de diferentes herramientas, tales como la “conformación de envolvente temporal” (TES) y el “procesamiento temporal” (TP). Puesto que la envolvente temporal objetivo de la señal difusa se deriva a partir de la envolvente de la señal de mezcla descendente transmitida, este método no requiere transmitir información secundaria adicional. Sin embargo, como consecuencia, la estructura fina temporal del sonido difuso es la misma para todos los canales de salida. Como la parte de señal directa, que se deriva directamente de la señal de mezcla descendente transmitida, también tiene una envolvente temporal similar, este método puede mejorar la calidad perceptual de las señales de tipo aplauso en términos de “nitidez”, por ejemplo. Sin embargo, como entonces la señal directa y la señal difusa tienen envolventes temporales similares para todos los canales, tales técnicas pueden mejorar la calidad subjetiva de las señales de tipo aplauso, pero no pueden mejorar la distribución espacial de eventos de aplauso únicos en la señal, ya que esto sería posible solamente si un canal reconstruido fuese mucho más intenso al producirse la señal transitoria que en los otros canales, lo cual es imposible teniendo señales que comparten básicamente la misma envolvente temporal. Un método alternativo para superar el problema se describe en la solicitud estadounidense 11/006.482 (“individual Channel Shaping for BCC Schemes and The Like”). Este enfoque emplea información secundaria de banda ancha temporal de grano fino que se transmite por medio del codificador para realizar una conformación temporal fina de la señal directa y la difusa. Evidentemente, este enfoque permite una estructura fina temporal que es individual para cada canal de salida y así puede albergar también señales para las que se producen eventos transitorios solamente en un subconjunto de los canales de salida. Una variación adicional de este enfoque se describe en el documento US 60/726.389 (“Methods for Improved Temporal and Spatial Shaping of Multi-Channel Audio Signals”). Ambos enfoques descritos para mejorar la calidad perceptual de las señales codificadas transitorias comprenden una conformación temporal de la envolvente de la señal difusa prevista para coincidir con una envolvente temporal de señales directas correspondientes. Aunque ambos métodos previamente descritos de la técnica anterior pueden mejorar la calidad subjetiva de las señales de tipo aplauso en términos de nitidez, sólo el último enfoque puede mejorar también la redistribución espacial de la señal reconstruida. Entonces, la calidad subjetiva de las señales de aplauso sintetizadas sigue siendo insatisfactoria, debido a que la conformación temporal de la combinación de sonido tanto seco como difuso lleva a distorsiones características (los ataques de los aplausos individuales se perciben o bien como no “cerrados“, cuando sólo se realiza una conformación temporal flexible, o bien las distorsiones se introducen si se aplica conformación a la señal con una resolución temporal muy alta). Esto se vuelve evidente, cuando una señal difusa es simplemente una copia retardada de la señal directa. Entonces, la señal difusa mezclada con la señal directa es más susceptible de tener una composición
espectral diferente que la señal directa. De este modo, aun cuando la envolvente se ajusta a escala para coincidir con la envolvente de la señal directa, las diferentes contribuciones espaciales, que no se originan directamente de la señal original, estarán presentes en la señal reconstruida. Las distorsiones introducidas pueden volverse aún peores, cuando la parte de señal difusa se mejora (se hace más fuerte) durante la reconstrucción, cuando la señal difusa se ajusta a escala para coincidir con la envolvente de la señal directa. Numerosas publicaciones se refieren al problema de codificar y decodificar apropiadamente señales multicanal. La solicitud de patente internacional WO 2004/097794 A2 se refiere al procesamiento avanzado de señales de audio multicanal basadas en un banco de filtros modulado exponencialmente complejo y métodos de señalización de tiempo adaptiva. Un sintetizador para generar una señal de decorrelación basándose en una señal de entrada es operativo sobre una pluralidad de señales de subbanda, en el que una señal de subbanda incluye una secuencia de al menos dos muestras de subbanda. El sintetizador incluye fases de filtrado para filtrar cada señal de subbanda usando un filtro de reverberación para obtener una pluralidad de señales reverberadas, en el que una pluralidad de señales de subbanda reverberadas juntas representan una señal de decorrelación. Esta señal de decorrelación se usa para reconstruir una señal basándose en una señal estéreo paramétricamente codificada que consiste en una señal mono y una medida de coherencia. La publicación “Parametric multi-channel audio coding: synthesis of coherence cues” Faller C., enero de 2006, IEEE transactions on audio, speech and language processing, IEEE service center, N.Y., EE.UU., páginas 299 a 310, XP007900793, página 303 a página 305, se refiere a formas de sintetizar indicadores de coherencia. Para dicho propósito, se usan filtros de decorrelación que modelan la reverberación tardía con respuestas de impulso que corresponden a varios 100 ms, dando como resultado la habilidad del esquema para generar sonido difuso que suena de forma natural. El documento “MPEG4-EXT2: CE on low complexity parametric stereo”, OOMEN W et al., diciembre de 2003, norma internacional ISO/IEC JTC1/SC 29/WG11, describe un concepto de cómo puede disminuirse la complexidad en el análisis y síntesis de estéreo paramétrico mediante el uso de bancos de filtros QMF en lugar de filtros FFT. La solicitud de patente estadounidense 2005/00583004 A1 se refiere a la codificación BCC y en particular a esquemas de codificación, en los que uno o más de los canales de entrada se transmiten como canales no modificados que no se mezclan de manera descendente en el codificador BCC y no se mezclan de manera ascendente en el decodificador BCC.
Sumario de la invención
Es el objetivo de la presente invención proporcionar un concepto de conformación de señal mejorada en reconstrucción multicanal. Este objetivo se logra por medio de un aparato según las reivindicaciones 1 ó 29, un método según la reivindicación 28 y un programa informático según la reivindicación 30. La presente invención se basa en el descubrimiento de que un canal de salida reconstruido, reconstruido con un reconstructor multicanal usando al menos un canal de mezcla descendente derivado de la mezcla descendente de una pluralidad de canales originales y usando una representación paramétrica que incluye información adicional sobre una estructura (fina) temporal de un canal original, puede reconstruirse de manera eficaz con alta calidad, cuando se usa un generador para generar una componente de señal directa y una componente de señal difusa basándose en el canal de mezcla descendente. La calidad puede mejorarse esencialmente si sólo se modifica la componente de señal directa de modo que la estructura fina temporal del canal de salida reconstruido se ajusta a una estructura fina temporal deseada, indicada por medio de la información adicional transmitida sobre la estructura fina temporal. En otras palabras, el ajuste a escala de las partes de señal directa derivadas directamente de la señal de mezcla descendente, apenas introduce artefactos adicionales en el momento en que se produce una señal transitoria. Cuando, como en la técnica anterior, la parte de señal húmeda se ajusta a escala para coincidir con una envolvente deseada, puede darse perfectamente el caso de que la señal transitoria original en el canal reconstruido se enmascare por una señal difusa mejorada mezclada con la señal directa, lo cual se describirá de manera más extensa a continuación. La presente invención resuelve este problema al ajustar a escala sólo la componente de señal directa, sin dar así oportunidad para introducir artefactos adicionales, a costa de transmitir parámetros adicionales para describir la envolvente temporal dentro de la información secundaria. Según una realización de la presente invención, los parámetros de ajuste a escala de la envolvente se derivan usando una presentación de la señal directa y difusa con un espectro blanqueado, es decir, donde diferentes partes espectrales de la señal tienen energías casi idénticas. Las ventajas de usar espectros blanqueados son dobles. Por un lado, el uso de un espectro blanqueado como base del cálculo de un factor de ajuste a escala usado para ajustar a escala la señal directa permite la transmisión de sólo un parámetro por ranura de tiempo que incluye la información sobre la estructura temporal. Como es usual en la codificación de audio multicanal que las señales se procesen dentro de numerosas bandas de frecuencia, esta característica ayuda a disminuir el número de información secundaria necesaria adicionalmente y, de este modo, el incremento de la tasa de transmisión de bits para la transmisión del parámetro adicional. Típicamente, otros parámetros tales como ICLD e ICC se transmiten una vez por trama de tiempo y banda de parámetro. Puesto que la cantidad de bandas de parámetro puede ser mayor que 20, es una ventaja principal el tener que transmitir sólo un único parámetro por canal. Generalmente, en la codificación multicanal, la señales se procesan en una estructura de trama, es decir, en entidades que tienen varios valores de muestreo, por ejemplo 1024 por trama. Adicionalmente, como ya se ha mencionado, las señales se dividen en varias partes espectrales antes de procesarse, de modo que finalmente de manera típica se transmite un parámetro ICC e ICLD por trama y parte espectral de la señal. La segunda ventaja del uso de sólo un parámetro tiene una causa física, puesto que las señales transitorias en cuestión tienen naturalmente espectros amplios. Por consiguiente, para tener en cuenta la energía de las señales transitorias dentro de los canales individuales de manera correcta, es más apropiado usar espectros blanqueados para el cálculo de los factores de ajuste a escala de energía. En una realización adicional de la presente invención, el concepto de la invención de modificar la componente de señal directa se aplica solamente a una parte espectral de la señal por encima de cierto límite espectral en presencia de señales residuales adicionales. Esto se debe a que las señales residuales junto con la señal de mezcla descendente permiten una reproducción de alta calidad de los canales originales. Resumiendo, el concepto de la invención está diseñado para proporcionar calidad espacial y temporal mejoradas con respecto a los enfoques de la técnica anterior, evitando los problemas asociados con aquellas técnicas. Por lo tanto, la información secundaria se transmite para describir la estructura de envolvente de tiempo fina de los canales individuales y permitir así la conformación temporal/espacial fina de las señales de canal de mezcla ascendente en el lado del decodificador. El método de la invención descrito en este documento se basa en los siguientes descubrimientos/consideraciones:
 Las señales de tipo aplauso pueden verse como compuestas por palmadas cercanas individuales y diferenciadas y un ambiente de tipo ruido que se origina a partir de palmadas lejanas muy densas.  En un decodificador de audio espacial, la mejor aproximación de las palmadas cercanas en cuanto a la envolvente temporal es la señal directa. Por lo tanto, sólo se procesa la señal directa por el método de la invención.  Puesto que la señal difusa representa principalmente la parte de ambiente de la señal, cualquier procesamiento sobre una resolución temporal fina es probable que introduzca artefactos de distorsión y modulación (aunque puede lograrse una cierta mejora subjetiva de la “nitidez” del aplauso por medio de tal técnica). Como una consecuencia de estas consideraciones, la señal difusa por tanto no se toca (es decir, no se somete a una conformación de tiempo fina) mediante el procesamiento de la invención).  No obstante, la señal difusa contribuye al equilibrio de energía de la señal de mezcla ascendente. El método de la invención tiene esto en cuenta al calcular un factor de ajuste a escala de banda ancha modificado a partir de la información transmitida que debe aplicarse solamente a la parte de señal directa. Este factor modificado se elige de modo que la energía total en un intervalo de tiempo dado es la misma dentro de ciertos límites como si se hubiera aplicado el factor original tanto a la parte directa como a la parte difusa de la señal en este intervalo.  Usando el método de la invención, se obtiene mejor calidad subjetiva de audio si la resolución espectral de los indicadores espaciales se elige como baja (por ejemplo, “ancho de banda completo”) para garantizar la conservación de la integridad espectral de las señales transitorias contenidas en la señal. En este caso, el método propuesto no incrementa necesariamente la tasa de transmisión de bits de información espacial secundaria promedio, puesto que la resolución espectral se intercambia de manera segura por la resolución temporal.
La mejora subjetiva de la calidad se logra por medio de la amplificación o amortiguación (“conformación”) de la parte
seca de la señal a lo largo del tiempo solamente y, de este modo,  Mejorando la calidad de la señal transitoria al reforzar la parte de señal directa en el sitio de la señal transitoria, mientras se evita una distorsión adicional que se origina de una señal difusa con envolvente temporal inapropiada  Mejorar la localización espacial mejorando la parte directa con respecto a la parte difusa en el origen espacial de un evento transitorio y amortiguándola con respecto a la parte difusa en posiciones alejadas panorámicas.
Breve descripción de los dibujos
La figura 1 muestra un diagrama de bloques de un codificador multicanal y un decodificador correspondiente; la figura 1b muestra un diagrama esquemático de la reconstrucción de señal usando señales decorrelacionadas; la figura 2 muestra un ejemplo de un reconstructor multicanal de la invención; la figura 3 muestra un ejemplo adicional de un reconstructor multicanal de la invención; la figura 4 muestra un ejemplo de representaciones de banda de parámetro usadas para identificar bandas de parámetro diferentes dentro de un esquema de decodificación multicanal; la figura 5 muestra un ejemplo de un decodificador multicanal de la invención; y La figura 6 muestra un diagrama de bloques que detalla un ejemplo de un método de la invención de reconstrucción de un canal de salida.
Descripción detallada de las realizaciones adicionales
La figura 1 muestra un ejemplo de codificación de datos de audio multicanal según la técnica anterior, para ilustrar más claramente el problema resuelto por el concepto de la invención. En general, en el lado de un codificador, una señal 10 multicanal original se introduce en el codificador 12 multicanal, derivando información 14 secundaria que indica la distribución espacial de los diversos canales de la señal multicanal original unos respecto a otros. Además de la generación de información 14 secundaria, un codificador 12 multicanal genera una o más señales 16 de suma, mezclándose de manera descendente a partir de la señal multicanal original. Configuraciones populares usadas ampliamente son las denominadas configuraciones 5-1-5 y 5-2-5. En la configuración 5-1-5 el codificador genera una única señal 16 de suma monofónica a partir de cinco canales de entrada y, por tanto, un correspondiente decodificador 18 tiene que generar cinco señales reconstruidas de una señal 20 multicanal reconstruida. En la configuración 5-2-5, el codificador genera dos canales mezclados de manera descendente a partir de cinco canales de entrada, conteniendo típicamente el primer canal de los canales mezclados de manera descendente información sobre un lado izquierdo o un lado derecho y conteniendo el segundo canal de los canales mezclados de manera descendente información sobre el otro lado. Los parámetros de muestreo que describen la distribución espacial de los canales originales son, como se indica por ejemplo en la figura 1, los parámetros ICLD e ICC previamente introducidos. Puede observarse que dentro del análisis que deriva la información 14 secundaria, las muestras de los canales originales de la señal 10 multicanal se procesan típicamente en dominios de subbanda que representan un intervalo específico de frecuencias de los canales originales. Un intervalo de frecuencias individual se indica mediante K. En algunas aplicaciones, los canales de entrada pueden filtrarse por medio de un banco de filtros híbrido antes del procesamiento, es decir, las bandas de parámetro K pueden subdividirse adicionalmente, indicándose cada subdivisión como k. Adicionalmente, el procesamiento de los valores de muestreo que describen un canal original se hace por tramas dentro de cada banda de parámetro individual, es decir, varias muestras consecutivas forman una trama de duración finita. Los parámetros BCC mencionados anteriormente describen normalmente una trama completa. Un parámetro relacionado de alguna manera con la presente invención y ya conocido en la técnica es el parámetro ICLD, que describe la energía contenida dentro de una trama de señal de un canal con respecto a las tramas correspondientes de otros canales de la señal multicanal original. Comúnmente, la generación de canales adicionales para derivar una reconstrucción de una señal multicanal a partir de una señal de suma transmitida solamente se logra con la ayuda de señales decorrelacionadas, que se derivan de la señal de suma usando decorreladores o reverberadores. En una aplicación típica, la frecuencia de muestreo discreta puede ser de 44,100 kH, de modo que una única muestra representa un intervalo de longitud finita de aproximadamente 0,02 ms de un canal original. Puede observarse que, usando bancos de filtros, la señal se divide en numerosas partes de señal, representando cada una un intervalo finito de frecuencias de la señal original. Para compensar un posible incremento de los parámetros que describen el canal, la resolución de tiempo normalmente se reduce, de manera que una parte de tiempo de longitud finita descrita por una única muestra dentro de un dominio de banco de filtros puede incrementarse a más de 0,5 ms. La longitud de trama típica puede variar entre 10 y 15 ms. La derivación de la señal decorrelacionada puede hacer uso de diferentes estructuras de filtro y/o retardos o combinaciones de los mismos sin limitar el alcance de la invención. Puede observarse adicionalmente que no hay que usar necesariamente el espectro completo para derivar las señales decorrelacionadas. Por ejemplo, sólo las partes espectrales por encima de un límite inferior espectral (el valor específico de K) de la señal de suma (señal de mezcla descendente) pueden usarse para derivar las señales decorrelacionadas usando retardos y/o filtros. Una señal decorrelacionada describe de este modo generalmente una señal derivada de la señal de mezcla descendente (canal de mezcla descendente) de modo que un coeficiente de correlación, cuando se deriva usando la señal decorrelacionada y el canal de mezcla descendente, se desvía significativamente de la unidad, por ejemplo, en 0,2. La figura 1b da un ejemplo extremadamente simplificado del proceso de mezcla descendente y reconstrucción durante la codificación de audio multicanal para explicar el gran beneficio del concepto de la invención de ajustar a escala solamente la componente de señal directa durante la reconstrucción de un canal de una señal multicanal. Para la siguiente descripción se asumen algunas simplificaciones. La primera simplificación es que la mezcla descendente de un canal izquierdo y uno derecho es una simple adición de las amplitudes dentro de los canales. La segunda gran simplificación es que la correlación se asume como un simple retardo de la señal completa. Bajo estos supuestos, van a codificarse una trama de un canal 21a izquierdo y un canal 21b derecho. Como se indica sobre el eje x de las ventanas mostradas, en la codificación de audio multicanal, el procesamiento se realiza típicamente sobre valores de muestreo, muestreados con una frecuencia de muestreo fija. Para facilidad de la explicación, esto se ignorará en el siguiente resumen breve. Como ya se mencionó, en el lado del codificador, un canal izquierdo y uno derecho se combinan (mezclan de manera descendente) en un canal 22 de mezcla descendente que se transmite al decodificador. En el lado del decodificador, una señal 23 decorrelacionada se deriva del canal 22 de mezcla descendente transmitido, que es la suma del canal 21a izquierdo y del canal 21b derecho en este ejemplo. Como ya se explicó, la reconstrucción del canal izquierdo se realiza entonces a partir de las tramas de señal derivadas del canal 22 de mezcla descendente y la señal 23 decorrelacionada. Puede observarse que cada trama individual se somete a un ajuste a escala global antes de la combinación, como se indica por el parámetro ICLD, que relaciona las energías dentro de las tramas individuales de canales individuales con la energía de las tramas correspondientes de los demás canales de una señal multicanal. Puesto que en el presente ejemplo se asume que energías iguales están contenidas dentro de la trama del canal 21a izquierdo y la trama del canal 21b derecho, el canal 22 de mezcla descendente transmitido y la señal 23 decorrelacionada se ajustan a escala aproximadamente por un factor de 0,5 antes de la combinación. Esto es, cuando la mezcla ascendente es igual de simple que la mezcla descendente, es decir, la suma de las dos señales, la reconstrucción del canal 21a izquierdo original es la suma del canal 24a de mezcla descendente ajustado a escala y la señal 24b decorrelacionada ajustada a escala. Debido a la suma para la transmisión y al ajuste a escala debido al parámetro ICLD, la relación señal a fondo de la señal transitoria disminuirá en un factor de 2 aproximadamente. Adicionalmente, cuando simplemente se suman las dos señales, se introducirá un artefacto adicional de tipo eco en la posición de la estructura transitoria retardada en la señal 24b decorrelacionada ajustada a escala. Como se indica en la figura 1b, la técnica anterior trata de resolver el problema del eco al ajustar a escala la amplitud de la señal 24b decorrelacionada ajustada a escala, para hacerla coincidir con la envolvente del canal 24b ajustado a escala transmitido, tal como se indica mediante las líneas discontinuas en la trama 24b. Debido al ajuste a escala, la amplitud en la posición de la señal transitoria original en el canal 21a izquierdo puede incrementarse. Sin embargo, la composición espectral de la señal decorrelacionada en la posición del ajuste a escala en la trama 24b es diferente de la composición espectral de la señal transitoria original. Por consiguiente, se introducen artefactos audibles en la señal, aunque la intensidad general de la señal puede reproducirse bien. La gran ventaja de la presente invención es que la presente invención sólo ajusta a escala una componente de señal directa del canal reconstruido. Puesto que este canal tiene una componente de señal que corresponde a la señal transitoria original con la composición espectral correcta y el tiempo correcto, ajustar a escala solamente el canal de mezcla descendente proporcionará una señal reconstruida que reconstruye el evento transitorio original con alta precisión. Éste es el caso puesto que sólo se mejoran mediante el ajuste a escala partes de señal que tienen la misma composición espectral que la señal transitoria original. La figura 2 muestra un diagrama de bloques de un ejemplo de un reconstructor multicanal de la invención, para detallar los aspectos principales del concepto de la invención. La figura 2 muestra un reconstructor 30 multicanal, con un generador 32, un modificador de señal directa y un combinador 36. El generador 32 recibe un canal 38 de mezcla descendente mezclado de manera descendente a partir de una pluralidad de canales originales y una representación 40 de parámetros que incluye información sobre una estructura temporal de un canal original. El generador genera una componente 42 de señal directa y una componente 44 de señal difusa basándose en el canal de mezcla descendente. El modificador 34 de señal directa recibe tanto la componente 42 de señal directa como la componente 44 de señal difusa y adicionalmente la representación 40 de parámetros con la información sobre una estructura temporal del canal original. Según la presente invención, el modificador 34 de señal directa modifica solamente la componente 42 de señal directa usando la representación de parámetros para derivar una componente 46 de señal directa modificada. La componente 46 de señal directa modificada y la componente 44 de señal difusa, que no se altera por el modificador 34 de señal directa, se introducen en el combinador 36 que combina la componente 46 de señal directa modificada y la componente 44 de señal difusa para obtener un canal 50 de salida reconstruido. Al modificar solamente la componente 42 de señal directa derivada del canal 38 de mezcla descendente transmitido sin reverberación (decorrelación), es posible reconstruir una envolvente de tiempo para el canal de salida reconstruido que coincide en gran medida con una envolvente de tiempo del canal original subyacente sin introducir artefactos adicionales y distorsiones audibles, como en las técnicas de la técnica anterior. Como se comentará con mayor detalle en la descripción de la figura 3, la conformación de envolvente de la invención restaura la envolvente de banda ancha de la señal de salida sintetizada. Comprende un procedimiento modificado de mezcla ascendente, seguido del aplanamiento de la envolvente y la reconformación de la parte de señal directa de cada canal de salida. Para la reconformación, se usa información secundaria de envolvente de banda ancha paramétrica contenida en el flujo de bits de la representación de parámetros. Esta información consiste, según una realización de la presente invención, en tasas (envRatio) que relacionan la envolvente de la señal de mezcla descendente transmitida con la envolvente de la señal de canal de entrada original. En el decodificador, se derivan factores de ganancia a partir de estas tasas para su aplicación a la señal directa en cada ranura de tiempo en una trama de un canal de salida dado. La parte de sonido difuso de cada canal no se altera según el concepto de la invención. La realización preferida de la presente invención mostrada en el diagrama de bloques de la figura 3 es un reconstructor 60 multicanal modificado para ajustarse al flujo de señal del decodificador de un decodificador MPEG espacial. El reconstructor 60 multicanal comprende un generador 62 para generar una componente 64 de señal directa y una componente 66 de señal difusa usando un canal 68 de mezcla descendente derivado mediante la mezcla descendente de una pluralidad de canales originales y una representación 70 de parámetros con información sobre las propiedades espaciales de los canales originales de la señal multicanal, tal como se usa en la codificación MPEG. El reconstructor 60 multicanal comprende adicionalmente un modificador 68 de señal directa, que recibe la componente 64 de señal directa, la componente 66 de señal difusa, la señal 69 de mezcla descendente e información 72 secundaria de envolvente adicional como entradas. El modificador de señal directa proporciona en su salida 73 del modificador la componente de señal directa modificada, modificada tal como se describe con mayor detalle a continuación. El combinador 74 recibe la componente de señal directa modificada y la componente de señal difusa para obtener el canal 76 de salida reconstruido. Como se muestra en la figura, la presente invención puede implementarse fácilmente en entornos multicanal ya existentes. La aplicación general del concepto de la invención en un esquema de codificación de este tipo podría encenderse y apagarse según algunos parámetros transmitidos adicionalmente dentro del flujo de bits de parámetros. Por ejemplo, podría introducirse una bandera adicional bsTempShapeEnable, que indica, cuando se establece en 1, que se requiere del uso del concepto de la invención.
5
10
15
20
25
30
35
40
45
Adicionalmente, podría introducirse una bandera adicional especificando de manera específica la necesidad de la aplicación del concepto de la invención sobre un canal basándose en el canal. Por lo tanto, puede usarse una bandera adicional, denominada por ejemplo bsEnvShapeChannel. Esta bandera, disponible para cada canal individual, puede entonces indicar el uso del concepto de la invención, cuando se establece en 1. Puede observarse además que para facilidad en la presentación, sólo se describe una configuración de dos canales en la figura 3. Por su puesto, la presente invención no pretende limitarse a una configuración de dos canales solamente. Por otra parte, cualquier configuración de canales puede usarse en conexión con el concepto de la invención. Por ejemplo, cinco o siete canales de entrada pueden usarse en conexión con la conformación de envolvente avanzada de la invención. Cuando se aplica el concepto de la invención en el esquema de codificación MPEG, como se indica en la figura 3, y la aplicación del concepto de la invención se señaliza al establecer bsTempShapeEnable igual a 1, las componentes de la señal difusa y la señal directa se sintetizan por separado por el generador 62 usando una mezcla posterior modificada en el dominio de subbanda híbrido según la siguiente fórmula:
imagen1
Aquí y en los siguiente párrafos, el vector Wm,k describe el vector de n parámetros de subbanda híbridos para la k-ésima subbanda del dominio de subbanda. Como se indica por la ecuación anterior, los parámetros de señal directa y difusa y se derivan por separado en la mezcla ascendente. Las salidas directas contienen la componente de señal directa y la señal residual, que es una señal que puede estar presente adicionalmente en la codificación MPEG. Las salidas difusas suministran solamente la señal difusa. Según el concepto de la invención, sólo se procesa adicionalmente la componente de señal directa mediante la conformación de envolvente guiada (la conformación de envolvente de la invención). El proceso de conformación de envolvente emplea una operación de extracción de envolvente sobre diferentes señales. El proceso de extracción de envolventes que tiene lugar dentro del modificador 68 de señal directa se describe con mayor detalle en los siguientes párrafos ya que es un paso obligado antes de la aplicación de la modificación de la invención a la componente de señal directa. Como ya se mencionó, dentro del dominio de subbanda híbrido, las subbandas se indican como k. Varias subbandas k también pueden organizarse en bandas de parámetro k. La asociación de subbandas con las bandas de parámetro que subyace a la realización de la presente invención comentada más adelante, se da en la tabla de la figura 4.
k
En primer lugar, para cada ranura en un trama, las energías E de ciertas bandas de parámetro k se calculan
ranura
siendo yn,k una señal de entrada de subbanda híbrida.
imagen1
con inicio=10 y detención=18. La suma incluye atribuir todas las k a una banda de parámetro  según la Tabla A.1.
k A continuación, se calcula un promedio de energía a largo plazo Eranura para cada banda de parámetro como:
imagen1
Con α siendo un factor de equilibrio que corresponde a un paso bajo IIR de primer orden (con una constante de tiempo de 400 ms aproximadamente) y n indica el índice de la ranura de tiempo. La energía (banda ancha) promedio total suavizada
imagen1 se calcula como
con
imagen1
imagen1
Como puede verse a partir de las fórmulas anteriores, la envolvente temporal se suaviza antes de que los factores de ganancia se deriven a partir de la representación suavizada de los canales. El suavizado significa generalmente la derivación de una representación suavizada a partir de un canal original con gradientes disminuidos. Como puede verse a partir de las fórmulas anteriores, la operación de blanqueado descrita a continuación se basa en estimaciones de la energía total temporalmente suavizada y en estimaciones de la energía suavizada en las subbandas, garantizando así mayor estabilidad en las estimaciones de envolvente finales.
imagen2
La estimación de envolvente de banda ancha se obtiene por medio de la suma de las contribuciones ponderadas de las bandas de parámetro, normalización sobre un promedio de energía a largo plazo y cálculo de la raíz cuadrada
imagen1
con
imagen1
donde β es un factor de equilibrio que corresponde a un paso bajo IIR de primer orden (una constante de tiempo de 40 ms aproximadamente). Las medidas de energía o amplitud blanqueadas espectralmente se usan como la base del cálculo de los factores de ajuste a escala. Como puede verse a partir de las fórmulas anteriores, el blanqueado espectral significa la alteración del espectro de modo que la misma energía o amplitud media está contenida dentro de cada banda espectral de la representación de los canales de audio. Esto es enormemente ventajoso puesto que las señales transitorias en cuestión tienen espectros muy amplios, de modo que es necesario usar la información completa sobre la totalidad del espectro disponible para el cálculo de los factores de ganancia para no suprimir las señales transitorias con respecto a otras señales no transitorias. En otras palabras, las señales blanqueadas espectralmente son señales que tienen una energía aproximadamente igual en diferentes bandas espectrales de su representación espectral. El modificador de señal directa de la invención modifica la componente de señal directa. Como ya se ha mencionado, el procesamiento puede restringirse a algunos índices de subbanda, comenzando con un índice de inicio, en presencia de señales residuales transmitidas. Adicionalmente, el procesamiento puede restringirse generalmente a índices de subbanda por encima de un índice umbral. El proceso de conformación de envolvente consiste en un aplanamiento de la envolvente de sonido directo para cada canal de salida seguido de una reconformación hacia una envolvente objetivo. Esto da como resultado la aplicación de una curva de ganancia a la señal directa de cada canal de salida, si se señaliza bsEnvShapeChannel=1 para este canal en la información secundaria. El procesamiento se realiza para ciertas subbandas híbridas k solamente: k>7 En presencia de señales residuales transmitidas, k se elige para comenzar por encima de la banda residual más alta implicada en la mezcla ascendente del canal en cuestión. Para la configuración 5-1-5, la envolvente objetivo se obtiene estimando la envolvente de la mezcla descendente transmitida EnvDmx, como se describió en la sección previa, y ajustarla a escala posteriormente con las relaciones de envolvente recuantificadas y transmitidas del codificador envRatioch. Entonces, una curva de ganancia gch(n) para todas las ranuras en un trama se calcula para cada canal de salida estimando su envolvente Envch y relacionándola con la envolvente objetivo. Finalmente, esta curva de ganancia se convierte en una curva de ganancia efectiva para ajustar a escala solamente la parte directa del canal convertido de manera ascendente: con
imagen1
imagen3
5
descendente transmitida del canal izquierdo EnvDmxL, para R y Rs se utiliza la envolvente de mezcla descendente transmitida del canal derecho EnvDmxR. El canal central se deriva a partir de la suma de las envolventes de la señal de mezcla descendente transmitida izquierda y derecha. La curva de ganancia se calcula para cada canal de salida estimando su envolvente EnvL,Ls,C,R,Rs y relacionarla con la
10 envolvente objetivo. En un segundo paso esta curva de ganancia se convierte en una curva de ganancia efectiva para
imagen4
con
imagen5
Para todos los canales, la curva de ganancia de ajuste de envolvente se aplica si bsEnvShapeChannel=1.
20 Si no, la señal directa simplemente se copia
imagen1
imagen1
Finalmente, la componente de señal directa modificada de cada canal individual tiene que combinarse con la componente de señal difusa del canal individual correspondiente dentro del dominio de subbanda híbrido según la siguiente ecuación:
25
imagen1
Como puede verse a partir de los párrafos anteriores, el concepto de la invención enseña a mejorar la calidad perceptual y la distribución espacial de señales de tipo aplauso en un decodificador de audio espacial. La mejora se complementa mediante la derivación de factores de ganancia con una granularidad temporal de ajuste a escala fina para ajustar a escala solamente la parte directa de la señal de mezcla ascendente espacial. Estos factores de ganancia
30 se derivan esencialmente de información secundaria transmitida y mediciones de nivel o energía de la señal directa y difusa en el codificador. Puesto que el ejemplo anterior describe particularmente el cálculo basado en mediciones de amplitud, debe observarse que el método de la invención no está restringido a esto, sino que puede calcularse también con, por ejemplo, mediciones de energía u otras magnitudes apropiadas para describir una envolvente temporal de una señal.
35 El ejemplo anterior describe el cálculo para las configuraciones de 5-1-5 y 5-2-5 canales. Naturalmente, el principio expuesto anteriormente podría aplicarse de manera análoga para, por ejemplo, configuraciones de 7-2-7 y 7-5-7 canales.
La figura 5 muestra un ejemplo de un decodificador 100 de audio multicanal de la invención, que recibe un canal 102 de mezcla descendente derivado mezclando de manera descendente una pluralidad de canales de una señal multicanal original y una representación 104 de parámetros que incluye información sobre una estructura temporal de los canales originales (izquierdo frontal, derecho frontal, izquierdo posterior y derecho posterior) de la señal multicanal original. El decodificador 100 multicanal tiene un generador 106 para generar una componente de señal directa y una componente de señal difusa para cada uno de los canales originales que subyacen al canal de mezcla 102 descendente. El decodificador 100 multicanal comprende además cuatro modificadores 108a a 108d de señal directa de la invención para cada uno de los canales que van a reconstruirse, de modo que el decodificador multicanal emite cuatro canales de salida (izquierdo frontal, derecho frontal, izquierdo posterior y derecho posterior) en sus salidas 112. Aunque el decodificador multicanal de la invención se ha detallado usando una configuración de ejemplo de cuatro canales originales para su reconstrucción, el concepto de la invención puede implementarse en esquemas de audio multicanal con cantidades arbitrarias de canales. La figura 6 muestra un diagrama de bloques, que detalla el método de la invención para generar un canal de salida reconstruido. En una etapa de generación 110, una componente de señal directa y una componente de señal difusa se derivan del canal de mezcla descendente. En una etapa de modificación 112 la componente de señal directa se modifica usando parámetros de la representación de parámetros con información sobre una estructura temporal de un canal original. En una etapa de combinación 114, la componente de señal directa modificada y la componente de seña difusa se combinan para obtener un canal de salida reconstruido. Dependiendo de ciertos requisitos de implementación de los métodos de la invención, los métodos de la invención pueden implementarse en hardware o software. La implementación puede llevarse a cabo usando un medio de almacenamiento digital, en particular un disco, un DVD o un CD, con señales de control legibles electrónicamente almacenadas en los mismos, que actúan conjuntamente con un sistema informático programable de manera que se realizan los métodos de la invención. En general, la presente invención es, por lo tanto, un producto de programa informático con un código de programa almacenado en un soporte legible por máquina, siendo el código de programa operativo para realizar los métodos de la invención cuando el producto de programa informático se ejecuta en un ordenador. En otras palabras, los métodos de la invención son, por consiguiente, un programa informático con un código de programa para llevar a cabo al menos uno de los métodos de la invención cuando el programa informático se ejecuta en un ordenador. Aunque lo anterior se ha mostrado y descrito particularmente en relación a las realizaciones particulares de la misma, los expertos en la técnica entenderán que pueden realizarse otros diversos cambios en la forma y detalle sin alejarse del alcance que comprenden las reivindicaciones que siguen.

Claims (30)

  1. REIVINDICACIONES
    1.
    Reconstructor (30; 60) multicanal para generar un canal (50; 76) de salida reconstruido usando al menos un canal (38; 68) de mezcla descendente derivado mezclando de manera descendente una pluralidad de canales originales y usando una representación (40; 72) de parámetros, incluyendo la representación (40; 72) de parámetros información sobre una estructura temporal de un canal original, que comprende:
    un generador (32; 62) para generar una componente (42; 64) de señal directa y una componente (44; 66) de señal difusa para el canal (50; 76) de salida reconstruido, basándose en el canal (38; 68) de mezcla descendente; un modificador (34; 69) de señal directa para modificar la componente (42; 64) de señal directa usando la representación (40; 72) de parámetros, usando la información sobre la estructura temporal del canal original; y un combinador (36; 74) para combinar la componente (46) de señal directa modificada y la componente (44; 66) de señal difusa para obtener el canal (50; 76) de salida reconstruido, en el que el modificador de señal directa no altera la componente de señal difusa.
  2. 2.
    Reconstructor multicanal según la reivindicación 1, en el que el generador (32; 62) es operativo para generar la componente (42; 64) de señal directa usando solamente componentes del canal (38; 68) de mezcla descendente.
  3. 3.
    Reconstructor (30; 60) multicanal según las reivindicaciones 1 ó 2, en el que el generador (32; 62) es operativo para generar la componente (44; 66) de señal difusa usando una parte filtrada y/o retardada del canal (38; 68) de mezcla descendente.
  4. 4.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones 1 a 3, en el que el modificador (34; 69) de señal directa es operativo para usar información sobre la estructura temporal del canal original que indica la energía contenida en el canal original dentro de una parte de tiempo de longitud finita del canal original.
  5. 5.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones 1 a 3, en el que el modificador (34; 69) de señal directa es operativo para usar información sobre la estructura temporal del canal original que indica una amplitud media del canal original dentro de una parte de de tiempo de longitud finita del canal original.
  6. 6.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones 1 a 5, en el que el combinador (36; 74) es operativo para añadir la componente (46) de señal directa modificada y la componente (44; 66) de señal difusa para obtener la señal reconstruida.
  7. 7.
    Reconstructor multicanal según cualquiera de las reivindicaciones 1 a 6, en el que el reconstructor multicanal es operativo para usar un primer canal de mezcla descendente que tiene información sobre un lado izquierdo de la pluralidad de canales originales y un segundo canal (38; 68) de mezcla descendente que tiene información sobre un lado derecho de la pluralidad de canales originales, en el que un primer canal (50; 76) de salida reconstruido para un lado izquierdo se combina usando solamente componentes de señal directa y difusa generadas a partir del primer canal de mezcla descendente y en el que un segundo canal de salida reconstruido para un lado derecho se combina usando componentes de señal directa y difusa generadas solamente a partir de la segunda señal de mezcla descendente.
  8. 8.
    Generador (30; 60) multicanal según cualquiera de las reivindicaciones 1 a 7, en el que el modificador (34; 68) de señal directa es operativo para modificar la señal directa para partes de tiempo de longitud finita que son menores que partes de tiempo de trama de información paramétrica adicional dentro de la representación (40; 72) de parámetros, en el que la información paramétrica adicional se usa por el generador (32; 62) para generar las componentes de señal directa y difusa.
  9. 9.
    Generador (30; 60) multicanal según la reivindicación 8, en el que el generador (32; 62) es operativo para usar información paramétrica adicional que tiene información sobre la energía del canal original con respecto a otros canales de la pluralidad de canales originales.
  10. 10.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones anteriores, en el que el modificador (34; 68) de señal directa es operativo para usar información sobre una estructura temporal del canal original que relaciona una estructura temporal del canal original con una estructura temporal del canal (38; 68) de mezcla descendente.
  11. 11.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones anteriores, en el que la información sobre la estructura temporal del canal original y la información sobre la estructura temporal del canal de mezcla descendente tiene una medida de energía o de amplitud.
  12. 12.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones anteriores, en el que el modificador (34; 68) de señal directa es operativo adicionalmente para derivar información temporal de mezcla descendente sobre la estructura temporal del canal (38; 68) de mezcla descendente.
  13. 13.
    Reconstructor (30; 60) multicanal según la reivindicación 12, en el que el modificador (34; 68) de señal directa es operativo para derivar información temporal de mezcla descendente que indica la energía contenida en el canal (38; 68) de mezcla descendente dentro de un intervalo de tiempo de longitud finita o una medida de amplitud para el intervalo de tiempo de longitud finita.
  14. 14.
    Reconstructor (30; 60) multicanal según las reivindicaciones 12 ó 13, en el que el modificador (34; 68) de señal directa es operativo adicionalmente para derivar una estructura temporal objetivo para el canal (38; 68) de mezcla descendente reconstruido usando la información temporal de mezcla descendente y la información sobre la estructura temporal del canal original.
  15. 15.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones 12 a 14, en el que el modificador (34; 68) de señal directa es operativo para derivar la información temporal de mezcla descendente para una parte espectral del canal (38; 68) de mezcla descendente por encima de un límite inferior espectral.
  16. 16.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones 12 a 15, en el que el modificador (34; 68) de señal directa es operativo adicionalmente para blanquear espectralmente el canal (38; 68) de mezcla descendente y para derivar la información temporal de mezcla descendente usando el canal (38; 68) de mezcla descendente blanqueado espectralmente.
  17. 17.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones 12 a 16, en el que el modificador (34; 68) de señal directa es operativo adicionalmente para derivar una representación suavizada del canal (38; 68) de mezcla descendente y para derivar la información temporal de mezcla descendente a partir de la representación suavizada del canal de mezcla descendente.
  18. 18.
    Reconstructor (30; 60) multicanal según la reivindicación 17, en el que el modificador (34; 68) de señal directa es operativo para derivar la representación suavizada filtrando el canal (38; 68) de mezcla descendente con un filtro paso bajo de primer orden.
  19. 19.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones anteriores, en el que el modificador (34; 68) de señal directa es operativo adicionalmente para derivar información sobre una estructura temporal de una combinación de la componente de señal directa y la componente de señal difusa.
  20. 20.
    Reconstructor (30; 60) multicanal según la reivindicación 19, en el que el modificador (34; 68) de señal directa es operativo para blanquear espectralmente la combinación de las componentes de señal directa y señal difusa y para derivar la información sobre la estructura temporal de la combinación de las componentes de señal directa y señal difusa usando las componentes de señales directa y difusa blanqueadas espectralmente.
  21. 21.
    Reconstructor (30; 60) multicanal según las reivindicaciones 19 ó 20, en el que el modificador (34; 68) de señal directa es operativo adicionalmente para derivar una representación suavizada de la combinación de las componentes de señal directa y difusa y para derivar la información sobre la estructura temporal de la combinación de las componentes de señal directa y difusa a partir de la representación suavizada de la combinación de las componentes de señal directa y difusa.
  22. 22.
    Reconstructor (30; 60) multicanal según la reivindicación 21, en el que el modificador (34; 68) de señal directa es operativo para derivar la representación suavizada de la combinación de las componentes de señal directa y difusa filtrando las componentes de señal directa y difusa con un filtro paso bajo de primer orden.
  23. 23.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones anteriores, en el que el modificador (34; 68) de señal directa es operativo para usar información sobre la estructura temporal del canal original que representa una relación de la energía o amplitud para un intervalo de tiempo de longitud finita del canal original y la energía o amplitud para el intervalo de tiempo de longitud finita del canal (38; 68) de mezcla descendente.
  24. 24.
    Reconstructor (30; 60) multicanal según cualquiera de las reivindicaciones anteriores, en el que el modificador (34; 68) de señal directa es operativo para derivar una estructura temporal objetivo para el canal (50; 76) de salida reconstruido usando el canal (38; 68) de mezcla descendente y la información sobre la estructura temporal.
  25. 25.
    Reconstructor (30; 60) multicanal según la reivindicación 23, en el que el modificador (34; 68) de señal directa es operativo para modificar la componente de señal directa de tal modo que una estructura temporal del canal (50; 76) de salida reconstruido iguala la estructura temporal objetivo dentro de un rango de tolerancia.
  26. 26.
    Reconstructor (30; 60) multicanal según la reivindicación 24, en el que el modificador (34; 68) de señal directa es operativo para derivar un factor de ajuste a ajuste a escala intermedio, siendo el factor de ajuste a escala intermedio tal que la estructura temporal del canal (50; 76) de salida reconstruido iguala la estructura temporal objetivo dentro del rango de tolerancia, cuando el canal (50; 76) de salida reconstruido se combina usando las componentes de señal directa ajustadas a escala con el factor de ajuste a escala intermedio y la componente de señal difusa ajustada a escala con el factor de ajuste a escala intermedio.
  27. 27.
    Reconstructor (30; 60) multicanal según la reivindicación 25, en el que el modificador (34; 68) de señal directa es operativo adicionalmente para derivar un factor de ajuste a escala final usando el factor de ajuste a escala intermedio y las componentes de señal directa y difusa de tal modo que la estructura temporal del canal (50; 76) de salida reconstruido iguala la estructura temporal objetivo dentro del rango de tolerancia, cuando el canal (50; 76) de salida reconstruido se combina usando la componente de señal difusa y la componente de señal directa ajustadas a escala usando el factor de ajuste a escala final.
  28. 28.
    Método para generar un canal (50; 76) de salida reconstruido usando al menos un canal (38; 68) de mezcla descendente derivado mezclando de manera descendente una pluralidad de canales originales y usando una representación (40; 72) de parámetros, incluyendo la representación (40; 72) de parámetros información sobre una estructura temporal de un canal original, comprendiendo el método:
    generar una componente de señal directa y una componente de señal difusa para el canal (50; 76) de salida reconstruido, basándose en el canal (38; 68) de mezcla descendente; modificar la componente de señal directa usando la representación (40; 72) de parámetros, usando la información sobre la estructura temporal del canal original; y combinar la componente (46) de señal directa modificada y la componente de señal difusa para obtener el canal (50; 76) de salida reconstruido, en el que la etapa de modificar no altera la componente de señal difusa.
  29. 29.
    Decodificador de audio multicanal para generar una reconstrucción de una señal multicanal usando al
    menos un canal (38; 68) de mezcla descendente derivado mezclando de manera descendente una pluralidad de canales originales y usando una representación (40; 72) de parámetros, incluyendo la representación (40; 72) de parámetros información sobre una estructura temporal de un canal original, el decodificador de audio multicanal, que comprende un reconstructor multicanal según las reivindicaciones 1 a 27.
  30. 30.
    Programa informático con un código de programa para ejecutar el método según la reivindicación 28, cuando se ejecuta en un ordenador.
ES06742984T 2006-03-28 2006-05-18 Método mejorado para la conformación de señales en reconstrucción de audio multicanal. Active ES2362920T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US78709606P 2006-03-28 2006-03-28
US787096P 2006-03-28

Publications (1)

Publication Number Publication Date
ES2362920T3 true ES2362920T3 (es) 2011-07-15

Family

ID=36649469

Family Applications (1)

Application Number Title Priority Date Filing Date
ES06742984T Active ES2362920T3 (es) 2006-03-28 2006-05-18 Método mejorado para la conformación de señales en reconstrucción de audio multicanal.

Country Status (21)

Country Link
US (1) US8116459B2 (es)
EP (1) EP1999997B1 (es)
JP (1) JP5222279B2 (es)
KR (1) KR101001835B1 (es)
CN (1) CN101406073B (es)
AT (1) ATE505912T1 (es)
AU (1) AU2006340728B2 (es)
BR (1) BRPI0621499B1 (es)
CA (1) CA2646961C (es)
DE (1) DE602006021347D1 (es)
ES (1) ES2362920T3 (es)
HK (1) HK1120699A1 (es)
IL (1) IL194064A (es)
MX (1) MX2008012324A (es)
MY (1) MY143234A (es)
NO (1) NO339914B1 (es)
PL (1) PL1999997T3 (es)
RU (1) RU2393646C1 (es)
TW (1) TWI314024B (es)
WO (1) WO2007110101A1 (es)
ZA (1) ZA200809187B (es)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
KR100880642B1 (ko) 2005-08-30 2009-01-30 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
EP1974348B1 (en) * 2006-01-19 2013-07-24 LG Electronics, Inc. Method and apparatus for processing a media signal
KR20080093024A (ko) * 2006-02-07 2008-10-17 엘지전자 주식회사 부호화/복호화 장치 및 방법
MX2008012324A (es) 2006-03-28 2008-10-10 Fraunhofer Ges Zur Foeerderung Metodo mejorado para la modulacion de señales en la reconstruccion de audio multicanal.
MX2008012250A (es) * 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
US8543231B2 (en) * 2007-12-09 2013-09-24 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2083585B1 (en) * 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
CN101662688B (zh) * 2008-08-13 2012-10-03 韩国电子通信研究院 音频信号的编码和解码方法及其装置
KR101392546B1 (ko) * 2008-09-11 2014-05-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
JP5237463B2 (ja) * 2008-12-11 2013-07-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネルオーディオ信号を生成するための装置
CN102265589B (zh) 2008-12-22 2014-11-26 皇家飞利浦电子股份有限公司 确定在远端谈话人信号与组合信号之间的声耦合
CN102460573B (zh) * 2009-06-24 2014-08-20 弗兰霍菲尔运输应用研究公司 音频信号译码器、对音频信号译码的方法
WO2011083979A2 (en) * 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2360681A1 (en) 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
CA2790956C (en) * 2010-02-24 2017-01-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
KR102033071B1 (ko) * 2010-08-17 2019-10-16 한국전자통신연구원 멀티 채널 오디오 호환 시스템 및 방법
CN103460282B (zh) 2010-08-25 2015-08-19 弗兰霍菲尔运输应用研究公司 用于利用传送的相位信息产生去相关信号的装置
CN103262158B (zh) 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
US8675881B2 (en) * 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
WO2012158705A1 (en) * 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
RU2595910C2 (ru) * 2011-06-24 2016-08-27 Конинклейке Филипс Н.В. Процессор аудиосигналов для обработки кодированных многоканальных аудиосигналов и способ для этого
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
SG11201505925SA (en) * 2013-01-29 2015-09-29 Fraunhofer Ges Forschung Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
BR112015018522B1 (pt) 2013-02-14 2021-12-14 Dolby Laboratories Licensing Corporation Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix.
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
SG11201510164RA (en) * 2013-06-10 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
KR101789083B1 (ko) 2013-06-10 2017-10-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 분포 양자화 및 코딩을 사용하는 누적 합계 표현의 모델링에 의한 오디오 신호 엔벨로프 인코딩, 처리 및 디코딩을 위한 장치 및 방법
MX361115B (es) * 2013-07-22 2018-11-28 Fraunhofer Ges Forschung Descodificador de audio multicanal, codificador de audio multicanal, métodos, programa de computadora y representación de audio codificada usando una decorrelación de señales de audio renderizadas.
EP2830046A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal to obtain modified output signals
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP3053359B1 (en) 2013-10-03 2017-08-30 Dolby Laboratories Licensing Corporation Adaptive diffuse signal generation in an upmixer
KR102381216B1 (ko) 2013-10-21 2022-04-08 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
US10049683B2 (en) 2013-10-21 2018-08-14 Dolby International Ab Audio encoder and decoder
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
CN106796804B (zh) * 2014-10-02 2020-09-18 杜比国际公司 用于对话增强的解码方法和解码器
MY191093A (en) 2016-02-17 2022-05-30 Fraunhofer Ges Forschung Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
EP3335218B1 (en) * 2016-03-16 2019-06-05 Huawei Technologies Co., Ltd. An audio signal processing apparatus and method for processing an input audio signal
JP7257975B2 (ja) 2017-07-03 2023-04-14 ドルビー・インターナショナル・アーベー 密集性の過渡事象の検出及び符号化の複雑さの低減
CN110246508B (zh) * 2019-06-14 2021-08-31 腾讯音乐娱乐科技(深圳)有限公司 一种信号调制方法、装置和存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4217276C1 (es) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5794180A (en) 1996-04-30 1998-08-11 Texas Instruments Incorporated Signal quantizer wherein average level replaces subframe steady-state levels
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19747132C2 (de) 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
TW569551B (en) 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
DE602005005640T2 (de) 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
MX2008012324A (es) 2006-03-28 2008-10-10 Fraunhofer Ges Zur Foeerderung Metodo mejorado para la modulacion de señales en la reconstruccion de audio multicanal.

Also Published As

Publication number Publication date
PL1999997T3 (pl) 2011-09-30
DE602006021347D1 (de) 2011-05-26
RU2008142565A (ru) 2010-05-10
TW200738037A (en) 2007-10-01
CA2646961A1 (en) 2007-10-04
CN101406073A (zh) 2009-04-08
TWI314024B (en) 2009-08-21
IL194064A (en) 2014-08-31
US20070236858A1 (en) 2007-10-11
CA2646961C (en) 2013-09-03
MY143234A (en) 2011-04-15
CN101406073B (zh) 2013-01-09
NO339914B1 (no) 2017-02-13
MX2008012324A (es) 2008-10-10
ZA200809187B (en) 2009-11-25
BRPI0621499B1 (pt) 2022-04-12
AU2006340728B2 (en) 2010-08-19
ATE505912T1 (de) 2011-04-15
NO20084409L (no) 2008-10-21
JP5222279B2 (ja) 2013-06-26
RU2393646C1 (ru) 2010-06-27
EP1999997B1 (en) 2011-04-13
KR20080107446A (ko) 2008-12-10
EP1999997A1 (en) 2008-12-10
AU2006340728A1 (en) 2007-10-04
BRPI0621499A2 (pt) 2011-12-13
WO2007110101A1 (en) 2007-10-04
KR101001835B1 (ko) 2010-12-15
HK1120699A1 (en) 2009-04-03
JP2009531724A (ja) 2009-09-03
US8116459B2 (en) 2012-02-14

Similar Documents

Publication Publication Date Title
ES2362920T3 (es) Método mejorado para la conformación de señales en reconstrucción de audio multicanal.
ES2770146T3 (es) Conformación temporal y espacial de señales de audio multicanal
ES2544946T3 (es) Decodificación de señal de audio multicanal usando señales de-correlacionadas
ES2398573T3 (es) Número reducido de decodificación de canales
ES2923661T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
JP5185337B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP4625084B2 (ja) バイノーラルキュー符号化方法等のための拡散音の整形
AU2008215231B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
AU2005324210C1 (en) Compact side information for parametric coding of spatial audio
JP5698189B2 (ja) オーディオ符号化
ES2339888T3 (es) Codificacion y decodificacion de audio.
ES2703327T3 (es) Codificador, decodificador y métodos para codificación espacial de objetos de audio de multirresolución retrocompatible
ES2654792T3 (es) Procedimiento y decodificador para codificación de objeto de audio espacial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal
BRPI0518507B1 (pt) Informações auxiliares compactas para a codificação paramétrica de áudio espacial