ES2338918T3 - Codificacion de audio residual adaptativa. - Google Patents
Codificacion de audio residual adaptativa. Download PDFInfo
- Publication number
- ES2338918T3 ES2338918T3 ES06742550T ES06742550T ES2338918T3 ES 2338918 T3 ES2338918 T3 ES 2338918T3 ES 06742550 T ES06742550 T ES 06742550T ES 06742550 T ES06742550 T ES 06742550T ES 2338918 T3 ES2338918 T3 ES 2338918T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- parameter
- audio
- residual
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003044 adaptive effect Effects 0.000 title description 19
- 230000005236 sound signal Effects 0.000 claims abstract description 94
- 238000000034 method Methods 0.000 claims abstract description 72
- 230000008569 process Effects 0.000 claims abstract description 13
- 230000005540 biological transmission Effects 0.000 claims description 24
- 230000001174 ascending effect Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 8
- 238000009795 derivation Methods 0.000 claims description 6
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 230000006837 decompression Effects 0.000 claims description 2
- 230000008447 perception Effects 0.000 abstract description 3
- 238000012805 post-processing Methods 0.000 abstract description 2
- 239000000203 mixture Substances 0.000 description 76
- 239000011159 matrix material Substances 0.000 description 15
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 238000004321 preservation Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000032258 transport Effects 0.000 description 3
- 101000860173 Myxococcus xanthus C-factor Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Codificador (10) de audio para codificar una señal de audio que tiene al menos dos canales (18), que comprende: un extractor (16) de parámetros para derivar un parámetro de coherencia (ICC) que describe una coherencia entre un primer y un segundo canal de los al menos dos canales y un parámetro de nivel (IID) que describe una diferencia de nivel entre el primer y el segundo canal, como parámetros espaciales; un limitador (14) para limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y un mezclador (12) descendente para derivar una señal (20) de mezcla descendente y una señal (18) residual a partir de la señal de audio utilizando una regla de mezcla descendente que depende del parámetro de coherencia limitado.
Description
Codificación de audio residual adaptativa.
La presente invención se refiere a la
codificación y decodificación de señales de audio y, en particular,
a la codificación de alta calidad eficaz de un par de canales de
audio.
Recientemente, la codificación de alta calidad
eficaz de señales de audio se ha vuelto cada vez más importante,
puesto que la distribución digital de contenido de audio y vídeo
comprimido, por ejemplo, por satélite o por difusión de audio o
vídeo digital terrestre se utiliza ampliamente. La técnica MP3 muy
conocida, por ejemplo, permite la transmisión conveniente de
títulos de audio por Internet u otros canales de transmisión que
tienen anchos de banda limitados.
Además de MP3, otros diversos esquemas de
codificación de audio ayudan a maximizar la calidad de audio para
una relación de compresión o velocidad de transmisión de datos dada.
Se ha mostrado en "Efficient and scalable Parametric Stereo
Coding for Low Bit rate Audio Coding Applications",
PCT/SE02/01372, que es posible recrear una señal estéreo que
asemeja mucho a la imagen estéreo original subyacente, a partir de
una señal mono cuando adicionalmente se utiliza una representación
muy compacta de la señal estéreo comúnmente denominada como "colas
espaciales". El principio dado a conocer es dividir la señal de
entrada estéreo en bandas de frecuencia y estimar parámetros
llamados diferencia de intensidad entre canales (IID) y coherencia
entre canales (ICC) para cada una de las bandas de frecuencia por
separado. El primer parámetro describe una medida de la distribución
de energía entre los dos canales en la banda de frecuencia
específica y el segundo parámetro describe una estimación de la
correlación entre los dos canales. Una descripción más concienzuda
de los parámetros espaciales puede encontrarse en
"High-quality parametric spatial audio coding at
low bit rates", J. Breebart, S. van de Par, A. Kohirausch y
E.Schuijers, Proc. 116^{th} AES Convention, Berlín (Alemania),
8-11 de mayo de 2004. Basándose en estas señales de
entrada espaciales, la señal de entrada estéreo se combina de manera
adaptativa en una señal mono. Tanto las colas espaciales como la
señal mono se codifican y la representación codificada se
multiplexa en un flujo de bits, que se transmite al decodificador.
En el lado del decodificador, la imagen estéreo se recrea a partir
de la señal mono mediante distribución de la energía de la señal
mono entre los dos canales de salida según los datos IID, y
mediante adición de una señal decorrelacionada con el fin de
conservar la correlación de canal de los canales estéreo originales,
según se describe por los parámetros ICC.
Cuando hay disponible más ancho de banda de
transmisión, puede lograrse una mayor calidad de audio sustituyendo
la señal mono decorrelacionada en el decodificador por una señal
residual transmitida. Es decir, se requiere la transmisión de una
señal residual adicional a un decodificador. También es éste el caso
con la codificación central-lateral
(mid-side, MS), en la que se codifican la
suma y la diferencia de los canales de una señal estéreo en vez de
los canales derecho e izquierdo directamente. Una descripción de la
técnica MS puede encontrarse en "Sum-difference
stereo transform coding", Proc. Int. Conf. Acoust. Speech Signal
Process. (ICASSP); San Francisco, EE.UU., 1992, págs. II
569-572. La codificación MS se basa en el hallazgo
de que el canal izquierdo y derecho de una señal estéreo son
bastante similares con una alta probabilidad. Por consiguiente, una
diferencia del canal izquierdo y derecho producirá una señal que
tiene una intensidad comparativamente baja la mayor parte del
tiempo, es decir, la amplitud de la señal de diferencia será
bastante pequeña. No obstante, puede ahorrarse una cantidad
significativa de velocidad de transmisión de datos cuando se
codifica la señal de diferencia, ya que los parámetros que
describen la señal de diferencia pueden cuantificarse de manera
aproximada. La señal de suma evidentemente necesitará
aproximadamente el mismo ancho de banda que un único canal izquierdo
o derecho, cuando se codifica. Por consiguiente, puede ahorrarse
una cantidad significativa de ancho de banda en total cuando se
utiliza el esquema de codificación MS. Cuando existe una gran
diferencia de intensidad entre el canal izquierdo y el derecho, la
técnica MS tiene sus límites, ya que entonces el canal de
diferencial contendrá una cantidad sustancial de energía y, por
consiguiente, necesita un mayor ancho de banda. Sin embargo, puede
observarse que en implementaciones codificadas en estéreo normales,
la codificación MS no se aplicará en este caso, debido a los
elevados costes de codificación. En estos casos, es ventajoso tener
la posibilidad de cambiar entre la codificación estéreo normal y la
codificación MS, dependiendo de la intensidad transportada por los
canales de audio originales que tienen que codificarse.
Al sustituir el concepto estático de formar la
suma y la diferencia de dos canales estéreo que van a codificarse
mediante invención de una matriz de rotación del decodificador con
elementos de matriz que describen la composición de dos canales
intermedios que son una combinación de los dos canales estéreo,
puede superarse el problema anterior. Los elementos de matriz son
dependientes de parámetros estéreo paramétricos que se extraen del
canal izquierdo y el derecho de la señal estéreo. La codificación
residual adaptativa es tal que permite la adaptación dinámica de la
regla de combinación para la generación de canales intermedios
respecto a las propiedades de la presente señal, logrando una
ganancia de rendimiento significativa frente a la codificación
MS.
La selección de una dependencia adecuada de los
elementos de matriz de la denominada matriz de rotación a partir de
los parámetros estéreo paramétricos, puede lograrse que la energía
dentro de un canal de diferencia permanezca al mínimo posible, como
se muestra ya en la solicitud de patente Europea no dada a conocer
EP 04103168.3. Cuando se introduce una matriz de rotación para
transformar (mezcla descendente o mezcla ascendente) la señal
estéreo en señales m y s (las señales intermedias, es decir, la
señal de mezcla descendente m y la señal residual s), es crucial
para la operación del método que las matrices de rotación (la matriz
de rotación del decodificador y la matriz de rotación del
codificador) estén delimitadas. Esto significa que los elementos de
matriz dentro de las matrices no divergen al infinito dentro del
intervalo entero de parámetros de codificación estéreo paramétricos
posibles. En otras palabras, ambas matrices de rotación tienen que
estar delimitadas en el sentido de que el número de condición de
matriz es lo suficientemente pequeño para permitir una inversión de
la matriz sin problemas para todo el intervalo de parámetros de
codificación estéreo paramétricos, lo que no es el caso para
implementaciones según técnicas de la técnica anterior.
Se conocen varios documentos en la técnica
relacionados con el problema de inestabilidad anterior.
Un enfoque (WERNER OOMEN, ERIK SCHUIJERS, HEIKO
PURNHAGEN, JONAS ENGDEGARD: "MPEG4-EXT2: CE ON LOW
COMPLEXITY PARAMETRIC STEREO-ISO/IEC
JTC1/SC29/WG11-MPEG2003/M10366" CODING OF MOVING
PICTURES AND AUDIO-ISO/IEC, diciembre de 2003
(2003-12), XP002388137 Hawai) se refiere a la
codificación de audio en MPEG4. Se propone limitar los parámetros
estéreo paramétricos a un límite fijo predeterminado, para evitar
problemas de inestabilidad computacional.
De manera similar, en otro enfoque (FALLER
CHRISTOF: "Parametric coding of spatial
audio-Thesis No.3062" THESE PRESENTEE A LA
FACULTE INFORMATIQUE ET COMMUNICATIONS INSTITUT DE SYSTEMES DE
COMMUNICATION SECTION DES SYSTEMES DE COMMUNICATION ÉCOLE
POLYTHECHNIQUE FÉDÉRALE DE LAUSANNE POUR L'OBTENTION DU GRADE DE
DOCTEUR EN SCIENCES, XX, XX, 2004 página completa, XP002343263) se
aplica un límite permanente a un factor de ganancia utilizado para
la mezcla descendente o mezcla ascendente de señales multicanal
paramétricamente codificadas.
La patente estadounidense 6021386 se refiere a
la codificación de múltiples canales de información de audio. En un
codificador, los múltiples canales de canal de audio que representan
fuentes de sonido multidimensional se dividen en señales de
subbanda y las señales de subbanda en una o más subbandas se
combinan para formar señales compuestas para transportarse. Los
niveles espectrales de las señales de subbanda combinadas en señales
compuestas se transmiten adicionalmente dentro de una señal de
salida codificada. La información de nivel espectral transporta o
bien la amplitud o energía de las señales de subbanda combinadas o
bien la dirección aparente del campo de sonido representado por la
señal de subbanda combinada. Para evitar artefactos, pueden
aplicarse límites a las señales compuestas.
El objetivo de la presente invención es
proporcionar un concepto para codificación de audio de alta calidad
que produce una representación altamente comprimida de una señal de
audio, evitando al mismo tiempo artefactos introducidos por la
codificación o decodificación de manera más eficaz.
Según un primer aspecto de la presente
invención, este objetivo se logra mediante un codificador de audio
según se reivindica en la reivindicación 1 para codificar una señal
de audio que tiene al menos dos canales, que comprende: un
extractor de parámetros para derivar un parámetro espacial de la
señal de audio, en el que el parámetro espacial describe una
interrelación entre los al menos dos canales; un limitador para
limitar el parámetro espacial utilizando una regla de limitación
para derivar un parámetro espacial limitado, en el que la regla de
limitación depende de una interrelación entre los al menos dos
canales; y un mezclador descendente para derivar una señal de
mezcla descendente y una señal residual a partir de la señal de
audio utilizando una regla de mezcla descendente que depende del
parámetro espacial limitado.
Según un segundo aspecto de la presente
invención, este objetivo se logra mediante un decodificador de audio
según se reivindica en la reivindicación 15 para decodificar una
señal de audio codificada que representa una señal de audio
original que tiene al menos dos canales, teniendo la señal de audio
codificada una señal de mezcla descendente, una señal residual y un
parámetro espacial que describe una interrelación entre los al
menos dos canales, que comprende: un limitador para limitar el
parámetro espacial para derivar un parámetro espacial limitado
utilizando una regla de limitación, en el que la regla de limitación
depende una interrelación entre los al menos dos canales; y un
mezclador ascendente para derivar una reconstrucción de la señal de
audio original a partir de la señal de mezcla descendente y la
señal residual utilizando una regla de mezcla ascendente que
depende del parámetro espacial limitado.
Según un tercer aspecto de la presente
invención, este objetivo se logra mediante un método según se
reivindica en la reivindicación 27 para codificar una señal de
audio que tiene al menos dos canales, comprendiendo el método:
derivar un parámetro espacial a partir de la señal de audio, en el
que el parámetro espacial describe una interrelación entre los al
menos dos canales; limitar el parámetro espacial utilizando una
regla de limitación para derivar un parámetro espacial limitado, en
el que la regla de limitación depende de una interrelación entre
los al menos dos canales; y derivar una señal de mezcla descendente
y una señal residual a partir de la señal de audio utilizando una
regla de mezcla descendente que depende del parámetro espacial
limitado.
Según un cuarto aspecto de la presente
invención, este objetivo se logra mediante un método según se
reivindica en la reivindicación 28 para decodificar una señal de
audio codificada que representa una señal de audio original que
tiene al menos dos canales, teniendo la señal de audio codificada
una señal de mezcla descendente, una señal residual y un parámetro
espacial que describe una interrelación entre los al menos dos
canales, comprendiendo el método: limitar el parámetro espacial
para derivar un parámetro espacial limitado utilizando una regla de
limitación, en el que la regla de limitación depende de una
interrelación entre los al menos dos canales; y derivar una
reconstrucción de la señal de audio original a partir de la señal de
mezcla descendente y la señal residual utilizando una regla de
mezcla ascendente que depende del parámetro espacial limitado.
Según un quinto aspecto de la presente
invención, este objetivo se logra mediante un transmisor o grabador
de audio según se reivindica en la reivindicación 29 que tiene un
codificador de audio para codificar una señal de audio que tiene al
menos dos canales, que comprende: un extractor de parámetros para
derivar un parámetro espacial de la señal de audio, en el que el
parámetro espacial describe una interrelación entre los al menos
dos canales; un limitador para limitar el parámetro espacial
utilizando una regla de limitación para derivar un parámetro
espacial limitado, en el que la regla de limitación depende de una
interrelación entre los al menos dos canales; y un mezclador
descendente para derivar una señal de mezcla descendente y una señal
residual a partir de la señal de audio utilizando una regla de
mezcla descendente que depende del parámetro espacial limitado.
Según un sexto aspecto de la presente invención,
este objetivo se logra mediante un receptor o reproductor de audio
según se reivindica en la reivindicación 30, que tiene un
decodificador de audio para decodificar una señal de audio
codificada que representa una señal de audio original que tiene al
menos dos canales, teniendo la señal de audio codificada una señal
de mezcla descendente, una señal residual y un parámetro espacial
que describe una interrelación entre los al menos dos canales, que
comprende: un limitador para limitar el parámetro espacial para
derivar un parámetro espacial limitado utilizando una regla de
limitación, en el que la regla de limitación depende de una
interrelación entre los al menos dos canales; y un mezclador
ascendente para derivar una reconstrucción de la señal de audio
original a partir de la señal de mezcla descendente y la señal
residual utilizando una regla de mezcla ascendente que depende del
parámetro espacial limitado.
Según un séptimo aspecto de la presente
invención, este objetivo se logra mediante un método de transmisión
o grabación de audio según se reivindica en la reivindicación 31,
teniendo el método un método para generar una señal codificada,
comprendiendo el método un método para codificar una señal de audio
que tiene al menos dos canales, comprendiendo el método: derivar un
parámetro espacial de la señal de audio, en el que el parámetro
espacial describe una interrelación entre los al menos dos canales;
limitar el parámetro espacial utilizando una regla de limitación
para derivar un parámetro espacial limitado, en el que la regla de
limitación depende de una interrelación entre los al menos dos
canales; derivar una señal de mezcla descendente y una señal
residual a partir de la señal de audio utilizando una regla de
mezcla descendente que depende del parámetro espacial limitado.
Según un octavo aspecto de la presente
invención, este objetivo se logra mediante un método para la
recepción o reproducción de audio según se reivindica en la
reivindicación 32, teniendo el método un método para decodificar
una señal de audio codificada, comprendiendo el método un método
para decodificar una señal de audio codificada que representa una
señal de audio original que tiene al menos dos canales, teniendo la
señal de audio codificada una señal de mezcla descendente, una
señal residual y un parámetro espacial que describe una
interrelación entre los al menos dos canales, comprendiendo el
método: limitar el parámetro espacial para derivar un parámetro
espacial limitado utilizando una regla de limitación, en el que la
regla de limitación depende de una interrelación entre los al menos
dos canales; y derivar una reconstrucción de la señal de audio
original a partir de la señal de mezcla descendente y la señal
residual utilizando una regla de mezcla ascendente que depende del
parámetro espacial limitado.
Según un noveno aspecto de la presente
invención, este objetivo se logra mediante un sistema de transmisión
que tiene un transmisor y un receptor, teniendo el transmisor un
codificador de audio para codificar una señal de audio que tiene al
menos dos canales, que comprende: un extractor de parámetros para
derivar un parámetro espacial de la señal de audio, en el que el
parámetro espacial describe una interrelación entre los al menos
dos canales; un limitador para limitar el parámetro espacial
utilizando una regla de limitación para derivar un parámetro
espacial limitado, en el que la regla de limitación depende de una
interrelación entre los al menos dos canales; y un mezclador
descendente para derivar una señal de mezcla descendente y una señal
residual a partir de la señal de audio utilizando una regla de
mezcla descendente que depende del parámetro espacial limitado; y
teniendo el receptor un decodificador de audio para decodificar una
señal de audio codificada que representa una señal de audio
original que tiene al menos dos canales, teniendo la señal de audio
codificada una señal de mezcla descendente, una señal residual y un
parámetro espacial que describe una interrelación entre los al
menos dos canales, que comprende: un limitador para limitar el
parámetro espacial para derivar un parámetro espacial limitado
utilizando una regla de limitación, en el que la regla de limitación
depende de una interrelación entre los al menos dos canales; y un
mezclador ascendente para derivar una reconstrucción de la señal de
audio original a partir de la señal de mezcla descendente y la señal
residual utilizando una regla de mezcla ascendente que depende del
parámetro espacial limitado.
Según un décimo aspecto de la presente
invención, este objetivo se logra mediante un método de transmisión
y recepción, incluyendo el método un método de transmisión que tiene
un método para generar una señal codificada de una señal de audio
que tiene al menos dos canales, comprendiendo el método: derivar un
parámetro espacial de la señal de audio, en el que el parámetro
espacial describe una interrelación entre los al menos dos canales;
limitar el parámetro espacial utilizando una regla de limitación
para derivar un parámetro espacial limitado, en el que la regla de
limitación depende de una interrelación entre los al menos dos
canales; y derivar una señal de mezcla descendente y una señal
residual a partir de la señal de audio utilizando una regla de
mezcla descendente que depende del parámetro espacial limitado; y
un método de recepción, que tiene un método para decodificar una
señal de audio codificada, comprendiendo el método: limitar el
parámetro espacial para derivar un parámetro espacial limitado
utilizando una regla de limitación, en el que la regla de limitación
depende de una interrelación entre los al menos dos canales; y
derivar una reconstrucción de la señal de audio original a partir
de la señal de mezcla descendente y la señal residual utilizando una
regla de mezcla ascendente que depende del parámetro espacial
limitado.
Según un undécimo aspecto de la presente
invención, este objeto se logra mediante una señal de audio
codificada que es una representación de una señal de audio que
tiene al menos dos canales, teniendo la señal de audio codificada
un parámetro espacial que describe una interrelación entre los al
menos dos canales, una señal de mezcla descendente y una señal
residual, en el que la señal de mezcla descendente y la señal
residual se derivan de la señal de audio utilizando una regla de
mezcla descendente que depende de un parámetro espacial limitado,
derivado utilizando una regla de limitación que depende de una
interrelación de los al menos dos canales.
La presente invención se basa en el hallazgo de
que una señal de audio que tiene al menos dos canales puede
mezclase descendentemente de manera eficaz en una señal de mezcla
descendente y una señal residual, cuando la regla de mezcla
descendente utilizada depende de un parámetro espacial que se deriva
de la señal de audio y que se postprocesa por un limitador para
aplicar un cierto límite al parámetro espacial derivado con el
propósito de evitar inestabilidades durante el proceso de mezcla
ascendente o de mezcla descendente. Al tener una regla de mezcla
descendente que depende dinámicamente de parámetros que describen
una interrelación entre los canales de audio, puede garantizarse
que la energía dentro de la señal residual mezclada descendentemente
se encuentra al mínimo posible, lo que es ventajoso en vista de la
eficacia de la codificación. Al postprocesar el parámetro espacial
con un limitador antes de usarlo en la mezcla descendente, pueden
evitarse inestabilidades en la mezcla ascendente o descendente, lo
que de lo contrario podría dar como resultado una perturbación de
la percepción espacial de la señal de audio codificada o
decodificada.
En una realización de la presente invención, una
señal estéreo original que tiene un canal izquierdo y uno derecho
se suministra a un mezclador descendente y a un extractor de
parámetros. El extractor de parámetros deriva los parámetros
espaciales generalmente conocidos ICC (correlación de entre canales)
e IID (diferencia de intensidad entre canales). El mezclador
descendente puede mezclar descendentemente los canales izquierdo y
derecho en una señal de mezcla descendente y una señal residual, en
el que la regla de mezcla descendente es tal que la señal residual
resultante transporta la mínima energía obtenible. Por consiguiente,
la posterior compresión de la señal residual resultante por un
codificador de audio estándar dará como resultado un código
extremadamente compacto. Esto puede lograrse mediante formulación de
la regla de mezcla descendente en dependencia de los parámetros
espaciales ICC e IID, ya que ambos parámetros describen relaciones
de intensidad o amplitud de los canales estéreo originales. Un
problema general durante la codificación es la preservación de
energía. Es necesario que tanto la señal original como la señal
codificada contengan la misma energía, ya que una violación de la
conservación de energía daría como resultado una percepción de
volumen diferente de las señales codificadas o incluso saltos
incontrolables en el volumen de la señal codificada. Por
consiguiente, en el esquema de codificación anterior, la señal de
mezcla descendente y la señal residual tienen que ajustarse a escala
por un factor de escala que garantice la regla de conservación de
energía.
Si la señal de audio original que va a
codificarse tiene propiedades especiales, este factor de escala
puede ser diferente, en particular, cuando el canal original
izquierdo y derecho están perfectamente anticorrelacionados, es
decir, cuando tienen las mismas amplitudes y un desplazamiento de
fase exactamente de 180º. Esta inestabilidad se evita dentro del
concepto de la invención aplicando una función de limitación al
parámetro ICC, en el que la función de limitación depende de un
factor de escala máximo aceptable y el parámetro IID. Para evitar
una posible divergencia, la regla que describe la mezcla
descendente se altera directamente, mientras que en implementaciones
del estado de la técnica el factor de escala simplemente se limita
estableciendo un umbral y el factor de escala se sustituye por el
valor umbral cuando se excede el umbral.
Una gran ventaja del concepto de la invención es
que tanto la señal en el canal de mezcla descendente como el canal
residual se alteran a través de la alteración de los parámetros que
son subyacentes al proceso de mezcla descendente. Sólo la señal en
el canal de mezcla descendente se vería influenciada al aplicar un
umbral según la técnica anterior, de este modo puede lograrse una
mejor preservación de la interrelación entre el canal original
izquierdo y derecho cuando se sigue el concepto de la invención.
Otra ventaja del concepto de la invención
anteriormente descrito es que los parámetros espaciales utilizados
generalmente se derivan durante un proceso de codificación. Por
consiguiente, puede implementarse la lógica de limitación necesaria
sin tener que introducir nuevos parámetros.
En una realización adicional de la presente
invención, se aplica un limitador en el lado del decodificador, que
tiene la misma regla de limitación que un limitador en el lado del
codificador. Esto significa que en el lado del decodificador se
reciben la señal de mezcla descendente y residual así como los
parámetros espaciales IID e ICC, y los parámetros espaciales
recibidos se limitan utilizando la misma regla de limitación
utilizada durante el proceso de codificación. La mezcla ascendente
depende entonces de los parámetros espaciales limitados,
garantizando que no ocurre una divergencia en el proceso de mezcla
ascendente. La ventaja de tener las mismas reglas de limitación en
la codificación y la decodificación es obvia, ya que sólo hay que
desarrollar circuitos de hardware o una implementación de un
algoritmo de software una vez. El hardware o software con
funcionalidad tanto de codificación como de decodificación, pueden
desarrollarse con menores costes, ya que es posible reutilizar el
mismo hardware o software para la funcionalidad de limitación.
En una realización adicional de la presente
invención, las señales mezcladas descendentemente y los parámetros
espaciales se comprimen después de su generación, produciendo dos
flujos de bits de audio para las señales mezcladas descendentemente
y un flujo de bits de parámetros que contiene los parámetros
espaciales comprimidos. Esto reduce el tamaño de la representación
codificada que va a transmitirse, ahorrando además ancho de banda,
pudiendo ser la codificación con pérdidas o sin pérdidas, ya que la
regla de codificación en sí es independiente del concepto de la
invención. Un decodificador de la invención según el concepto de la
invención comprende entonces una etapa de descompresión, en el que
las representaciones comprimidas se descomprimen en los parámetros
espaciales, el canal mezclado descendentemente y el canal residual
antes de la mezcla ascendente.
En otra realización de la presente invención,
los flujos de bits de audio ya comprimidos y el flujo de bits de
parámetros se combinan en un flujo de bits combinado, por ejemplo,
mediante multiplexación, permitiendo un almacenamiento conveniente
de un archivo generado en un medio de almacenamiento. Esto también
permite aplicaciones de transferencia en flujo continuo
(streaming), por ejemplo, transferencia en flujo continuo del
contenido codificado a través de Internet, ya que toda la
información relevante está incluida en un único archivo o flujo de
bits, permitiendo un manejo más conveniente que en un caso en el que
se transferirían tres flujos de bits separados. El decodificador de
la invención correspondiente tiene entonces una etapa de
descombinación, que podría ser, por ejemplo, un demultiplexor que
descombina el flujo de bits en tres flujos de bits separados,
concretamente los flujos de bits de audio y el flujo de bits de
parámetros.
Debe observarse aquí que el concepto de la
invención proporciona una retrocompatibilidad perfecta con la
codificación residual de la técnica anterior, en la que los
parámetros espaciales no se limitan, e incluso con la codificación
estéreo paramétrica de la técnica anterior, en la que un
decodificador no hace uso de la señal residual. Por supuesto, esto
es una ventaja importante ya que los nuevos datos de audio
codificados pueden reproducirse con la máxima calidad posible
mediante decodificadores de la invención, mientras que también
pueden reproducirse por decodificadores ya existentes según la
técnica anterior.
En una realización adicional de la presente
invención, se combinan tres codificadores de la invención para
codificar una señal de audio multicanal que comprende seis canales
individuales, en el que cada uno de los tres codificadores de la
invención codifica un par de canales, derivando parámetros
espaciales, una señal de mezcla descendente y una residual para
cada uno de los pares de canales. El concepto de la invención
también puede utilizarse por tanto para codificar señales de audio
multicanal en las que la eficacia de la codificación y la capacidad
de compactación de la representación resultante tiene una prioridad
incluso mayor, ya que la cantidad total de datos que van a
codificarse y transmitirse es mucho mayor que para una señal
estéreo. En principio, puede combinarse un número arbitrario de
codificadores de audio de la invención para codificar
simultáneamente una señal de audio multicanal que tiene básicamente
cualquier número de canales de audio individuales. En una
realización adicional del codificador de audio multicanal, las
señales de mezcla descendente y las señales residuales
individuales, así como los flujos de bits de parámetros individuales
se combinan mediante un mezclador descendente 3 a 2 para recibir
una señal izquierda común, una señal derecha común y una señal
residual común y un flujo de bits de parámetros combinado,
reduciendo adicionalmente la cantidad de ancho de banda requerido.
Los decodificadores correspondientes comprenden entonces
evidentemente una etapa de mezclador ascendente 2 a 3.
En otra realización de la presente invención, un
transmisor o grabador de audio comprende un codificador de la
invención, permitiendo la grabación o transmisión de audio compacta,
de alta calidad, en el que el tamaño del contenido de audio
transmitido o almacenado puede reducirse significativamente. Tal
contenido de audio puede almacenarse en un medio de almacenamiento
de una capacidad dada o se usa menos ancho de banda durante la
transmisión de la señal de audio.
En otra realización, un receptor o reproductor
de audio tiene un decodificador de la invención, permitiendo
aplicaciones de transferencia en flujo continuo en entornos de ancho
de banda limitado, tales como teléfonos móviles, o permitiendo la
construcción de pequeños dispositivos de reproducción portátiles,
utilizando medios de almacenamiento de capacidad limitada.
Una combinación de un transmisor y receptor de
la invención produce un sistema de transmisión que permite la
transmisión conveniente de contenido de audio a través de interfaces
de transmisión por cable o inalámbricas, tales como LAN
inalámbrica, Bluetooth, LAN por cable, tecnologías de comunicación
por cable eléctrico, radiotransmisión, o cualquier otro tipo de
transmisión de datos.
Las realizaciones preferidas de la presente
invención se describen a continuación mediante referencia a los
dibujos adjuntos, en los que:
la figura 1 muestra un diagrama de bloques de un
codificador de la invención;
la figura 2 muestra un diagrama de bloques del
principio de codificación de la invención;
la figura 3 muestra otra realización de un
codificador de la invención;
la figura 4 muestra la retrocompatibilidad del
esquema de codificación de la invención con decodificadores de la
técnica anterior;
la figura 5 muestra un codificador de audio
multicanal de la invención;
la figura 6 muestra un diagrama de bloques de un
decodificador de audio de la invención;
la figura 7 muestra un diagrama de bloques del
concepto de decodificación de la invención;
la figura 8 muestra una realización adicional de
un decodificador de la invención;
la figura 9 muestra una realización de un
decodificador de audio multicanal de la invención;
la figura 10 muestra una realización alternativa
de un codificador de audio de la invención;
la figura 11 muestra una realización alternativa
de un decodificador de audio de la invención;
la figura 12 muestra un transmisor/grabador de
audio de la invención;
la figura 13 muestra un receptor/reproductor de
audio de la invención;
la figura 14 muestra un sistema de transmisión
de la invención.
La figura 1 muestra un diagrama de bloques de un
codificador 10 de audio de la invención, que comprende un mezclador
12 descendente, un limitador 14 y un extractor 16 de parámetros.
Una señal 18 estéreo, que tiene un canal
izquierdo y un derecho, se introduce en el mezclador 12 descendente
y en el extractor 16 de parámetros, simultáneamente. El extractor 16
de parámetros extrae parámetros 19 espaciales que describen una
interrelación entre el canal izquierdo y el derecho de la señal 18
estéreo. Estos parámetros, por un lado, están disponibles para la
transmisión y, por otro lado, se introducen en el limitador 14. El
limitador 14 aplica una regla de limitación a los parámetros. Los
detalles de una regla de limitación adecuada se derivarán en los
siguientes párrafos.
El limitador deriva parámetros espaciales
limitados y estos se introducen en el mezclador 12 descendente, en
el que el mezclador 12 descendente aplica una regla de mezcla
descendente al canal izquierdo y derecho de la señal 18 estéreo
para derivar una señal 20 de mezcla descendente y una señal 22
residual del canal izquierdo y el derecho de la señal estéreo. La
regla de mezcla descendente depende adicionalmente del parámetro
espacial limitado.
Cuando se selecciona una regla de limitación
adecuada para el limitador, sólo se suministran al mezclador 12
descendente parámetros limitados que se limitan de manera que la
regla de mezcla descendente no diverge ni produce salida alguna que
deteriore una interrelación espacial del canal izquierdo y el
derecho debido a la mezcla descendente.
Como resultado, la señal 18 estéreo está
representada por la señal 20 de mezcla descendente, la señal 22
residual y los parámetros 19 espaciales después del proceso de
codificación llevado a cabo por el codificador 10 de audio.
Para entender la manera en que una regla de
mezcla descendente y una regla de limitación tienen que
interrelacionarse para proporcionar una señal 22 residual
resultante que contiene la mínima energía posible mientras se limita
simultáneamente un parámetro espacial de tal manera que la regla de
mezcla descendente no origine divergencia alguna, el concepto
básico subyacente a la presente invención se elabora con mayor
detalle en los siguientes párrafos.
Los parámetros extraídos por el extractor 16 de
parámetros normalmente son resultado de un único intervalo de
tiempo y frecuencia de muestras de subbanda a partir de un análisis
de banco de filtros modulado complejo de las señales de tiempo
discretas. Esto significa que la señal de audio del canal izquierdo
y derecho de la señal 18 estéreo se divide primero en tramas de
tiempo de una longitud dada, y dentro de una única trama de tiempo,
el espectro de frecuencia se subdivide en un número de muestras de
subbanda. Para cada subbanda individual, el extractor 16 de
parámetros deriva entonces un parámetro espacial mediante
comparación de los canales izquierdo y derecho de la señal estéreo
dentro de la subbanda de interés. Por consiguiente, el canal
izquierdo y derecho de la señal 18 estéreo y la señal de mezcla
descendente m y la señal residual s de la figura 1 tienen que
entenderse como vectores discretos de longitud finita, que describen
las señales subyacentes dentro de un intervalo de tiempo discreto.
Como se mencionó anteriormente, durante una mezcla descendente,
debe garantizarse la preservación de energía. Para vectores
complejos discretos x, y, el producto interno complejo y la norma
cuadrada (comparable con energía) se definen por
Según la convención normal, un * indica
conjugación compleja. A partir de este momento, las letras en
mayúscula describen la suma o energía al cuadrado de los vectores
complejos de longitud finita correspondientes indicados por letras
en minúscula.
Según la presente invención, el canal de mezcla
descendente m que resulta de la mezcla descendente adaptativa es la
suma de energía ponderada del canal original izquierdo y derecho y,
por lo tanto, se define por
donde g es un factor de ganancia
real y positivo, ajustado de tal manera que la energía de la mezcla
descendente (M) es igual a la suma de energías de los vectores de
señal de canal izquierdo (L) y (R) (M = L +
R).
Puesto que este factor de ganancia diverge al
infinito cuando l y r se encuentran fuera de fase y tienen energía
comparable (es decir, l + r = 0 en la ecuación n.º 2), es necesario
limitar este factor por un factor de ganancia máximo g_{0} que se
encuentra normalmente dentro del intervalo [1,2]. El extractor 16 de
parámetros, según se muestra en la figura 1, extrae los parámetros
de audio espaciales IID (diferencia de intensidad entre canales) e
IIC (coherencia entre canales) que se representan aquí por
Aquí, c indica el parámetro IID y \rho indica
el parámetro ICC. El factor de ganancia g puede expresarse
dependiendo de los parámetros ICC e IID y de manera que la
limitación requerida del factor de ganancia puede escribirse como
sigue:
Generalmente, puesto que
|\rho|\leq1, tenemos
2\rhoc\leqc^{2}+1, de tal manera que
1/\sqrt{2} \leq g \leq g_{0}.
Para lograr la máxima eficacia de codificación,
se desea que la energía dentro de la señal 22 residual sea mínima.
La siguiente derivación resuelve un problema de optimización más
general que comprende una señal residual adicional t, que resulta
entonces superflua debido a (9). Considerando el problema desde el
lado del decodificador, es necesario determinar ganancias a, b, de
tal manera que las señales residuales s, t en la mezcla
ascendente
tengan energía mínima. La solución
viene dada
por
donde
\vskip1.000000\baselineskip
El mismo problema, con la restricción adicional
de que los coeficientes a,b son reales, tiene la solución
dada al tomar la parte real de (7) e insertarla en (6). En este
caso, \rho puede expresarse en términos de los parámetros
PS c, \rho como sigue:
\vskip1.000000\baselineskip
Al insertar (6) en (5) y sumar las dos
ecuaciones en (5) se desprende que:
\vskip1.000000\baselineskip
Al describir el proceso de mezcla ascendente en
la notación de matriz normal, la mezcla ascendente puede
representarse por una matriz de rotación H como sigue:
\vskip1.000000\baselineskip
En el caso en el que g no se limita por g_{0}
en (4), una representación diferente de los coeficientes óptimos
a,b viene dada por:
\vskip1.000000\baselineskip
La primera columna de la matriz de rotación H es
idéntica a la rotación de amplitud usada en estéreo paramétrico,
esto se deriva por ejemplo de WO 03/090206 A1.
La mezcla descendente tiene que ser compatible
con la mezcla ascendente en el sentido de que se obtiene una
reconstrucción perfecta cuando se omiten todas las etapas de
codificación con pérdidas. Como consecuencia, la matriz de mezcla
descendente D,
\vskip1.000000\baselineskip
\newpage
debe ser la inversa de la rotación
de mezcla ascendente H. Un cálculo elemental
da
donde la primer fila es consistente
con
(2).
Existe un problema de estabilidad con las dos
rotaciones óptimas dadas por (10) y (13). Puesto que
(c,\rho) se acerca a (1, -1), el valor de \rho
dado por (8) diverge. Por consiguiente, hay que desviarse de las
rotaciones óptimas en la proximidad de este punto del dominio de
parámetro PS. La solución que enseña la presente invención es
modificar los parámetros PS mediante un limitador de inestabilidad
tanto en el codificador como en el decodificador.
En su forma general, tal limitador alterará los
valores del par (c,\rho) en la proximidad de (1, -1) con
objeto de lograr un intervalo delimitado para \rho. Una
solución particularmente atractiva se basa en la observación de que
el denominador de (8) es el mismo que el de (4). La solución de la
invención mantiene c sin alterar y modifica \rho de
manera exacta cuando la ganancia de mezcla descendente adaptativa g
se limita por g_{0} en (4). Esto ocurre cuando
La modificación preferida de \rho
llevada a cabo por el limitador 14 de inestabilidad es entonces:
El valor correspondiente de \rho dado
por la inserción de \tilde{\rho} en lugar de \rho
en (8) tiene la propiedad de que
En los párrafos previos, se ha detallado el
análisis del problema que conduce a la definición del limitador 14.
Aunque la notación se basa en señales estéreo, está claro que el
mismo método puede aplicarse a cualquier par de señales de audio,
tales como pares de canales seleccionados a partir de o generados
por una mezcla descendente parcial de una señal de audio
multicanal. Es particularmente ventajoso que la misma regla de
limitación puede usarse para limitar los parámetros en la matriz de
mezcla ascendente y de mezcla descendente.
La figura 2 describe el procedimiento de
codificación de audio de la invención, utilizando un diagrama de
bloques, que muestra la manera en que se lleva a cabo la
codificación de audio cuando se sigue el concepto de la invención.
En una primer etapa de extracción de parámetros 30, se derivan los
parámetros ICC e IID.
Estos parámetros se reenvían entonces como
salida 23 y se transfieren para servir como entrada a la etapa de
limitación 32, en la que se hace una comparación del parámetro ICC
con un parámetro ICC mínimo calculado, ICC_{min}, en el que
ICC_{min} depende de IID. En un primer caso, en el que el
parámetro ICC excede el parámetro ICC mínimo,
ICC_{min}(IID), el parámetro ICC se reenvía directamente a
la etapa de mezcla descendente 34.
Si el parámetro ICC no excede
ICC_{min}(IID), se lleva a cabo una etapa de intercambio
adicional 36, en la que el valor del parámetro ICC se sustituye por
el valor del parámetro ICC mínimo ICC_{min}(IID). Después
de la etapa de intercambio 36, el parámetro ICC que tiene el nuevo
valor se transfiere entonces a la etapa de mezcla descendente
34.
En la etapa de mezcla descendente 34, la señal
20 de mezcla descendente y la señal 22 residual se derivan de los
canales l y r, dependiendo de los parámetros ICC e IID.
Finalmente, los parámetros 23 (ICC e IID), la
señal 20 de mezcla descendente y la señal 22 residual se encuentran
disponibles como salida del procedimiento de codificación.
\newpage
La figura 3 muestra otra realización de un
dispositivo 50 de codificación de audio de la invención que
comprende un codificador 10 de audio, una unidad 51 de
procesamiento de señal que tiene un primer compresor 52 de audio,
un segundo compresor 54 de audio y un compresor 56 de parámetros, y
una interfaz de salida 58.
Los componentes del codificador 10 de audio ya
se han comentado en los párrafos previos. Por consiguiente, solo
aquellas partes del dispositivo 50 de codificación de audio que sean
una extensión del codificador 10 de audio se comentarán en los
siguientes párrafos.
El propósito general de la unidad 51 de
procesamiento de señales es comprimir la señal 20 de mezcla
descendente, la señal 22 residual y los parámetros 23. Por
consiguiente, la señal 20 de mezcla descendente se introduce en el
primer compresor 52 de audio, la señal 22 residual se introduce en
el segundo compresor de audio 54 y los parámetros espaciales 23 se
introducen en el compresor 56 de parámetros. El primer compresor 52
de audio deriva un primer flujo 60 de bits de audio, el segundo
compresor 54 de audio deriva un segundo flujo 62 de bits de audio y
el compresor 56 de parámetros deriva un flujo 64 de bits de
parámetros. El primer y el segundo flujo (60, 62) de bits de audio
y el flujo 64 de bits de parámetros se utilizan entonces como
entrada de la interfaz de salida, que combina las tres flujos (60,
62, 64) de bits para derivar un flujo 66 de bits combinado, que es
la salida del dispositivo 50 de codificación de la invención.
La combinación llevada a cabo por la interfaz 58
de salida podría ser, por ejemplo, una simple multiplexación de los
tres flujos de bits entrantes. Además, es posible cualquier clase de
combinación que conduzca a un único flujo 66 de bits de salida. El
tratar con un único flujo de bits es mucho más conveniente en el
manejo, tal como la transferencia en flujo continuo a través de
Internet u otros enlaces de datos.
En otras palabras, la figura 3 ilustra un
codificador que toma una señal de audio de dos canales, que
comprende los canales l, r como entrada, y genera un flujo de bits
que permite la decodificación mediante un decodificador estéreo
paramétrico. La mezcla descendente adaptativa toma la señal de dos
canales l, r y genera una señal mono de mezcla descendente m y una
residual s. Estas señales pueden codificarse entonces mediante
codificadores de audio perceptivos a fin de producir flujos de bits
de audio compactos. La estimación de parámetros estéreo
paramétricos (PS) toma la señal de dos canales l, r como entrada y
genera un conjunto de parámetros PS. El limitador de inestabilidad
modifica los parámetros PS que controlan la mezcla descendente
adaptativa. El bloque de codificación produce la información
lateral estéreo paramétrica (información lateral PS) a partir de la
emisión no modificada de la estimación de parámetros PS. El
multiplexor combina todos los datos codificados para formar el
flujo de bits combinado.
Una de las principales ventajas del concepto de
codificación de la invención, es que es completamente
retrocompatible con los decodificadores estéreo paramétricos de la
técnica anterior. Para ilustrar esto, la figura 4 muestra un
decodificador estéreo paramétrico de la técnica anterior.
El decodificador 70 estéreo paramétrico
comprende una interfaz 72 de entrada, un decodificador 74 de audio,
un decodificador 76 de parámetros y un mezclador 78 ascendente.
La interfaz 72 de entrada recibe un flujo 80 de
bits combinado como el que se produce mediante el codificador 50 de
audio de la invención. La interfaz 72 de entrada del decodificador
70 estéreo paramétrico de la técnica anterior no reconoce la señal
22 residual y por lo tanto solamente extrae la señal 60 de mezcla
descendente (primer flujo 60 de bits de audio de la figura 3) y el
flujo 64 de bits de parámetros del flujo 80 de bits de entrada. El
decodificador 74 de audio es el dispositivo complementario al primer
compresor 52 de audio y el decodificador 76 de parámetros es el
dispositivo complementario al compresor 56 de parámetros. Por lo
tanto, el flujo 60 de bits de audio se decodifica en la señal 20 de
mezcla descendente y el flujo 64 de bits de parámetros se
decodifica en los parámetros 23 espaciales. Puesto que los
parámetros 23 espaciales se han transferido directamente y no se
han procesado adicionalmente por el codificador 10 ó 50 de la
invención, un mezclador 78 ascendente de la técnica anterior puede
reconstruir un canal derecho e izquierdo, construyendo una señal 80
de salida a partir de la señal 20 de mezcla descendente utilizando
los parámetros 23 espaciales.
En otras palabras, la figura 4 ilustra un
decodificador estéreo paramétrico que toma un flujo de bits
compatible como el que se genera por un dispositivo 50 codificador
de la invención, como entrada, y genera la señal de audio estéreo
comprendiendo los canales l y r, sin utilizar o sin tener acceso a
la parte del flujo de bits que describe la señal residual. Primero,
un demultiplexor toma el flujo de bits compatible como entrada y lo
descompone en flujos de bits de audio e información lateral PS. El
decodificador de audio perceptivo produce una señal mono m, y la
información lateral PS se decodifica en parámetros PS. La síntesis
PS convierte la señal mono en señales derecha e izquierda l y r
según los parámetros PS, en particular añadiendo una señal
decorrelacionada a fin de retener la correlación de canal de los
canales estéreo originales.
La figura 5 muestra un codificador 100 de audio
multicanal de la invención que codifica una señal de audio de 6
canales en una mezcla descendente estéreo y un número de conjuntos
de parámetros.
El codificador 100 de audio multicanal comprende
un primer codificador 102 adaptativo, un segundo codificador 104
adaptativo, un módulo 106 de estimación, un extractor 108 de
parámetros y un mezclador 110 descendente 3 a 2.
\newpage
El primer codificador 102 adaptativo y el
segundo codificador 104 adaptativo son realizaciones de un
codificador 10 de la invención. La señal de entrada de 6 canales
tiene un canal 112a izquierdo frontal, un canal 112b izquierdo
posterior, un canal 114a derecho frontal, un canal 114b derecho
posterior, un canal 116a central y un canal 116b de refuerzo de
baja frecuencia. El canal 112a izquierdo frontal y el canal 112b
izquierdo posterior se introducen en el primer codificador 102
adaptativo que deriva de una primera señal 118a de mezcla
descendente, la señal 118b residual correspondiente y los parámetros
118c espaciales. El canal 114a derecho frontal y el canal 114b
derecho posterior se introducen en el segundo codificador 104
adaptativo, que deriva una segunda señal 120a de mezcla
descendente, la señal 120b residual correspondiente y los parámetros
120c espaciales subyacentes. El canal 116a central y el canal 116
de refuerzo de baja frecuencia se introducen en el módulo 106 de
suma que suma las señales para crear una señal 122a mono y
parámetros 122b espaciales correspondientes.
El mezclador 110 descendente 3 a 2 recibe las
señales 118a, 120a y 122a de mezcla descendente para mezclarlas
descendentemente en una señal 124 de salida estéreo que tiene un
canal izquierdo y derecho. El mezclador descendente 3 a 2
adicionalmente deriva una señal 126 residual a partir de los canales
118a, 120a y 122a de entrada. Además, el mezclador 110 descendente
3 a 2 deriva un conjunto de parámetros 128 a partir del grupo de
parámetros 118b, 120b y 122b.
Resumiendo de manera breve, la figura 5 ilustra
una parte de un codificador de audio espacial que toma como entrada
una señal de audio multicanal en formato 5.1, comprendiendo los
canales Lf (izquierdo frontal), Lr (izquierdo envolvente), Rf
(derecho frontal), Rr (derecho envolvente), C (central) y LFE
(eficiente de baja frecuencia), y que crea una mezcla descendente
estéreo, comprendiendo L0 y R0, y un número de conjuntos de
parámetros. En esta figura no se muestran las transformaciones de
tiempo a frecuencia, la codificación de las señales de mezcla
descendente y los parámetros, y la multiplexación de la información
codificada en un flujo de bits que puede decodificarse por un
decodificador de audio espacial correspondiente. La mezcla
descendente adaptativa toma como entrada las señales Lf y Lr y
produce una señal mono L y una señal residual L. La estimación de
parámetros estéreo paramétricos (PS) toma la señal de dos canales Lf
y Lr como entrada y genera un conjunto de parámetros PS. El
limitador de inestabilidad modifica los parámetros PS que controlan
la mezcla descendente adaptativa. De una manera similar, la mezcla
descendente adaptativa toma como entrada las señales Rf y Rr y
produce una señal mono R y una señal residual R. La estimación de
parámetros estéreo paramétricos (PS) toma la señal de dos canales
Rf y Rr como entrada y genera un conjunto de parámetros PS. El
limitador de inestabilidad modifica los parámetros PS que controlan
la mezcla descendente adaptativa. El módulo de suma, suma las
señales C y LFE para crear una señal mono C. La estimación de
parámetros estéreo paramétrico (PS) toma la señal de dos canales C
y LFE como entrada y genera un conjunto de parámetros IID, un
subconjunto de parámetros PS. Las señales mono L, R y C se mezclan
para dar una señal estéreo (Lo y Ro) y una señal residual Eo
mediante el módulo 3 a 2. El módulo 3 a 2 también da como salida un
conjunto de parámetros {Lo, Ro}.
La figura 6 describe un decodificador 140 de
audio de la invención, que comprende un mezclador 142 ascendente y
un limitador 144.
El decodificador 140 de la invención recibe una
señal 146 de mezcla descendente, una señal 148 residual y
parámetros 150 espaciales. La señal 146 de mezcla descendente y la
señal 148 residual se introducen en el mezclador 142 ascendente,
mientras que los parámetros 150 espaciales se introducen en el
limitador 144. El limitador 144 limita los parámetros 150
espaciales para derivar parámetros 152 espaciales limitados.
Es importante señalar, que el limitador utiliza
la misma regla de limitación para derivar los parámetros limitados
que el codificador correspondiente durante el proceso de
codificación. Los parámetros limitados se utilizan para controlar
el proceso de mezcla descendente en el mezclador 142 ascendente que
deriva una señal 154 estéreo que tiene un canal izquierdo y derecho
a partir de la señal 146 de mezcla descendente y la señal 148
residual.
La figura 7 muestra un diagrama de bloques que
ilustra el principio de un decodificador de la invención. En una
primera etapa de limitación 160 se limitan los parámetros espaciales
recibidos ICC e IID. Es decir, se comprueba si el parámetro ICC
recibido excede un parámetro ICC mínimo ICC_{min}(IID). Si
éste es el caso, los parámetros 150 espaciales (ICC e IID), una
señal 146 de mezcla descendente recibida y una señal 148 residual
recibida de transmiten a la etapa de mezcla ascendente 162. Si el
parámetro ICC no excede el parámetro ICC mínimo
ICC_{min}(IID), una etapa de limitación 164 se lleva a cabo
adicionalmente, en la que el valor del parámetro ICC se intercambia
por el valor del parámetro ICC_{min}(IID), con el efecto de
que el valor de ICC_{min}(IID) se transmite a la etapa de
mezcla ascendente 162.
En la etapa de mezcla ascendente 162, una señal
154 estéreo que tiene un canal izquierdo y derecho se deriva a
partir de la señal de mezcla 146 descendente y la señal 148
residual, utilizando los parámetros espaciales ICC e IID.
La figura 8 muestra una realización adicional de
un dispositivo 180 decodificador de la invención que comprende un
decodificador 140, una unidad 182 de procesamiento de señal que
tiene un primer decodificador 184 de audio, un segundo
decodificador 186 de audio y un decodificador 188 de parámetros. El
dispositivo 180 decodificador comprende además una interfaz 190 de
entrada para recibir un flujo 192 de bits combinado, que se genera
por un dispositivo 50 codificador de la invención.
El flujo 192 de bits combinado se descompone por
la interfaz 190 de entrada en un primer flujo 194a de bits de
audio, un segundo flujo 194b de bits de audio y un flujo 196 de bits
de parámetros.
El primer flujo 194a de bits de audio se
introduce en el primer decodificador 185 de audio, el segundo flujo
194b de bits de audio se introduce en el segundo decodificador 186
de audio y el flujo 196 de bits de parámetros se introduce en el
decodificador 188 de parámetros. La señal 198 de mezcla descendente
(m) y la señal 200 residual (s) descomprimidas se introducen en el
mezclador 142 descendente del decodificador 140. Los parámetros 202
espaciales derivados por el decodificador 188 de parámetros se
introducen en el limitador 144 del decodificador 140 de audio. La
limitación de los parámetros espaciales y la mezcla ascendente ya se
han descrito en la descripción del decodificador 140
de audio. Una descripción detallada puede obtenerse de los párrafos correspondientes de la descripción de la figura 6.
de audio. Una descripción detallada puede obtenerse de los párrafos correspondientes de la descripción de la figura 6.
El dispositivo 180 decodificador de la invención
finalmente da como salida una señal 204 estéreo, que tiene un canal
izquierdo y derecho.
En otras palabras, la figura 8 ilustra un
decodificador estéreo paramétrico que toma un flujo de bits
compatible como entrada y genera la señal de audio estéreo que
comprende los canales l y r. Primero, un demultiplexor toma el
flujo de bits compatible como entrada y lo descompone en dos flujos
de bits de audio y la información lateral PS. Los decodificadores
de audio perceptivos producen una señal mono m y una señal residual
s respectivamente, y la información lateral PS se decodifica en
parámetros PS por el decodificador de parámetros. El limitador de
inestabilidad modifica los parámetros PS. El mezclador ascendente
convierte las señales mono y residual en las señales izquierda y
derecha l y r por medio de una matriz de rotación definida a partir
de los parámetros PS modificados por el limitador de
inestabilidad.
La figura 9 muestra un decodificador 210 de
audio multicanal de la invención que comprende un primer
decodificador 212 de dos canales, un módulo 216 de síntesis y un
módulo 218 2 a 3.
La figura 9 ilustra parte de un decodificador de
audio espacial que toma como entrada una señal de audio estéreo
(que comprende Lo y Ro), una señal residual Eo y un conjunto de
parámetros {Lo, Ro}. El módulo 218 2 a 3 produce tres canales de
audio L, R y C a partir de la entrada anteriormente mencionada. El
canal mono L y el canal residual L se convierten por un primer
decodificador 211 de dos canales en las señales de salida Lf y Lr.
El limitador de inestabilidad modifica el conjunto de parámetros PS
L. De igual forma, el canal mono R y el canal residual R se
convierten por un segundo decodificador 214 de dos canales en las
señales de salida Rf y Rr. El limitador de inestabilidad es el
mismo al utilizado durante la generación del canal mono R y modifica
el conjunto de parámetros PS R. El módulo 216 de síntesis PS toma
el canal mono C y el conjunto de parámetros C y genera los canales
de salida C y LFE.
Las figuras 10 y 11 muestran una solución
alternativa para un codificador y un decodificador que evita el
problema de la inestabilidad. La alternativa se basa en utilizar los
parámetros espaciales limitados como los parámetros que van a
codificarse y transmitirse. Esto puede observarse en el codificador
de la invención en la figura 10 que se basa en el dispositivo
codificador de la invención de la figura 3.
La figura 10 muestra una modificación de un
codificador de la invención ya mostrado en la figura 3, con la
diferencia de que los parámetros alimentados en el codificador 56 de
parámetros se toman en un punto 300, es decir, después del proceso
de limitación. Es decir, los parámetros limitados se codifican y se
transmiten en lugar de los parámetros originales.
En el lado del decodificador mostrado en la
figura 11, la modificación es que el limitador puede omitirse en
comparación con el dispositivo 180 decodificador. Por lo tanto, el
parámetro 310 espacial decodificador se introduce directamente en
el mezclador 142 ascendente para derivar la señal 204 estéreo.
Las desventajas de esta solución en comparación
con la colocación de limitadores de inestabilidad como se enseñó
anteriormente y se muestra en las figuras previas son dobles.
Primero, la cuantificación de los parámetros limitados podría mover
las rotaciones más allá de lo óptimo y por tanto de lo necesario. El
tamaño residual por tanto podría ser más grande en general,
conduciendo a una pérdida en ganancia de codificación para el
método de codificación residual. Segundo, la retrocompatibilidad con
la decodificación estéreo paramétrica podría perderse. En casos
críticos, cuando la correlación de canal del canal original es
negativa, el decodificador no podría ser capaz de reproducir esta
correlación sin tener acceso a la señal residual.
La figura 12 muestra un transmisor o grabador
330 de audio que tiene un codificador 50 de audio, una interfaz 332
de entrada y una interfaz 334 de salida.
Una señal de audio puede suministrarse a la
interfaz 332 de entrada del transmisor/grabador 330. La señal de
audio se codifica por un codificador 50 de la invención en el
transmisor/grabador y la representación codificada sale en la
interfaz 334 de salida del transmisor/grabador 330. La
representación codificada puede entonces transmitirse o almacenarse
en un medio de almacenamiento.
La figura 13 muestra un receptor o reproductor
340 de audio, que tiene un decodificador 180 de audio de la
invención, una entrada 342 de flujo de bits y una salida 344 de
audio.
Un flujo de bits puede introducirse en la
entrada 342 del receptor/reproductor 340 de audio de la invención.
El flujo de bits se codifica entonces por el decodificador 180 y la
señal decodificada sale o se reproduce en la salida 344 del
receptor/reproductor 340 de audio de la invención.
La figura 14 muestra un sistema de transmisión
que comprende un transmisor 330 de la invención y un receptor 340
de la invención.
La entrada de señal de audio en la interfaz 332
de entrada del transmisor 330 se codifica y se transfiere de la
salida 334 del transmisor 330 a la entrada 342 del receptor 340. El
receptor decodifica la señal de audio y reproduce o da como salida
la señal de audio en su salida 344.
Las realizaciones de la presente invención
anteriormente mencionadas y descritas son meramente ilustrativas de
los principios de la presente invención para la mejora de la
codificación residual adaptativa. Se entiende que serán posibles
modificaciones y variaciones de las disposiciones y detalles
descritos en el presente documento por otros expertos en la
técnica. Por lo tanto, pretende estar limitada solamente por el
alcance de las reivindicaciones de patente que siguen y no por los
detalles específicos presentados a modo de descripción y explicación
de las realizaciones en el presente documento.
Aunque las realizaciones de la presente
invención descritas en las figuras anteriores se describen
utilizando principalmente una nomenclatura utilizada para señales
estéreo, es evidente que la presente invención no se limita a las
señales estéreo, sino que podría aplicarse a cualquier otro tipo de
combinación de dos señales de audio, como se hace por ejemplo en
los codificadores y decodificadores de audio multicanal mostrados en
la figura 5 y la figura 9.
Utilizando un sistema de transmisión de la
invención que tiene un transmisor y un receptor, la transmisión
entre el transmisor y el receptor puede lograrse por diversos
medios. Puede ser por ejemplo la transferencia en flujo continuo en
directo por Internet u otros medios en red, almacenando un archivo
en un medio legible por ordenador y transfiriendo el medio,
directamente conectando el transmisor y el receptor por cable o de
manera inalámbrica, tal como LAN inalámbrica o Bluetooth o cualquier
otra conexión de datos imaginable.
A pesar de que se ha descrito en detalle que el
parámetro ICC solamente se cambiará para garantizar una matriz de
mezcla descendente y ascendente no divergente, también es posible
limitar tanto los parámetros IID como IIC de tal forma que no se
produzca ninguna divergencia. Más generalmente, la aplicación del
concepto de la invención también puede significar la derivación de
otros parámetros espaciales y la aplicación de una regla de
limitación a estos parámetros, garantizando una mezcla ascendente y
descendente no divergente.
Las interfaces de entrada y salida en los
codificadores y decodificadores de la invención no se limitan
únicamente a simples multiplexores o demultiplexores. En una
variación más sofisticada, la interfaz de salida puede combinar los
flujos de bits no simplemente multiplexándolos, sino por cualquier
otro medio, posiblemente incluso intentando alguna codificación de
entropía adicional para reducir el tamaño del flujo de bits.
Dependiendo de ciertos requisitos de
implementación de los métodos de la invención, los métodos de la
invención pueden implementarse en hardware o en software. La
implementación puede realizarse utilizando un medio de
almacenamiento digital, en particular un disco, DVD o un CD, que
tienen señales de control electrónicamente legibles almacenadas en
los mismos, que actúan conjuntamente con un sistema informático
programable de tal forma que se lleven a cabo los métodos de la
invención. Generalmente, la presente invención es, por lo tanto, un
producto de programa informático con un código de programa
almacenado en un soporte legible por máquina, siendo el código de
programa operativo para realizar los métodos de la invención cuando
el producto de programa informático se ejecuta en un ordenador. En
otras palabras, los métodos de la invención son, por lo tanto, un
programa informático que tiene un código de programa para realizar
al menos uno de los métodos de la invención cuando el programa
informático se ejecuta en un ordenador.
Aunque lo precedente se ha mostrado y descrito
particularmente con referencia a las realizaciones particulares de
la misma, los expertos en la técnica entenderán que pueden hacerse
otros diversos cambios en la forma y detalles sin alejarse del
alcance de la misma. Se entenderá que pueden hacerse diversos
cambios en adaptación a diferentes realizaciones sin alejarse de
los conceptos más amplios dados a conocer en el presente documento
y comprendidos por las reivindicaciones que siguen.
Claims (35)
1. Codificador (10) de audio para codificar una
señal de audio que tiene al menos dos canales (18), que
comprende:
- \quad
- un extractor (16) de parámetros para derivar un parámetro de coherencia (ICC) que describe una coherencia entre un primer y un segundo canal de los al menos dos canales y un parámetro de nivel (IID) que describe una diferencia de nivel entre el primer y el segundo canal, como parámetros espaciales;
- \quad
- un limitador (14) para limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y
- \quad
- un mezclador (12) descendente para derivar una señal (20) de mezcla descendente y una señal (18) residual a partir de la señal de audio utilizando una regla de mezcla descendente que depende del parámetro de coherencia limitado.
\vskip1.000000\baselineskip
2. Codificador (10) de audio según la
reivindicación 1, en el que el extractor (16) de parámetros es
operativo para derivar múltiples parámetros espaciales para una
porción de tiempo dada de la señal de audio.
3. Codificador (10) de audio según la
reivindicación 1 ó 2, en el que el limitador (14) es operativo para
limitar el parámetro de coherencia de tal manera que una relación
de intensidades entre la señal (20) de mezcla descendente y los al
menos dos canales no excede un límite predefinido.
4. Codificador (10) de audio según cualquiera de
las reivindicaciones 1 a 3, en el que una regla de limitación del
limitador (14) es de tal manera que un límite inferior para el
parámetro de coherencia ICC depende del parámetro de nivel IID y
del factor de escala que depende de un factor de ganancia
predefinido g_{0} como se describe por la siguiente
expresión:
5. Codificador (10) de audio según la
reivindicación 4, en el que el factor de ganancia predefinido
g_{0} se selecciona del intervalo [1, 2].
6. Codificador (10) de audio según cualquiera de
las reivindicaciones 1 a 5, en el que el mezclador (12) descendente
es operativo para utilizar una regla de mezcla descendente de tal
forma que la señal (20) de mezcla descendente y la señal (18)
residual se derivan al formar una combinación lineal de los canales
de los al menos dos canales, en el que los coeficientes de la
combinación lineal dependen del parámetro de coherencia
limitado.
7. Codificador (10) de audio según la
reivindicación 6, en el que la regla de mezcla descendente es de tal
manera que la derivación de la señal (20) de mezcla descendente m y
la señal (18) residual s puede describirse por la siguiente
ecuación, dependiendo del parámetro de coherencia limitado ICC, el
parámetro de nivel IID, el primer canal l y el segundo canal r:
\vskip1.000000\baselineskip
8. Codificador (10) de audio según cualquiera de
las reivindicaciones 1 a 7, que comprende además una unidad (51) de
procesamiento de señal para procesar o transmitir la señal (20) de
mezcla descendente, la señal (18) residual y los parámetros
espaciales para derivar una señal de mezcla descendente procesada,
una señal residual procesada y parámetros procesados.
9. Codificador (10) de audio según la
reivindicación 8, en el que la unidad (51) de procesamiento de señal
es operativa para derivar la señal de mezcla descendente procesada,
la señal residual procesada y los parámetros procesados de tal
forma que la derivación incluye una compresión de la señal (20) de
mezcla descendente, la señal (18) residual y los parámetros
espaciales.
10. Codificador (10) de audio según las
reivindicaciones 8 ó 9, que comprende además una interfaz (58) de
salida para proporcionar la información de la señal (20) de mezcla
descendente procesada, la señal (18) residual procesada y los
parámetros procesados.
11. Codificador (10) de audio según la
reivindicación 10, en el que la interfaz (58) de salida es operativa
para combinar la señal de mezcla descendente procesada, la señal
residual procesada y los parámetros procesados para derivar un
flujo de bits de salida que tiene la información de la señal de
mezcla descendente procesada, la señal residual procesada y los
parámetros procesados.
12. Codificador (10) de audio según la
reivindicación 11, en el que la interfaz (58) de salida es operativa
para multiplexar la señal de mezcla descendente procesada, la señal
residual procesada y los parámetros procesados para derivar el
flujo de bits de salida.
13. Codificador (10) de audio según cualquiera
de las reivindicaciones 1 a 12, en el que se codifican los múltiples
pares de canales, en el que para cada par de canales se derivan
parámetros espaciales, una señal (20) de mezcla descendente y una
señal (18) residual.
14. Codificador (10) de audio según la
reivindicación 13, en el que los múltiples pares de canales
comprenden un canal izquierdo frontal, uno izquierdo posterior, uno
derecho frontal, uno derecho posterior, uno de refuerzo de baja
frecuencia y uno central.
15. Decodificador (140) de audio para
decodificar una señal de audio codificada que representa una señal
de audio original que tiene al menos dos canales, teniendo la señal
de audio codificada una señal de mezcla descendente y una señal
residual así como un parámetro de coherencia (ICC) que describe la
coherencia entre un primer y un segundo canal de los al menos dos
canales y un parámetro de nivel (IID) que describe una diferencia de
nivel entre el primer y el segundo canal, como parámetros
espaciales, que comprende:
- \quad
- un limitador (144) para limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y
- \quad
- un mezclador (142) ascendente para derivar una reconstrucción de la señal (154) de audio original a partir de la señal de mezcla descendente y la señal residual utilizando una regla de mezcla ascendente que depende del parámetro de coherencia limitado.
\vskip1.000000\baselineskip
16. Decodificador (140) de audio según la
reivindicación 15, en el que el limitador (144) es operativo para
limitar múltiples parámetros de coherencia para una porción de
tiempo dado de la señal de audio codificada correspondiente a una
trama de tiempo de la señal de audio original.
17. Decodificador (140) de audio según la
reivindicación 15 ó 16, en el que el limitador (144) es operativo
para limitar el parámetro de coherencia de tal manera que una
relación de intensidades entre la señal de mezcla descendente y los
al menos dos canales de la señal de audio original no excede un
límite predefinido.
18. Decodificador (144) de audio según
cualquiera de las reivindicaciones 15 a 17, en el que la regla de
limitación del limitador (144) es de tal forma que un límite
inferior para el parámetro de coherencia ICC depende del parámetro
de nivel IID y del factor de escala que depende de un factor de
ganancia predefinido g_{0} como se describe por la siguiente
expresión:
19. Decodificador (140) de audio según la
reivindicación 18, en el que el factor de ganancia predefinido
g_{0} se selecciona del intervalo [1, 2].
20. Decodificador (140) de audio según
cualquiera de las reivindicaciones 15 ó 19, en el que el mezclador
(142) ascendente es operativo para utilizar una regla de mezcla
ascendente de tal forma que un primer canal reconstruido y un
segundo canal reconstruido de los al menos dos canales se derivan al
formar una combinación lineal de la señal de mezcla descendente y
la señal residual, en el que los coeficientes de la combinación
lineal dependen del parámetro de coherencia limitado.
21. Decodificador (140) de audio según la
reivindicación 20, en el que la regla de mezcla ascendente es de tal
forma que la derivación del primer canal reconstruido l y el
segundo canal reconstruido r a partir de la señal de mezcla
descendente m y la señal residual s depende del parámetro de
coherencia limitado ICC y el parámetro de nivel, como se describe
por las siguientes ecuaciones:
\vskip1.000000\baselineskip
donde
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
22. Decodificador (140) de audio según
cualquiera de las reivindicaciones 15 a 21, que comprende además una
unidad (182) de procesamiento de señal para transmitir o procesar
una señal residual procesada, una señal de mezcla descendente
procesada y parámetros procesados para derivar la señal residual, la
señal de mezcla descendente y los parámetros espaciales.
23. Decodificador (140) de audio según la
reivindicación 22, en el que la unidad (182) de procesamiento de
señal es operativa para derivar la señal residual, la señal de
mezcla descendente y los parámetros espaciales de tal forma que la
derivación de la señal residual, la señal de mezcla descendente y
los parámetros espaciales incluyen la descompresión de la señal
residual procesada, la señal de mezcla descendente procesada y los
parámetros procesados.
24. Decodificador (140) de audio según las
reivindicaciones 22 ó 23, que comprende además una interfaz (190) de
entrada para proporcionar la señal residual procesada, la señal de
mezcla descendente procesada y los parámetros procesados.
25. Decodificador (140) de audio según la
reivindicación 24, en el que la interfaz (190) de entrada es
operativa para descomponer un flujo de bits de entrada único para
derivar la señal residual procesada, la señal de mezcla descendente
procesada y los parámetros procesados.
26. Decodificador (140) de audio según la
reivindicación 25, en el que la interfaz (190) de entrada es
operativa para descomponer el flujo de bits de entrada único de tal
forma que la derivación de la señal residual procesada, la señal de
mezcla descendente procesada y los parámetros procesados incluye una
demultiplexación del flujo de bits de en-
trada.
trada.
27. Método para codificar una señal de audio que
tiene al menos dos canales, comprendiendo el método:
- \quad
- derivar un parámetro de coherencia (ICC) que describe la coherencia entre un primer y un segundo canal de los al menos dos canales y un parámetro de nivel (IID) que describe una diferencia de nivel entre el primer y el segundo canal, como parámetros espaciales;
- \quad
- limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y
- \quad
- derivar una señal de mezcla descendente y una señal residual a partir de la señal de audio utilizando una regla de mezcla descendente que depende del parámetro de coherencia limitado.
\vskip1.000000\baselineskip
28. Método para decodificar una señal de audio
codificada que representa una señal de audio original que tiene al
menos dos canales, teniendo la señal de audio codificada una señal
de mezcla descendente y una señal residual así como un parámetro de
coherencia (ICC) que describe una coherencia entre un primer y un
segundo canal de los al menos dos canales y un parámetro de nivel
(IID) que describe una diferencia de nivel entre el primer y el
segundo canal, como parámetros espaciales, comprendiendo el
método:
- \quad
- limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y
- \quad
- derivar una reconstrucción de la señal de audio original a partir de la señal de mezcla descendente y la señal residual utilizando una regla de mezcla ascendente que depende del parámetro de coherencia limitado.
\vskip1.000000\baselineskip
29. Transmisor o grabador de audio que tiene un
codificador (10) de audio para codificar una señal de audio que
tiene al menos dos canales, que comprende:
- \quad
- un extractor (16) de parámetros para derivar un parámetro de coherencia (ICC)que describe una coherencia entre un primer y un segundo canal de los al menos dos canales y un parámetro de nivel (IID) que describe una diferencia de nivel entre el primer y el segundo canal, como parámetros espaciales;
- \quad
- un limitador (14) para limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y
- \quad
- un mezclador (12) descendente para derivar una señal de mezcla descendente y una señal residual a partir de la señal de audio utilizando una regla de mezcla descendente que depende del parámetro de coherencia limitado.
\vskip1.000000\baselineskip
30. Receptor o reproductor de audio, que tiene
un decodificador (140) de audio para decodificar una señal de audio
codificada que representa una señal de audio original que tiene al
menos dos canales, teniendo la señal de audio codificada una señal
de mezcla descendente y una señal residual así como un parámetro de
coherencia (ICC) que describe una coherencia entre un primer y un
segundo canal de los al menos dos canales y un parámetro de nivel
(IID) que describe una diferencia de nivel entre el primer y el
segundo canal, como parámetros espaciales, que comprende:
- \quad
- un limitador (144) para limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y
- \quad
- un mezclador (142) ascendente para derivar una reconstrucción de la señal de audio original a partir de la señal de mezcla descendente y la señal residual utilizando una regla de mezcla ascendente que depende del parámetro de coherencia limitado.
\vskip1.000000\baselineskip
31. Método para transmitir o grabar audio,
teniendo el método un método para codificar una señal de audio que
tiene al menos dos canales, comprendiendo el método:
- \quad
- derivar un parámetro de coherencia (ICC) que describe una coherencia entre un primer y un segundo canal de los al menos dos canales y un parámetro de nivel (IID) que describe una diferencia de nivel entre el primer y el segundo canal, como parámetros espaciales;
- \quad
- limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y
- \quad
- derivar una señal de mezcla descendente y una señal residual a partir de la señal de audio utilizando una regla de mezcla descendente que depende del parámetro de coherencia limitado.
\vskip1.000000\baselineskip
32. Método para recibir o reproducir audio,
teniendo el método un método para decodificar una señal de audio
codificada que representa una señal de audio original que tiene al
menos dos canales, teniendo la señal de audio codificada una señal
de mezcla descendente y una señal residual así como un parámetro de
coherencia (ICC) que describe una coherencia entre un primer y un
segundo canal de los al menos dos canales y un parámetro de nivel
(IID) que describe una diferencia de nivel entre el primer y el
segundo canal, como parámetros espaciales, comprendiendo el
método:
- \quad
- limitar el parámetro de coherencia para derivar un parámetro de coherencia limitado, en el que el límite del parámetro de coherencia depende del parámetro de nivel y de un factor de escala; y
- \quad
- derivar una reconstrucción de la señal de audio original a partir de la señal de mezcla descendente y la señal residual utilizando una regla de mezcla ascendente que depende del parámetro de coherencia limitado.
\vskip1.000000\baselineskip
33. Sistema de transmisión que tiene un
transmisor y un receptor,
- \quad
- comprendiendo el transmisor un codificador (10) de audio para codificar una señal de audio según cualquiera de las reivindicaciones 1 a 14; y
- \quad
- comprendiendo el receptor un decodificador (140) de audio según cualquiera de las reivindicaciones 15 a 26.
\vskip1.000000\baselineskip
34. Método para transmisión y recepción,
comprendiendo el método:
- \quad
- un método de transmisión que comprende un método para codificar una señal de audio según la reivindicación 27; y
- \quad
- un método de recepción que comprende un método para decodificar una señal de audio codificada según la reivindicación 28.
\vskip1.000000\baselineskip
35. Programa informático para realizar, cuando
se ejecuta en un ordenador, un método según cualquiera de las
reivindicaciones de método 27, 28, 31, 32 ó 34.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US247555 | 1981-03-25 | ||
US67158105P | 2005-04-15 | 2005-04-15 | |
US671581P | 2005-04-15 | ||
US11/247,555 US7751572B2 (en) | 2005-04-15 | 2005-10-11 | Adaptive residual audio coding |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2338918T3 true ES2338918T3 (es) | 2010-05-13 |
Family
ID=36589009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES06742550T Active ES2338918T3 (es) | 2005-04-15 | 2006-04-07 | Codificacion de audio residual adaptativa. |
Country Status (16)
Country | Link |
---|---|
US (1) | US7751572B2 (es) |
EP (1) | EP1869668B1 (es) |
JP (1) | JP4685925B2 (es) |
KR (1) | KR100955361B1 (es) |
CN (1) | CN101160619B (es) |
AT (1) | ATE454693T1 (es) |
BR (1) | BRPI0612218B1 (es) |
DE (1) | DE602006011591D1 (es) |
ES (1) | ES2338918T3 (es) |
HK (1) | HK1110985A1 (es) |
MX (1) | MX2007012686A (es) |
MY (1) | MY147609A (es) |
PL (1) | PL1869668T3 (es) |
RU (1) | RU2380766C2 (es) |
TW (1) | TWI303411B (es) |
WO (1) | WO2006108573A1 (es) |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL2175671T3 (pl) * | 2004-07-14 | 2012-10-31 | Koninl Philips Electronics Nv | Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
CN101147191B (zh) * | 2005-03-25 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
WO2006126844A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
JP4988716B2 (ja) * | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
US8019614B2 (en) * | 2005-09-02 | 2011-09-13 | Panasonic Corporation | Energy shaping apparatus and energy shaping method |
WO2007032648A1 (en) * | 2005-09-14 | 2007-03-22 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
WO2007046659A1 (en) * | 2005-10-20 | 2007-04-26 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
TWI329462B (en) * | 2006-01-19 | 2010-08-21 | Lg Electronics Inc | Method and apparatus for processing a media signal |
JP5054035B2 (ja) * | 2006-02-07 | 2012-10-24 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
FR2898725A1 (fr) * | 2006-03-15 | 2007-09-21 | France Telecom | Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale |
EP2005420B1 (fr) * | 2006-03-15 | 2011-10-26 | France Telecom | Dispositif et procede de codage par analyse en composante principale d'un signal audio multi-canal |
US8027479B2 (en) | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
US20080235006A1 (en) * | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
EP2595152A3 (en) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Transkoding apparatus |
EP3145200A1 (en) | 2007-01-12 | 2017-03-22 | ActiveVideo Networks, Inc. | Mpeg objects and systems and methods for using mpeg objects |
US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
EP3712888B1 (en) * | 2007-03-30 | 2024-05-08 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi object audio signal with multi channel |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
WO2009050896A1 (ja) * | 2007-10-16 | 2009-04-23 | Panasonic Corporation | ストリーム合成装置、復号装置、方法 |
MX2010004220A (es) | 2007-10-17 | 2010-06-11 | Fraunhofer Ges Forschung | Codificacion de audio usando mezcla descendente. |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
WO2009086174A1 (en) | 2007-12-21 | 2009-07-09 | Srs Labs, Inc. | System for adjusting perceived loudness of audio signals |
JP5243556B2 (ja) | 2008-01-01 | 2013-07-24 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
AU2008344132B2 (en) * | 2008-01-01 | 2012-07-19 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP2248263B1 (en) * | 2008-01-31 | 2012-12-26 | Agency for Science, Technology And Research | Method and device of bitrate distribution/truncation for scalable audio coding |
CN101960514A (zh) * | 2008-03-14 | 2011-01-26 | 日本电气株式会社 | 信号分析控制系统及其方法、信号控制装置及其方法和程序 |
BRPI0908630B1 (pt) | 2008-05-23 | 2020-09-15 | Koninklijke Philips N.V. | Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador |
JP5383676B2 (ja) * | 2008-05-30 | 2014-01-08 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
US8473288B2 (en) * | 2008-06-19 | 2013-06-25 | Panasonic Corporation | Quantizer, encoder, and the methods thereof |
WO2010005050A1 (ja) * | 2008-07-11 | 2010-01-14 | 日本電気株式会社 | 信号分析装置、信号制御装置及びその方法と、プログラム |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
KR101614160B1 (ko) * | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
FR2936898A1 (fr) * | 2008-10-08 | 2010-04-09 | France Telecom | Codage a echantillonnage critique avec codeur predictif |
JP5608660B2 (ja) * | 2008-10-10 | 2014-10-15 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
KR101271972B1 (ko) | 2008-12-11 | 2013-06-10 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 다채널 오디오 신호를 생성하기 위한 장치 |
US20120121091A1 (en) * | 2009-02-13 | 2012-05-17 | Nokia Corporation | Ambience coding and decoding for audio applications |
JP5564803B2 (ja) * | 2009-03-06 | 2014-08-06 | ソニー株式会社 | 音響機器及び音響処理方法 |
KR101433701B1 (ko) | 2009-03-17 | 2014-08-28 | 돌비 인터네셔널 에이비 | 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩 |
ES2452569T3 (es) | 2009-04-08 | 2014-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase |
KR101387808B1 (ko) * | 2009-04-15 | 2014-04-21 | 한국전자통신연구원 | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 |
US20120053949A1 (en) * | 2009-05-29 | 2012-03-01 | Nippon Telegraph And Telephone Corp. | Encoding device, decoding device, encoding method, decoding method and program therefor |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
WO2011013381A1 (ja) * | 2009-07-31 | 2011-02-03 | パナソニック株式会社 | 符号化装置および復号装置 |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
KR101613975B1 (ko) * | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
WO2011029984A1 (en) * | 2009-09-11 | 2011-03-17 | Nokia Corporation | Method, apparatus and computer program product for audio coding |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
CN102696070B (zh) * | 2010-01-06 | 2015-05-20 | Lg电子株式会社 | 处理音频信号的设备及其方法 |
JP5604933B2 (ja) | 2010-03-30 | 2014-10-15 | 富士通株式会社 | ダウンミクス装置およびダウンミクス方法 |
CA3097372C (en) | 2010-04-09 | 2021-11-30 | Dolby International Ab | Mdct-based complex prediction stereo coding |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US9237400B2 (en) * | 2010-08-24 | 2016-01-12 | Dolby International Ab | Concealment of intermittent mono reception of FM stereo radio receivers |
US8885701B2 (en) * | 2010-09-08 | 2014-11-11 | Samsung Electronics Co., Ltd. | Low complexity transform coding using adaptive DCT/DST for intra-prediction |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
CA2814070A1 (en) | 2010-10-14 | 2012-04-19 | Activevideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
TWI462087B (zh) * | 2010-11-12 | 2014-11-21 | Dolby Lab Licensing Corp | 複數音頻信號之降混方法、編解碼方法及混合系統 |
CN102056053B (zh) * | 2010-12-17 | 2015-04-01 | 中兴通讯股份有限公司 | 一种多话筒混音方法及装置 |
US9204203B2 (en) | 2011-04-07 | 2015-12-01 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
UA107771C2 (en) * | 2011-09-29 | 2015-02-10 | Dolby Int Ab | Prediction-based fm stereo radio noise reduction |
WO2013106390A1 (en) | 2012-01-09 | 2013-07-18 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
KR20140017338A (ko) * | 2012-07-31 | 2014-02-11 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 장치 및 방법 |
MX351193B (es) | 2012-08-10 | 2017-10-04 | Fraunhofer Ges Forschung | Codificador, decodificador, sistema y metodo que emplean un concepto residual para codificar objetos de audio parametricos. |
CN103067629B (zh) * | 2013-01-18 | 2014-10-29 | 苏州科达科技股份有限公司 | 回声消除装置 |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
KR101775084B1 (ko) * | 2013-01-29 | 2017-09-05 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법 |
US10275128B2 (en) | 2013-03-15 | 2019-04-30 | Activevideo Networks, Inc. | Multiple-mode system and method for providing user selectable video content |
US9679571B2 (en) * | 2013-04-10 | 2017-06-13 | Electronics And Telecommunications Research Institute | Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal |
JP6248186B2 (ja) | 2013-05-24 | 2017-12-13 | ドルビー・インターナショナル・アーベー | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
EP3005712A1 (en) | 2013-06-06 | 2016-04-13 | ActiveVideo Networks, Inc. | Overlay rendering of user interface onto source video |
US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
EP3023984A4 (en) * | 2013-07-15 | 2017-03-08 | Electronics and Telecommunications Research Institute | Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
WO2015036350A1 (en) | 2013-09-12 | 2015-03-19 | Dolby International Ab | Audio decoding system and audio encoding system |
TWI579831B (zh) | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
CN104768121A (zh) | 2014-01-03 | 2015-07-08 | 杜比实验室特许公司 | 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频 |
US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
CN105989851B (zh) | 2015-02-15 | 2021-05-07 | 杜比实验室特许公司 | 音频源分离 |
ES2904275T3 (es) | 2015-09-25 | 2022-04-04 | Voiceage Corp | Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo |
US9978381B2 (en) * | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
CN109644315A (zh) * | 2017-02-17 | 2019-04-16 | 无比的优声音科技公司 | 用于缩混多声道音频信号的设备和方法 |
EP3669556B1 (en) * | 2017-10-16 | 2022-06-08 | Sony Europe B.V. | Audio processing |
EP3550561A1 (en) | 2018-04-06 | 2019-10-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
CN110556117B (zh) * | 2018-05-31 | 2022-04-22 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
CN114420139A (zh) * | 2018-05-31 | 2022-04-29 | 华为技术有限公司 | 一种下混信号的计算方法及装置 |
RU2769429C2 (ru) * | 2018-08-17 | 2022-03-31 | Нокиа Текнолоджиз Ой | Кодер звукового сигнала |
GB2578625A (en) | 2018-11-01 | 2020-05-20 | Nokia Technologies Oy | Apparatus, methods and computer programs for encoding spatial metadata |
GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
DE4236989C2 (de) | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
US6036878A (en) * | 1996-02-02 | 2000-03-14 | Applied Materials, Inc. | Low density high frequency process for a parallel-plate electrode plasma reactor having an inductive antenna |
SG54379A1 (en) | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
EP1173925B1 (en) | 1999-04-07 | 2003-12-03 | Dolby Laboratories Licensing Corporation | Matrixing for lossless encoding and decoding of multichannels audio signals |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
JP2002076904A (ja) | 2000-09-04 | 2002-03-15 | Victor Co Of Japan Ltd | 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置 |
KR20020070373A (ko) | 2000-11-03 | 2002-09-06 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호들의 사인 곡선 모델 기초 코딩 |
JP2002175097A (ja) | 2000-12-06 | 2002-06-21 | Yamaha Corp | 音声信号のエンコード/圧縮装置およびデコード/伸長装置 |
JP3951690B2 (ja) | 2000-12-14 | 2007-08-01 | ソニー株式会社 | 符号化装置および方法、並びに記録媒体 |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
CN1705980A (zh) | 2002-02-18 | 2005-12-07 | 皇家飞利浦电子股份有限公司 | 参数音频编码 |
CN1311426C (zh) | 2002-04-10 | 2007-04-18 | 皇家飞利浦电子股份有限公司 | 立体声信号的编码、解码方法和装置及其传输设备 |
BR0304231A (pt) | 2002-04-10 | 2004-07-27 | Koninkl Philips Electronics Nv | Métodos para codificação de um sinal de canais múltiplos, método e disposição para decodificação de informação de sinal de canais múltiplos, sinal de dados incluindo informação de sinal de canais múltiplos, meio legìvel por computador, e, dispositivo para comunicação de um sinal de canais múltiplos |
DE60326782D1 (de) | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
JP2003330497A (ja) | 2002-05-15 | 2003-11-19 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体 |
CN1231889C (zh) * | 2002-11-19 | 2005-12-14 | 华为技术有限公司 | 多通道声码器的语音处理方法 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
-
2005
- 2005-10-11 US US11/247,555 patent/US7751572B2/en active Active
-
2006
- 2006-04-07 MX MX2007012686A patent/MX2007012686A/es active IP Right Grant
- 2006-04-07 DE DE602006011591T patent/DE602006011591D1/de active Active
- 2006-04-07 WO PCT/EP2006/003200 patent/WO2006108573A1/en active Application Filing
- 2006-04-07 BR BRPI0612218-3A patent/BRPI0612218B1/pt active IP Right Grant
- 2006-04-07 RU RU2007142177/09A patent/RU2380766C2/ru active
- 2006-04-07 AT AT06742550T patent/ATE454693T1/de not_active IP Right Cessation
- 2006-04-07 KR KR1020077023341A patent/KR100955361B1/ko active IP Right Grant
- 2006-04-07 JP JP2008505784A patent/JP4685925B2/ja active Active
- 2006-04-07 CN CN2006800121211A patent/CN101160619B/zh active Active
- 2006-04-07 PL PL06742550T patent/PL1869668T3/pl unknown
- 2006-04-07 EP EP06742550A patent/EP1869668B1/en active Active
- 2006-04-07 ES ES06742550T patent/ES2338918T3/es active Active
- 2006-04-12 TW TW095113074A patent/TWI303411B/zh active
- 2006-04-12 MY MYPI20061673A patent/MY147609A/en unknown
-
2008
- 2008-05-05 HK HK08104988.8A patent/HK1110985A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
DE602006011591D1 (de) | 2010-02-25 |
CN101160619B (zh) | 2011-09-07 |
MX2007012686A (es) | 2008-03-14 |
CN101160619A (zh) | 2008-04-09 |
PL1869668T3 (pl) | 2010-06-30 |
WO2006108573A1 (en) | 2006-10-19 |
HK1110985A1 (en) | 2008-07-25 |
JP4685925B2 (ja) | 2011-05-18 |
KR20070120527A (ko) | 2007-12-24 |
TW200643897A (en) | 2006-12-16 |
JP2008536184A (ja) | 2008-09-04 |
RU2380766C2 (ru) | 2010-01-27 |
US7751572B2 (en) | 2010-07-06 |
EP1869668A1 (en) | 2007-12-26 |
ATE454693T1 (de) | 2010-01-15 |
BRPI0612218A2 (pt) | 2010-10-26 |
US20060233379A1 (en) | 2006-10-19 |
BRPI0612218B1 (pt) | 2021-03-02 |
EP1869668B1 (en) | 2010-01-06 |
MY147609A (en) | 2012-12-31 |
TWI303411B (en) | 2008-11-21 |
KR100955361B1 (ko) | 2010-04-29 |
RU2007142177A (ru) | 2009-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2338918T3 (es) | Codificacion de audio residual adaptativa. | |
JP5260665B2 (ja) | ダウンミックスを用いたオーディオコーディング | |
JP5934922B2 (ja) | 復号装置 | |
TWI431610B (zh) | 用以將以物件為主之音訊信號編碼與解碼之方法與裝置 | |
ES2690278T3 (es) | Concepto para puentear el espacio entre codificación parámetrica de audio multicanal y codificación multicanal envolvente matricial | |
ES2307160T3 (es) | Codificador multicanal. | |
ES2658824T3 (es) | Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia | |
US8712784B2 (en) | Encoding method and encoding device, decoding method and decoding device and transcoding method and transcoder for multi-object audio signals | |
JP6978565B2 (ja) | マルチチャネル・オーディオ・コンテンツの符号化 | |
US20080052089A1 (en) | Acoustic Signal Encoding Device and Acoustic Signal Decoding Device | |
US20120183148A1 (en) | System for multichannel multitrack audio and audio processing method thereof | |
CN1826635B (zh) | 音频文件格式转换 |