ES2297825T3 - Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. - Google Patents

Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. Download PDF

Info

Publication number
ES2297825T3
ES2297825T3 ES06724214T ES06724214T ES2297825T3 ES 2297825 T3 ES2297825 T3 ES 2297825T3 ES 06724214 T ES06724214 T ES 06724214T ES 06724214 T ES06724214 T ES 06724214T ES 2297825 T3 ES2297825 T3 ES 2297825T3
Authority
ES
Spain
Prior art keywords
parameter
channel
channels
energy
measure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06724214T
Other languages
English (en)
Inventor
Jonas Roeden
Jonas Engdegard
Heiko Purnhagen
Jeroen Breebaart
Erik Schuijers
Steven Van De Par
Johannes Hilpert
Jurgen Herre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Koninklijke Philips NV
Coding Technologies Sweden AB
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Koninklijke Philips Electronics NV
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Koninklijke Philips Electronics NV, Coding Technologies Sweden AB filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2297825T3 publication Critical patent/ES2297825T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

Cuantificador de parámetros para cuantificar un parámetro de entrada, el que el parámetro de entrada es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, que comprende: un generador de reglas de cuantificación para generar una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y un cuantificador de valores para obtener un parámetro cuantificado a partir del parámetro de entrada, utilizando la regla de cuantificación generada.

Description

Cuantificación dependiente de energía para la codificación eficaz de parámetros de audio espaciales.
Campo de la invención
La presente invención se refiere a cuantificación de parámetros de audio espaciales y en particular a un concepto para permitir una compresión más eficaz sin reducir de manera significativa la calidad de percepción de una señal de audio reconstruida utilizando los parámetros de audio espaciales cuantificados.
Antecedentes de la invención y técnica anterior
Recientemente, las técnicas de reproducción de audio multicanal son cada vez más importantes. En vista de una transmisión eficaz de señales de audio multicanal que presentan 5 o más canales de audio independientes, se han desarrollado diversas maneras de comprimir una señal estéreo o multicanal. Enfoques recientes para la codificación paramétrica de señales de audio multicanal (estéreo paramétrico (PS, Parametric Stereo), "codificación de indicación binaural" (BCC, Binaural Cue Coding) etc.) representan una señal de audio multicanal por medio de una señal de downmix (conversión de señal envolvente a señal mono o estéreo)(que podría ser monofónica o comprender varios canales) e información secundaria paramétrica, a la que también se hace referencia como "indicaciones espaciales", caracterizando su escenario de sonido espacial percibido.
Un dispositivo de codificación multicanal generalmente recibe, como entrada, al menos dos canales, y emite uno o más canales portadores y datos paramétricos. Los datos paramétricos se obtienen de tal manera que, en un descodificador, puede calcularse una aproximación de la señal multicanal original. Normalmente, el(los) canal(canales) portador(es) incluirá(n) muestras de subbanda, coeficientes espectrales, muestras en el dominio del tiempo, etc., que proporcionan una representación comparativamente precisa de la señal subyacente, mientras que los datos paramétricos no incluyen tales muestras de coeficientes espectrales sino que incluyen parámetros de control para controlar en su lugar un cierto algoritmo de reconstrucción. Una reconstrucción de este tipo podría comprender ponderación mediante multiplicación, desplazamiento en el tiempo, desplazamiento de frecuencia, desplazamiento de fase, etc. Por tanto, los datos paramétricos incluyen sólo una representación comparativamente basta de la señal o el canal asociado.
La técnica de codificación de indicación binaural (BCC) se describe en un número de publicaciones, como en "Binaural Cue Coding applied to Stereo and Multi-Canal Audio Compression", C. Faller, F. Baumgarte, convención AES, documento 5574, mayo de 2002, Munich, en las 2 publicaciones de ICASSP "Estimation of auditory spatial cues for binaural cue coding", y "Binaural cue coding: a normal and efficient representación of spatial audio", ambas escritas por C. Faller y F. Baumgarte, Orlando, FL, mayo de 2002.
En la codificación BCC, un número de canales de entrada de audio se convierten a una representación espectral utilizando una transformada basándose en DFT (transformada discreta de Fourier, Discrete Fourier Transform) con ventanas superpuestas. El espectro uniforme resultante se divide entonces en particiones no superpuestas. Cada partición presenta un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB, Equivalent Rectangular Bandwidth). Entonces, se estiman los parámetros espaciales llamados ICLD (diferencia de nivel entre canales, Inter-Channel Level Difference) e ICTD (diferencia de tiempo entre canales, Inter-Channel Time Difference) para cada partición. El parámetro ICLD describe una diferencia de nivel entre dos canales y el parámetro ICTD describe la diferencia de tiempo (desfase) entre dos señales de diferentes canales. Las diferencias de nivel y las diferencias de tiempo se dan normalmente para cada canal con respecto a un canal de referencia. Después de la obtención de estos parámetros, los parámetros se cuantifican y finalmente se codifican para su transmisión.
Aunque los parámetros ICLD e ICTD representan los parámetros de localización de fuente de sonido más importantes, una representación espacial que utiliza estos parámetros puede mejorarse introduciendo parámetros adicionales.
Una técnica relacionada, llamada "estéreo paramétrico" describe la codificación paramétrica de una señal estéreo de dos canales basándose en una señal mono transmitida más información secundaria de parámetros. En este caso, se introducen 3 tipos de parámetros espaciales, a los que se hace referencia como diferencia de intensidad entre canales (IID, Inter-Channel Intensity Difference), diferencias de fase entre canales (IPD, Inter-Channel Phase Differences) y coherencia entre canales (IC, Inter-Channel Coherence). La ampliación del conjunto de parámetros espaciales con un parámetro de coherencia (parámetro de correlación) permite una parametrización de la "difusividad" espacial o "compacidad" espacial percibida del escenario de sonido. El estéreo paramétrico se describe con más detalle en: "Parametric Coding of stereo audio", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Señal Proc. 9, páginas 1305 a 1322)'', en "High-Quality Parametric Spatial Audio Coding at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, 116ª convención AES, edición preliminar 6072, Berlín, mayo de 2004, y en "Low Complexity Parametric Stereo Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, 116ª convención AES, edición preliminar 6073, Berlín, mayo de 2004.
La publicación internacional WO 2004/008805 A1 enseña cómo una señal de audio multicanal puede comprimirse de manera ventajosa combinando varios módulos de estéreo paramétrico, realizando por tanto una estructura jerárquica para obtener una representación de la señal de audio multicanal original que comprende una señal de downmix e información secundaria paramétrica.
Dentro del enfoque de BCC y estéreo paramétrico (PS), una representación de las diferencias de nivel (llamadas también diferencias de intensidad ICLD o diferencias de energía IID) entre canales de audio es una parte vital de una representación paramétrica de una señal de audio estereofónica/multicanal. Tal información y otros parámetros espaciales se transmiten desde el codificador al descodificador para cada ranura de tiempo/frecuencia. En vista de la eficacia de codificación, es por lo tanto de gran interés representar estos parámetros tan compactamente como sea posible mientras se conserva la calidad de audio.
En codificación BCC, las diferencias de nivel se representan con respecto a un denominado "canal de referencia" y se cuantifican sobre una escala uniforme en unidades de dB con respecto a un canal de referencia. Esto no aprovecha óptimamente el hecho de que los canales con bajo nivel con respecto al canal de referencia están sometidos a un efecto de enmascaramiento significativo cuando los escuchan oyentes humanos. En el caso extremo de una canal que no presenta ninguna señal, el ancho de banda utilizado por parámetros que describen este canal particular está completamente desaprovechado. En el caso más común en el que un canal es mucho más débil que otro canal, es decir, un oyente difícilmente puede oír el canal débil durante la reproducción, una reproducción menos precisa del canal débil también llevaría a la misma calidad de percepción del oyente, puesto que la señal débil está enmascarada principalmente por la señal más fuerte.
Para explicar la situación y los problemas que surgen cuando se codifica una señal multicanal, se hace referencia a la figura 10a en la que se ilustra una señal de 5 canales comúnmente utilizada. La configuración de 5 canales presenta un canal 101 trasero izquierdo (A, que presenta una señal a(t)), un canal 102 delantero izquierdo (B, que presenta una señal b(t)), un canal 103 central (C, que presenta una señal c(t)), un canal 104 delantero derecho (D, que presenta una señal d(t)) y un canal 105 posterior derecho (E, que presenta una señal e(t)). Las relaciones de intensidad entre únicos canales o pares de canales están marcadas con flechas. Por tanto, la distribución de intensidad entre el canal 102 delantero izquierdo y el canal 104 delantero derecho se marca con r_{1} (110), la distribución de intensidad entre el canal posterior izquierdo y el canal posterior derecho se marca con r_{4} (112). La distribución de intensidad entre la combinación del canal 102 delantero izquierdo y el canal 104 delantero derecho y el canal 103 central se marca con r_{2} (114) y la distribución de intensidad entre la combinación de los canales posteriores y la combinación de los canales delanteros se marca con r_{3} (116).
Cuando, por ejemplo, se graba un simple monólogo, la mayor parte de la energía estaría contenida en el canal 103 central. En este ejemplo, especialmente los canales posteriores sólo contendrán poca energía (o 0). Por lo tanto, los parámetros que describen las propiedades de los canales posteriores simplemente se desaprovechan en este ejemplo, puesto que principalmente el canal 102 central o los canales delanteros estarán activos durante la reproducción.
Basándose en la figura 10a, las maneras de calcular la distribución de energía entre canales o combinaciones de canales se describen en el siguiente párrafo.
La figura 10a ilustra una parametrización multicanal para una configuración de altavoces de cinco canales en la que los diferentes canales de audio se indican por 101 a 105; a(t) 101 representa la señal del canal envolvente izquierdo, b(t) 102 representa la señal del canal delantero izquierdo, c(t) 103 representa la señal del canal central, d(t) 104 representa la señal del canal delantero derecho, e(t) 105 representa la señal del canal envolvente derecho. La configuración de altavoces está dividida en una parte delantera y una parte posterior. La distribución de energía entre toda la configuración de canales (102, 103 y 104) delanteros y los canales (101 y 105) posteriores se ilustra mediante la flecha en figura 10a y se indica mediante el parámetro r_{3}. La distribución de energía entre el canal 103 central y los canales delantero izquierdo 102 y delantero derecho 103 se indica mediante r_{2}. La distribución de energía entre el canal 101 envolvente izquierdo y el canal 105 envolvente derecho se ilustra mediante r_{4}. Finalmente, la distribución de energía entre el canal 102 delantero izquierdo y el canal 104 delantero derecho viene dada por r_{1}. Puesto que r_{1} a r_{4} son parametrizaciones de diferentes regiones también está claro que aparte de la distribución de energía también pueden parametrizarse otras propiedades de regiones esenciales, como por ejemplo la correlación entre las regiones. Adicionalmente, puede calcularse una energía local para cada parámetro r_{1} a r_{4}. Por ejemplo, la energía local de r_{4} es la energía sumada del canal A 101 y E 105.
Energía Local_{r4} = E[a^{2} (t)] + E[e^{2} (t)].
Donde E[.] es el valor esperado según se define por
E[f(x)] = \frac{1}{T} \int\limits^{T}_{0} f(x(t))dt.
La figura 10b muestra un descodificador de audio multicanal construido mediante módulos de estéreo paramétrico de orden jerárquico, tal como se describe, por ejemplo en el documento WO 2004/008805 A1. En este caso, los canales 101 a 105 de audio, tal como se introducen en la figura 10a, se reproducen etapa a etapa a partir de una única señal 120 (M) de downmix monofónica e información secundaria correspondiente mediante un primer descodificador 122 de dos canales, un segundo descodificador 124 de dos canales, un tercer descodificador 126 de dos canales y un cuarto descodificador 128 de dos canales. Tal como puede observarse, en la estructura a modo de árbol de la figura 10b, el primer descodificador de dos canales descompone la señal 120 de downmix monofónica en dos señales alimentadas al segundo y al tercer descodificador 124 y 126 de dos canales. En los mismos, el canal alimentado al tercer descodificador 126 de dos canales es un canal combinado, combinándose a partir del canal 101 posterior izquierdo y del canal 105 posterior derecho. El canal alimentado al segundo descodificador 124 de dos canales es una combinación del canal 103 central y un canal combinado que es de nuevo una combinación del canal 102 delantero izquierdo y del canal 104 delantero derecho.
Por tanto, después de la segunda etapa de la descodificación jerárquica, se reconstruyen el canal 101 posterior izquierdo, el canal 105 posterior derecho, el canal 103 central y un canal combinado, que es una combinación del canal 102 delantero izquierdo y del canal 104 delantero derecho, utilizando los parámetros espaciales transmitidos, que comprenden un parámetro de nivel para su uso por cada uno de los descodificadores 122, 124, y 126 de dos canales.
En la tercera etapa de la descodificación jerárquica, el cuarto descodificador 128 de dos canales obtiene el canal 102 delantero izquierdo y el canal 104 delantero derecho, utilizando una información de nivel transmitida como información secundaria para el cuarto descodificador 128 de dos canales. Utilizando un descodificador jerárquico de la técnica anterior tal como se muestra en la figura 10b, la energía deseada para cada único canal de salida se deduce a partir de diversos módulos de estéreo paramétrico diferentes entre la señal de entrada y cada señal de salida. Dicho de otro modo, la energía de un canal de salida específico puede depender de los parámetros IID/ICLD de múltiples módulos de estéreo paramétrico. En una estructura a modo de árbol de este tipo de módulos de estéreo paramétrico conectados, también puede aplicarse una cuantificación no uniforme de parámetros IID dentro de cada módulo de estéreo paramétrico para producir valores IID, que se utilizan entonces por un descodificador como parte de la información secundaria. Esto aprovecharía localmente los beneficios de cuantificación IID no uniforme (es decir, dentro de cada módulo de estéreo paramétrico individualmente), aunque no es del todo óptimo ya que la cuantificación en cada módulo ("hojas") se lleva a cabo independientemente de las energías/nivel de otros canales de audio que pueden ser altos a nivel relativo y, por lo tanto, se produce enmascaramiento.
Esto es posible, puesto que los módulos "hoja" no son conscientes de la distribución de nivel global en un nivel del árbol superior (por ejemplo, el módulo "raíz"). Cada hoja presenta su propio parámetro IID/ICLD correspondiente, que indica la distribución de energía desde su entrada hacia los canales de salida. Por ejemplo, el parámetro IID/ICLD de la hoja "r_{3}" (procesado por el primer descodificador 122 de dos canales) puede indicar que el 90 % de la energía entrante debería enviarse a la hoja r_{2}, mientras que la energía restante (10 %) debería enviarse a la hoja r_{4}. Este proceso se repite para cara hoja en el árbol. Puesto que cada parámetro de distribución de energía se representa con precisión limitada, la desviación entre la energía deseada y la real de cada canal A a E de salida depende de los errores de cuantificación en los parámetros IID/ICLD, así como de la distribución de energía (y por tanto de la propagación de errores de cuantificación). Dicho de otro modo, como se utiliza la misma tabla de cuantificación para un cierto tipo de parámetros, por ejemplo, ICC o IID, en todos los escenarios r_{1} a r_{4} de parametrización, la cuantificación IID/ICLD se realiza de manera óptima sólo locamente. Esto significa que para cada escenario r_{1} a r_{4} de parametrización, el error en la energía de salida de los canales de salida (locales) es máximo para el canal de salida más débil en implementaciones de la técnica anterior.
Tal como se detalla en los párrafos anteriores, la cuantificación de parámetros de nivel (IID o ICLD) u otros parámetros tales como ICC, diferencias de fase o diferencias en el tiempo que describen la percepción espacial de una señal de audio multicanal no es todavía del todo óptima, puesto que puede desaprovecharse ancho de banda para parámetros espaciales que describen canales que están fundamentalmente enmascarados debido a la baja energía en el canal.
Sumario de la invención
Es el objetivo de la presente invención proporcionar un concepto mejorado para la cuantificación de parámetros espaciales de una señal de audio multicanal.
Según un primer aspecto de la presente invención, este objetivo se consigue mediante un cuantificador de parámetros para cuantificar un parámetro de entrada, en el que el parámetro de entrada es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, que comprende: un generador de reglas de cuantificación para generar una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y un cuantificador de valores para obtener un parámetro cuantificado a partir del parámetro de entrada, utilizando la regla de cuantificación generada.
Según un segundo aspecto de la presente invención, este objetivo se consigue mediante un descuantificador de parámetros para descuantificar un parámetro cuantificado para obtener un parámetro, en el que el parámetro es una medida para una característica de un único canal o un par canales con respecto a otro único canal o un par de canales de una señal multicanal, que comprende: un generador de reglas de descuantificación para generar una regla de descuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y un descuantificador de valores para obtener el parámetro a partir del parámetro cuantificado, utilizando la regla de descuantificación generada.
\newpage
Según un tercer aspecto de la presente invención, este objetivo se consigue mediante un método de cuantificación de un parámetro de entrada, en el que el parámetro de entrada es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, comprendiendo el método: generar una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y obtener un parámetro cuantificado a partir del parámetro de entrada utilizando la regla de cuantificación generada.
Según un cuarto aspecto de la presente invención, este objetivo se consigue mediante un método de descuantificación de un parámetro cuantificado para obtener un parámetro, en el que el parámetro es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, comprendiendo el método: generar una regla de descuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y obtener el parámetro a partir del parámetro cuantificado utilizando la regla de descuantificación generada.
Según un quinto aspecto de la presente invención, este objetivo se consigue mediante una representación de una señal multicanal que presenta un parámetro cuantificado que es una representación cuantificada de un parámetro que es una medida para una característica de un único canal o un par de canales, en la que el parámetro es una medida para una característica del único canal o el par de canales con respecto a otro único canal o un par de canales de una señal multicanal, en la que el parámetro cuantificado se obtiene utilizando una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal.
Según un sexto aspecto de la presente invención, este objetivo se consigue mediante un medio de almacenamiento legible por máquina que tiene almacenado en el mismo una representación de una señal multicanal tal como se describió anteriormente.
Según un séptimo aspecto de la presente invención, este objetivo se consigue mediante un transmisor o grabador de audio que presenta un cuantificador de parámetros para cuantificar un parámetro de entrada, en el que el parámetro de entrada es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, que comprende: un generador de reglas de cuantificación para generar una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y un cuantificador de valores para obtener un parámetro cuantificado a partir del parámetro de entrada, utilizando la regla de cuantificación generada.
Según un octavo aspecto de la presente invención, este objetivo se consigue mediante un receptor o reproductor de audio que presenta un descuantificador de parámetros para descuantificar un parámetro cuantificado para obtener un parámetro, en el que el parámetro es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, que comprende: un generador de reglas de descuantificación para generar una regla de descuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y un descuantificador de valores para obtener el parámetro a partir del parámetro cuantificado, utilizando la regla de descuantificación generada.
Según un noveno aspecto de la presente invención, este objetivo se consigue mediante un método de transmisión o grabación de audio, comprendiendo el método un método de cuantificación de un parámetro de entrada, en el que el parámetro de entrada es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, comprendiendo el método: generar una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y obtener un parámetro cuantificado a partir del parámetro de entrada utilizando la regla de cuantificación generada.
Según un décimo aspecto de la presente invención, este objetivo se consigue mediante un método de recepción o reproducción de audio, presentando el método un método de descuantificación de un parámetro cuantificado para obtener un parámetro, en el que el parámetro es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, comprendiendo el método: generar una regla de descuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y obtener el parámetro a partir del parámetro cuantificado utilizando la regla de descuantificación generada.
Según un undécimo aspecto de la presente invención, este objetivo se consigue mediante un sistema de transmisión que presenta un transmisor y un receptor, presentando el transmisor un cuantificador de parámetros para cuantificar un parámetro de entrada; y presentando el receptor un descuantificador de parámetros para descuantificar un parámetro cuantificado.
Según un duodécimo aspecto de la presente invención, este objetivo se consigue mediante un método de transmisión y recepción, incluyendo el método un método de transmisión que presenta un método de cuantificación de un parámetro de entrada; e incluyendo el método un método de recepción que incluye un método de descuantificación de un parámetro cuantificado.
\newpage
Según un decimotercero aspecto de la presente invención, este objetivo se consigue mediante un programa informático para realizar, cuando se ejecuta en un ordenador, uno de los métodos anteriores.
La presente invención se basa en el descubrimiento de que los parámetros que son una medida para una característica de un único canal o de un par de canales con respecto a otro único canal o de un par de canales de una señal multicanal pueden cuantificarse más eficazmente utilizando una regla de cuantificación que se genera basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal.
El concepto inventivo presenta la ventaja principal de que o bien se genera una regla de cuantificación o bien se selecciona una regla de cuantificación apropiada a partir de un grupo de reglas de cuantificación disponibles, dependiendo de la energía de la señal que va a describirse. Por lo tanto, puede aplicarse un modelo psicoacústico a un cuantificador durante la codificación o a un descuantificador durante la descodificación, para utilizar una regla de cuantificación adaptada a las necesidades de la señal real. Especialmente, cuando un canal contiene muy poca energía comparado con otros canales en la señal multicanal, la cuantificación puede ser mucho más basta que para señales que presentan altas energías. Esto se debe al hecho que las señales de alta energía enmascaran las señales de baja energía durante la reproducción, es decir, un oyente difícilmente reconocerá algún detalle de la señal de baja energía y por tanto la señal de baja energía puede deteriorarse más a través de la cuantificación basta sin que el oyente pueda reconocer el falseamiento debido al alto enmascaramiento de la señal de baja energía.
En una realización de la presente invención, un cuantificador de parámetros para cuantificar parámetros presenta un generador de reglas de cuantificación para generar una regla de cuantificación y un cuantificador de valores para obtener parámetros cuantificados a partir de parámetros de entrada utilizando la regla de cuantificación generada. Para generar una regla de cuantificación apropiada, el selector de cuantificador recibe como una entrada la energía total de la señal de audio multicanal que va a codificarse y la energía local del canal o el par de canales cuyos parámetros espaciales van a cuantificarse. Conociendo la energía total y la energía local, el selector de cuantificador puede decidir qué regla de cuantificación utilizar, es decir, seleccionar reglas de cuantificación más bastas para canales o pares de canales que presentan energía local comparativamente baja. Como alternativa, el selector de cuantificador también podría obtener una regla algorítmica para modificar una regla de cuantificación existente o para calcular una regla de cuantificación completamente nueva dependiendo de la energía local y la total. Una posibilidad sería por ejemplo calcular un factor de escala general para aplicarse a una señal antes de un cuantificador lineal o un cuantificador no lineal para conseguir el objetivo de reducir el tamaño de la información secundaria que va a transmitirse.
En una realización adicional de la presente invención, se codifica una señal multicanal mediante pares, es decir, utilizando una estructura jerárquica que presenta varios elementos de downmix 2 a 1 ordenados en una estructura a modo de árbol, generando cada elemento de downmix un canal mono a partir de dos canales introducidos en el elemento de downmix. Siguiendo el concepto inventivo, ahora puede implementarse la cuantificación dependiente de energía no sólo localmente, es decir, en cada elemento de downmix 2 a 1 que tiene la información disponible solamente en la entrada del elemento de downmix 2 a 1, pero basándose en el conocimiento global de la suma de las energías de las señales. Esto mejora la calidad de percepción de una señal de percepción significativamente.
Es evidente que siguiendo el concepto inventivo, el tamaño de la información secundaria puede disminuirse mientras que difícilmente se ve afectada la calidad de la señal de audio multicanal codificada.
En una realización adicional de la presente invención, se incorpora un cuantificador de parámetros inventivo en un codificador de parámetros antes de un codificador diferencial y un codificador de Huffman, utilizándose ambos para codificar adicionalmente los parámetros cuantificados para obtener un flujo de bits de parámetros. Un codificador inventivo de este tipo tiene la gran ventaja de que además de disminuir el tamaño de palabras de código necesarias para describir los parámetros cuantificados, una cuantificación más basta aumentará automáticamente la abundancia de palabras de código idénticas alimentadas al codificador diferencial y al codificador de Huffman, lo que permite una mejor compresión de los parámetros cuantificados, reduciendo además el tamaño de la información secundaria.
En una realización adicional de la presente invención, un cuantificador de parámetros inventivo presenta un generador de funciones de factor del cuantificador y un multiplicador de parámetros. El generador de funciones de factor del cuantificador recibe la energía total y la local como entrada y obtiene un único valor de elemento de ajuste a escala a partir de las cantidades de entrada. El multiplicador de parámetros recibe los parámetros y el factor f del cuantificador obtenido para dividir los parámetros por el factor del cuantificador antes de transferir los parámetros modificados al cuantificador que aplica una regla de cuantificación fija a los parámetros modificados.
Una variación de esta realización es tener un multiplicador de parámetros después del cuantificador y por tanto utilizar el factor f del cuantificador obtenido para dividir el índice resultante a partir del cuantificador. El resultado de esto necesita entonces redondearse de nuevo a un índice entero.
La aplicación de un factor de escala a los parámetros presenta el mismo efecto que elegir diferentes reglas de cuantificación puesto que, por ejemplo, la división por un factor grande comprime el espacio de parámetros de entrada de tal manera que efectivamente sólo sería efectiva una parte más pequeña de una regla de cuantificación ya existente. Esta solución tiene la ventaja de que en el lado del descodificador y del codificador puede ahorrarse memoria adicional porque sólo hay una regla de cuantificación que ha de almacenarse o ha de procesarse puesto que el ajuste a escala se realiza mediante una simple multiplicación, requiriendo sólo hardware o software adicional limitado. Una ventaja adicional es que aplicando un factor del cuantificador, el factor del cuantificador puede obtenerse utilizando cualquier dependencia funcional posible. Por lo tanto, puede ajustarse la sensibilidad de un cuantificador o de un descuantificador continuamente dentro del espacio de parámetros de entrada posible total en vez de seleccionar reglas de cuantificación predefinidas a partir de una muestra dada.
Breve descripción de los dibujos
Posteriormente se describen realizaciones preferidas de la presente invención haciendo referencia a los dibujos adjuntos, en los que:
la figura 1 muestra un diagrama de bloques de un cuantificador de parámetros inventivo;
las figuras 2a a c muestran varias reglas de cuantificación posibles de aplicar;
la figura 3 muestra un codificador de parámetros que presenta un cuantificador de parámetros inventivo;
las figuras 4a, 4b muestran una realización alternativa de un codificador de parámetros que presenta un cuantificador de parámetros inventivo;
la figura 5 muestra ejemplos de funciones de factor de escala;
la figura 6 muestra una regla de cuantificación no lineal;
la figura 7 muestra un descuantificador de parámetros inventivo;
la figura 8 muestra un descompresor de parámetros que presenta un descuantificador de parámetros inventivo;
la figura 9a muestra una realización de un descuantificador de parámetros inventivo;
la figura 9b muestra una realización adicional de un descuantificador de parámetros inventivo;
la figura 9c muestra un ejemplo para implementar descuantificación dependiente de energía;
la figura 9d muestra un ejemplo adicional para implementar descuantificación dependiente de energía;
la figura 9e muestra ejemplos de cuantificación y descuantificación de parámetros;
la figura 10a muestra una representación de una señal de audio multicanal de 5 canales; y
la figura 10b muestra un descodificador multicanal paramétrico jerárquico según la técnica anterior.
Descripción detallada de realizaciones preferidas
La figura 1 muestra un cuantificador 199 de parámetros inventivo que presenta un cuantificador 200 y un selector 202 de cuantificador. El selector 202 de cuantificador recibe la energía local del canal o el par de canales subyacentes a los parámetros que van a codificarse y la energía total de la señal de audio multicanal. Basándose en ambas informaciones de energía, el selector 202 de cuantificador genera una regla de cuantificación que utiliza el cuantificador 200 para obtener un parámetro 204 cuantificado a partir de un parámetro 206 introducido en el cuantificador 200. Por tanto, en este caso el selector 202 de cuantificador sirve como un generador de reglas de cuantificación.
Los parámetros de entrada al selector 202 de cuantificador son la energía total de la señal multicanal original y la energía local para el canal descrito por parámetro que va cuantificarse. En una realización preferida de la presente invención la proporción entre la energía local y la energía total da una medida que puede utilizarse para decidir qué cuantificador utilizar. Como un ejemplo, esta proporción q (energía local relativa) puede calcularse en dB, utilizando la siguiente ecuación:
q = 10 \cdot log 10 \left(\frac{\text{Energía Local}}{\text{Energía Total}}\right)
El cuantificador seleccionado se utiliza entonces para cuantificar el parámetro 206 con el cuantificador.
La presente invención enseña que puede utilizarse una cuantificación más basta de parámetros IID/ICLD (y similares) si un escenario de parametrización es inferior en energía comparado con la energía total, es decir, cuando la energía q local relativa es pequeña. La presente invención utiliza la relación psicoacústica que es más importante para parametrizar las señales de energía dominante/alta con alta precisión que la señal de audio con energía baja/menos importante. Para hacer esto incluso más claro se hace referencia de nuevo a la figura 10a. Cuando dentro de un escenario de audio en la señal multicanal original la energía/señal está presente principalmente en la imagen delantera, es decir el canal 102 delantero izquierdo, el canal 103 central y el canal 104 delantero derecho, los canales envolventes pueden cuantificarse con menos precisión puesto que los canales envolventes presentan mucha menos energía. El error de cuantificación adicional introducido a partir de la cuantificación más basta no puede percibirse puesto que los canales delanteros presentan energía mucho más alta y por tanto el error de cuantificación de r_{4} (y los errores de energía resultantes para los canales A y E envolventes) se enmascara mediante los canales B, D, y/o C.
En el ejemplo más extremo, los canales A y E envolventes sólo presentan algún ruido débil y los canales B, C, y D delanteros presentan señales de amplitud completa. En tal caso, una señal original PCM de 16 bits indicaría una diferencia de energía de más de 80 dB. Por lo tanto, podría realizarse una cuantificación basta arbitrariamente para el parámetro r_{4} sin introducir ninguna diferencia audible debido a la cuantificación (basta).
Las figuras 2a a 2c muestran tres posibles reglas de cuantificación que introducen diferentes niveles de errores de cuantificación. Todas las figuras muestran el parámetro original en sus ejes x y los valores enteros asignados a los parámetros en sus ejes y. Además, las figuras 2a a 2c muestran líneas discontinuas que corresponden a índices para cada etapa de cuantificación y por tanto pueden utilizarse para su transmisión o almacenamiento. Los índices transmitidos pueden entonces utilizarse en el lado del descodificador, por ejemplo en combinación con una tabla de consulta, para la descuantificación.
La cuantificación más precisa se indica en la figura 2a mediante la curva 230 de cuantificación que mapea intervalos de parámetros discretos del eje x con 13 valores enteros. La cuantificación intermedia se consigue mediante la curva 232 de cuantificación en la figura 2b, mientras que la cuantificación más basta se consigue mediante la curva 234 de cuantificación de la figura 2c. Es obvio que el error de cuantificación introducido es mayor en el ejemplo mostrado en la figura 2c y menor en el ejemplo mostrado en la figura 2a.
Estas tres reglas de cuantificación son ejemplos de reglas de cuantificación que puede seleccionar el selector 202 de cuantificador. Dicho de otro modo, las figuras 2a a c ilustran tres reglas de cuantificación lineales diferentes, donde el eje x describe el valor de entrada y el eje y da el valor cuantificado correspondiente. Las figuras 2a a 2c presentan todas la misma escala en el eje x y en el eje y, y por tanto, la figura 2a presenta la cuantificación más precisa de las tres y por tanto el error de cuantificación más pequeño. La figura 2c presenta la cuantificación más basta y por tanto el error de cuantificación más grande. También proporcionaría la tasa de bits más baja después de la codificación diferencial y la codificación de Huffman puesto que presenta la cantidad más pequeña de escalones de cuantificación.
Como ejemplo, una posible generación de reglas de cuantificación podría basarse en la energía q local relativa entre la energía local y la energía total, tal como se comentó anteriormente. Una posible gama de valores q con selecciones correspondientes de reglas de cuantificación se resume, como ejemplo, en la siguiente tabla:
1
La figura 3 muestra un compresor de parámetros inventivo que presenta un cuantificador 199 de parámetros inventivo, un codificador 220 diferencial, y un codificador 222 de Huffman. El codificador de parámetros inventivo de la figura 3 amplía el cuantificador de parámetros de la figura 1 utilizando los parámetros cuantificados como entrada para el codificador 220 diferencial que codifica diferencialmente los parámetros 204 cuantificados para obtener parámetros cuantificados codificados diferencialmente que se introducen entonces en el codificador 222 de Huffman que aplica un esquema de codificación de Huffman a los parámetros cuantificados codificados diferencialmente obteniendo un elemento 224 de flujo de bits de parámetros de un flujo final de bits de parámetros como salida.
La combinación de un cuantificador de parámetros inventivo con un codificador diferencial y un codificador de Huffman es particularmente atractiva puesto que una cuantificación más basta da como resultado una mayor abundancia de símbolos iguales (parámetros cuantificados). La combinación del codificador 220 diferencial y el codificador 222 de Huffman proporcionará obviamente una representación codificada de los parámetros cuantificados (elemento 224 de flujo de bits de parámetros) que es más compacta, cuando el número máximo de posibles símbolos de entrada disminuye mediante una cuantificación más basta.
La figura 4a muestra una realización adicional de un codificador de parámetros inventivo que utiliza un cuantificador 250 de parámetros inventivo, un codificador 252 diferencial, y un codificador 254 de Huffman.
El cuantificador 250 de parámetros presenta un generador 256 de factores del cuantificador, un elemento 258 de ajuste a escala de parámetros, y un cuantificador 260. En este caso, el generador 256 de factores del cuantificador junto con el elemento 258 de ajuste a escala de parámetros sirve como un generador de reglas de cuantificación.
El generador 256 de funciones del cuantificador recibe como entrada la energía total de la señal de audio multicanal y la energía local del canal o el par de canales para el parámetro que va a cuantificarse. El generador 256 de factores del cuantificador genera un factor 262 (f) de escala basándose en la energía local y la energía total. En una realización preferida esto se realiza basándose en una proporción entre la energía local y la energía total dando como resultado una energía q local relativa, según sigue:
q = 10 \cdot log 10 \left(\frac{\text{Energía Local}}{\text{Energía Total}}\right)
Esta proporción q puede utilizarse dentro del generador 256 de factores del cuantificador para calcular el factor f (262) del cuantificador que se utiliza como entrada para el elemento 258 de ajuste a escala de parámetros que recibe adicionalmente el parámetro que va a cuantificarse.
El elemento 258 de ajuste a escala de parámetros aplica un ajuste a escala al parámetro de entrada que podría ser, por ejemplo, una división del parámetro por el factor 262 del cuantificador. El ajuste a escala del parámetro es equivalente a seleccionar reglas de cuantificación diferentes. El parámetro ajustado a escala se introduce entonces en un cuantificador 260 que aplica una regla de cuantificación fija en esta realización de la presente invención. El procesamiento adicional del parámetro cuantificado es igual al procesamiento de la figura 3, el parámetro se codifica diferencialmente y después se codifica mediante codificación de Huffman para proporcionar finalmente un elemento de flujo de bits de parámetros.
Aplicar un factor de escala a los parámetros presenta la ventaja de que la regla de cuantificación podría adaptarse a las necesidades de una manera continua, puesto que una función analítica que obtiene el factor 262 de cuantificación puede tener básicamente cualquier forma.
La figura 4b muestra una realización adicional de un codificador 270 de parámetros inventivo que es similar al codificador 250 de parámetros inventivo mostrado en la figura 4a. Por lo tanto, sólo se explicarán brevemente las diferencias con el codificador 250 de parámetros en el siguiente párrafo.
El codificador 270 de parámetros inventivo no presenta un elemento de ajuste a escala de parámetros (elemento 258 de ajuste a escala de parámetros del codificador 250 de parámetros). Para conseguir una dependencia de energía de cuantificación, el cuantificador 270 de parámetros presenta en su lugar un dispositivo 272 de compresión. Esto significa que el generador 256 de factores del cuantificador junto con el dispositivo 258 de compresión sirve como un generador de reglas de cuantificación en este caso. El dispositivo 272 de compresión está conectado al cuantificador 260 y al generador 256 de factores del cuantificador. La unidad 272 de compresión recibe como una entrada un parámetro cuantificado que se cuantifica mediante el cuantificador 260 según la utilización de un esquema de cuantificación fijo. Para implementar la dependencia de energía, la unidad de compresión utiliza el parámetro cuantificado como entrada y ajusta a escala el parámetro cuantificado utilizando el 262 factor de escala. Esto ahorra tasa de bits disminuyendo el número posible de parámetros cuantificados que van a transmitirse al codificador 252 delta. Esta compresión puede conseguirse, por ejemplo, mediante una división del índice del parámetro cuantificado por el factor 262 de escala.
En la figura 5 se muestran posibles funciones para obtener el factor 262 de escala a partir de la proporción q de energía local relativa. La figura 5 muestra como un ejemplo cuatro posibles funciones 300, 302, 303 y 304 diferentes que pueden utilizarse para obtener el factor f de escala. La primera función 300 de factor es una función constante y por tanto no presenta dependencia de energía.
Las funciones 302 y 304 de factor muestran dos posibilidades para implementar funciones de factor, en las que la función 302 de factor es la menos agresiva y por lo tanto aumentaría en menor medida el error de cuantificación introducido que utilizando la función 304 de factor. Por otro lado, la función 302 de factor ahorraría menos tasa de bits que la función 304 de factor. La función 303 de factor muestra una cuarta posibilidad para obtener el factor del cuantificador a partir de la cuota q de energía, mientra que la función 303 de factor es escalonada y por lo tanto asigna intervalos de la cuota q de energía al mismo factor del cuantificador.
La figura 6 ejemplifica un cuantificador no uniforme en el que la entrada en el eje x en dB se cuantifica según la función 310 para dar como resultado la salida y en dB que se dibuja en el eje y. Una función del cuantificador no uniforme de este tipo puede utilizarse para cuantificar también parámetros espaciales. Esto es de especial interés cuando el canal de referencia en un esquema de codificación BCC se elige para que sea el canal más fuerte en una señal multicanal. El cuantificador no uniforme tal como se muestra en la figura 6 ejemplifica una función 310 del cuantificador que se ajustaría entonces a las necesidades, puesto que los escalones de cuantificación aumentan a medida que el nivel de energía se vuelve más pequeño comparado con el canal al que se hace referencia. Esta es una propiedad particularmente atractiva puesto que los errores de cuantificación del nivel de energía pueden ser mayores para canales con menos energía que para los canales más fuertes.
La figura 7 muestra un descuantificador 500 de parámetros inventivo que presenta un descuantificador 502 y un selector 504 de descuantificador. El selector 504 de descuantificador recibe la energía total de la señal de audio multicanal y la energía local del canal o pares de canales junto con un parámetro 505 cuantificado que va a descuantificarse. Basándose en la información de energía rec a, el selector 504 de descuantificador obtiene una regla de descuantificación que utiliza el descuantificador 502 para descuantificar el parámetro 505 cuantificado. Por tanto, en este caso el selector 504 de descuantificador sirve como un generador de reglas de descuantificación.
Puede observarse que el selector 504 de descuantificador puede funcionar de diferentes maneras. Una primera posibilidad es que el selector 504 de descuantificador obtenga la regla de cuantificación directamente y transfiera la regla de cuantificación obtenida al descuantificador 502. Otra posibilidad es que el selector 504 de descuantificador satisfaga una decisión de regla de descuantificación que se transfiere al descuantificador 502 que puede utilizar la decisión de regla de descuantificación para seleccionar la regla de descuantificación apropiada de un número de reglas de cuantificación que, por ejemplo, se almacenan en el descuantificador 502.
La figura 8 muestra un descodificador de parámetros inventivo que presenta un descuantificador 500 de parámetros, un descodificador 510 diferencial y un descodificador 512 de Huffman.
El descodificador 512 de Huffman recibe un elemento 513 de flujo de bits de parámetros y en asociación con el mismo, el selector 504 de descuantificador recibe la energía local de un canal o un par de canales descritos por el elemento 513 de flujo de bits de parámetros y la energía total de la señal de audio multicanal. El elemento 513 de flujo de bits de parámetros se produce mediante un codificador de parámetros inventivo, tal como se muestra en la figura 3. Por lo tanto, el elemento 513 de flujo de bits de parámetros se descodifica mediante descodificación de Huffman por el descodificador 512 de Huffman y se descodifica diferencialmente por un descodificador 510 diferencial antes de suministrarse al descuantificador 502. Después de la descodificación mediante el descodificador 512 de Huffman y el descodificador 510 diferencial, la descuantificación se realiza mediante el descuantificador 500 de parámetros inventivo, tal como ya se describió en la descripción del parámetro inventivo de la figura 7.
Dicho de otro modo, la figura 8 ilustra un descodificador que utiliza un descuantificador 500 dependiente de energía, correspondiendo el descodificador a un codificador inventivo. El elemento de flujo de bits de parámetros se descodifica mediante descodificación de Huffman y se descodifica diferencialmente en índices. El descuantificador correcto se elige en el selector 504 de descuantificador utilizando la misma regla y función que la que se utilizó en el codificador con la energía total y energía local como entrada. El descuantificador seleccionado se utiliza entonces para descuantificar (utilizando el descuantificador 502) los índices en parámetros descuantificados.
La figura 9a muestra una realización adicional de un descodificador de parámetros inventivo, que presenta un descuantificador 520 dependiente de energía inventivo, un descodificador 512 de Huffman y un descodificador 510 diferencial. El descuantificador 520 de parámetros comprende un generador 522 de factores del cuantificador, un descuantificador 524, y un elemento 526 de ajuste a escala de parámetros. En este caso, el generador 522 de factores del descuantificador junto con el elemento 526 de ajuste a escala de parámetros sirve como un generador de reglas de descuantificación.
Después de descodificar el elemento 513 de flujo de bits de parámetros mediante el descodificador de Huffman y el descodificador diferencial, el parámetro cuantificado se descuantifica mediante el descuantificador 524, donde el descuantificador 524 utiliza una regla de descuantificación que corresponde a una regla de cuantificación utilizada para generar el parámetro cuantificado. El generador 522 de factores del cuantificador obtiene un factor 528 (f) de escala a partir de una proporción de la energía local y la energía total de la señal de audio multicanal. El elemento 526 de ajuste a escala de parámetros aplica entonces el factor 528 de escala al parámetro descuantificado mediante una multiplicación del factor de escala con el parámetro descuantificado.
Después del ajuste a escala mediante el elemento 526 de ajuste a escala de parámetros, los parámetros descuantificados descomprimidos están disponibles en una salida del descodificador de parámetros inventivo.
La figura 9b muestra una realización adicional de un descodificador 530 de parámetros inventivo, similar al descodificador 520 de parámetros inventivo. Por lo tanto, sólo se explicarán en detalle las diferencias con el descodificador 520 de parámetros en el siguiente párrafo.
El descodificador 530 de parámetros inventivo presenta un descompresor 532, consiguiendo el descompresor 532 el mismo resultado funcional que el elemento de 526 ajuste a escala de parámetros en el descodificador 520 de parámetros inventivo. El descompresor 532 recibe como una entrada los parámetros cuantificados y como entrada adicional el factor 528 de escala desde el generador 522 de factores. Eso significa que el generador 522 de factores junto con el descompresor 532 sirve como un generador de reglas de descuantificación en este caso. Para implementar la funcionalidad de descuantificación ponderada de energía, el parámetro cuantificado se ajusta a escala mediante el descompresor 532 antes de que el parámetro cuantificado ajustado a escala así obtenido se introduzca en el descuantificador 524. Entonces, el descuantificador 524 descuantifica el parámetro cuantificado ajustado a escala para obtener el parámetro descuantificado utilizando un regla de descuantificación fija. Esta descompresión puede conseguirse, por ejemplo, mediante una multiplicación del índice del parámetro cuantificado por el factor 528 de escala.
Aunque el ajuste a escala mediante el elemento 258 de ajuste a escala de parámetros y el elemento 526 de ajuste a escala de parámetros durante la codificación y descodificación se describe para que sea una división durante la codificación y una multiplicación durante la descodificación, puede aplicarse a los parámetros durante la codificación o la descodificación cualquier otro tipo de ajuste a escala que tenga el mismo efecto que utilizar una regla de cuantificación diferente.
En el caso de una parametrización apilada (codificación o descodificación jerárquica) tal como se ejemplifica, por ejemplo, en la figura 10b, debería observarse que puesto que el descodificador puede descodificar la distribución de energía a partir de las raíces (el canal de downmix) a partir de las hojas, existe una energía local bien definida en cada parametrización r_{1} a r_{4} (descodificadores 122, 124, 126 y 128 de dos canales), ésta puede utilizarse como la energía local en el lado del descodificador. Adicionalmente, si un codificador también cuantifica desde la raíz a la hoja, puede utilizarse exactamente la misma energía local en el codificador como la energía local para el selector de cuantificador y la función de factor del cuantificador.
Dicho de otro modo, un descodificador puede incluso decidir de un modo autónomo qué regla de descuantificación usar utilizando la energía total y la energía local. Como alternativa, podría señalizarse mediante alguna información secundaria adicional al descodificador qué regla de descuantificación es la apropiada para descuantificar los parámetros.
Aunque se describe en diferentes realizaciones de la presente invención, la aplicación de un factor de escala y la selección de una regla de descuantificación apropiada también puede combinarse en una realización de un codificador o descodificador inventivo.
Para dar un ejemplo más detallado, en las figuras 9c y 9d se muestran dos posibles maneras de implementar una descuantificación dependiente de energía para la reconstrucción de una señal multicanal a partir de una señal M monofónica transferida utilizando parámetros (CLD, ICC) espaciales transmitidos adicionalmente. Antes de comentar las figuras, puede observarse que la estructura a modo de árbol en las figuras sólo es importante para la reconstrucción de los parámetros espaciales, donde el abmix para la generación de los canales individuales de una señal multicanal se realiza normalmente en una única etapa.
La figura 9c muestra la situación en la que los parámetros CLD se obtienen de tal manera que se supone que un parámetro CLDº describe la distribución de energía entre canales que se combinan utilizando un número de canales de la señal original.
En la primera posición 1000 de upmix (conversión de señal mono o estéreo en señal envolvente) jerárquico, CLDº describe la relación de energía entre dos canales, donde un primer canal es una combinación 1002 de un canal delantero izquierdo, un canal delantero derecho, un canal central y un canal de mejora de bajas frecuencias. El segundo canal es una combinación de un canal posterior izquierdo y un canal posterior derecho. Dicho de otro modo, el parámetro CLDº describe la distribución de energía entre todos los canales traseros y todos los canales delanteros.
Por lo tanto es evidente que cuando CLDº indica que sólo pequeñas energías están contenidas en los canales traseros, los parámetros que describen las propiedades espaciales entre el canal posterior izquierdo y el posterior derecho pueden cuantificarse de manera más fuerte, puesto que la distorsión introducida adicionalmente por la cuantificación basta es difícilmente audible todos los canales se reproducen simultáneamente.
Un descuantificador de parámetros inventivo, tal como se muestra en la figura 9b es, por ejemplo, calcular un factor 528 de escala para implementar la descuantificación multiplicando un parámetro que va a cuantificarse con un índice de parámetro antes de que se realice la descuantificación real. Por lo tanto, si se transmite un parámetro CLDº, se puede, cuando se utiliza el descodificador de la figura 9b por ejemplo, calcular los parámetros CLD utilizados finalmente de otras etapas jerárquicas según la siguiente fórmula.
En lo sucesivo, el término "DEQ" describe la aplicación de una tabla de descuantificación fija para un parámetro dado para el procedimiento DEQ. Es decir, un parámetro IDX CLD (0,L) transmitido puede cuantificarse directamente, lo que se indica mediante la siguiente expresión:
\vskip1.000000\baselineskip
2
\vskip1.000000\baselineskip
Puesto que el parámetro CLD describe una distribución de energía entre dos canales y los canales son combinaciones de canales según se indica en la figura 9c, puede obtenerse ahora la energía FC local relativa según:
\vskip1.000000\baselineskip
3
\newpage
La energía local relativa de los canales posteriores es por consiguiente:
4
Dado lo anterior y el concepto inventivo, ahora puede calcularse CLD^{1}, teniendo en cuenta la energía global contenida en la señal 1002 de combinación:
5
En la fórmula dada anteriormente, el término "facFunc" describe una función que da una independencia del valor real de la energía FC local relativa. Dicho de otro modo, la formula 4 describe que antes de la descuantificación, el índice IDX CLD (1,1,m) del parámetro transmitido se multiplica con un factor (facFunc) de escala para obtener un parámetro cuantificado intermedio. Puesto que el parámetro cuantificado intermedio no es necesariamente un valor entero, el parámetro cuantificado intermedio debe redondearse para obtener IdxCLDEdQ, que se descuantifica después en el parámetro final utilizado por la siguiente operación:
6
La descuantificación se realiza mediante una tabla de descuantificación estándar, tal como, por ejemplo, la siguiente:
7
El parámetro CLD^{1} obtenido describe una relación de energía entre un canal que es una combinación de un canal delantero izquierdo y un canal delantero derecho y un canal siendo una combinación de un canal central y un canal de mejora de bajas frecuencias, tal como puede observarse a partir de la descomposición de canales en la segunda etapa 1004 jerárquica. Así, puede calcularse una energía F local relativa, que describe una energía contenida en los canales delanteros, delantero izquierdo y delantero derecho, según la siguiente fórmula:
8
Anteriormente, se ha obtenido una energía S local relativa que describe la energía de los canales posteriores de tal manera que puede calcularse un parámetro IDX CLD EDQ cuantificado intermedio para la caja 1006 jerárquica según las siguientes fórmulas:
9
Puesto que, tal como se describió anteriormente, ahora está disponible una energía local relativa que describe la energía (F^{5151}) de sólo los canales delanteros, el parámetro CLD^{3} que describe una relación de energía entre el canal delantero izquierdo y el delantero derecho puede obtenerse ahora de una manera dependiente de energía según las siguientes fórmulas:
10
En una posible implementación, el parámetro CAD^{4} que describe una relación de energía entre el canal central y el de mejora de bajas frecuencias puede obtenerse ahora sin utilizar ninguna función de factor:
11
En realizaciones alternativas, por supuesto, también es factible implementar dependencia de energía también en la obtención del parámetro CLD^{4}.
La figura 9d muestra otra posibilidad de definir una jerarquía para la obtención de los parámetros espaciales.
En analogía con la descripción de la figura 9c, los parámetros CLD individuales pueden obtenerse según las siguientes fórmulas:
12
\vskip1.000000\baselineskip
13
\vskip1.000000\baselineskip
14
\vskip1.000000\baselineskip
15
\vskip1.000000\baselineskip
16
\vskip1.000000\baselineskip
17
\vskip1.000000\baselineskip
18
19
\vskip1.000000\baselineskip
20
21
\vskip1.000000\baselineskip
Puede observarse que pueden utilizarse diferentes funciones de factor para implementar el concepto inventivo tal como, por ejemplo, una de las funciones mostradas en la figura 5.
En general, tal como se mencionó anteriormente, el concepto inventivo es aplicar una cuantificación dependiente de energía en el sentido de que parámetros (CLD) de partes de la señal que contienen energía relativamente baja comparada con otras partes de señal, se cuantifican de una manera más basta. Es decir, la función de factor tiene que ser tal que para componentes de baja energía, el factor aplicado es grande.
Para ilustrar esto en más detalle, se da un ejemplo en la figura 9e, que muestra las manipulaciones durante la codificación y descodificación, señalando adicionalmente el concepto de la invención. Se hace referencia además a la tabla de cuantificación introducida previamente para calcular los ejemplos mostrados.
La tabla 9d muestra la manipulación del índice de cuantificación en el lado del cuantificador en una columna 1100 izquierda, y la reconstrucción del parámetro transmitido en el lado del cuantificador en una columna 1102. El parámetro transmitido se da en la columna 1104. Se muestran dos ejemplos para una combinación de canales que presenta energía relativamente baja. Esto se indica mediante el factor de escala común 4,5 que es significativamente mayor que 1 (véase la figura 4). Según el concepto inventivo, el índice IDX de cuantificación se divide por el factor de escala después de la cuantificación en el lado del cuantificador. Después, el resultado tiene que redondearse a un valor entero para codificarse diferencialmente y mediante codificación de Huffman (véase la figura 4a). Por lo tanto, ambos índices 10 y 9 de ejemplo dan como resultado un índice IDXtransm transmitido de 2.
El descuantificador multiplica el índice transmitido por el factor de escala para obtener un índice IDXrek reconstruido utilizado para la descuantificación. Tal como puede observarse en el primer ejemplo de un índice 10 en el lado del cuantificador, surge un error adicional de 1 debido al redondeo del índice dividido en el lado del cuantificador. Por otro lado, cuando, por casualidad, la división del factor de escala en el lado del cuantificador proporciona un índice IDXtransm de valor entero que va a transmitirse, no se introduce error adicional.
Evidentemente, el peligro de introducir errores adicionales aumenta con un factor f de escala creciente. Esto significa que la probabilidad de añadir errores adicionales a señales de baja energía es bastante alta. Cuando las señales descritas por el parámetro CLD en cuestión presentan energía comparativamente igual, el valor CLD estará próximo a la unidad y ese será el factor de escala (véase, por ejemplo la figura 5). Es decir, cuando los canales para los que los parámetros se codifican de una manera dependiente de energía comparten aproximadamente la misma energía, normalmente no se introducen errores adicionales en la cuantificación. Por supuesto esto es lo más apropiado, puesto que cuando todos los canales presenten aproximadamente la misma energía dentro de una señal multicanal, cada único canal es audible durante la reproducción simultánea y, por lo tanto, un error introducido sería claramente audible para la audiencia.
Evidentemente, es una enorme ventaja de la presente invención que los errores sólo se aceptan para canales que presenten energía comparativamente baja. Por otro lado, para esos canales, dividir los índices de los parámetros asociados por algunos números grandes proporciona los valores de índice de esos canales más próximos a cero, en promedio. Esto puede aprovecharse perfectamente por el siguiente procedimiento de codificación diferencial y codificación de Huffman para disminuir eficazmente la tasa de bits consumida para los parámetros transmitidos de una señal
multicanal.
La relación de la energía local y la total sobre la que se basa la decisión de qué regla de descuantificación/cuantifica-
ción utilizar, se describe como una medida logarítmica en los párrafos anteriores. Por supuesto, ésta no es la única medida posible que puede utilizarse para realizar el concepto inventivo. Cualquier otra medida que describa una diferencia de energía entre la energía local o la energía total, como por ejemplo la diferencia de plano, puede utilizarse para tomar la decisión.
Otra característica importante con la presente invención es que en combinación con un diseño de descodificador (PS) de dos canales que distribuya la energía entrante en los dos canales de salida controlado normalmente mediante por ejemplo parámetros CLD (lo que significa que la energía entrante es igual a la suma de las energías para los dos canales de salida) la diferencia en energía, la energía local relativa entre la energía total y la energía local para cada descodificador (122, 124, 126, y 128) de dos canales se define mediante los parámetros CLD. Esto significa que no hay necesidad de medir realmente la energía total y la energía local puesto que la diferencia en energía en dB que se utiliza normalmente para calcular el factor de escala se define mediante los parámetros CLD.
Dependiendo de ciertos requisitos de implementación de los métodos inventivos, los métodos inventivos pueden implementarse en hardware o en software. La implementación puede realizarse utilizando un medio de almacenamiento digital, en particular un disco, DVD o un CD que presente señales de control legibles electrónicamente almacenadas en el mismo, que actúe conjuntamente con un sistema informático programable de tal manera que se realicen los métodos inventivos. En general, la presente invención es, por lo tanto, un producto de programa informático con un código de programa almacenado en un portador legible por ordenador, estando operativo el código de programa para realizar los métodos inventivos cuando el producto de programa informático se ejecute en un ordenador. Dicho de otro modo, los métodos inventivos son, por lo tanto, un programa informático que presenta un código de programa para realizar al menos uno de los métodos inventivos cuando el programa informático se ejecuta en un ordenador.
Aunque lo anterior se ha mostrado y descrito en particular con referencia a realizaciones particulares de la misma, los expertos en la técnica entenderán que pueden realizarse otros diversos cambios en la forma y detalles sin apartarse del alcance de la invención tal como se define mediante las reivindicaciones adjuntas.

Claims (44)

1. Cuantificador de parámetros para cuantificar un parámetro de entrada, el que el parámetro de entrada es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, que comprende:
un generador de reglas de cuantificación para generar una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y
un cuantificador de valores para obtener un parámetro cuantificado a partir del parámetro de entrada, utilizando la regla de cuantificación generada.
2. Cuantificador de parámetros según la reivindicación 1, en el que el generador de reglas de cuantificación está operativo para generar la regla de cuantificación de tal manera que una cuantificación es más basta para un canal o un par de canales que presentan una medida de baja energía que para un canal o un par de canales que presentan una medida de alta energía.
3. Cuantificador de parámetros según la reivindicación 1, en el que el generador de reglas de cuantificación está operativo para elegir una regla de cuantificación a partir de dos o más reglas de cuantificación predeterminadas.
4. Cuantificador de parámetros según la reivindicación 1, en el que el generador de reglas de cuantificación está operativo para calcular una nueva regla de cuantificación basándose en una relación de la medida de energía del canal o el par de canales y la medida de energía de la señal multicanal.
5. Cuantificador de parámetros según la reivindicación 4, en el que el generador de reglas de cuantificación está operativo de tal manera que el cálculo de la regla de cuantificación comprende un cálculo de un factor de
escala.
6. Cuantificador de parámetros según la reivindicación 5, que comprende además un elemento de ajuste a escala de parámetros para modificar el parámetro de entrada utilizando el factor de escala.
7. Cuantificador de parámetros según la reivindicación 6, en el que el elemento de ajuste a escala de parámetros está operativo para modificar el parámetro de entrada de tal manera que la modificación incluye una división del parámetro de entrada por el factor de escala.
8. Cuantificador de parámetros según la reivindicación 5, que comprende además un dispositivo de compresión, en el que el cuantificador de parámetros está operativo para obtener un parámetro cuantificado intermedio utilizando una regla de cuantificación predeterminada; y
en el que el dispositivo de compresión está operativo para obtener el parámetro cuantificado utilizando el parámetro cuantificado intermedio y el factor de escala.
9. Cuantificador de parámetros según la reivindicación 1, en el que el generador de reglas de cuantificación está operativo para generar una regla de cuantificación de tal manera que una aplicación de la regla de cuantificación al parámetro de entrada comprende una asignación del mismo parámetro cuantificado a todos los parámetros de entrada dentro de una gama de parámetros de entrada dada.
10. Cuantificador de parámetros según la reivindicación 1, en el que el parámetro de entrada es un parámetro espacial, que describe una percepción espacial de la señal de audio multicanal, y en el que el parámetro de entrada se elige a partir de la siguiente lista de parámetros:
correlación/coherencia entre canales (ICC),
diferencia de nivel/intensidad entre canales (ICLD o IID),
diferencia de fase entre canales (IPD), y
diferencia de tiempo entre canales (ICTD).
11. Cuantificador de parámetros según la reivindicación 1, que comprende además un codificador diferencial y un codificador de Huffman, en el que el codificador diferencial está operativo para obtener una representación codificada diferencialmente del parámetro cuantificado; y
en el que el codificador de Huffman está operativo para obtener una representación codificada de Huffman de la representación codificada diferencialmente.
\newpage
12. Descuantificador de parámetros para descuantificar un parámetro cuantificado para obtener un parámetro, en el que el parámetro es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, que comprende:
un generador de reglas de descuantificación para generar una regla de descuantificación basándose en una relación de una medida de energía del único canal o el par de canales y una medida de energía obtenida a partir de canales de la señal multicanal; y
un descuantificador de valores para obtener el parámetro a partir del parámetro cuantificado, utilizando la regla de descuantificación generada.
13. Descuantificador de parámetros según la reivindicación 12, en el que el generador de reglas de descuantificación está operativo para utilizar una medida de energía obtenida a partir de los canales de la señal multicanal que se obtiene a partir de una combinación de canales sin tener el canal o el par de canales.
14. Descuantificador de parámetros según la reivindicación 12, en el que el generador de reglas de descuantificación está operativo para generar la regla de descuantificación de tal manera que una descuantificación es más basta para un canal o un par de canales que presentan una medida de baja energía que para un canal o un par de canales que presentan una medida de alta energía.
15. Descuantificador de parámetros según la reivindicación 12, en el que el generador de reglas de descuantificación está operativo para elegir una regla de descuantificación a partir de dos o más reglas de descuantificación fijas almacenadas en una memoria.
16. Descuantificador de parámetros según la reivindicación 12, en el que el generador de reglas de descuantificación está operativo para calcular la nueva regla de descuantificación basándose en una relación de la medida de energía del canal o el par de canales y la medida de energía obtenida a partir de los canales de la señal multicanal.
17. Descuantificador de parámetros según la reivindicación 12, en el que el generador de reglas de descuantificación está operativo de tal manera que el cálculo de la regla de descuantificación comprende un cálculo de un factor de escala.
18. Descuantificador de parámetros según la reivindicación 17, en el que el generador de reglas de descuantificación comprende además un elemento de ajuste a escala de parámetros para modificar el parámetro utilizando el factor de escala.
19. Descuantificador de parámetros según la reivindicación 17, en el que el elemento de ajuste a escala de parámetros está operativo para modificar el parámetro de tal manera que la modificación incluye una multiplicación del parámetro por el factor de escala.
20. Descuantificador de parámetros según la reivindicación 17, en el que el generador de reglas de descuantificación comprende además un descompresor para obtener un parámetro cuantificado intermedio a partir del parámetro cuantificado utilizando el factor de escala; y
en el que el descuantificador de valores está operativo para obtener el parámetro a partir del parámetro cuantificado intermedio utilizando una regla de descuantificación fija.
21. Descuantificador de parámetros según la reivindicación 20, en el que el descompresor está operativo para obtener el parámetro cuantificado intermedio mediante la multiplicación del factor de escala y el parámetro cuantificado.
22. Descuantificador de parámetros según la reivindicación 20, en el que el generador de reglas de descuantificación comprende además un elemento de redondeo para obtener un parámetro cuantificado intermedio de valor entero a partir del parámetro cuantificado intermedio; y en el que el descuantificador de valores está operativo para obtener el parámetro a partir del parámetro cuantificado intermedio de valor entero utilizando una regla de descuantificación fija.
23. Descuantificador de parámetros según la reivindicación 12, en el que el parámetro cuantificado es una medida para una relación de energía entre una combinación de un canal delantero izquierdo y un canal delantero derecho y una combinación de un canal central y un canal de mejora de bajas frecuencias;
en el que la medida de energía es una medida de energía para un par de canales que presenta un primer canal combinado a partir del canal delantero izquierdo y el delantero derecho y que presenta un segundo canal combinado a partir del canal central y el canal de mejora de bajas frecuencias; y
en el que la medida de energía obtenida a partir de los canales de la señal multicanal es una medida de energía obtenida a partir de una combinación de un canal posterior izquierdo y un canal posterior derecho.
24. Descuantificador de parámetros según la reivindicación 12, en el que el parámetro cuantificado es una medida para una relación de energía entre un canal posterior izquierdo y un canal posterior derecho;
en el que la medida de energía es una medida de energía para un par de canales que presenta el canal posterior izquierdo y el posterior derecho; y
en el que la medida de energía obtenida a partir de los canales de la señal multicanal es una medida de energía obtenida a partir de una combinación de un canal delantero izquierdo, un canal delantero derecho, un canal central y un canal de mejora de bajas frecuencias.
25. Descuantificador de parámetros según la reivindicación 12, en el que el parámetro cuantificado es una medida para una relación de energía entre un canal delantero izquierdo y uno delantero derecho;
en el que la medida de energía es una medida para un par de canales que presenta el canal delantero izquierdo y el delantero derecho; y
en el que la medida de energía obtenida a partir de los canales de la señal multicanal es una medida de energía obtenida a partir de una combinación de un canal central y un canal de mejora de bajas frecuencias.
26. Descuantificador de parámetros según la reivindicación 12, en el que el parámetro cuantificado es una medida para una relación de energía entre una combinación de un canal delantero izquierdo y un canal posterior izquierdo y una combinación de un canal delantero derecho y un canal posterior derecho; en el que
la medida de energía es una medida de energía para un par de canales que presenta un primer canal combinado a partir del canal delantero izquierdo y el posterior izquierdo y que presenta un segundo canal combinado a partir del canal delantero derecho y el posterior derecho; y
en el que la medida de energía obtenida a partir de los canales de la señal multicanal es una medida de energía obtenida a partir de una combinación de un canal central y un canal de mejora de bajas frecuencias.
27. Descuantificador de parámetros según la reivindicación 12, en el que el parámetro cuantificado es una medida para una relación de energía entre un canal delantero izquierdo y un canal posterior izquierdo; en el que
la medida de energía es una medida de energía para un par de canales que presenta el canal delantero izquierdo y el posterior izquierdo; y
en el que la medida de energía obtenida a partir de los canales de la señal multicanal es una medida de energía obtenida a partir de una combinación de un canal delantero derecho y un canal posterior derecho.
28. Descuantificador de parámetros según la reivindicación 12, en el que el parámetro cuantificado es una medida para una relación de energía entre un canal delantero derecho y un canal posterior derecho; en el que
la medida de energía es una medida de energía para un par de canales que presenta el canal delantero derecho y el posterior derecho; y
en el que la medida de energía obtenida a partir de los canales de la señal multicanal es una medida de energía obtenida a partir de una combinación de un canal delantero izquierdo y un canal posterior izquierdo.
29. Descuantificador de parámetros según la reivindicación 12, en el que el generador de reglas de descuantificación está operativo para generar una regla de descuantificación de tal manera que una aplicación de la regla de descuantificación al parámetro cuantificado comprende una asignación del parámetro cuantificado a un parámetro.
30. Descuantificador de parámetros según la reivindicación 12, que comprende además un descodificador diferencial y un descodificador de Huffman,
en el que el descodificador de Huffman está operativo para obtener una representación descodificada de Huffman de una representación codificada de Huffman recibida; y
en el que el descodificador diferencial está operativo para obtener el parámetro cuantificado a partir de la representación descodificada de Huffman.
31. Descuantificador de parámetros según la reivindicación 12, en el que el parámetro es un parámetro espacial, que describe una percepción espacial de señal de audio multicanal, y en el que el parámetro de entrada se elige a partir de la siguiente lista de parámetros:
correlación/coherencia entre canales (ICC),
diferencia de nivel/intensidad entre canales (ICLD o IID),
diferencia de fase entre canales (IPD), y
diferencia de tiempo entre canales (ICTD).
32. Método de cuantificación de un parámetro de entrada, en el que el parámetro de entrada es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, comprendiendo el método:
generar una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y
obtener un parámetro cuantificado a partir del parámetro de entrada utilizando la regla de cuantificación generada.
33. Método de descuantificación de un parámetro cuantificado para obtener un parámetro, en el que el parámetro es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, comprendiendo el método:
generar una regla de descuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y
obtener el parámetro a partir del parámetro cuantificado utilizando la regla de descuantificación generada.
34. Representación de una señal multicanal que presenta un parámetro cuantificado que es una representación cuantificada de un parámetro que es una medida para una característica de un único canal o un par de canales, en la que el parámetro es una medida para una característica del único canal o el par de canales con respecto a otro único canal o un par de canales de una señal multicanal, en la que el parámetro cuantificado se obtiene utilizando una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal.
35. Medio de almacenamiento legible por máquina que tiene almacenado en el mismo una representación de una señal multicanal de la reivindicación 34.
36. Transmisor o grabador de audio, que presenta un cuantificador de parámetros según la reivindicación 1.
37. Receptor o reproductor de audio, que presenta un descuantificador de parámetros según la reivindicación 12.
38. Método de transmisión o grabación de audio, comprendiendo el método un método de cuantificación según la reivindicación 32.
39. Método de recepción o reproducción de audio, presentando el método un método de descuantificación según la reivindicación 33.
40. Sistema de transmisión que presenta un transmisor y un receptor, presentando el transmisor un cuantificador de parámetros según la reivindicación 1 y presentando el receptor un descuantificador de parámetros según la reivindicación 12.
41. Método de transmisión y recepción, incluyendo el método un método de transmisión que presenta un método de cuantificación según la reivindicación 32 y un método de recepción que presenta un método de descuantificación según la reivindicación 33.
42. Programa informático adaptado para realizar, cuando se ejecuta en un ordenador, un método según una cualquiera de las reivindicaciones 32, 33, 38, 39, ó 41 de métodos.
43. Descodificador multicanal para generar una reconstrucción de una señal multicanal:
un descuantificador de parámetros según la reivindicación 12; y
un elemento de upmix para realizar upmix sobre la reconstrucción de la señal multicanal a partir de una señal de downmix transmitida utilizando parámetros descuantificados por el descuantificador de parámetros.
44. Codificador multicanal para generar una representación codificada de una señal multicanal, que comprende:
un cuantificador de parámetros según la reivindicación 1; y
un elemento de downmix para generar una señal de downmix a partir de la señal multicanal utilizando parámetros cuantificados por el cuantificador, en el que esta señal de downmix presenta menos canales que la señal multicanal.
ES06724214T 2005-04-19 2006-04-10 Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. Active ES2297825T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67294305P 2005-04-19 2005-04-19
US672943P 2005-04-19

Publications (1)

Publication Number Publication Date
ES2297825T3 true ES2297825T3 (es) 2008-05-01

Family

ID=36581679

Family Applications (1)

Application Number Title Priority Date Filing Date
ES06724214T Active ES2297825T3 (es) 2005-04-19 2006-04-10 Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales.

Country Status (15)

Country Link
US (1) US8054981B2 (es)
EP (1) EP1754222B1 (es)
JP (1) JP4521032B2 (es)
KR (1) KR100878371B1 (es)
CN (1) CN1993733B (es)
AT (1) ATE378675T1 (es)
BR (1) BRPI0605857A (es)
DE (1) DE602006000239T2 (es)
ES (1) ES2297825T3 (es)
HK (1) HK1095993A1 (es)
MY (1) MY141427A (es)
PL (1) PL1754222T3 (es)
RU (1) RU2376655C2 (es)
TW (1) TWI327306B (es)
WO (1) WO2006111294A1 (es)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2623551T3 (es) * 2005-03-25 2017-07-11 Iii Holdings 12, Llc Dispositivo de codificación de sonido y procedimiento de codificación de sonido
WO2007037613A1 (en) * 2005-09-27 2007-04-05 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
JP2009532712A (ja) * 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
EP2102855A4 (en) * 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
EP2214163A4 (en) * 2007-11-01 2011-10-05 Panasonic Corp CODING DEVICE, DECODING DEVICE AND METHOD THEREFOR
CN102027535A (zh) * 2008-04-11 2011-04-20 诺基亚公司 信号处理
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
EP2489039B1 (fr) * 2009-10-15 2015-08-12 Orange Codage/décodage paramétrique bas débit optimisé
JP2012023540A (ja) * 2010-07-14 2012-02-02 Asahi Kasei Electronics Co Ltd マルチビットデルタシグマ変調器及びadコンバータ
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
CN103718466B (zh) * 2011-08-04 2016-08-17 杜比国际公司 通过使用参量立体声改善fm立体声无线电接收器
ES2540215T3 (es) 2012-04-05 2015-07-09 Huawei Technologies Co., Ltd. Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial
US9799339B2 (en) 2012-05-29 2017-10-24 Nokia Technologies Oy Stereo audio signal encoder
US9380317B2 (en) 2012-10-08 2016-06-28 Qualcomm Incorporated Identification of operation points applicable to nested SEI message in video coding
US9350970B2 (en) 2012-12-14 2016-05-24 Qualcomm Incorporated Disparity vector derivation
CN105074818B (zh) 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
EP3217398B1 (en) * 2013-04-05 2019-08-14 Dolby International AB Advanced quantizer
US9821908B2 (en) * 2013-06-07 2017-11-21 Bell Helicopter Textron Inc. System and method for assisting in rotor speed control
EP3011562A2 (en) * 2013-06-17 2016-04-27 Dolby Laboratories Licensing Corporation Multi-stage quantization of parameter vectors from disparate signal dimensions
US9530422B2 (en) 2013-06-27 2016-12-27 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
TWI579831B (zh) * 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
US9911423B2 (en) 2014-01-13 2018-03-06 Nokia Technologies Oy Multi-channel audio signal classifier
RU2696952C2 (ru) * 2014-10-01 2019-08-07 Долби Интернешнл Аб Аудиокодировщик и декодер
WO2016050854A1 (en) * 2014-10-02 2016-04-07 Dolby International Ab Decoding method and decoder for dialog enhancement
FR3048808A1 (fr) 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
PT3539125T (pt) * 2016-11-08 2023-01-27 Fraunhofer Ges Forschung Aparelho e método para codificar ou descodificar um sinal multicanal utilizando um ganho side e um ganho residual
GB2574239A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
KR102587641B1 (ko) 2018-10-31 2023-10-10 노키아 테크놀로지스 오와이 공간적 오디오 파라미터 인코딩 및 연관된 디코딩의 결정
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
GB2595883A (en) * 2020-06-09 2021-12-15 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
GB2598773A (en) * 2020-09-14 2022-03-16 Nokia Technologies Oy Quantizing spatial audio parameters

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HU216669B (hu) 1990-09-19 1999-08-30 Koninklijke Philips Electronics N.V. Információhordozó fő adatállománnyal és vezérlőállománnyal, eljárás és készülék ezen állományok rögzítésére, valamint készülék azok kiolvasására
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CN1288624C (zh) * 2001-11-23 2006-12-06 皇家飞利浦电子股份有限公司 感觉噪声替换的方法和装置
JP4296753B2 (ja) 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
BRPI0305434B1 (pt) * 2002-07-12 2017-06-27 Koninklijke Philips Electronics N.V. Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal
CN1748247B (zh) * 2003-02-11 2011-06-15 皇家飞利浦电子股份有限公司 音频编码
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
WO2005010209A2 (de) * 2003-07-24 2005-02-03 Qiagen Gmbh Verfahren zur reversen transkription und/oder amplifikation von nukleinsäuren

Also Published As

Publication number Publication date
JP4521032B2 (ja) 2010-08-11
CN1993733B (zh) 2010-12-08
RU2376655C2 (ru) 2009-12-20
KR100878371B1 (ko) 2009-01-15
MY141427A (en) 2010-04-30
TW200703238A (en) 2007-01-16
BRPI0605857A (pt) 2007-12-18
US8054981B2 (en) 2011-11-08
DE602006000239T2 (de) 2008-09-18
EP1754222B1 (en) 2007-11-14
US20070016416A1 (en) 2007-01-18
CN1993733A (zh) 2007-07-04
WO2006111294A1 (en) 2006-10-26
RU2007106874A (ru) 2008-08-27
DE602006000239D1 (de) 2007-12-27
JP2008517339A (ja) 2008-05-22
ATE378675T1 (de) 2007-11-15
EP1754222A1 (en) 2007-02-21
KR20070062502A (ko) 2007-06-15
HK1095993A1 (en) 2007-05-25
PL1754222T3 (pl) 2008-04-30
TWI327306B (en) 2010-07-11

Similar Documents

Publication Publication Date Title
ES2297825T3 (es) Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales.
US11343631B2 (en) Compatible multi-channel coding/decoding
ES2770146T3 (es) Conformación temporal y espacial de señales de audio multicanal
ES2306076T3 (es) Aparato y metodo para construir una señal de salida multicanal o para generar una señal de downmix.
ES2923661T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
ES2340796T3 (es) Dispositivo y metodo para generar una señal estereofonica codificada de una pieza de audio o flujo de datos de audio.