ES2297825T3 - Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. - Google Patents
Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. Download PDFInfo
- Publication number
- ES2297825T3 ES2297825T3 ES06724214T ES06724214T ES2297825T3 ES 2297825 T3 ES2297825 T3 ES 2297825T3 ES 06724214 T ES06724214 T ES 06724214T ES 06724214 T ES06724214 T ES 06724214T ES 2297825 T3 ES2297825 T3 ES 2297825T3
- Authority
- ES
- Spain
- Prior art keywords
- parameter
- channel
- channels
- energy
- measure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011002 quantification Methods 0.000 title claims description 146
- 230000001419 dependent effect Effects 0.000 title description 11
- 238000013139 quantization Methods 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 claims description 50
- 230000005236 sound signal Effects 0.000 claims description 17
- 230000005540 biological transmission Effects 0.000 claims description 11
- 230000006835 compression Effects 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 230000008447 perception Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims 4
- 238000005259 measurement Methods 0.000 claims 2
- 238000012986 modification Methods 0.000 claims 2
- 230000004048 modification Effects 0.000 claims 2
- 238000013459 approach Methods 0.000 abstract description 3
- 230000003247 decreasing effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 26
- 230000008901 benefit Effects 0.000 description 9
- 230000007423 decrease Effects 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 102100040836 Claudin-1 Human genes 0.000 description 2
- 101100113671 Homo sapiens CLDN1 gene Proteins 0.000 description 2
- 101100113675 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CLD1 gene Proteins 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000004230 Fast Yellow AB Substances 0.000 description 1
- 238000012885 constant function Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
Cuantificador de parámetros para cuantificar un parámetro de entrada, el que el parámetro de entrada es una medida para una característica de un único canal o un par de canales con respecto a otro único canal o un par de canales de una señal multicanal, que comprende: un generador de reglas de cuantificación para generar una regla de cuantificación basándose en una relación de una medida de energía del canal o el par de canales y una medida de energía de la señal multicanal; y un cuantificador de valores para obtener un parámetro cuantificado a partir del parámetro de entrada, utilizando la regla de cuantificación generada.
Description
Cuantificación dependiente de energía para la
codificación eficaz de parámetros de audio espaciales.
La presente invención se refiere a
cuantificación de parámetros de audio espaciales y en particular a
un concepto para permitir una compresión más eficaz sin reducir de
manera significativa la calidad de percepción de una señal de audio
reconstruida utilizando los parámetros de audio espaciales
cuantificados.
Recientemente, las técnicas de reproducción de
audio multicanal son cada vez más importantes. En vista de una
transmisión eficaz de señales de audio multicanal que presentan 5 o
más canales de audio independientes, se han desarrollado diversas
maneras de comprimir una señal estéreo o multicanal. Enfoques
recientes para la codificación paramétrica de señales de audio
multicanal (estéreo paramétrico (PS, Parametric Stereo),
"codificación de indicación binaural" (BCC, Binaural Cue
Coding) etc.) representan una señal de audio multicanal por
medio de una señal de downmix (conversión de señal envolvente a
señal mono o estéreo)(que podría ser monofónica o comprender varios
canales) e información secundaria paramétrica, a la que también se
hace referencia como "indicaciones espaciales", caracterizando
su escenario de sonido espacial percibido.
Un dispositivo de codificación multicanal
generalmente recibe, como entrada, al menos dos canales, y emite
uno o más canales portadores y datos paramétricos. Los datos
paramétricos se obtienen de tal manera que, en un descodificador,
puede calcularse una aproximación de la señal multicanal original.
Normalmente, el(los) canal(canales)
portador(es) incluirá(n) muestras de subbanda, coeficientes
espectrales, muestras en el dominio del tiempo, etc., que
proporcionan una representación comparativamente precisa de la señal
subyacente, mientras que los datos paramétricos no incluyen tales
muestras de coeficientes espectrales sino que incluyen parámetros
de control para controlar en su lugar un cierto algoritmo de
reconstrucción. Una reconstrucción de este tipo podría comprender
ponderación mediante multiplicación, desplazamiento en el tiempo,
desplazamiento de frecuencia, desplazamiento de fase, etc. Por
tanto, los datos paramétricos incluyen sólo una representación
comparativamente basta de la señal o el canal asociado.
La técnica de codificación de indicación
binaural (BCC) se describe en un número de publicaciones, como en
"Binaural Cue Coding applied to Stereo and
Multi-Canal Audio Compression", C. Faller, F.
Baumgarte, convención AES, documento 5574, mayo de 2002, Munich, en
las 2 publicaciones de ICASSP "Estimation of auditory spatial
cues for binaural cue coding", y "Binaural cue coding: a
normal and efficient representación of spatial audio", ambas
escritas por C. Faller y F. Baumgarte, Orlando, FL, mayo de
2002.
En la codificación BCC, un número de canales de
entrada de audio se convierten a una representación espectral
utilizando una transformada basándose en DFT (transformada discreta
de Fourier, Discrete Fourier Transform) con ventanas
superpuestas. El espectro uniforme resultante se divide entonces en
particiones no superpuestas. Cada partición presenta un ancho de
banda proporcional al ancho de banda rectangular equivalente (ERB,
Equivalent Rectangular Bandwidth). Entonces, se estiman los
parámetros espaciales llamados ICLD (diferencia de nivel entre
canales, Inter-Channel Level Difference) e
ICTD (diferencia de tiempo entre canales,
Inter-Channel Time Difference) para cada
partición. El parámetro ICLD describe una diferencia de nivel entre
dos canales y el parámetro ICTD describe la diferencia de tiempo
(desfase) entre dos señales de diferentes canales. Las diferencias
de nivel y las diferencias de tiempo se dan normalmente para cada
canal con respecto a un canal de referencia. Después de la
obtención de estos parámetros, los parámetros se cuantifican y
finalmente se codifican para su transmisión.
Aunque los parámetros ICLD e ICTD representan
los parámetros de localización de fuente de sonido más importantes,
una representación espacial que utiliza estos parámetros puede
mejorarse introduciendo parámetros adicionales.
Una técnica relacionada, llamada "estéreo
paramétrico" describe la codificación paramétrica de una señal
estéreo de dos canales basándose en una señal mono transmitida más
información secundaria de parámetros. En este caso, se introducen 3
tipos de parámetros espaciales, a los que se hace referencia como
diferencia de intensidad entre canales (IID,
Inter-Channel Intensity Difference),
diferencias de fase entre canales (IPD,
Inter-Channel Phase Differences) y
coherencia entre canales (IC, Inter-Channel
Coherence). La ampliación del conjunto de parámetros espaciales
con un parámetro de coherencia (parámetro de correlación) permite
una parametrización de la "difusividad" espacial o
"compacidad" espacial percibida del escenario de sonido. El
estéreo paramétrico se describe con más detalle en:
"Parametric Coding of stereo audio", J. Breebaart, S.
van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied
Señal Proc. 9, páginas 1305 a 1322)'', en
"High-Quality Parametric Spatial Audio Coding
at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch,
E. Schuijers, 116ª convención AES, edición preliminar 6072, Berlín,
mayo de 2004, y en "Low Complexity Parametric Stereo
Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J.
Engdegard, 116ª convención AES, edición preliminar 6073, Berlín,
mayo de 2004.
La publicación internacional WO 2004/008805 A1
enseña cómo una señal de audio multicanal puede comprimirse de
manera ventajosa combinando varios módulos de estéreo paramétrico,
realizando por tanto una estructura jerárquica para obtener una
representación de la señal de audio multicanal original que
comprende una señal de downmix e información secundaria
paramétrica.
Dentro del enfoque de BCC y estéreo paramétrico
(PS), una representación de las diferencias de nivel (llamadas
también diferencias de intensidad ICLD o diferencias de energía IID)
entre canales de audio es una parte vital de una representación
paramétrica de una señal de audio estereofónica/multicanal. Tal
información y otros parámetros espaciales se transmiten desde el
codificador al descodificador para cada ranura de tiempo/frecuencia.
En vista de la eficacia de codificación, es por lo tanto de gran
interés representar estos parámetros tan compactamente como sea
posible mientras se conserva la calidad de audio.
En codificación BCC, las diferencias de nivel se
representan con respecto a un denominado "canal de referencia"
y se cuantifican sobre una escala uniforme en unidades de dB con
respecto a un canal de referencia. Esto no aprovecha óptimamente el
hecho de que los canales con bajo nivel con respecto al canal de
referencia están sometidos a un efecto de enmascaramiento
significativo cuando los escuchan oyentes humanos. En el caso
extremo de una canal que no presenta ninguna señal, el ancho de
banda utilizado por parámetros que describen este canal particular
está completamente desaprovechado. En el caso más común en el que un
canal es mucho más débil que otro canal, es decir, un oyente
difícilmente puede oír el canal débil durante la reproducción, una
reproducción menos precisa del canal débil también llevaría a la
misma calidad de percepción del oyente, puesto que la señal débil
está enmascarada principalmente por la señal más fuerte.
Para explicar la situación y los problemas que
surgen cuando se codifica una señal multicanal, se hace referencia
a la figura 10a en la que se ilustra una señal de 5 canales
comúnmente utilizada. La configuración de 5 canales presenta un
canal 101 trasero izquierdo (A, que presenta una señal a(t)),
un canal 102 delantero izquierdo (B, que presenta una señal
b(t)), un canal 103 central (C, que presenta una señal
c(t)), un canal 104 delantero derecho (D, que presenta una
señal d(t)) y un canal 105 posterior derecho (E, que presenta
una señal e(t)). Las relaciones de intensidad entre únicos
canales o pares de canales están marcadas con flechas. Por tanto,
la distribución de intensidad entre el canal 102 delantero izquierdo
y el canal 104 delantero derecho se marca con r_{1} (110), la
distribución de intensidad entre el canal posterior izquierdo y el
canal posterior derecho se marca con r_{4} (112). La distribución
de intensidad entre la combinación del canal 102 delantero izquierdo
y el canal 104 delantero derecho y el canal 103 central se marca
con r_{2} (114) y la distribución de intensidad entre la
combinación de los canales posteriores y la combinación de los
canales delanteros se marca con r_{3} (116).
Cuando, por ejemplo, se graba un simple
monólogo, la mayor parte de la energía estaría contenida en el canal
103 central. En este ejemplo, especialmente los canales posteriores
sólo contendrán poca energía (o 0). Por lo tanto, los parámetros
que describen las propiedades de los canales posteriores simplemente
se desaprovechan en este ejemplo, puesto que principalmente el
canal 102 central o los canales delanteros estarán activos durante
la reproducción.
Basándose en la figura 10a, las maneras de
calcular la distribución de energía entre canales o combinaciones de
canales se describen en el siguiente párrafo.
La figura 10a ilustra una parametrización
multicanal para una configuración de altavoces de cinco canales en
la que los diferentes canales de audio se indican por 101 a 105;
a(t) 101 representa la señal del canal envolvente izquierdo,
b(t) 102 representa la señal del canal delantero izquierdo,
c(t) 103 representa la señal del canal central, d(t)
104 representa la señal del canal delantero derecho, e(t) 105
representa la señal del canal envolvente derecho. La configuración
de altavoces está dividida en una parte delantera y una parte
posterior. La distribución de energía entre toda la configuración de
canales (102, 103 y 104) delanteros y los canales (101 y 105)
posteriores se ilustra mediante la flecha en figura 10a y se indica
mediante el parámetro r_{3}. La distribución de energía entre el
canal 103 central y los canales delantero izquierdo 102 y delantero
derecho 103 se indica mediante r_{2}. La distribución de energía
entre el canal 101 envolvente izquierdo y el canal 105 envolvente
derecho se ilustra mediante r_{4}. Finalmente, la distribución de
energía entre el canal 102 delantero izquierdo y el canal 104
delantero derecho viene dada por r_{1}. Puesto que r_{1} a
r_{4} son parametrizaciones de diferentes regiones también está
claro que aparte de la distribución de energía también pueden
parametrizarse otras propiedades de regiones esenciales, como por
ejemplo la correlación entre las regiones. Adicionalmente, puede
calcularse una energía local para cada parámetro r_{1} a r_{4}.
Por ejemplo, la energía local de r_{4} es la energía sumada del
canal A 101 y E 105.
Energía
Local_{r4} = E[a^{2} (t)] + E[e^{2}
(t)].
Donde E[.] es el valor esperado según se define
por
E[f(x)] =
\frac{1}{T} \int\limits^{T}_{0}
f(x(t))dt.
La figura 10b muestra un descodificador de audio
multicanal construido mediante módulos de estéreo paramétrico de
orden jerárquico, tal como se describe, por ejemplo en el documento
WO 2004/008805 A1. En este caso, los canales 101 a 105 de audio,
tal como se introducen en la figura 10a, se reproducen etapa a etapa
a partir de una única señal 120 (M) de downmix monofónica e
información secundaria correspondiente mediante un primer
descodificador 122 de dos canales, un segundo descodificador 124 de
dos canales, un tercer descodificador 126 de dos canales y un
cuarto descodificador 128 de dos canales. Tal como puede observarse,
en la estructura a modo de árbol de la figura 10b, el primer
descodificador de dos canales descompone la señal 120 de downmix
monofónica en dos señales alimentadas al segundo y al tercer
descodificador 124 y 126 de dos canales. En los mismos, el canal
alimentado al tercer descodificador 126 de dos canales es un canal
combinado, combinándose a partir del canal 101 posterior izquierdo
y del canal 105 posterior derecho. El canal alimentado al segundo
descodificador 124 de dos canales es una combinación del canal 103
central y un canal combinado que es de nuevo una combinación del
canal 102 delantero izquierdo y del canal 104 delantero derecho.
Por tanto, después de la segunda etapa de la
descodificación jerárquica, se reconstruyen el canal 101 posterior
izquierdo, el canal 105 posterior derecho, el canal 103 central y un
canal combinado, que es una combinación del canal 102 delantero
izquierdo y del canal 104 delantero derecho, utilizando los
parámetros espaciales transmitidos, que comprenden un parámetro de
nivel para su uso por cada uno de los descodificadores 122, 124, y
126 de dos canales.
En la tercera etapa de la descodificación
jerárquica, el cuarto descodificador 128 de dos canales obtiene el
canal 102 delantero izquierdo y el canal 104 delantero derecho,
utilizando una información de nivel transmitida como información
secundaria para el cuarto descodificador 128 de dos canales.
Utilizando un descodificador jerárquico de la técnica anterior tal
como se muestra en la figura 10b, la energía deseada para cada único
canal de salida se deduce a partir de diversos módulos de estéreo
paramétrico diferentes entre la señal de entrada y cada señal de
salida. Dicho de otro modo, la energía de un canal de salida
específico puede depender de los parámetros IID/ICLD de múltiples
módulos de estéreo paramétrico. En una estructura a modo de árbol
de este tipo de módulos de estéreo paramétrico conectados, también
puede aplicarse una cuantificación no uniforme de parámetros IID
dentro de cada módulo de estéreo paramétrico para producir valores
IID, que se utilizan entonces por un descodificador como parte de
la información secundaria. Esto aprovecharía localmente los
beneficios de cuantificación IID no uniforme (es decir, dentro de
cada módulo de estéreo paramétrico individualmente), aunque no es
del todo óptimo ya que la cuantificación en cada módulo
("hojas") se lleva a cabo independientemente de las
energías/nivel de otros canales de audio que pueden ser altos a
nivel relativo y, por lo tanto, se produce enmascaramiento.
Esto es posible, puesto que los módulos
"hoja" no son conscientes de la distribución de nivel global en
un nivel del árbol superior (por ejemplo, el módulo "raíz").
Cada hoja presenta su propio parámetro IID/ICLD correspondiente,
que indica la distribución de energía desde su entrada hacia los
canales de salida. Por ejemplo, el parámetro IID/ICLD de la hoja
"r_{3}" (procesado por el primer descodificador 122 de dos
canales) puede indicar que el 90 % de la energía entrante debería
enviarse a la hoja r_{2}, mientras que la energía restante (10 %)
debería enviarse a la hoja r_{4}. Este proceso se repite para cara
hoja en el árbol. Puesto que cada parámetro de distribución de
energía se representa con precisión limitada, la desviación entre la
energía deseada y la real de cada canal A a E de salida depende de
los errores de cuantificación en los parámetros IID/ICLD, así como
de la distribución de energía (y por tanto de la propagación de
errores de cuantificación). Dicho de otro modo, como se utiliza la
misma tabla de cuantificación para un cierto tipo de parámetros, por
ejemplo, ICC o IID, en todos los escenarios r_{1} a r_{4} de
parametrización, la cuantificación IID/ICLD se realiza de manera
óptima sólo locamente. Esto significa que para cada escenario
r_{1} a r_{4} de parametrización, el error en la energía de
salida de los canales de salida (locales) es máximo para el canal de
salida más débil en implementaciones de la técnica anterior.
Tal como se detalla en los párrafos anteriores,
la cuantificación de parámetros de nivel (IID o ICLD) u otros
parámetros tales como ICC, diferencias de fase o diferencias en el
tiempo que describen la percepción espacial de una señal de audio
multicanal no es todavía del todo óptima, puesto que puede
desaprovecharse ancho de banda para parámetros espaciales que
describen canales que están fundamentalmente enmascarados debido a
la baja energía en el canal.
Es el objetivo de la presente invención
proporcionar un concepto mejorado para la cuantificación de
parámetros espaciales de una señal de audio multicanal.
Según un primer aspecto de la presente
invención, este objetivo se consigue mediante un cuantificador de
parámetros para cuantificar un parámetro de entrada, en el que el
parámetro de entrada es una medida para una característica de un
único canal o un par de canales con respecto a otro único canal o un
par de canales de una señal multicanal, que comprende: un generador
de reglas de cuantificación para generar una regla de cuantificación
basándose en una relación de una medida de energía del canal o el
par de canales y una medida de energía de la señal multicanal; y un
cuantificador de valores para obtener un parámetro cuantificado a
partir del parámetro de entrada, utilizando la regla de
cuantificación generada.
Según un segundo aspecto de la presente
invención, este objetivo se consigue mediante un descuantificador
de parámetros para descuantificar un parámetro cuantificado para
obtener un parámetro, en el que el parámetro es una medida para una
característica de un único canal o un par canales con respecto a
otro único canal o un par de canales de una señal multicanal, que
comprende: un generador de reglas de descuantificación para generar
una regla de descuantificación basándose en una relación de una
medida de energía del canal o el par de canales y una medida de
energía de la señal multicanal; y un descuantificador de valores
para obtener el parámetro a partir del parámetro cuantificado,
utilizando la regla de descuantificación generada.
\newpage
Según un tercer aspecto de la presente
invención, este objetivo se consigue mediante un método de
cuantificación de un parámetro de entrada, en el que el parámetro
de entrada es una medida para una característica de un único canal
o un par de canales con respecto a otro único canal o un par de
canales de una señal multicanal, comprendiendo el método: generar
una regla de cuantificación basándose en una relación de una medida
de energía del canal o el par de canales y una medida de energía de
la señal multicanal; y obtener un parámetro cuantificado a partir
del parámetro de entrada utilizando la regla de cuantificación
generada.
Según un cuarto aspecto de la presente
invención, este objetivo se consigue mediante un método de
descuantificación de un parámetro cuantificado para obtener un
parámetro, en el que el parámetro es una medida para una
característica de un único canal o un par de canales con respecto a
otro único canal o un par de canales de una señal multicanal,
comprendiendo el método: generar una regla de descuantificación
basándose en una relación de una medida de energía del canal o el
par de canales y una medida de energía de la señal multicanal; y
obtener el parámetro a partir del parámetro cuantificado utilizando
la regla de descuantificación generada.
Según un quinto aspecto de la presente
invención, este objetivo se consigue mediante una representación de
una señal multicanal que presenta un parámetro cuantificado que es
una representación cuantificada de un parámetro que es una medida
para una característica de un único canal o un par de canales, en la
que el parámetro es una medida para una característica del único
canal o el par de canales con respecto a otro único canal o un par
de canales de una señal multicanal, en la que el parámetro
cuantificado se obtiene utilizando una regla de cuantificación
basándose en una relación de una medida de energía del canal o el
par de canales y una medida de energía de la señal multicanal.
Según un sexto aspecto de la presente invención,
este objetivo se consigue mediante un medio de almacenamiento
legible por máquina que tiene almacenado en el mismo una
representación de una señal multicanal tal como se describió
anteriormente.
Según un séptimo aspecto de la presente
invención, este objetivo se consigue mediante un transmisor o
grabador de audio que presenta un cuantificador de parámetros para
cuantificar un parámetro de entrada, en el que el parámetro de
entrada es una medida para una característica de un único canal o un
par de canales con respecto a otro único canal o un par de canales
de una señal multicanal, que comprende: un generador de reglas de
cuantificación para generar una regla de cuantificación basándose
en una relación de una medida de energía del canal o el par de
canales y una medida de energía de la señal multicanal; y un
cuantificador de valores para obtener un parámetro cuantificado a
partir del parámetro de entrada, utilizando la regla de
cuantificación generada.
Según un octavo aspecto de la presente
invención, este objetivo se consigue mediante un receptor o
reproductor de audio que presenta un descuantificador de parámetros
para descuantificar un parámetro cuantificado para obtener un
parámetro, en el que el parámetro es una medida para una
característica de un único canal o un par de canales con respecto a
otro único canal o un par de canales de una señal multicanal, que
comprende: un generador de reglas de descuantificación para generar
una regla de descuantificación basándose en una relación de una
medida de energía del canal o el par de canales y una medida de
energía de la señal multicanal; y un descuantificador de valores
para obtener el parámetro a partir del parámetro cuantificado,
utilizando la regla de descuantificación generada.
Según un noveno aspecto de la presente
invención, este objetivo se consigue mediante un método de
transmisión o grabación de audio, comprendiendo el método un método
de cuantificación de un parámetro de entrada, en el que el
parámetro de entrada es una medida para una característica de un
único canal o un par de canales con respecto a otro único canal o
un par de canales de una señal multicanal, comprendiendo el método:
generar una regla de cuantificación basándose en una relación de
una medida de energía del canal o el par de canales y una medida de
energía de la señal multicanal; y obtener un parámetro cuantificado
a partir del parámetro de entrada utilizando la regla de
cuantificación generada.
Según un décimo aspecto de la presente
invención, este objetivo se consigue mediante un método de recepción
o reproducción de audio, presentando el método un método de
descuantificación de un parámetro cuantificado para obtener un
parámetro, en el que el parámetro es una medida para una
característica de un único canal o un par de canales con respecto a
otro único canal o un par de canales de una señal multicanal,
comprendiendo el método: generar una regla de descuantificación
basándose en una relación de una medida de energía del canal o el
par de canales y una medida de energía de la señal multicanal; y
obtener el parámetro a partir del parámetro cuantificado utilizando
la regla de descuantificación generada.
Según un undécimo aspecto de la presente
invención, este objetivo se consigue mediante un sistema de
transmisión que presenta un transmisor y un receptor, presentando
el transmisor un cuantificador de parámetros para cuantificar un
parámetro de entrada; y presentando el receptor un descuantificador
de parámetros para descuantificar un parámetro cuantificado.
Según un duodécimo aspecto de la presente
invención, este objetivo se consigue mediante un método de
transmisión y recepción, incluyendo el método un método de
transmisión que presenta un método de cuantificación de un
parámetro de entrada; e incluyendo el método un método de recepción
que incluye un método de descuantificación de un parámetro
cuantificado.
\newpage
Según un decimotercero aspecto de la presente
invención, este objetivo se consigue mediante un programa
informático para realizar, cuando se ejecuta en un ordenador, uno
de los métodos anteriores.
La presente invención se basa en el
descubrimiento de que los parámetros que son una medida para una
característica de un único canal o de un par de canales con
respecto a otro único canal o de un par de canales de una señal
multicanal pueden cuantificarse más eficazmente utilizando una regla
de cuantificación que se genera basándose en una relación de una
medida de energía del canal o el par de canales y una medida de
energía de la señal multicanal.
El concepto inventivo presenta la ventaja
principal de que o bien se genera una regla de cuantificación o
bien se selecciona una regla de cuantificación apropiada a partir de
un grupo de reglas de cuantificación disponibles, dependiendo de la
energía de la señal que va a describirse. Por lo tanto, puede
aplicarse un modelo psicoacústico a un cuantificador durante la
codificación o a un descuantificador durante la descodificación,
para utilizar una regla de cuantificación adaptada a las necesidades
de la señal real. Especialmente, cuando un canal contiene muy poca
energía comparado con otros canales en la señal multicanal, la
cuantificación puede ser mucho más basta que para señales que
presentan altas energías. Esto se debe al hecho que las señales de
alta energía enmascaran las señales de baja energía durante la
reproducción, es decir, un oyente difícilmente reconocerá algún
detalle de la señal de baja energía y por tanto la señal de baja
energía puede deteriorarse más a través de la cuantificación basta
sin que el oyente pueda reconocer el falseamiento debido al alto
enmascaramiento de la señal de baja energía.
En una realización de la presente invención, un
cuantificador de parámetros para cuantificar parámetros presenta un
generador de reglas de cuantificación para generar una regla de
cuantificación y un cuantificador de valores para obtener
parámetros cuantificados a partir de parámetros de entrada
utilizando la regla de cuantificación generada. Para generar una
regla de cuantificación apropiada, el selector de cuantificador
recibe como una entrada la energía total de la señal de audio
multicanal que va a codificarse y la energía local del canal o el
par de canales cuyos parámetros espaciales van a cuantificarse.
Conociendo la energía total y la energía local, el selector de
cuantificador puede decidir qué regla de cuantificación utilizar, es
decir, seleccionar reglas de cuantificación más bastas para canales
o pares de canales que presentan energía local comparativamente
baja. Como alternativa, el selector de cuantificador también podría
obtener una regla algorítmica para modificar una regla de
cuantificación existente o para calcular una regla de cuantificación
completamente nueva dependiendo de la energía local y la total. Una
posibilidad sería por ejemplo calcular un factor de escala general
para aplicarse a una señal antes de un cuantificador lineal o un
cuantificador no lineal para conseguir el objetivo de reducir el
tamaño de la información secundaria que va a transmitirse.
En una realización adicional de la presente
invención, se codifica una señal multicanal mediante pares, es
decir, utilizando una estructura jerárquica que presenta varios
elementos de downmix 2 a 1 ordenados en una estructura a modo de
árbol, generando cada elemento de downmix un canal mono a partir de
dos canales introducidos en el elemento de downmix. Siguiendo el
concepto inventivo, ahora puede implementarse la cuantificación
dependiente de energía no sólo localmente, es decir, en cada
elemento de downmix 2 a 1 que tiene la información disponible
solamente en la entrada del elemento de downmix 2 a 1, pero
basándose en el conocimiento global de la suma de las energías de
las señales. Esto mejora la calidad de percepción de una señal de
percepción significativamente.
Es evidente que siguiendo el concepto inventivo,
el tamaño de la información secundaria puede disminuirse mientras
que difícilmente se ve afectada la calidad de la señal de audio
multicanal codificada.
En una realización adicional de la presente
invención, se incorpora un cuantificador de parámetros inventivo en
un codificador de parámetros antes de un codificador diferencial y
un codificador de Huffman, utilizándose ambos para codificar
adicionalmente los parámetros cuantificados para obtener un flujo de
bits de parámetros. Un codificador inventivo de este tipo tiene la
gran ventaja de que además de disminuir el tamaño de palabras de
código necesarias para describir los parámetros cuantificados, una
cuantificación más basta aumentará automáticamente la abundancia de
palabras de código idénticas alimentadas al codificador diferencial
y al codificador de Huffman, lo que permite una mejor compresión de
los parámetros cuantificados, reduciendo además el tamaño de la
información secundaria.
En una realización adicional de la presente
invención, un cuantificador de parámetros inventivo presenta un
generador de funciones de factor del cuantificador y un
multiplicador de parámetros. El generador de funciones de factor
del cuantificador recibe la energía total y la local como entrada y
obtiene un único valor de elemento de ajuste a escala a partir de
las cantidades de entrada. El multiplicador de parámetros recibe los
parámetros y el factor f del cuantificador obtenido para dividir
los parámetros por el factor del cuantificador antes de transferir
los parámetros modificados al cuantificador que aplica una regla de
cuantificación fija a los parámetros modificados.
Una variación de esta realización es tener un
multiplicador de parámetros después del cuantificador y por tanto
utilizar el factor f del cuantificador obtenido para dividir el
índice resultante a partir del cuantificador. El resultado de esto
necesita entonces redondearse de nuevo a un índice entero.
La aplicación de un factor de escala a los
parámetros presenta el mismo efecto que elegir diferentes reglas de
cuantificación puesto que, por ejemplo, la división por un factor
grande comprime el espacio de parámetros de entrada de tal manera
que efectivamente sólo sería efectiva una parte más pequeña de una
regla de cuantificación ya existente. Esta solución tiene la
ventaja de que en el lado del descodificador y del codificador puede
ahorrarse memoria adicional porque sólo hay una regla de
cuantificación que ha de almacenarse o ha de procesarse puesto que
el ajuste a escala se realiza mediante una simple multiplicación,
requiriendo sólo hardware o software adicional limitado. Una
ventaja adicional es que aplicando un factor del cuantificador, el
factor del cuantificador puede obtenerse utilizando cualquier
dependencia funcional posible. Por lo tanto, puede ajustarse la
sensibilidad de un cuantificador o de un descuantificador
continuamente dentro del espacio de parámetros de entrada posible
total en vez de seleccionar reglas de cuantificación predefinidas a
partir de una muestra dada.
Posteriormente se describen realizaciones
preferidas de la presente invención haciendo referencia a los
dibujos adjuntos, en los que:
la figura 1 muestra un diagrama de bloques de un
cuantificador de parámetros inventivo;
las figuras 2a a c muestran varias reglas de
cuantificación posibles de aplicar;
la figura 3 muestra un codificador de parámetros
que presenta un cuantificador de parámetros inventivo;
las figuras 4a, 4b muestran una realización
alternativa de un codificador de parámetros que presenta un
cuantificador de parámetros inventivo;
la figura 5 muestra ejemplos de funciones de
factor de escala;
la figura 6 muestra una regla de cuantificación
no lineal;
la figura 7 muestra un descuantificador de
parámetros inventivo;
la figura 8 muestra un descompresor de
parámetros que presenta un descuantificador de parámetros
inventivo;
la figura 9a muestra una realización de un
descuantificador de parámetros inventivo;
la figura 9b muestra una realización adicional
de un descuantificador de parámetros inventivo;
la figura 9c muestra un ejemplo para implementar
descuantificación dependiente de energía;
la figura 9d muestra un ejemplo adicional para
implementar descuantificación dependiente de energía;
la figura 9e muestra ejemplos de cuantificación
y descuantificación de parámetros;
la figura 10a muestra una representación de una
señal de audio multicanal de 5 canales; y
la figura 10b muestra un descodificador
multicanal paramétrico jerárquico según la técnica anterior.
La figura 1 muestra un cuantificador 199 de
parámetros inventivo que presenta un cuantificador 200 y un selector
202 de cuantificador. El selector 202 de cuantificador recibe la
energía local del canal o el par de canales subyacentes a los
parámetros que van a codificarse y la energía total de la señal de
audio multicanal. Basándose en ambas informaciones de energía, el
selector 202 de cuantificador genera una regla de cuantificación que
utiliza el cuantificador 200 para obtener un parámetro 204
cuantificado a partir de un parámetro 206 introducido en el
cuantificador 200. Por tanto, en este caso el selector 202 de
cuantificador sirve como un generador de reglas de
cuantificación.
Los parámetros de entrada al selector 202 de
cuantificador son la energía total de la señal multicanal original
y la energía local para el canal descrito por parámetro que va
cuantificarse. En una realización preferida de la presente
invención la proporción entre la energía local y la energía total da
una medida que puede utilizarse para decidir qué cuantificador
utilizar. Como un ejemplo, esta proporción q (energía local
relativa) puede calcularse en dB, utilizando la siguiente
ecuación:
q = 10 \cdot
log 10 \left(\frac{\text{Energía Local}}{\text{Energía
Total}}\right)
El cuantificador seleccionado se utiliza
entonces para cuantificar el parámetro 206 con el cuantificador.
La presente invención enseña que puede
utilizarse una cuantificación más basta de parámetros IID/ICLD (y
similares) si un escenario de parametrización es inferior en
energía comparado con la energía total, es decir, cuando la energía
q local relativa es pequeña. La presente invención utiliza la
relación psicoacústica que es más importante para parametrizar las
señales de energía dominante/alta con alta precisión que la señal de
audio con energía baja/menos importante. Para hacer esto incluso
más claro se hace referencia de nuevo a la figura 10a. Cuando
dentro de un escenario de audio en la señal multicanal original la
energía/señal está presente principalmente en la imagen delantera,
es decir el canal 102 delantero izquierdo, el canal 103 central y el
canal 104 delantero derecho, los canales envolventes pueden
cuantificarse con menos precisión puesto que los canales
envolventes presentan mucha menos energía. El error de
cuantificación adicional introducido a partir de la cuantificación
más basta no puede percibirse puesto que los canales delanteros
presentan energía mucho más alta y por tanto el error de
cuantificación de r_{4} (y los errores de energía resultantes para
los canales A y E envolventes) se enmascara mediante los canales B,
D, y/o C.
En el ejemplo más extremo, los canales A y E
envolventes sólo presentan algún ruido débil y los canales B, C, y
D delanteros presentan señales de amplitud completa. En tal caso,
una señal original PCM de 16 bits indicaría una diferencia de
energía de más de 80 dB. Por lo tanto, podría realizarse una
cuantificación basta arbitrariamente para el parámetro r_{4} sin
introducir ninguna diferencia audible debido a la cuantificación
(basta).
Las figuras 2a a 2c muestran tres posibles
reglas de cuantificación que introducen diferentes niveles de
errores de cuantificación. Todas las figuras muestran el parámetro
original en sus ejes x y los valores enteros asignados a los
parámetros en sus ejes y. Además, las figuras 2a a 2c muestran
líneas discontinuas que corresponden a índices para cada etapa de
cuantificación y por tanto pueden utilizarse para su transmisión o
almacenamiento. Los índices transmitidos pueden entonces utilizarse
en el lado del descodificador, por ejemplo en combinación con una
tabla de consulta, para la descuantificación.
La cuantificación más precisa se indica en la
figura 2a mediante la curva 230 de cuantificación que mapea
intervalos de parámetros discretos del eje x con 13 valores enteros.
La cuantificación intermedia se consigue mediante la curva 232 de
cuantificación en la figura 2b, mientras que la cuantificación más
basta se consigue mediante la curva 234 de cuantificación de la
figura 2c. Es obvio que el error de cuantificación introducido es
mayor en el ejemplo mostrado en la figura 2c y menor en el ejemplo
mostrado en la figura 2a.
Estas tres reglas de cuantificación son ejemplos
de reglas de cuantificación que puede seleccionar el selector 202
de cuantificador. Dicho de otro modo, las figuras 2a a c ilustran
tres reglas de cuantificación lineales diferentes, donde el eje x
describe el valor de entrada y el eje y da el valor cuantificado
correspondiente. Las figuras 2a a 2c presentan todas la misma
escala en el eje x y en el eje y, y por tanto, la figura 2a presenta
la cuantificación más precisa de las tres y por tanto el error de
cuantificación más pequeño. La figura 2c presenta la cuantificación
más basta y por tanto el error de cuantificación más grande. También
proporcionaría la tasa de bits más baja después de la codificación
diferencial y la codificación de Huffman puesto que presenta la
cantidad más pequeña de escalones de cuantificación.
Como ejemplo, una posible generación de reglas
de cuantificación podría basarse en la energía q local relativa
entre la energía local y la energía total, tal como se comentó
anteriormente. Una posible gama de valores q con selecciones
correspondientes de reglas de cuantificación se resume, como
ejemplo, en la siguiente tabla:
La figura 3 muestra un compresor de parámetros
inventivo que presenta un cuantificador 199 de parámetros inventivo,
un codificador 220 diferencial, y un codificador 222 de Huffman. El
codificador de parámetros inventivo de la figura 3 amplía el
cuantificador de parámetros de la figura 1 utilizando los parámetros
cuantificados como entrada para el codificador 220 diferencial que
codifica diferencialmente los parámetros 204 cuantificados para
obtener parámetros cuantificados codificados diferencialmente que se
introducen entonces en el codificador 222 de Huffman que aplica un
esquema de codificación de Huffman a los parámetros cuantificados
codificados diferencialmente obteniendo un elemento 224 de flujo de
bits de parámetros de un flujo final de bits de parámetros como
salida.
La combinación de un cuantificador de parámetros
inventivo con un codificador diferencial y un codificador de
Huffman es particularmente atractiva puesto que una cuantificación
más basta da como resultado una mayor abundancia de símbolos
iguales (parámetros cuantificados). La combinación del codificador
220 diferencial y el codificador 222 de Huffman proporcionará
obviamente una representación codificada de los parámetros
cuantificados (elemento 224 de flujo de bits de parámetros) que es
más compacta, cuando el número máximo de posibles símbolos de
entrada disminuye mediante una cuantificación más basta.
La figura 4a muestra una realización adicional
de un codificador de parámetros inventivo que utiliza un
cuantificador 250 de parámetros inventivo, un codificador 252
diferencial, y un codificador 254 de Huffman.
El cuantificador 250 de parámetros presenta un
generador 256 de factores del cuantificador, un elemento 258 de
ajuste a escala de parámetros, y un cuantificador 260. En este caso,
el generador 256 de factores del cuantificador junto con el elemento
258 de ajuste a escala de parámetros sirve como un generador de
reglas de cuantificación.
El generador 256 de funciones del cuantificador
recibe como entrada la energía total de la señal de audio
multicanal y la energía local del canal o el par de canales para el
parámetro que va a cuantificarse. El generador 256 de factores del
cuantificador genera un factor 262 (f) de escala basándose en la
energía local y la energía total. En una realización preferida esto
se realiza basándose en una proporción entre la energía local y la
energía total dando como resultado una energía q local relativa,
según sigue:
q = 10 \cdot
log 10 \left(\frac{\text{Energía Local}}{\text{Energía
Total}}\right)
Esta proporción q puede utilizarse dentro del
generador 256 de factores del cuantificador para calcular el factor
f (262) del cuantificador que se utiliza como entrada para el
elemento 258 de ajuste a escala de parámetros que recibe
adicionalmente el parámetro que va a cuantificarse.
El elemento 258 de ajuste a escala de parámetros
aplica un ajuste a escala al parámetro de entrada que podría ser,
por ejemplo, una división del parámetro por el factor 262 del
cuantificador. El ajuste a escala del parámetro es equivalente a
seleccionar reglas de cuantificación diferentes. El parámetro
ajustado a escala se introduce entonces en un cuantificador 260 que
aplica una regla de cuantificación fija en esta realización de la
presente invención. El procesamiento adicional del parámetro
cuantificado es igual al procesamiento de la figura 3, el parámetro
se codifica diferencialmente y después se codifica mediante
codificación de Huffman para proporcionar finalmente un elemento de
flujo de bits de parámetros.
Aplicar un factor de escala a los parámetros
presenta la ventaja de que la regla de cuantificación podría
adaptarse a las necesidades de una manera continua, puesto que una
función analítica que obtiene el factor 262 de cuantificación puede
tener básicamente cualquier forma.
La figura 4b muestra una realización adicional
de un codificador 270 de parámetros inventivo que es similar al
codificador 250 de parámetros inventivo mostrado en la figura 4a.
Por lo tanto, sólo se explicarán brevemente las diferencias con el
codificador 250 de parámetros en el siguiente párrafo.
El codificador 270 de parámetros inventivo no
presenta un elemento de ajuste a escala de parámetros (elemento 258
de ajuste a escala de parámetros del codificador 250 de parámetros).
Para conseguir una dependencia de energía de cuantificación, el
cuantificador 270 de parámetros presenta en su lugar un dispositivo
272 de compresión. Esto significa que el generador 256 de factores
del cuantificador junto con el dispositivo 258 de compresión sirve
como un generador de reglas de cuantificación en este caso. El
dispositivo 272 de compresión está conectado al cuantificador 260 y
al generador 256 de factores del cuantificador. La unidad 272 de
compresión recibe como una entrada un parámetro cuantificado que se
cuantifica mediante el cuantificador 260 según la utilización de un
esquema de cuantificación fijo. Para implementar la dependencia de
energía, la unidad de compresión utiliza el parámetro cuantificado
como entrada y ajusta a escala el parámetro cuantificado utilizando
el 262 factor de escala. Esto ahorra tasa de bits disminuyendo el
número posible de parámetros cuantificados que van a transmitirse
al codificador 252 delta. Esta compresión puede conseguirse, por
ejemplo, mediante una división del índice del parámetro cuantificado
por el factor 262 de escala.
En la figura 5 se muestran posibles funciones
para obtener el factor 262 de escala a partir de la proporción q de
energía local relativa. La figura 5 muestra como un ejemplo cuatro
posibles funciones 300, 302, 303 y 304 diferentes que pueden
utilizarse para obtener el factor f de escala. La primera función
300 de factor es una función constante y por tanto no presenta
dependencia de energía.
Las funciones 302 y 304 de factor muestran dos
posibilidades para implementar funciones de factor, en las que la
función 302 de factor es la menos agresiva y por lo tanto aumentaría
en menor medida el error de cuantificación introducido que
utilizando la función 304 de factor. Por otro lado, la función 302
de factor ahorraría menos tasa de bits que la función 304 de
factor. La función 303 de factor muestra una cuarta posibilidad para
obtener el factor del cuantificador a partir de la cuota q de
energía, mientra que la función 303 de factor es escalonada y por
lo tanto asigna intervalos de la cuota q de energía al mismo factor
del cuantificador.
La figura 6 ejemplifica un cuantificador no
uniforme en el que la entrada en el eje x en dB se cuantifica según
la función 310 para dar como resultado la salida y en dB que se
dibuja en el eje y. Una función del cuantificador no uniforme de
este tipo puede utilizarse para cuantificar también parámetros
espaciales. Esto es de especial interés cuando el canal de
referencia en un esquema de codificación BCC se elige para que sea
el canal más fuerte en una señal multicanal. El cuantificador no
uniforme tal como se muestra en la figura 6 ejemplifica una función
310 del cuantificador que se ajustaría entonces a las necesidades,
puesto que los escalones de cuantificación aumentan a medida que el
nivel de energía se vuelve más pequeño comparado con el canal al
que se hace referencia. Esta es una propiedad particularmente
atractiva puesto que los errores de cuantificación del nivel de
energía pueden ser mayores para canales con menos energía que para
los canales más fuertes.
La figura 7 muestra un descuantificador 500 de
parámetros inventivo que presenta un descuantificador 502 y un
selector 504 de descuantificador. El selector 504 de
descuantificador recibe la energía total de la señal de audio
multicanal y la energía local del canal o pares de canales junto con
un parámetro 505 cuantificado que va a descuantificarse. Basándose
en la información de energía rec a, el selector 504 de
descuantificador obtiene una regla de descuantificación que utiliza
el descuantificador 502 para descuantificar el parámetro 505
cuantificado. Por tanto, en este caso el selector 504 de
descuantificador sirve como un generador de reglas de
descuantificación.
Puede observarse que el selector 504 de
descuantificador puede funcionar de diferentes maneras. Una primera
posibilidad es que el selector 504 de descuantificador obtenga la
regla de cuantificación directamente y transfiera la regla de
cuantificación obtenida al descuantificador 502. Otra posibilidad es
que el selector 504 de descuantificador satisfaga una decisión de
regla de descuantificación que se transfiere al descuantificador 502
que puede utilizar la decisión de regla de descuantificación para
seleccionar la regla de descuantificación apropiada de un número de
reglas de cuantificación que, por ejemplo, se almacenan en el
descuantificador 502.
La figura 8 muestra un descodificador de
parámetros inventivo que presenta un descuantificador 500 de
parámetros, un descodificador 510 diferencial y un descodificador
512 de Huffman.
El descodificador 512 de Huffman recibe un
elemento 513 de flujo de bits de parámetros y en asociación con el
mismo, el selector 504 de descuantificador recibe la energía local
de un canal o un par de canales descritos por el elemento 513 de
flujo de bits de parámetros y la energía total de la señal de audio
multicanal. El elemento 513 de flujo de bits de parámetros se
produce mediante un codificador de parámetros inventivo, tal como
se muestra en la figura 3. Por lo tanto, el elemento 513 de flujo de
bits de parámetros se descodifica mediante descodificación de
Huffman por el descodificador 512 de Huffman y se descodifica
diferencialmente por un descodificador 510 diferencial antes de
suministrarse al descuantificador 502. Después de la descodificación
mediante el descodificador 512 de Huffman y el descodificador 510
diferencial, la descuantificación se realiza mediante el
descuantificador 500 de parámetros inventivo, tal como ya se
describió en la descripción del parámetro inventivo de la figura
7.
Dicho de otro modo, la figura 8 ilustra un
descodificador que utiliza un descuantificador 500 dependiente de
energía, correspondiendo el descodificador a un codificador
inventivo. El elemento de flujo de bits de parámetros se
descodifica mediante descodificación de Huffman y se descodifica
diferencialmente en índices. El descuantificador correcto se elige
en el selector 504 de descuantificador utilizando la misma regla y
función que la que se utilizó en el codificador con la energía
total y energía local como entrada. El descuantificador
seleccionado se utiliza entonces para descuantificar (utilizando el
descuantificador 502) los índices en parámetros
descuantificados.
La figura 9a muestra una realización adicional
de un descodificador de parámetros inventivo, que presenta un
descuantificador 520 dependiente de energía inventivo, un
descodificador 512 de Huffman y un descodificador 510 diferencial.
El descuantificador 520 de parámetros comprende un generador 522 de
factores del cuantificador, un descuantificador 524, y un elemento
526 de ajuste a escala de parámetros. En este caso, el generador 522
de factores del descuantificador junto con el elemento 526 de
ajuste a escala de parámetros sirve como un generador de reglas de
descuantificación.
Después de descodificar el elemento 513 de flujo
de bits de parámetros mediante el descodificador de Huffman y el
descodificador diferencial, el parámetro cuantificado se
descuantifica mediante el descuantificador 524, donde el
descuantificador 524 utiliza una regla de descuantificación que
corresponde a una regla de cuantificación utilizada para generar el
parámetro cuantificado. El generador 522 de factores del
cuantificador obtiene un factor 528 (f) de escala a partir de una
proporción de la energía local y la energía total de la señal de
audio multicanal. El elemento 526 de ajuste a escala de parámetros
aplica entonces el factor 528 de escala al parámetro descuantificado
mediante una multiplicación del factor de escala con el parámetro
descuantificado.
Después del ajuste a escala mediante el elemento
526 de ajuste a escala de parámetros, los parámetros
descuantificados descomprimidos están disponibles en una salida del
descodificador de parámetros inventivo.
La figura 9b muestra una realización adicional
de un descodificador 530 de parámetros inventivo, similar al
descodificador 520 de parámetros inventivo. Por lo tanto, sólo se
explicarán en detalle las diferencias con el descodificador 520 de
parámetros en el siguiente párrafo.
El descodificador 530 de parámetros inventivo
presenta un descompresor 532, consiguiendo el descompresor 532 el
mismo resultado funcional que el elemento de 526 ajuste a escala de
parámetros en el descodificador 520 de parámetros inventivo. El
descompresor 532 recibe como una entrada los parámetros
cuantificados y como entrada adicional el factor 528 de escala
desde el generador 522 de factores. Eso significa que el generador
522 de factores junto con el descompresor 532 sirve como un
generador de reglas de descuantificación en este caso. Para
implementar la funcionalidad de descuantificación ponderada de
energía, el parámetro cuantificado se ajusta a escala mediante el
descompresor 532 antes de que el parámetro cuantificado ajustado a
escala así obtenido se introduzca en el descuantificador 524.
Entonces, el descuantificador 524 descuantifica el parámetro
cuantificado ajustado a escala para obtener el parámetro
descuantificado utilizando un regla de descuantificación fija. Esta
descompresión puede conseguirse, por ejemplo, mediante una
multiplicación del índice del parámetro cuantificado por el factor
528 de escala.
Aunque el ajuste a escala mediante el elemento
258 de ajuste a escala de parámetros y el elemento 526 de ajuste a
escala de parámetros durante la codificación y descodificación se
describe para que sea una división durante la codificación y una
multiplicación durante la descodificación, puede aplicarse a los
parámetros durante la codificación o la descodificación cualquier
otro tipo de ajuste a escala que tenga el mismo efecto que utilizar
una regla de cuantificación diferente.
En el caso de una parametrización apilada
(codificación o descodificación jerárquica) tal como se ejemplifica,
por ejemplo, en la figura 10b, debería observarse que puesto que el
descodificador puede descodificar la distribución de energía a
partir de las raíces (el canal de downmix) a partir de las hojas,
existe una energía local bien definida en cada parametrización
r_{1} a r_{4} (descodificadores 122, 124, 126 y 128 de dos
canales), ésta puede utilizarse como la energía local en el lado
del descodificador. Adicionalmente, si un codificador también
cuantifica desde la raíz a la hoja, puede utilizarse exactamente la
misma energía local en el codificador como la energía local para el
selector de cuantificador y la función de factor del
cuantificador.
Dicho de otro modo, un descodificador puede
incluso decidir de un modo autónomo qué regla de descuantificación
usar utilizando la energía total y la energía local. Como
alternativa, podría señalizarse mediante alguna información
secundaria adicional al descodificador qué regla de
descuantificación es la apropiada para descuantificar los
parámetros.
Aunque se describe en diferentes realizaciones
de la presente invención, la aplicación de un factor de escala y la
selección de una regla de descuantificación apropiada también puede
combinarse en una realización de un codificador o descodificador
inventivo.
Para dar un ejemplo más detallado, en las
figuras 9c y 9d se muestran dos posibles maneras de implementar una
descuantificación dependiente de energía para la reconstrucción de
una señal multicanal a partir de una señal M monofónica transferida
utilizando parámetros (CLD, ICC) espaciales transmitidos
adicionalmente. Antes de comentar las figuras, puede observarse que
la estructura a modo de árbol en las figuras sólo es importante
para la reconstrucción de los parámetros espaciales, donde el abmix
para la generación de los canales individuales de una señal
multicanal se realiza normalmente en una única etapa.
La figura 9c muestra la situación en la que los
parámetros CLD se obtienen de tal manera que se supone que un
parámetro CLDº describe la distribución de energía entre canales que
se combinan utilizando un número de canales de la señal
original.
En la primera posición 1000 de upmix (conversión
de señal mono o estéreo en señal envolvente) jerárquico, CLDº
describe la relación de energía entre dos canales, donde un primer
canal es una combinación 1002 de un canal delantero izquierdo, un
canal delantero derecho, un canal central y un canal de mejora de
bajas frecuencias. El segundo canal es una combinación de un canal
posterior izquierdo y un canal posterior derecho. Dicho de otro
modo, el parámetro CLDº describe la distribución de energía entre
todos los canales traseros y todos los canales delanteros.
Por lo tanto es evidente que cuando CLDº indica
que sólo pequeñas energías están contenidas en los canales
traseros, los parámetros que describen las propiedades espaciales
entre el canal posterior izquierdo y el posterior derecho pueden
cuantificarse de manera más fuerte, puesto que la distorsión
introducida adicionalmente por la cuantificación basta es
difícilmente audible todos los canales se reproducen
simultáneamente.
Un descuantificador de parámetros inventivo, tal
como se muestra en la figura 9b es, por ejemplo, calcular un factor
528 de escala para implementar la descuantificación multiplicando un
parámetro que va a cuantificarse con un índice de parámetro antes
de que se realice la descuantificación real. Por lo tanto, si se
transmite un parámetro CLDº, se puede, cuando se utiliza el
descodificador de la figura 9b por ejemplo, calcular los parámetros
CLD utilizados finalmente de otras etapas jerárquicas según la
siguiente fórmula.
En lo sucesivo, el término "DEQ" describe
la aplicación de una tabla de descuantificación fija para un
parámetro dado para el procedimiento DEQ. Es decir, un parámetro
IDX CLD (0,L) transmitido puede cuantificarse directamente, lo que
se indica mediante la siguiente expresión:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Puesto que el parámetro CLD describe una
distribución de energía entre dos canales y los canales son
combinaciones de canales según se indica en la figura 9c, puede
obtenerse ahora la energía FC local relativa según:
\vskip1.000000\baselineskip
\newpage
La energía local relativa de los canales
posteriores es por consiguiente:
Dado lo anterior y el concepto inventivo, ahora
puede calcularse CLD^{1}, teniendo en cuenta la energía global
contenida en la señal 1002 de combinación:
En la fórmula dada anteriormente, el término
"facFunc" describe una función que da una independencia del
valor real de la energía FC local relativa. Dicho de otro modo, la
formula 4 describe que antes de la descuantificación, el índice IDX
CLD (1,1,m) del parámetro transmitido se multiplica con un factor
(facFunc) de escala para obtener un parámetro cuantificado
intermedio. Puesto que el parámetro cuantificado intermedio no es
necesariamente un valor entero, el parámetro cuantificado
intermedio debe redondearse para obtener IdxCLDEdQ, que se
descuantifica después en el parámetro final utilizado por la
siguiente operación:
La descuantificación se realiza mediante una
tabla de descuantificación estándar, tal como, por ejemplo, la
siguiente:
El parámetro CLD^{1} obtenido describe una
relación de energía entre un canal que es una combinación de un
canal delantero izquierdo y un canal delantero derecho y un canal
siendo una combinación de un canal central y un canal de mejora de
bajas frecuencias, tal como puede observarse a partir de la
descomposición de canales en la segunda etapa 1004 jerárquica. Así,
puede calcularse una energía F local relativa, que describe una
energía contenida en los canales delanteros, delantero izquierdo y
delantero derecho, según la siguiente fórmula:
Anteriormente, se ha obtenido una energía S
local relativa que describe la energía de los canales posteriores
de tal manera que puede calcularse un parámetro IDX CLD EDQ
cuantificado intermedio para la caja 1006 jerárquica según las
siguientes fórmulas:
Puesto que, tal como se describió anteriormente,
ahora está disponible una energía local relativa que describe la
energía (F^{5151}) de sólo los canales delanteros, el parámetro
CLD^{3} que describe una relación de energía entre el canal
delantero izquierdo y el delantero derecho puede obtenerse ahora de
una manera dependiente de energía según las siguientes fórmulas:
En una posible implementación, el parámetro
CAD^{4} que describe una relación de energía entre el canal
central y el de mejora de bajas frecuencias puede obtenerse ahora
sin utilizar ninguna función de factor:
En realizaciones alternativas, por supuesto,
también es factible implementar dependencia de energía también en la
obtención del parámetro CLD^{4}.
La figura 9d muestra otra posibilidad de definir
una jerarquía para la obtención de los parámetros espaciales.
En analogía con la descripción de la figura 9c,
los parámetros CLD individuales pueden obtenerse según las
siguientes fórmulas:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Puede observarse que pueden utilizarse
diferentes funciones de factor para implementar el concepto
inventivo tal como, por ejemplo, una de las funciones mostradas en
la figura 5.
En general, tal como se mencionó anteriormente,
el concepto inventivo es aplicar una cuantificación dependiente de
energía en el sentido de que parámetros (CLD) de partes de la señal
que contienen energía relativamente baja comparada con otras partes
de señal, se cuantifican de una manera más basta. Es decir, la
función de factor tiene que ser tal que para componentes de baja
energía, el factor aplicado es grande.
Para ilustrar esto en más detalle, se da un
ejemplo en la figura 9e, que muestra las manipulaciones durante la
codificación y descodificación, señalando adicionalmente el concepto
de la invención. Se hace referencia además a la tabla de
cuantificación introducida previamente para calcular los ejemplos
mostrados.
La tabla 9d muestra la manipulación del índice
de cuantificación en el lado del cuantificador en una columna 1100
izquierda, y la reconstrucción del parámetro transmitido en el lado
del cuantificador en una columna 1102. El parámetro transmitido se
da en la columna 1104. Se muestran dos ejemplos para una combinación
de canales que presenta energía relativamente baja. Esto se indica
mediante el factor de escala común 4,5 que es significativamente
mayor que 1 (véase la figura 4). Según el concepto inventivo, el
índice IDX de cuantificación se divide por el factor de escala
después de la cuantificación en el lado del cuantificador. Después,
el resultado tiene que redondearse a un valor entero para
codificarse diferencialmente y mediante codificación de Huffman
(véase la figura 4a). Por lo tanto, ambos índices 10 y 9 de ejemplo
dan como resultado un índice IDXtransm transmitido de 2.
El descuantificador multiplica el índice
transmitido por el factor de escala para obtener un índice IDXrek
reconstruido utilizado para la descuantificación. Tal como puede
observarse en el primer ejemplo de un índice 10 en el lado del
cuantificador, surge un error adicional de 1 debido al redondeo del
índice dividido en el lado del cuantificador. Por otro lado,
cuando, por casualidad, la división del factor de escala en el lado
del cuantificador proporciona un índice IDXtransm de valor entero
que va a transmitirse, no se introduce error adicional.
Evidentemente, el peligro de introducir errores
adicionales aumenta con un factor f de escala creciente. Esto
significa que la probabilidad de añadir errores adicionales a
señales de baja energía es bastante alta. Cuando las señales
descritas por el parámetro CLD en cuestión presentan energía
comparativamente igual, el valor CLD estará próximo a la unidad y
ese será el factor de escala (véase, por ejemplo la figura 5). Es
decir, cuando los canales para los que los parámetros se codifican
de una manera dependiente de energía comparten aproximadamente la
misma energía, normalmente no se introducen errores adicionales en
la cuantificación. Por supuesto esto es lo más apropiado, puesto
que cuando todos los canales presenten aproximadamente la misma
energía dentro de una señal multicanal, cada único canal es audible
durante la reproducción simultánea y, por lo tanto, un error
introducido sería claramente audible para la audiencia.
Evidentemente, es una enorme ventaja de la
presente invención que los errores sólo se aceptan para canales que
presenten energía comparativamente baja. Por otro lado, para esos
canales, dividir los índices de los parámetros asociados por
algunos números grandes proporciona los valores de índice de esos
canales más próximos a cero, en promedio. Esto puede aprovecharse
perfectamente por el siguiente procedimiento de codificación
diferencial y codificación de Huffman para disminuir eficazmente la
tasa de bits consumida para los parámetros transmitidos de una
señal
multicanal.
multicanal.
La relación de la energía local y la total sobre
la que se basa la decisión de qué regla de
descuantificación/cuantifica-
ción utilizar, se describe como una medida logarítmica en los párrafos anteriores. Por supuesto, ésta no es la única medida posible que puede utilizarse para realizar el concepto inventivo. Cualquier otra medida que describa una diferencia de energía entre la energía local o la energía total, como por ejemplo la diferencia de plano, puede utilizarse para tomar la decisión.
ción utilizar, se describe como una medida logarítmica en los párrafos anteriores. Por supuesto, ésta no es la única medida posible que puede utilizarse para realizar el concepto inventivo. Cualquier otra medida que describa una diferencia de energía entre la energía local o la energía total, como por ejemplo la diferencia de plano, puede utilizarse para tomar la decisión.
Otra característica importante con la presente
invención es que en combinación con un diseño de descodificador
(PS) de dos canales que distribuya la energía entrante en los dos
canales de salida controlado normalmente mediante por ejemplo
parámetros CLD (lo que significa que la energía entrante es igual a
la suma de las energías para los dos canales de salida) la
diferencia en energía, la energía local relativa entre la energía
total y la energía local para cada descodificador (122, 124, 126, y
128) de dos canales se define mediante los parámetros CLD. Esto
significa que no hay necesidad de medir realmente la energía total y
la energía local puesto que la diferencia en energía en dB que se
utiliza normalmente para calcular el factor de escala se define
mediante los parámetros CLD.
Dependiendo de ciertos requisitos de
implementación de los métodos inventivos, los métodos inventivos
pueden implementarse en hardware o en software. La implementación
puede realizarse utilizando un medio de almacenamiento digital, en
particular un disco, DVD o un CD que presente señales de control
legibles electrónicamente almacenadas en el mismo, que actúe
conjuntamente con un sistema informático programable de tal manera
que se realicen los métodos inventivos. En general, la presente
invención es, por lo tanto, un producto de programa informático con
un código de programa almacenado en un portador legible por
ordenador, estando operativo el código de programa para realizar
los métodos inventivos cuando el producto de programa informático se
ejecute en un ordenador. Dicho de otro modo, los métodos inventivos
son, por lo tanto, un programa informático que presenta un código
de programa para realizar al menos uno de los métodos inventivos
cuando el programa informático se ejecuta en un ordenador.
Aunque lo anterior se ha mostrado y descrito en
particular con referencia a realizaciones particulares de la misma,
los expertos en la técnica entenderán que pueden realizarse otros
diversos cambios en la forma y detalles sin apartarse del alcance
de la invención tal como se define mediante las reivindicaciones
adjuntas.
Claims (44)
1. Cuantificador de parámetros para cuantificar
un parámetro de entrada, el que el parámetro de entrada es una
medida para una característica de un único canal o un par de canales
con respecto a otro único canal o un par de canales de una señal
multicanal, que comprende:
un generador de reglas de cuantificación para
generar una regla de cuantificación basándose en una relación de una
medida de energía del canal o el par de canales y una medida de
energía de la señal multicanal; y
un cuantificador de valores para obtener un
parámetro cuantificado a partir del parámetro de entrada, utilizando
la regla de cuantificación generada.
2. Cuantificador de parámetros según la
reivindicación 1, en el que el generador de reglas de cuantificación
está operativo para generar la regla de cuantificación de tal manera
que una cuantificación es más basta para un canal o un par de
canales que presentan una medida de baja energía que para un canal o
un par de canales que presentan una medida de alta energía.
3. Cuantificador de parámetros según la
reivindicación 1, en el que el generador de reglas de cuantificación
está operativo para elegir una regla de cuantificación a partir de
dos o más reglas de cuantificación predeterminadas.
4. Cuantificador de parámetros según la
reivindicación 1, en el que el generador de reglas de cuantificación
está operativo para calcular una nueva regla de cuantificación
basándose en una relación de la medida de energía del canal o el par
de canales y la medida de energía de la señal multicanal.
5. Cuantificador de parámetros según la
reivindicación 4, en el que el generador de reglas de cuantificación
está operativo de tal manera que el cálculo de la regla de
cuantificación comprende un cálculo de un factor de
escala.
escala.
6. Cuantificador de parámetros según la
reivindicación 5, que comprende además un elemento de ajuste a
escala de parámetros para modificar el parámetro de entrada
utilizando el factor de escala.
7. Cuantificador de parámetros según la
reivindicación 6, en el que el elemento de ajuste a escala de
parámetros está operativo para modificar el parámetro de entrada de
tal manera que la modificación incluye una división del parámetro de
entrada por el factor de escala.
8. Cuantificador de parámetros según la
reivindicación 5, que comprende además un dispositivo de compresión,
en el que el cuantificador de parámetros está operativo para obtener
un parámetro cuantificado intermedio utilizando una regla de
cuantificación predeterminada; y
en el que el dispositivo de compresión está
operativo para obtener el parámetro cuantificado utilizando el
parámetro cuantificado intermedio y el factor de escala.
9. Cuantificador de parámetros según la
reivindicación 1, en el que el generador de reglas de cuantificación
está operativo para generar una regla de cuantificación de tal
manera que una aplicación de la regla de cuantificación al parámetro
de entrada comprende una asignación del mismo parámetro cuantificado
a todos los parámetros de entrada dentro de una gama de parámetros
de entrada dada.
10. Cuantificador de parámetros según la
reivindicación 1, en el que el parámetro de entrada es un parámetro
espacial, que describe una percepción espacial de la señal de audio
multicanal, y en el que el parámetro de entrada se elige a partir de
la siguiente lista de parámetros:
correlación/coherencia entre canales (ICC),
diferencia de nivel/intensidad entre canales
(ICLD o IID),
diferencia de fase entre canales (IPD), y
diferencia de tiempo entre canales (ICTD).
11. Cuantificador de parámetros según la
reivindicación 1, que comprende además un codificador diferencial y
un codificador de Huffman, en el que el codificador diferencial está
operativo para obtener una representación codificada
diferencialmente del parámetro cuantificado; y
en el que el codificador de Huffman está
operativo para obtener una representación codificada de Huffman de
la representación codificada diferencialmente.
\newpage
12. Descuantificador de parámetros para
descuantificar un parámetro cuantificado para obtener un parámetro,
en el que el parámetro es una medida para una característica de un
único canal o un par de canales con respecto a otro único canal o un
par de canales de una señal multicanal, que comprende:
un generador de reglas de descuantificación para
generar una regla de descuantificación basándose en una relación de
una medida de energía del único canal o el par de canales y una
medida de energía obtenida a partir de canales de la señal
multicanal; y
un descuantificador de valores para obtener el
parámetro a partir del parámetro cuantificado, utilizando la regla
de descuantificación generada.
13. Descuantificador de parámetros según la
reivindicación 12, en el que el generador de reglas de
descuantificación está operativo para utilizar una medida de energía
obtenida a partir de los canales de la señal multicanal que se
obtiene a partir de una combinación de canales sin tener el canal o
el par de canales.
14. Descuantificador de parámetros según la
reivindicación 12, en el que el generador de reglas de
descuantificación está operativo para generar la regla de
descuantificación de tal manera que una descuantificación es más
basta para un canal o un par de canales que presentan una medida de
baja energía que para un canal o un par de canales que presentan una
medida de alta energía.
15. Descuantificador de parámetros según la
reivindicación 12, en el que el generador de reglas de
descuantificación está operativo para elegir una regla de
descuantificación a partir de dos o más reglas de descuantificación
fijas almacenadas en una memoria.
16. Descuantificador de parámetros según la
reivindicación 12, en el que el generador de reglas de
descuantificación está operativo para calcular la nueva regla de
descuantificación basándose en una relación de la medida de energía
del canal o el par de canales y la medida de energía obtenida a
partir de los canales de la señal multicanal.
17. Descuantificador de parámetros según la
reivindicación 12, en el que el generador de reglas de
descuantificación está operativo de tal manera que el cálculo de la
regla de descuantificación comprende un cálculo de un factor de
escala.
18. Descuantificador de parámetros según la
reivindicación 17, en el que el generador de reglas de
descuantificación comprende además un elemento de ajuste a escala de
parámetros para modificar el parámetro utilizando el factor de
escala.
19. Descuantificador de parámetros según la
reivindicación 17, en el que el elemento de ajuste a escala de
parámetros está operativo para modificar el parámetro de tal manera
que la modificación incluye una multiplicación del parámetro por el
factor de escala.
20. Descuantificador de parámetros según la
reivindicación 17, en el que el generador de reglas de
descuantificación comprende además un descompresor para obtener un
parámetro cuantificado intermedio a partir del parámetro
cuantificado utilizando el factor de escala; y
en el que el descuantificador de valores está
operativo para obtener el parámetro a partir del parámetro
cuantificado intermedio utilizando una regla de descuantificación
fija.
21. Descuantificador de parámetros según la
reivindicación 20, en el que el descompresor está operativo para
obtener el parámetro cuantificado intermedio mediante la
multiplicación del factor de escala y el parámetro cuantificado.
22. Descuantificador de parámetros según la
reivindicación 20, en el que el generador de reglas de
descuantificación comprende además un elemento de redondeo para
obtener un parámetro cuantificado intermedio de valor entero a
partir del parámetro cuantificado intermedio; y en el que el
descuantificador de valores está operativo para obtener el parámetro
a partir del parámetro cuantificado intermedio de valor entero
utilizando una regla de descuantificación fija.
23. Descuantificador de parámetros según la
reivindicación 12, en el que el parámetro cuantificado es una medida
para una relación de energía entre una combinación de un canal
delantero izquierdo y un canal delantero derecho y una combinación
de un canal central y un canal de mejora de bajas frecuencias;
en el que la medida de energía es una medida de
energía para un par de canales que presenta un primer canal
combinado a partir del canal delantero izquierdo y el delantero
derecho y que presenta un segundo canal combinado a partir del canal
central y el canal de mejora de bajas frecuencias; y
en el que la medida de energía obtenida a partir
de los canales de la señal multicanal es una medida de energía
obtenida a partir de una combinación de un canal posterior izquierdo
y un canal posterior derecho.
24. Descuantificador de parámetros según la
reivindicación 12, en el que el parámetro cuantificado es una medida
para una relación de energía entre un canal posterior izquierdo y un
canal posterior derecho;
en el que la medida de energía es una medida de
energía para un par de canales que presenta el canal posterior
izquierdo y el posterior derecho; y
en el que la medida de energía obtenida a partir
de los canales de la señal multicanal es una medida de energía
obtenida a partir de una combinación de un canal delantero
izquierdo, un canal delantero derecho, un canal central y un canal
de mejora de bajas frecuencias.
25. Descuantificador de parámetros según la
reivindicación 12, en el que el parámetro cuantificado es una medida
para una relación de energía entre un canal delantero izquierdo y
uno delantero derecho;
en el que la medida de energía es una medida
para un par de canales que presenta el canal delantero izquierdo y
el delantero derecho; y
en el que la medida de energía obtenida a partir
de los canales de la señal multicanal es una medida de energía
obtenida a partir de una combinación de un canal central y un canal
de mejora de bajas frecuencias.
26. Descuantificador de parámetros según la
reivindicación 12, en el que el parámetro cuantificado es una medida
para una relación de energía entre una combinación de un canal
delantero izquierdo y un canal posterior izquierdo y una combinación
de un canal delantero derecho y un canal posterior derecho; en el
que
la medida de energía es una medida de energía
para un par de canales que presenta un primer canal combinado a
partir del canal delantero izquierdo y el posterior izquierdo y que
presenta un segundo canal combinado a partir del canal delantero
derecho y el posterior derecho; y
en el que la medida de energía obtenida a partir
de los canales de la señal multicanal es una medida de energía
obtenida a partir de una combinación de un canal central y un canal
de mejora de bajas frecuencias.
27. Descuantificador de parámetros según la
reivindicación 12, en el que el parámetro cuantificado es una medida
para una relación de energía entre un canal delantero izquierdo y un
canal posterior izquierdo; en el que
la medida de energía es una medida de energía
para un par de canales que presenta el canal delantero izquierdo y
el posterior izquierdo; y
en el que la medida de energía obtenida a partir
de los canales de la señal multicanal es una medida de energía
obtenida a partir de una combinación de un canal delantero derecho y
un canal posterior derecho.
28. Descuantificador de parámetros según la
reivindicación 12, en el que el parámetro cuantificado es una medida
para una relación de energía entre un canal delantero derecho y un
canal posterior derecho; en el que
la medida de energía es una medida de energía
para un par de canales que presenta el canal delantero derecho y el
posterior derecho; y
en el que la medida de energía obtenida a partir
de los canales de la señal multicanal es una medida de energía
obtenida a partir de una combinación de un canal delantero izquierdo
y un canal posterior izquierdo.
29. Descuantificador de parámetros según la
reivindicación 12, en el que el generador de reglas de
descuantificación está operativo para generar una regla de
descuantificación de tal manera que una aplicación de la regla de
descuantificación al parámetro cuantificado comprende una asignación
del parámetro cuantificado a un parámetro.
30. Descuantificador de parámetros según la
reivindicación 12, que comprende además un descodificador
diferencial y un descodificador de Huffman,
en el que el descodificador de Huffman está
operativo para obtener una representación descodificada de Huffman
de una representación codificada de Huffman recibida; y
en el que el descodificador diferencial está
operativo para obtener el parámetro cuantificado a partir de la
representación descodificada de Huffman.
31. Descuantificador de parámetros según la
reivindicación 12, en el que el parámetro es un parámetro espacial,
que describe una percepción espacial de señal de audio multicanal, y
en el que el parámetro de entrada se elige a partir de la siguiente
lista de parámetros:
correlación/coherencia entre canales (ICC),
diferencia de nivel/intensidad entre canales
(ICLD o IID),
diferencia de fase entre canales (IPD), y
diferencia de tiempo entre canales (ICTD).
32. Método de cuantificación de un parámetro de
entrada, en el que el parámetro de entrada es una medida para una
característica de un único canal o un par de canales con respecto a
otro único canal o un par de canales de una señal multicanal,
comprendiendo el método:
generar una regla de cuantificación basándose en
una relación de una medida de energía del canal o el par de canales
y una medida de energía de la señal multicanal; y
obtener un parámetro cuantificado a partir del
parámetro de entrada utilizando la regla de cuantificación
generada.
33. Método de descuantificación de un parámetro
cuantificado para obtener un parámetro, en el que el parámetro es
una medida para una característica de un único canal o un par de
canales con respecto a otro único canal o un par de canales de una
señal multicanal, comprendiendo el método:
generar una regla de descuantificación basándose
en una relación de una medida de energía del canal o el par de
canales y una medida de energía de la señal multicanal; y
obtener el parámetro a partir del parámetro
cuantificado utilizando la regla de descuantificación generada.
34. Representación de una señal multicanal que
presenta un parámetro cuantificado que es una representación
cuantificada de un parámetro que es una medida para una
característica de un único canal o un par de canales, en la que el
parámetro es una medida para una característica del único canal o el
par de canales con respecto a otro único canal o un par de canales
de una señal multicanal, en la que el parámetro cuantificado se
obtiene utilizando una regla de cuantificación basándose en una
relación de una medida de energía del canal o el par de canales y
una medida de energía de la señal multicanal.
35. Medio de almacenamiento legible por máquina
que tiene almacenado en el mismo una representación de una señal
multicanal de la reivindicación 34.
36. Transmisor o grabador de audio, que presenta
un cuantificador de parámetros según la reivindicación 1.
37. Receptor o reproductor de audio, que
presenta un descuantificador de parámetros según la reivindicación
12.
38. Método de transmisión o grabación de audio,
comprendiendo el método un método de cuantificación según la
reivindicación 32.
39. Método de recepción o reproducción de audio,
presentando el método un método de descuantificación según la
reivindicación 33.
40. Sistema de transmisión que presenta un
transmisor y un receptor, presentando el transmisor un cuantificador
de parámetros según la reivindicación 1 y presentando el receptor un
descuantificador de parámetros según la reivindicación 12.
41. Método de transmisión y recepción,
incluyendo el método un método de transmisión que presenta un método
de cuantificación según la reivindicación 32 y un método de
recepción que presenta un método de descuantificación según la
reivindicación 33.
42. Programa informático adaptado para realizar,
cuando se ejecuta en un ordenador, un método según una cualquiera de
las reivindicaciones 32, 33, 38, 39, ó 41 de métodos.
43. Descodificador multicanal para generar una
reconstrucción de una señal multicanal:
un descuantificador de parámetros según la
reivindicación 12; y
un elemento de upmix para realizar upmix sobre
la reconstrucción de la señal multicanal a partir de una señal de
downmix transmitida utilizando parámetros descuantificados por el
descuantificador de parámetros.
44. Codificador multicanal para generar una
representación codificada de una señal multicanal, que
comprende:
un cuantificador de parámetros según la
reivindicación 1; y
un elemento de downmix para generar una señal de
downmix a partir de la señal multicanal utilizando parámetros
cuantificados por el cuantificador, en el que esta señal de downmix
presenta menos canales que la señal multicanal.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67294305P | 2005-04-19 | 2005-04-19 | |
US672943P | 2005-04-19 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2297825T3 true ES2297825T3 (es) | 2008-05-01 |
Family
ID=36581679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES06724214T Active ES2297825T3 (es) | 2005-04-19 | 2006-04-10 | Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. |
Country Status (15)
Country | Link |
---|---|
US (1) | US8054981B2 (es) |
EP (1) | EP1754222B1 (es) |
JP (1) | JP4521032B2 (es) |
KR (1) | KR100878371B1 (es) |
CN (1) | CN1993733B (es) |
AT (1) | ATE378675T1 (es) |
BR (1) | BRPI0605857A (es) |
DE (1) | DE602006000239T2 (es) |
ES (1) | ES2297825T3 (es) |
HK (1) | HK1095993A1 (es) |
MY (1) | MY141427A (es) |
PL (1) | PL1754222T3 (es) |
RU (1) | RU2376655C2 (es) |
TW (1) | TWI327306B (es) |
WO (1) | WO2006111294A1 (es) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2623551T3 (es) * | 2005-03-25 | 2017-07-11 | Iii Holdings 12, Llc | Dispositivo de codificación de sonido y procedimiento de codificación de sonido |
WO2007037613A1 (en) * | 2005-09-27 | 2007-04-05 | Lg Electronics Inc. | Method and apparatus for encoding/decoding multi-channel audio signal |
JP2009532712A (ja) * | 2006-03-30 | 2009-09-10 | エルジー エレクトロニクス インコーポレイティド | メディア信号処理方法及び装置 |
EP2102855A4 (en) * | 2006-12-07 | 2010-07-28 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL |
EP2214163A4 (en) * | 2007-11-01 | 2011-10-05 | Panasonic Corp | CODING DEVICE, DECODING DEVICE AND METHOD THEREFOR |
CN102027535A (zh) * | 2008-04-11 | 2011-04-20 | 诺基亚公司 | 信号处理 |
KR101614160B1 (ko) | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
EP2489039B1 (fr) * | 2009-10-15 | 2015-08-12 | Orange | Codage/décodage paramétrique bas débit optimisé |
JP2012023540A (ja) * | 2010-07-14 | 2012-02-02 | Asahi Kasei Electronics Co Ltd | マルチビットデルタシグマ変調器及びadコンバータ |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
KR20120038311A (ko) * | 2010-10-13 | 2012-04-23 | 삼성전자주식회사 | 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법 |
CN103718466B (zh) * | 2011-08-04 | 2016-08-17 | 杜比国际公司 | 通过使用参量立体声改善fm立体声无线电接收器 |
ES2540215T3 (es) | 2012-04-05 | 2015-07-09 | Huawei Technologies Co., Ltd. | Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial |
US9799339B2 (en) | 2012-05-29 | 2017-10-24 | Nokia Technologies Oy | Stereo audio signal encoder |
US9380317B2 (en) | 2012-10-08 | 2016-06-28 | Qualcomm Incorporated | Identification of operation points applicable to nested SEI message in video coding |
US9350970B2 (en) | 2012-12-14 | 2016-05-24 | Qualcomm Incorporated | Disparity vector derivation |
CN105074818B (zh) | 2013-02-21 | 2019-08-13 | 杜比国际公司 | 音频编码系统、用于产生比特流的方法以及音频解码器 |
EP3217398B1 (en) * | 2013-04-05 | 2019-08-14 | Dolby International AB | Advanced quantizer |
US9821908B2 (en) * | 2013-06-07 | 2017-11-21 | Bell Helicopter Textron Inc. | System and method for assisting in rotor speed control |
EP3011562A2 (en) * | 2013-06-17 | 2016-04-27 | Dolby Laboratories Licensing Corporation | Multi-stage quantization of parameter vectors from disparate signal dimensions |
US9530422B2 (en) | 2013-06-27 | 2016-12-27 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
TWI579831B (zh) * | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
US9911423B2 (en) | 2014-01-13 | 2018-03-06 | Nokia Technologies Oy | Multi-channel audio signal classifier |
RU2696952C2 (ru) * | 2014-10-01 | 2019-08-07 | Долби Интернешнл Аб | Аудиокодировщик и декодер |
WO2016050854A1 (en) * | 2014-10-02 | 2016-04-07 | Dolby International Ab | Decoding method and decoder for dialog enhancement |
FR3048808A1 (fr) | 2016-03-10 | 2017-09-15 | Orange | Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal |
PT3539125T (pt) * | 2016-11-08 | 2023-01-27 | Fraunhofer Ges Forschung | Aparelho e método para codificar ou descodificar um sinal multicanal utilizando um ganho side e um ganho residual |
GB2574239A (en) * | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
KR102587641B1 (ko) | 2018-10-31 | 2023-10-10 | 노키아 테크놀로지스 오와이 | 공간적 오디오 파라미터 인코딩 및 연관된 디코딩의 결정 |
GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
GB2595883A (en) * | 2020-06-09 | 2021-12-15 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
GB2598773A (en) * | 2020-09-14 | 2022-03-16 | Nokia Technologies Oy | Quantizing spatial audio parameters |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
HU216669B (hu) | 1990-09-19 | 1999-08-30 | Koninklijke Philips Electronics N.V. | Információhordozó fő adatállománnyal és vezérlőállománnyal, eljárás és készülék ezen állományok rögzítésére, valamint készülék azok kiolvasására |
KR970011727B1 (en) * | 1994-11-09 | 1997-07-14 | Daewoo Electronics Co Ltd | Apparatus for encoding of the audio signal |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
CN1288624C (zh) * | 2001-11-23 | 2006-12-06 | 皇家飞利浦电子股份有限公司 | 感觉噪声替换的方法和装置 |
JP4296753B2 (ja) | 2002-05-20 | 2009-07-15 | ソニー株式会社 | 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体 |
BRPI0305434B1 (pt) * | 2002-07-12 | 2017-06-27 | Koninklijke Philips Electronics N.V. | Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal |
CN1748247B (zh) * | 2003-02-11 | 2011-06-15 | 皇家飞利浦电子股份有限公司 | 音频编码 |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
WO2005010209A2 (de) * | 2003-07-24 | 2005-02-03 | Qiagen Gmbh | Verfahren zur reversen transkription und/oder amplifikation von nukleinsäuren |
-
2006
- 2006-04-10 BR BRPI0605857-4A patent/BRPI0605857A/pt active Search and Examination
- 2006-04-10 EP EP06724214A patent/EP1754222B1/en active Active
- 2006-04-10 KR KR1020077003513A patent/KR100878371B1/ko active IP Right Grant
- 2006-04-10 JP JP2007537308A patent/JP4521032B2/ja active Active
- 2006-04-10 ES ES06724214T patent/ES2297825T3/es active Active
- 2006-04-10 WO PCT/EP2006/003284 patent/WO2006111294A1/en active IP Right Grant
- 2006-04-10 PL PL06724214T patent/PL1754222T3/pl unknown
- 2006-04-10 DE DE602006000239T patent/DE602006000239T2/de active Active
- 2006-04-10 RU RU2007106874/09A patent/RU2376655C2/ru active
- 2006-04-10 AT AT06724214T patent/ATE378675T1/de not_active IP Right Cessation
- 2006-04-10 CN CN2006800005085A patent/CN1993733B/zh active Active
- 2006-04-12 TW TW095113078A patent/TWI327306B/zh active
- 2006-04-18 MY MYPI20061770A patent/MY141427A/en unknown
- 2006-04-19 US US11/406,631 patent/US8054981B2/en active Active
-
2007
- 2007-03-30 HK HK07103451A patent/HK1095993A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
JP4521032B2 (ja) | 2010-08-11 |
CN1993733B (zh) | 2010-12-08 |
RU2376655C2 (ru) | 2009-12-20 |
KR100878371B1 (ko) | 2009-01-15 |
MY141427A (en) | 2010-04-30 |
TW200703238A (en) | 2007-01-16 |
BRPI0605857A (pt) | 2007-12-18 |
US8054981B2 (en) | 2011-11-08 |
DE602006000239T2 (de) | 2008-09-18 |
EP1754222B1 (en) | 2007-11-14 |
US20070016416A1 (en) | 2007-01-18 |
CN1993733A (zh) | 2007-07-04 |
WO2006111294A1 (en) | 2006-10-26 |
RU2007106874A (ru) | 2008-08-27 |
DE602006000239D1 (de) | 2007-12-27 |
JP2008517339A (ja) | 2008-05-22 |
ATE378675T1 (de) | 2007-11-15 |
EP1754222A1 (en) | 2007-02-21 |
KR20070062502A (ko) | 2007-06-15 |
HK1095993A1 (en) | 2007-05-25 |
PL1754222T3 (pl) | 2008-04-30 |
TWI327306B (en) | 2010-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2297825T3 (es) | Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. | |
US11343631B2 (en) | Compatible multi-channel coding/decoding | |
ES2770146T3 (es) | Conformación temporal y espacial de señales de audio multicanal | |
ES2306076T3 (es) | Aparato y metodo para construir una señal de salida multicanal o para generar una señal de downmix. | |
ES2923661T3 (es) | Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia | |
ES2340796T3 (es) | Dispositivo y metodo para generar una señal estereofonica codificada de una pieza de audio o flujo de datos de audio. |