ES2331889T3 - Codificacion de audio. - Google Patents
Codificacion de audio. Download PDFInfo
- Publication number
- ES2331889T3 ES2331889T3 ES05707322T ES05707322T ES2331889T3 ES 2331889 T3 ES2331889 T3 ES 2331889T3 ES 05707322 T ES05707322 T ES 05707322T ES 05707322 T ES05707322 T ES 05707322T ES 2331889 T3 ES2331889 T3 ES 2331889T3
- Authority
- ES
- Spain
- Prior art keywords
- audio
- parameterization
- version
- values
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 39
- 238000012546 transfer Methods 0.000 claims abstract description 36
- 238000001914 filtration Methods 0.000 claims abstract description 16
- 238000011002 quantification Methods 0.000 claims description 52
- 230000000873 masking effect Effects 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims 1
- 230000003321 amplification Effects 0.000 description 62
- 238000003199 nucleic acid amplification method Methods 0.000 description 62
- 238000005070 sampling Methods 0.000 description 62
- 238000011045 prefiltration Methods 0.000 description 48
- 230000006870 function Effects 0.000 description 34
- 230000006835 compression Effects 0.000 description 27
- 238000007906 compression Methods 0.000 description 27
- 230000009467 reduction Effects 0.000 description 19
- 230000008859 change Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 15
- 238000013139 quantization Methods 0.000 description 11
- 230000002441 reversible effect Effects 0.000 description 10
- 238000013479 data entry Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Cereal-Derived Products (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Stereophonic System (AREA)
Abstract
Dispositivo para la codificación de una señal de audio de una secuencia de valores de audio en una señal codificada, con un medio (20) para determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia de valores de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia de valores de audio; un medio (24) para calcular una versión de una primera parametrización de un filtro (30) parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del segundo umbral de escucha; un medio (30) para filtrar un bloque predeterminado de valores de audio de la secuencia de valores de audio con el filtro parametrizable utilizando una parametrización predeterminada, que de manera predeterminada depende de la versión de la segunda parametrización, para obtener un bloque de valores de audio filtrados correspondiente al bloque predeterminado; un medio (28) para cuantificar los valores de audio filtrados, para obtener un bloque de valores de audio filtrados, cuantificados; un medio para formar una combinación de la versión de la primera parametrización y de la versión de la segunda parametrización, que se suceden entre sí, y que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización; y un medio para integrar información, a partir de la que pueden derivarse los valores de audio filtrados, cuantificados y una versión de la primera parametrización, y que comprende la combinación, en la señal codificada.
Description
Codificación de audio.
La presente invención se refiere a codificadores
o decodificadores de audio o a la codificación de audio en general
y, especialmente, a codificaciones de audio que permiten una
codificación de señales de audio con un tiempo de retardo
corto.
El procedimiento de compresión de audio
actualmente más conocido es el MPEG-1 capa III. En
este procedimiento de compresión se codifican con pérdidas los
valores de muestreo o de audio de una señal de audio en una señal
codificada. Dicho de otro modo, en la compresión se reducen o de
manera ideal se eliminan la irrelevancia y redundancia de la señal
de audio original. Para conseguir esto, mediante un modelo
psicoacústico se detectan enmascaramientos simultáneos y
temporales, es decir, se calcula o determina un umbral de
enmascaramiento que varía en el tiempo, dependiente de la señal de
audio, que indica a partir de qué volumen empiezan a ser
perceptibles los tonos de una determinada frecuencia para el oído
humano. Esta información se utiliza a su vez para la codificación
de la señal, cuantificándose los valores espectrales de la señal de
audio en función del umbral de enmascaramiento de manera más
precisa, menos precisa o no cuantificándose en absoluto, e
integrándose en la señal codificada.
Los procedimientos de compresión de audio, tales
como el formato MP3, experimentan entonces un límite en su
aplicabilidad, cuando se trata de transferir datos de audio por un
canal de transferencia con una tasa de bits limitada por un lado
comprimidos, pero por otro lado con un tiempo de retardo lo más
reducido posible. En algunas aplicaciones, el tiempo de retardo no
es importante, como por ejemplo en el caso de archivar información
de audio. Sin embargo, los codificadores de audio con un tiempo de
retardo bajo, también denominados a veces "codificadores de
retardo ultrabajo", son necesarios cuando se trata de
transferencias críticas en cuanto al tiempo de señales de audio,
como por ejemplo en el caso de teleconferencias, altavoces o
micrófonos inalámbricos. Para estos campos de aplicación se propone
en el artículo de Schuller G. etc. "Perceptual Audio Coding using
Adaptive Pre- and Post-Filters and Lossless
Compression", IEEE Transactions on Speech and Audio Processing,
vol. 10, n.º 6, septiembre de 2002, págs. 379-390,
una codificación de audio, en la que la reducción de irrelevancia y
la reducción de redundancia se realizan no basándose en una única
transformación, sino en dos transformaciones separadas.
El principio se explica a continuación haciendo
referencia a las figuras 12 y 13. La codificación parte de una
señal 902 de audio, que ya se ha muestreado y por tanto ya está
presente como una secuencia 904 de valores 906 de audio o muestreo,
indicándose mediante una flecha 908 el orden temporal de los valores
906 de audio. Para bloques sucesivos de valores 906 de audio, que
se indican con una numeración creciente con "bloque#", se
calcula un umbral de escucha mediante un modelo psicoacústico. La
figura 13 muestra por ejemplo un diagrama, en el que, con respecto
a la frecuencia f, con la curva a se ha trazado en unidades
logarítmicas el espectro de un bloque de señal de 128 valores 906
de audio y en b el umbral de enmascaramiento, tal como se ha
calculado mediante un modelo psicoacústico. Como ya se ha
mencionado, el umbral de enmascaramiento indica hasta qué
intensidad las frecuencias son imperceptibles para el oído humano,
concretamente todos los tonos por debajo del umbral de
enmascaramiento b. Ahora, basándose en los umbrales de
enmascaramiento calculados para cada bloque se consigue una
reducción de irrelevancia mediante el control de un filtro
parametrizable seguido por un cuantificador. Para un filtro
parametrizable se calcula una parametrización de tal modo que la
respuesta de frecuencia del mismo corresponde a la inversa de la
magnitud del umbral de enmascaramiento. Esta parametrización se
indica en la figura 12 mediante x_{#}(i).
Tras el filtrado de los valores 906 de audio se
realiza una cuantificación con un tamaño de paso constante, por
ejemplo una operación de redondeo al siguiente número entero. El
ruido de cuantificación provocado de este modo es ruido blanco. En
el lado del decodificador la señal filtrada vuelve a
"transformarse de manera inversa" con un filtro
parametrizable, cuya función de transferencia se ajusta a la
magnitud del propio umbral de enmascaramiento. De este modo no sólo
se vuelve a decodificar la señal filtrada sino que también se adapta
el ruido de cuantificación en el lado del decodificador a la forma
del umbral de enmascaramiento. Para que el ruido de cuantificación
corresponda con la mayor precisión posible al umbral de
enmascaramiento, en el lado del codificador se calcula para cada
conjunto de parámetros o para cada parametrización además un valor
de amplificación a_{#}, que se aplica antes de la cuantificación a
la señal filtrada. Para que en el lado del decodificador pueda
realizarse la transformación inversa se transfieren al codificador
el valor de amplificación a y la parametrización x como información
910 secundaria además de los datos principales reales, concretamente
los valores 912 de audio filtrados, cuantificados. Para la
reducción 914 de redundancia estos datos, es decir, la información
910 secundaria y los datos 912 principales, se someten aún a una
compresión sin pérdida, concretamente a una codificación de
entropía, con lo cual se obtiene la señal codificada.
El artículo anterior propone como tamaño de
bloque un tamaño de 128 valores 906 de muestreo. De este modo se
permite un retardo relativamente corto de 8 ms a una tasa de
muestreo de 32 kHz. Con respecto a la implementación detallada se
describe aún en el artículo, que para aumentar la eficacia de la
codificación de información secundaria, la información secundaria,
concretamente los coeficientes x_{#} y a_{#} sólo se transfieren
cuando existe un cambio suficiente en comparación con un conjunto
de parámetros transferido anteriormente, es decir, cuando el cambio
supera un valor umbral determinado. Además se describe que la
implementación se lleva a cabo preferiblemente de modo que un
conjunto de parámetros actual no se aplica directamente a todos los
valores de muestreo pertenecientes al bloque respectivo, sino que se
utiliza una interpolación lineal de los coeficientes de filtro
x_{#} para evitar artefactos audibles. Para realizar la
interpolación lineal de los coeficientes de filtro se propone una
estructura reticular para el filtro, para evitar la aparición de
inestabilidades. Para el caso de que se desee una señal codificada
con una tasa de bits controlada, el artículo propone además
multiplicar o atenuar aún selectivamente la señal filtrada y
ajustada a escala con el factor de amplificación a dependiente del
tiempo con un factor diferente de 1, de modo que si bien se generan
interferencias audibles, sin embargo puede reducirse la tasa de bits
en puntos complejos de codificar de la señal de audio.
Aunque el esquema de codificación de audio
descrito en el artículo citado anteriormente ya reduce
suficientemente el tiempo de retardo para muchas aplicaciones, un
problema del esquema anterior consiste en que, debido a la
necesidad de tener que transferir el umbral de enmascaramiento o la
función de transferencia del filtro en el lado del codificador,
designado a continuación como prefiltro, el canal de transferencia
se carga relativamente mucho, aunque los coeficientes de filtro
sólo se transfieran al superar un umbral predeterminado.
Otra desventaja del esquema de codificación
anterior consiste en que, debido al hecho de que el umbral de
enmascaramiento o la inversa del mismo debe ponerse a disposición en
el lado del decodificador mediante el conjunto de parámetros
x_{#} que ha de transferirse, debe llegarse a un acuerdo entre por
un lado una tasa de bits lo más baja posible o una relación de
compresión alta y por otro lado una aproximación o parametrización
lo más precisa posible del umbral de enmascaramiento o la inversa
del mismo. Por tanto es inevitable que el ruido de cuantificación
adaptado mediante el esquema de codificación de audio anterior al
umbral de enmascaramiento supere en algunas gamas de frecuencia el
umbral de enmascaramiento y por tanto lleve a interferencias de
audio audibles para el oyente.
La figura 13 muestra por ejemplo con la curva c
la respuesta de frecuencia parametrizada del filtro parametrizable
en el lado del decodificador. Como puede observarse, hay zonas en
las que la función de transferencia del filtro en el lado del
decodificador, a continuación denominado también postfiltro, supera
el umbral de enmascaramiento b. El problema se agrava ahora porque
la parametrización sólo se transfiere de manera intermitente en caso
de cambio suficiente entre las parametrizaciones y entremedias se
interpola. Una interpolación solo de los coeficientes de filtro
x_{#}, como se propone en el artículo, manteniendo constante el
valor de amplificación a_{#} de un punto de referencia a otro o
de una nueva parametrización a otra, lleva a interferencias
audibles. Incluso aunque la interpolación propuesta en el artículo
también se aplique al valor de información secundaria a_{#}, es
decir, los valores de amplificación transferidos, en la señal de
audio entrante en el lado del decodificador pueden quedar
artefactos de audio audibles. Otro problema del esquema de
codificación de audio según la figura 12 ó 13 consiste en que la
señal filtrada, debido al filtrado selectivo en frecuencia, puede
adoptar una forma no predecible, en la que especialmente debido a un
solapamiento arbitrario de muchos armónicos individuales un único
valor de audio o valores de audio individuales de la señal
codificada se suman para dar valores muy altos que, debido a su
aparición poco frecuente, llevan a su vez, en la reducción de
redundancia posterior, a una peor relación de compresión.
El objetivo de la presente invención consiste en
crear un esquema de codificación de audio más eficaz.
Este objetivo se soluciona con un procedimiento
según la reivindicación 8 ó 10 y un dispositivo según la
reivindicación 1 ó 9.
Una codificación según la invención de una señal
de audio de una secuencia de valores de audio en una señal
codificada comprende determinar un primer umbral de escucha para un
primer bloque de valores de audio de la secuencia de valores de
audio y un segundo umbral de escucha para un segundo bloque de
valores de audio de la secuencia de valores de audio; calcular una
versión de una primera parametrización de un filtro parametrizable,
de modo que su función de transferencia corresponde aproximadamente
a la inversa de la magnitud del primer umbral de escucha, y una
versión de una segunda parametrización del filtro parametrizable, de
modo que su función de transferencia corresponde aproximadamente a
la inversa de la magnitud del segundo umbral de escucha; filtrar un
bloque predeterminado de valores de audio de la secuencia de valores
de audio con el filtro parametrizable utilizando una
parametrización predeterminada, que de manera predeterminada depende
de la versión de la segunda parametrización, para obtener un bloque
de valores de audio filtrados correspondiente al bloque
predeterminado; cuantificar los valores de audio filtrados, para
obtener un bloque de valores de audio filtrados, cuantificados;
formar una combinación de la versión de la primera parametrización y
de la versión de la segunda parametrización, que comprende al menos
una diferencia entre la versión de la primera parametrización y la
versión de la segunda parametrización; e integrar información,
partir de la que pueden derivarse los valores de audio filtrados,
cuantificados y una versión de la primera parametrización, y que
comprende la combinación, en la señal codificada.
La idea principal de la presente invención
consiste en que mediante la transferencia de diferencias de
parametrizaciones sucesivas puede conseguirse una mayor relación de
compresión.
Si además la transferencia de las
parametrizaciones tiene lugar sólo cuando entre las mismas existe
una diferencia suficiente, la enseñanza de la presente invención
consiste especialmente también en que, igualmente en este caso,
aunque las diferencias de parametrización no queden por debajo de la
medida de diferenciación mínima, aún así la transferencia de
diferencias entre dos parametrizaciones en lugar de la una
parametrización proporciona un aumento de compresión, que compensa
de manera más que suficiente el esfuerzo adicional de la formación
de diferencias en el lado del codificador y la formación de sumas en
el lado del decodificador.
Según un ejemplo de realización de la presente
invención se transfieren las diferencias netas entre
parametrizaciones sucesivas, mientras que, según otro ejemplo de
realización, de estas diferencias aún se resta el umbral mínimo a
partir del cual empiezan a transferirse las parametrizaciones de
puntos de referencia nuevos.
Ejemplos de realización preferidos de la
presente invención se explican a continuación con más detalle
haciendo referencia a los dibujos adjuntos. Muestran:
la figura 1 un diagrama de bloques de un
codificador de audio según un ejemplo de realización de la presente
invención;
la figura 2 un diagrama de flujo para ilustrar
el modo de funcionamiento del codificador de audio de la figura 1 en
la entrada de datos;
la figura 3 un diagrama de flujo para ilustrar
el modo de funcionamiento del codificador de audio de la figura 1 en
cuanto al análisis de la señal de audio entrante a través de un
modelo psicoacústico;
la figura 4 un diagrama de flujo para ilustrar
el modo de funcionamiento del codificador de audio de la figura 1 en
cuanto a la aplicación del parámetro obtenido a través del modelo
psicoacústico a la señal de audio entrante;
la figura 5a un diagrama esquemático para
ilustrar la señal de audio entrante, la secuencia de valores de
audio de la que ésta se compone, y las etapas de trabajo de la
figura 4 en relación con los valores de audio;
la figura 5b un diagrama esquemático para
ilustrar la estructura de la señal codificada;
la figura 6 un diagrama de flujo para ilustrar
el modo de funcionamiento del codificador de audio de la figura 1 en
cuanto al procesamiento final hasta la señal codificada;
la figura 7a un diagrama en el que se muestra
un ejemplo de realización de una función escalonada de
cuantificación;
la figura 7b un diagrama en el que se muestra
otro ejemplo de realización de una función escalonada de
cuantificación;
la figura 8 un diagrama de bloques de un
decodificador de audio, que puede decodificar una señal de audio
codificada mediante el codificador de audio de la figura 1, según un
ejemplo de realización de la presente invención;
la figura 9 un diagrama de flujo para ilustrar
el modo de funcionamiento del decodificador de la figura 8 en la
entrada de datos;
la figura 10 un diagrama de flujo para ilustrar
el modo de funcionamiento del decodificador de la figura 8 en cuanto
al almacenamiento intermedio de los datos de audio filtrados,
cuantificados, predecodificados y el procesamiento de los bloques de
audio sin información secundaria correspondiente;
la figura 11 un diagrama de flujo para ilustrar
el modo de funcionamiento del decodificador de la figura 8 en cuanto
al verdadero filtrado inverso;
la figura 12 un diagrama esquemático para
ilustrar un esquema de codificación de audio convencional con un
tiempo de retardo corto; y
la figura 13 un diagrama, en el que se muestran
a modo de ejemplo un espectro de una señal de audio, un umbral de
escucha de la misma y la función de transferencia del postfiltro en
el decodificador.
La figura 1 muestra un codificador de audio
según un ejemplo de realización de la presente invención. El
codificador de audio, que en general se indica con 10, comprende en
primer lugar una entrada 12 de datos, en la que éste recibe la
señal de audio que va a codificarse, tal como se explicará a
continuación aún con más detalle con referencia a la figura 5a, que
se compone de una secuencia de valores de audio o valores de
muestreo, así como una salida de datos, en la que se entrega la
señal codificada, cuyo contenido de información se explicará con
más detalle haciendo referencia a la figura 5b.
El codificador 10 de audio de la figura 1 se
divide en una parte 16 de reducción de irrelevancia y una parte 18
de reducción de redundancia. La parte 16 de reducción de
irrelevancia comprende un medio 20 para determinar un umbral de
escucha, un medio 22 para calcular un valor de amplificación, un
medio 24 para calcular una parametrización, un medio 26 de
comparación de puntos de referencia, un cuantificador 28 y un
prefiltro 30 parametrizable así como una memoria 32 intermedia de
entrada FIFO (primero en entrar, primero en salir), una memoria
intermedia o memoria 38 y un multiplicador o un medio 40 de
multiplicación. La parte 18 de reducción de redundancia comprende
un compresor 34 y un control 36 de tasa de bits.
La parte 16 de reducción de irrelevancia y la
parte 18 de reducción de redundancia están conectadas en serie en
este orden entre la entrada 12 de datos y la salida 14 de datos.
Especialmente la entrada 12 de datos está unida con una entrada de
datos del medio 20 para determinar un umbral de escucha y una
entrada de datos de la memoria 32 intermedia de entrada. Una salida
de datos del medio 20 para determinar un umbral de escucha está
unida con una entrada del medio 24 para calcular una parametrización
así como con una entrada de datos del medio 22 para calcular un
valor de amplificación, para transmitir a las mismas un umbral de
escucha determinado. Los medios 22 y 24 calculan, basándose en el
umbral de escucha, una parametrización o un valor de amplificación
y están unidos con el medio 26 de comparación de puntos de
referencia, para transmitir al mismo estos resultados. El medio 26
de comparación de puntos de referencia transmite según un resultado
de comparación, tal como se explicará aún a continuación, los
resultados calculados por los medios 22 y 24 como parámetro de
entrada o parametrización al prefiltro 30 parametrizable. El
prefiltro 30 parametrizable está conectado entre una salida de
datos de la memoria 32 intermedia de entrada y una entrada de datos
de la memoria 38 intermedia. Entre una salida de datos de la
memoria 38 intermedia y el cuantificador 28 está conectado el
multiplicador 40. El cuantificador 28 transmite a la parte 18 de
reducción de redundancia dado el caso valores de audio multiplicados
o ajustados a escala, aunque en cualquier caso filtrados,
cuantificados, y concretamente a una entrada de datos del compresor
34. El medio 26 de comparación de puntos de referencia transmite a
la parte 18 de reducción de redundancia información, a partir de la
que pueden derivarse los parámetros de entrada transmitidos al
prefiltro 30 parametrizable, y concretamente a una entrada de datos
adicional del compresor 34. El control de tasa de bits está unido
con una entrada de control del multiplicador 40 a través de una
conexión de control, para ocuparse de que los valores de audio
filtrados, cuantificados, tal como se obtienen por el prefiltro 30,
se multipliquen mediante el multiplicador 40 por un multiplicador
adecuado, como se explicará a continuación aún más detalladamente.
El control 36 de tasa de bits está conectado entre una salida de
datos del compresor 34 y la salida 14 de datos del codificador 10
de audio, para determinar de manera adecuada el multiplicador para
el multiplicador 40. En la primera pasada de cada valor de audio a
través del cuantificador 40, el multiplicador está ajustado en
primer lugar a un factor de ajuste a escala adecuado, como por
ejemplo 1. Sin embargo, la memoria 38 intermedia sigue almacenando
cada valor de audio filtrado, para darle al control 36 de tasa de
bits, como se describirá a continuación, la oportunidad de cambiar
el multiplicador para una pasada adicional de un bloque de valores
de audio. Si no se indica un cambio de este tipo mediante el control
36 de tasa de bits, entonces la memoria 38 intermedia puede liberar
la memoria ocupada por este bloque.
Una vez descrita anteriormente la estructura del
codificador de audio de la figura 1, a continuación se describirá
su modo de funcionamiento haciendo referencia a las figuras 2 a
7b.
Como puede deducirse de la figura 2, la señal de
audio, cuando llega a la entrada 12 de datos, ya se ha obtenido
mediante muestreo 50 de señal de audio de una señal de audio
analógica. El muestreo de señal de audio se realiza con una
frecuencia de muestreo predeterminada, que habitualmente se
encuentra entre 32 y 48 kHz. En la entrada 12 de datos hay por
tanto una señal de audio que se compone de una secuencia de valores
de muestreo o de audio. Aunque, tal como aún se aclarará a partir
de la siguiente descripción, la codificación de la señal de audio
no tiene lugar basándose en bloques, los valores de audio en la
entrada 12 de datos se agrupan en primer lugar en una etapa 52 para
formar bloques de audio. La agrupación para formar bloques de audio
se produce, como se aclarará a partir de la siguiente descripción,
únicamente para determinar el umbral de escucha y tiene lugar en
una fase de entrada del medio 20 para determinar un umbral de
escucha. En el presente ejemplo de realización se parte a modo de
ejemplo de que en cada caso se agrupan 128 valores de audio
sucesivos para formar bloques de audio, y que la agrupación tiene
lugar de tal modo que por un lado no se solapan los bloques de
audio sucesivos y por otro lado son directamente adyacentes. Esto se
explica de nuevo brevemente a modo de ejemplo mediante la figura
5a.
La figura 5a indica con 54 la secuencia de
valores de muestreo, estando ilustrado cada valor de muestreo
mediante un rectángulo 56. Los valores de muestreo están numerados
con fines ilustrativos, mostrándose por motivos de claridad a su
vez sólo algunos de los valores de muestreo de la secuencia 54. Tal
como se muestra mediante corchetes por encima de la secuencia 54,
según el presente ejemplo de realización en cada caso 128 valores
de muestreo sucesivos están agrupados en un bloque, formando los 128
valores de muestreo inmediatamente siguientes el siguiente bloque.
Sólo por si acaso se indica que la agrupación en bloques también
podría realizarse de otra manera, por ejemplo mediante bloques que
se solapan o bloques distanciados y bloques con otro tamaño de
bloque, aunque a su vez se prefiere el tamaño de bloque de 128, ya
que proporciona un buen acuerdo entre por un lado una alta calidad
de audio y por otro lado un tiempo de retardo lo más bajo
posible.
Mientras se procesan por bloques en el medio 20
para determinar un umbral de escucha los bloques de audio agrupados
en la etapa 52 en el medio 20, en la memoria 32 intermedia de
entrada se almacenan 54 de manera intermedia los valores de audio
entrantes hasta que el prefiltro 30 parametrizable haya obtenido
parámetros de entrada desde el medio 26 de comparación de puntos de
referencia, para llevar a cabo un prefiltrado, tal como se
describirá aún a continuación.
Como puede deducirse de la figura 3, el medio 20
para determinar un umbral de escucha inicia su procesamiento
directamente después de que hayan entrado suficientes valores de
audio en la entrada 12 de datos para formar un bloque de audio o
formar el siguiente bloque de audio, lo que supervisa el medio 20
mediante una comprobación en la etapa 60. Si todavía no está
presente un bloque de audio completo procesable, el medio 20 espera.
Si está presente un bloque de audio completo para procesar,
entonces el medio 20 para determinar un umbral de escucha calcula
en una etapa 62 basándose en un modelo psicoacústico adecuado en una
etapa 62 un umbral de escucha. Para ilustrar el umbral de escucha
se remite a su vez a la figura 12 y especialmente a la curva b, que
se ha obtenido basándose en un modelo psicoacústico por ejemplo con
respecto a un bloque de audio actual con un espectro a. El umbral
de enmascaramiento, que se determina en la etapa 62, es una función
dependiente de la frecuencia, que puede variar para bloques de
audio sucesivos, y que también puede variar considerablemente de
una señal de audio a otra, como por ejemplo de piezas de música rock
a piezas de música clásica. El umbral de escucha indica para cada
frecuencia un valor umbral, por debajo del cual el oído humano no
puede percibir interferencias.
En una etapa 64 siguiente, el medio 24 y el
medio 22 calculan a partir del umbral de escucha M(f)
calculado (indicando f la frecuencia) un valor de amplificación a o
un conjunto de parámetros de N parámetros x(i) (i = 1,...,
N). La parametrización x(i), que calcula el medio 24 en la
etapa 64, está prevista para el prefiltro 30 parametrizable, que
por ejemplo está configurado en una estructura de filtro adaptativo,
tal como se utiliza en la codificación LPC (LPC = linear
predictive coding = codificación lineal predictiva). Si por
ejemplo s(n) con n = 0,... 127 son los 128 valores de audio
del bloque de audio momentáneo y s'(n) son los 128 valores de audio
filtrados que se obtienen, entonces el filtro está configurado por
ejemplo de tal modo que se cumple la ecuación siguiente:
siendo K el orden de filtro, y con
k = 1,..., K, los coeficientes de filtro, e ilustrando el índice t
que los coeficientes de filtro cambian en bloques de audio
sucesivos. El medio 24 calcula ahora la parametrización de tal modo
que la función de transferencia H(f) del prefiltro 30
parametrizable es aproximadamente igual a la inversa de la magnitud
del umbral de enmascaramiento M(f), es decir, de modo que se
aplica
ilustrando la dependencia de t a su
vez que para diferentes bloques de audio cambia el umbral de
enmascaramiento M(f). En caso de implementarse el prefiltro
30 como el filtro adaptativo explicado anteriormente se obtienen los
coeficientes de filtro de la siguiente manera: la transformada de
Fourier discreta inversa de |M(f,t)|^{2} con
respecto a la frecuencia para el bloque en el instante t da lugar a
la función de autocorrelación objetivo. Entonces resolviendo el
sistema de ecuaciones lineal se
obtiene:
Para que, sin embargo, en la interpolación
lineal que aún se describirá con más detalle a continuación entre
las parametrizaciones, no aparezcan inestabilidades, se utiliza
preferiblemente para el filtro 30 una estructura reticular,
reparametrizándose los coeficientes de filtro para la estructura
reticular en coeficientes de reflexión. Con respecto a detalles más
precisos en cuanto al diseño del prefiltro, el cálculo de los
coeficientes y la reparametrización se remite al artículo de
Schuller etc. mencionado en la introducción de la descripción y
especialmente a la página 381, punto III, que se incorpora a este
respecto al presente documento como referencia.
Mientras que a continuación el medio 24 calcula
una parametrización para el prefiltro 30 parametrizable de tal modo
que su función de transferencia es igual a la inversa del umbral de
enmascaramiento, el medio 22, basándose en el umbral de escucha,
calcula un límite de potencia de ruido, concretamente un límite que
indica qué potencia de ruido puede introducir el cuantificador 28
en la señal de audio filtrada mediante el prefiltro 30, para que el
ruido de cuantificación tras el postfiltrado o filtrado inverso en
el lado del decodificador esté por debajo del umbral de escucha
M(f) o exactamente en el mismo. El medio 22 calcula este
límite de potencia de ruido como el área por debajo del cuadrado
del valor absoluto del umbral de escucha M, es decir, como
\Sigma|M(f)|^{2}. El valor de amplificación a
lo calcula el medio 22 a partir del límite de potencia de ruido,
calculando la raíz a partir de la fracción de potencia de ruido de
cuantificación entre límite de potencia de ruido. El ruido de
cuantificación es el ruido provocado por el cuantificador 28. El
ruido provocado por el cuantificador 28, tal como aún se
describirá, es ruido blanco y, por tanto, depende de la frecuencia.
La potencia de ruido de cuantificación es la potencia del ruido de
cuantificación.
Como se ha aclarado a partir de la descripción
anterior, el medio 22 calcula, además del valor de amplificación a,
también el límite de potencia de ruido. Aunque es posible que el
medio 26 de comparación de puntos de referencia calcule de nuevo, a
partir del valor de amplificación a obtenido desde el medio 22, el
límite de potencia de ruido, es además posible que el medio 22,
además del valor de amplificación a, también transmita directamente
al medio 26 de comparación de puntos de referencia el límite de
potencia de ruido determinado.
Tras calcular el valor de amplificación así como
la parametrización, el medio 26 de comparación de puntos de
referencia comprueba a continuación en una etapa 66, si la
parametrización recién calculada se diferencia en más de un umbral
predeterminado de la parametrización actual, transmitida en último
lugar al prefiltro parametrizable. En caso de que la comprobación
en la etapa 66 indique que la parametrización recién calculada se
diferencia en más del umbral predeterminado de la actual, entonces
se almacenan de manera intermedia los coeficientes de filtro recién
calculados y el valor de amplificación recién calculado o el límite
de potencia de ruido en el medio 26 de comparación de puntos de
referencia para una interpolación que todavía se explicará, y el
medio 26 de comparación de puntos de referencia entrega en una etapa
68 los coeficientes de filtro recién calculados y en una etapa 70
el valor de amplificación recién calculado al prefiltro 30. Si éste
no es el caso, y la parametrización recién calculada no se
diferencia en más del umbral predeterminado de la actual, el medio
(26) de comparación de puntos de referencia entrega al prefiltro 30
en la etapa 72 en lugar de la parametrización recién calculada sólo
la parametrización de punto de referencia actual, es decir, la
parametrización que por última vez llevó en la etapa 66 a un
resultado positivo, que por tanto se diferenció en más de un umbral
predeterminado de una parametrización de punto de referencia
anterior. Después de las etapas 70 y 72, el proceso de la figura 3
vuelve para el procesamiento del siguiente bloque de audio, es
decir, a la consulta 60.
En caso de que la parametrización recién
calculada no se diferencie de la parametrización de punto de
referencia actual y en consecuencia el prefiltro 30 en la etapa 72
vuelva a obtener la parametrización de punto de referencia obtenida
ya anteriormente para al menos el último bloque de audio, el
prefiltro 30 aplica esta parametrización de punto de referencia a
todos los valores de muestreo de este bloque de audio que se
encuentra en la FIFO 32, tal como se describirá aún con más detalle
a continuación, con lo que este bloque actual se extrae de la FIFO
32 y el cuantificador 28 obtiene un bloque de audio que se produce
de valores de audio prefiltrados.
La figura 4 representa con más detalle el modo
de funcionamiento del prefiltro 30 parametrizable para el caso de
que éste obtenga la parametrización recién calculada y el valor de
amplificación recién calculado, porque los mismos se diferencian
suficientemente de la parametrización de punto de referencia actual.
Tal como se ha descrito con referencia a la figura 3, no se realiza
por tanto para cada uno de los bloques de audio sucesivos un
procesamiento según la figura 4, sino sólo para bloques de audio en
los que la parametrización correspondiente se diferencia
suficientemente de la parametrización de punto de referencia actual.
Los demás bloques de audio, tal como se acaba de describir, se
prefiltran aplicando la parametrización de punto de referencia
actual en cada caso y el valor de amplificación actual en cada caso
correspondiente a todos los valores de muestreo de estos bloques de
audio. En una etapa 80, el prefiltro 30 parametrizable supervisa
ahora si ha tenido lugar una entrega de coeficientes de filtro
recién calculados desde el medio 26 de comparación de puntos de
referencia, o de parametrizaciones de puntos de referencia
anteriores. El prefiltro 30 realiza la supervisión 80 hasta que
haya tenido lugar una entrega de este tipo.
Una vez ha tenido lugar una entrega de este
tipo, el prefiltro 30 parametrizable inicia el procesamiento del
bloque de audio actual de valores de audio, que ahora mismo se
encuentra en la memoria 32 intermedia, esto es, aquél para el que
acaba de calcularse la parametrización. En la figura 5a se ha
ilustrado, por ejemplo, que ya se han procesado todos los valores
56 de audio antes del valor de audio con el número 0 y, por tanto,
ya han pasado por la memoria 32. El procesamiento del bloque de
valores de audio antes del valor de audio con el número 0 se activó
en ese momento, porque la parametrización, que se ha calculado para
el bloque de audio antes del bloque 0, concretamente
x_{0}(i), se diferenció en más del umbral predeterminado de
la parametrización de punto de referencia transmitida anteriormente
al prefiltro 30. La parametrización x_{0}(i) es por tanto
una parametrización de punto de referencia, tal como se designa en
la presente invención. El procesamiento de los valores de audio en
el bloque de audio antes del valor de audio 0 se realizó basándose
en el conjunto de parámetros a_{0}, x_{0}(i).
En la figura 5a se parte de que la
parametrización, que se ha calculado para el bloque 0 con los
valores de audio 0 a 127, se diferenció en menos del umbral
predeterminado de la parametrización x_{0}(i), que se
refería al bloque anterior. Por tanto, este bloque 0 también se
extrajo ya por el prefiltro 30 de la FIFO 32, se procesó del mismo
modo en cuanto a todos sus valores de muestreo 0 a 127 mediante la
parametrización x_{0}(i) introducida en la etapa 72, tal
como se indica mediante la flecha 81 descrita como "aplicación
directa", y a continuación se transmitió al cuantificador 28.
Sin embargo, la parametrización calculada para
el bloque 1 que aún se encuentra en la FIFO 32 se diferenció según
el ejemplo ilustrativo de la figura 5a, en cambio, en más del umbral
predeterminado de la parametrización x_{0}(i) y por tanto
se transmitió en la etapa 68 al prefiltro 30 como parametrización
x_{1}(i) junto con el valor de amplificación a_{1} (etapa
70) y dado el caso el límite de potencia de ruido correspondiente,
debiendo ser los índices de a y x en la figura 5a un índice para los
puntos de referencia, tal como se utilizan en la interpolación que
se explicará posteriormente que se realiza con respecto a los
valores de muestreo 128 a 255 en el bloque 1, se simboliza mediante
una flecha 82 y se efectúa mediante las etapas que siguen a la
etapa 80 en la figura 4. Con la aparición del bloque de audio con el
número 1 se iniciaría por tanto el procesamiento en la etapa
80.
En el momento de la transmisión del conjunto de
parámetros a_{1}, x_{1} se encuentran en la memoria 32 por
tanto ya sólo los valores de audio 128 a 255, es decir, el bloque de
audio actual tras el bloque de audio 0 procesado en último lugar
por el prefiltro 30. Después de haberse determinado ahora la entrega
de parámetros de puntos de referencia
x_{1}(i) en la etapa 80, el prefiltro 30 determina en la etapa 84 el límite de potencia de ruido q_{1} correspondiente al valor de amplificación a_{1}. Esto puede producirse porque el medio 26 de comparación de puntos de referencia transmita este valor al prefiltro 30, o mediante un nuevo cálculo de este valor mediante el prefiltro 30, tal como se ha descrito anteriormente haciendo referencia a la etapa 64.
x_{1}(i) en la etapa 80, el prefiltro 30 determina en la etapa 84 el límite de potencia de ruido q_{1} correspondiente al valor de amplificación a_{1}. Esto puede producirse porque el medio 26 de comparación de puntos de referencia transmita este valor al prefiltro 30, o mediante un nuevo cálculo de este valor mediante el prefiltro 30, tal como se ha descrito anteriormente haciendo referencia a la etapa 64.
A continuación, en una etapa 86, se inicializa
un índice j a un valor de muestreo, para indicar el valor de
muestreo más antiguo que ha quedado en la memoria 32 FIFO o el
primer valor de muestreo del bloque de audio actual "bloque
1", es decir, en el presente ejemplo de la figura 5a, el valor de
muestreo 128. En una etapa 88, el prefiltro parametrizable realiza
una interpolación entre los coeficientes de filtro x_{0} y
x_{1}, valiendo a este respecto la parametrización x_{0} como
valor de referencia en el punto de referencia con número de valor
de audio 127 del bloque 0 anterior y la parametrización x_{1} como
valor de referencia en el punto de referencia con número de valor
de audio 255 del bloque 1 actual. Estas posiciones de valor de
audio 127 y 255 se denominan a continuación también punto de
referencia 0 y punto de referencia 1, estando indicadas en la
figura 5a mediante las flechas 90 y 92 las parametrizaciones de
puntos de referencia que se refieren a los puntos de
referencia.
El prefiltro 30 parametrizable realiza en la
etapa 88 la interpolación de los coeficientes de filtro x_{0},
x_{1} entre los dos puntos de referencia en forma de una
interpolación lineal, para obtener el coeficiente de filtro
interpolado en la posición de muestreo j, es decir,
x(t_{j})(i) con i = 1...N.
A continuación, concretamente en la etapa 90, el
prefiltro 30 parametrizable realiza una interpolación entre el
límite de potencia de ruido q_{1} y q_{0}, para obtener un
límite de potencia de ruido interpolado en la posición de muestreo
j, es decir, q(t_{j}). En una etapa 92, el prefiltro 30
parametrizable calcula a continuación el valor de amplificación
para la posición de muestreo j basándose en el límite de potencia
de ruido interpolado y la potencia de ruido de cuantificación así
como preferiblemente también los coeficientes de filtro
interpolados, concretamente por ejemplo en función de
la
{}\hskip17cm raíz de \frac{Potencia \ de \ ruido \ de \ cuantificación}{q(t_{j})}, remitiéndose a este respecto a las realizaciones relativas a la etapa 64 de la figura 3.
{}\hskip17cm raíz de \frac{Potencia \ de \ ruido \ de \ cuantificación}{q(t_{j})}, remitiéndose a este respecto a las realizaciones relativas a la etapa 64 de la figura 3.
A continuación, en una etapa 94, el prefiltro 30
parametrizable aplica el valor de amplificación calculado así como
los coeficientes de filtro interpolados al valor de muestreo en la
posición de muestreo j, para obtener un valor de muestreo filtrado
para esta posición de muestreo, concretamente s'(t_{j}).
A continuación, en una etapa 96, el prefiltro 30
parametrizable comprueba si la posición de muestreo j ha alcanzado
el punto de referencia actual, es decir, el punto de referencia 1,
en el caso de la figura 5a la posición de muestreo 255, es decir,
el valor de muestreo para el que debe valer la parametrización
transmitida al prefiltro 30 parametrizable más el valor de
amplificación directamente, es decir, sin interpolación. Si éste no
es el caso, entonces el prefiltro 30 parametrizable aumenta o
incrementa el índice j en 1, volviendo a repetirse las etapas 88 a
96. Sin embargo, en caso de que la comprobación en la etapa 96
resulte ser positiva, entonces en la etapa 100 el prefiltro
parametrizable aplica el valor de amplificación transmitido en
último lugar por el medio 26 de comparación de puntos de referencia
y los coeficientes de filtro transmitidos en último lugar por el
medio 26 de comparación de puntos de referencia, directamente sin
interpolación al valor de muestreo en el nuevo punto de referencia,
tras lo cual se procesa el bloque actual, es decir, en el presente
caso el bloque 1, y el proceso se realiza de nuevo en la etapa 80
con respecto al bloque que va a procesarse a continuación que,
dependiendo de si la parametrización del siguiente bloque de audio,
bloque 2, se diferencia suficientemente de la parametrización
x_{1}(i), dado el caso puede ser entonces este siguiente
bloque de audio, bloque 2, o bien un bloque de audio posterior.
Antes de describir haciendo referencia a la
figura 5 el procedimiento adicional en el procesamiento de los
valores de muestreo filtrados s', se describe a continuación la
finalidad y la base de la manera de proceder según las figuras 3 y
4. El sentido y la finalidad del filtrado consisten en filtrar la
señal de audio en la entrada 12 con un filtro adaptativo, cuya
función de transferencia siempre se adapta de la manera más óptima
posible a la inversa del umbral de escucha, que también cambia con
el tiempo. El motivo de esto es que, en el lado del decodificador,
el filtrado inverso mediante un filtro adaptativo, cuya función de
transferencia se adapta de manera correspondiente siempre al umbral
de escucha, forma el ruido blanco de cuantificación introducido por
una cuantificación de la señal de audio filtrada, es decir, el ruido
de cuantificación constante en frecuencia, concretamente adaptado a
la forma del umbral de escucha.
La aplicación del valor de amplificación en las
etapas 94 y 100 en el prefiltro 30 consiste en una multiplicación
de la señal de audio o de la señal de audio filtrada, es decir, de
los valores de muestreo s o de los valores de muestreo filtrados
s', por el factor de amplificación. El sentido consiste en ajustar
de este modo el ruido de cuantificación, que se introduce en la
señal de audio filtrada por la cuantificación descrita con más
detalle a continuación, y que se adapta por el filtrado inverso en
el lado del decodificador a la forma del umbral de escucha, a ser
posible tan alto que aún así no supere el umbral de escucha. Esto
puede ilustrarse mediante la fórmula de Parseval, según la cual el
cuadrado del valor absoluto de una función es igual al cuadrado del
valor absoluto de la transformada de Fourier. Entonces, cuando en el
lado del decodificador vuelve a realizarse en sentido inverso la
multiplicación de la señal de audio en el prefiltro por el valor de
amplificación, dividiéndose la señal de audio filtrada por el valor
de amplificación, se reduce de este modo también la potencia de
ruido de cuantificación, concretamente por el factor a^{-2},
siendo a el valor de amplificación. Por consiguiente, mediante la
aplicación del valor de amplificación en el prefiltro 30, la
potencia de ruido de cuantificación puede ajustarse de manera
óptima alta, lo que de este modo es sinónimo de que se aumenta el
tamaño de paso de cuantificación y de este modo el número de
escalones de cuantificación que van a codificarse, lo que a su vez
aumenta la compresión en la parte de reducción de redundancia
posterior.
Dicho de otro modo, el efecto del prefiltro
puede considerarse como una normalización de la señal a su umbral
de enmascaramiento, de modo que el nivel de las interferencias de
cuantificación o del ruido de cuantificación puede mantenerse
constante tanto en tiempo como en frecuencia. Puesto que la señal de
audio está presente en el dominio de tiempo, la cuantificación
puede realizarse por tanto paso a paso con una cuantificación
constante uniforme, tal como se describirá aún a continuación. De
este modo se elimina de manera ideal cualquier tipo de irrelevancia
de la señal de audio, y puede utilizarse un esquema de compresión
sin pérdida, para eliminar aún la redundancia que queda en la señal
de audio prefiltrada y cuantificada, tal como se describirá aún a
continuación.
Mediante la figura 5a se destaca además
claramente de nuevo que, evidentemente, los coeficientes de filtro
y los valores de amplificación a_{0}, a_{1}, x_{0}, x_{1}
deben estar disponibles como información secundaria en el lado del
decodificador, pero que, sin embargo, el esfuerzo de transferencia
para ello se reduce porque simplemente no tienen que volver a
utilizarse para cada bloque nuevos coeficientes de filtro y nuevos
valores de amplificación. Más bien tiene lugar una comprobación 66
de valor umbral, para transferir las parametrizaciones como
información secundaria sólo en caso de un cambio de parametrización
suficiente y en caso contrario no se transfiere la información
secundaria o las parametrizaciones. En los bloques de audio, para
los que se transfirieron las parametrizaciones, tiene lugar a lo
largo del intervalo de estos bloques una interpolación de la
parametrización anterior a la nueva. La interpolación de los
coeficientes de filtro tiene lugar de la manera descrita
anteriormente con referencia a la etapa 88. La interpolación en
cuanto a la amplificación tiene lugar dando un rodeo, concretamente
a través de una interpolación 90 lineal del límite de potencia de
ruido q_{0}, q_{1}. En comparación con una interpolación directa
a través del valor de amplificación, la interpolación lineal lleva
con respecto al límite de potencia de ruido a un mejor resultado de
escucha o a menos artefactos audibles.
A continuación se describe ahora mediante la
figura 6 el procesamiento adicional de la señal prefiltrada que
fundamentalmente comprende una cuantificación y una reducción de
redundancia. En primer lugar se almacenan los valores de muestreo
filtrados entregados por el prefiltro 30 parametrizable en la
memoria 38 intermedia y simultáneamente se pasan de la memoria 38
intermedia al multiplicador 40, en el que, a su vez, puesto que es
su primera pasada, en primer lugar sin cambio, concretamente con un
factor de ajuste a escala de uno, se transmiten a través del
multiplicador 40 al cuantificador 28. En éste se cortan los valores
de audio filtrados por encima de un límite superior en una etapa
110 y a continuación se cuantifican en una etapa 112. Las dos
etapas 110 y 112 se realizan por el cuantificador 28. Especialmente
las dos etapas 110 y 112 se realizan por el cuantificador 28 de
manera preferible en una etapa, cuantificando los valores de audio
filtrados s' con una función escalonada de cuantificación, que
representa los valores de muestreo filtrados s' presentes por
ejemplo en una representación en coma flotante en una pluralidad de
índices o valores de escalón de cuantificación de número entero y,
a partir de un cierto valor umbral, para los valores de muestreo
filtrados discurre de una manera plana, de modo que los valores de
muestreo filtrados, que son mayores que el valor umbral, se
cuantifican en un mismo escalón de cuantificación. Un ejemplo de
una función escalonada de cuantificación de este tipo se representa
en la figura 7a.
Los valores de muestreo filtrados cuantificados
se designan en la figura 7a con \sigma'. La función escalonada de
cuantificación es preferiblemente una función escalonada de
cuantificación con un tamaño de paso constante por debajo del valor
umbral, es decir, el salto al siguiente escalón de cuantificación
tiene lugar siempre tras un intervalo constante a lo largo de los
valores de entrada S'. En la implementación se ajusta el tamaño de
paso al valor umbral de tal modo que el número de escalones de
cuantificación corresponde preferiblemente a una potencia de 2. En
comparación con la representación en coma flotante de los valores de
muestreo filtrados s' entrantes, el valor umbral es menor, de modo
que un valor máximo del intervalo que puede representarse de la
representación en coma flotante sobrepasa el valor umbral.
El motivo para el valor umbral consiste en que
se ha observado que la señal de audio filtrada, que se entrega por
el prefiltro 30, presenta individualmente valores de audio, que
debido a una acumulación desfavorable de armónicos se suman para
dar valores muy grandes. Además se ha observado, que un corte de
estos valores, tal como se consigue mediante la función escalonada
de cuantificación mostrada en la figura 7a, lleva a una elevada
reducción de datos, pero sólo a un ligero perjuicio de la calidad de
audio. Más bien se generan estos puntos individualizados en la
señal de audio filtrada de manera artificial mediante el filtrado
selectivo en frecuencia en el filtro 30 parametrizable, de modo que
un corte de los mismos sólo perjudica ligeramente a la calidad de
audio.
Un ejemplo algo más concreto para la función
escalonada de cuantificación mostrada en la figura 7a sería una
que, hasta el valor umbral, redondeara todos los valores de muestreo
filtrados s' al siguiente número entero y, a partir de ahí,
cuantificara todos los valores de muestreo filtrados situados por
encima al escalón de cuantificación más alto, como por ejemplo 256.
Este caso se representa en la figura 7a.
Otro ejemplo de una posible función escalonada
de cuantificación sería la mostrada en la figura 7b. Hasta el valor
umbral, la función escalonada de cuantificación de la figura 7b
corresponde a la de la figura 7a. Aunque en lugar de discurrir para
valores de muestreo s' por encima del valor umbral de una manera
abrupta y plana, la función escalonada de cuantificación sigue
discurriendo con una pendiente, que es menor que la pendiente en el
intervalo por debajo del valor umbral. Dicho de otro modo, por
encima del valor umbral, el tamaño de paso de cuantificación es
mayor. De este modo se consigue un efecto similar al de la función
de cuantificación de la figura 7a, aunque por un lado con más
esfuerzo debido a los diferentes tamaños de paso de la función
escalonada de cuantificación por encima y por debajo del valor
umbral y, por otro lado, con una mejor calidad de audio, ya que no
se cortan completamente valores de audio filtrados s' muy altos,
sino que sólo se cuantifican con un tamaño de paso de
cuantificación mayor.
Tal como ya se ha descrito anteriormente, en el
lado del decodificador no tienen que estar disponibles sólo los
valores de audio filtrados y cuantificados \sigma' sino además
también los parámetros de entrada para el prefiltro 30, en los que
se ha basado el filtrado de estos valores, concretamente la
parametrización de punto de referencia incluyendo una indicación
del valor de amplificación correspondiente. Por tanto, en una etapa
114, el compresor 34 lleva a cabo un primer intento de compresión y
comprime en este caso información secundaria que contiene los
valores de amplificación a_{0} y a_{1} en los puntos de
referencia, como por ejemplo 127 y 255, así como los coeficientes
de filtro x_{0} y x_{1} en los puntos de referencia y los
valores de muestreo filtrados, cuantificados \sigma' en una señal
filtrada provisional. El compresor 34 es a este respecto un
codificador que funciona sin pérdida, como por ejemplo un
codificador de Huffman o aritmético con o sin predicción y/o
adaptación.
La memoria 38, por la que pasan los valores de
audio muestreados \sigma', sirve como memoria intermedia para un
tamaño de bloque adecuado, con el que el compresor 34 procesa los
valores de audio filtrados, cuantificados \sigma' y, como se
describe a continuación, dado el caso ajustados a escala, entregados
por el cuantificador 28. El tamaño de bloque puede diferir del
tamaño de bloque de los bloques de audio, tal como se utilizan por
el medio 20.
Como ya se mencionó para el primer intento de
compresión, el control 36 de tasa de bits ha activado el
multiplicador 40 con un multiplicador de 1, de modo que los valores
de audio filtrados llegan desde el prefiltro 30 sin cambios al
cuantificador 28 y desde allí como valores de audio filtrados,
cuantificados al compresor 34. El compresor 34 supervisa en una
etapa 116, si se ha codificado un determinado tamaño de bloque de
compresión, es decir, un determinado número de valores de audio
muestreados, cuantificados, en la señal codificada provisional, o
si han de codificarse otros valores de audio filtrados,
cuantificados \sigma' en la señal codificada provisional actual.
En caso de no alcanzarse el tamaño de bloque de compresión, el
compresor 34 sigue realizando la compresión 114 actual. Sin
embargo, si se alcanza el tamaño de bloque de compresión, el control
36 de tasa de bits comprueba en una etapa 118 si la cantidad de
bits necesaria para la compresión es mayor que una cantidad de bits
fijada por una tasa de bits deseada. Si éste no es el caso, el
control 36 de tasa de bits comprueba, en una etapa 120, si la
cantidad de bits necesaria es menor que la cantidad de bits fijada
por la tasa de bits deseada. En este caso, el control 36 de tasa de
bits añade a la señal codificada en la etapa 122 bits de relleno,
hasta que se alcanza la cantidad de bits fijada por la tasa de bits
deseada. A continuación se realiza en la etapa 124 la entrega de la
señal codificada. Alternativamente a la etapa 122, el control 36 de
tasa de bits podría transmitir el bloque de compresión de valores
de audio filtrados \sigma' en los que se basa en último lugar la
compresión, aún almacenado en la memoria 38, en una forma
multiplicada por un multiplicador mayor que 1 mediante el
multiplicador 40, al cuantificador 28 para pasar de nuevo por las
etapas 110 a 118, hasta que se alcanza la cantidad de bits fijada
por la tasa de bits deseada, tal como se indica mediante una etapa
125 con línea discontinua.
Sin embargo, si la comprobación en la etapa 118
da como resultado que la cantidad de bits necesaria es mayor que la
fijada por la tasa de bits deseada, el control 36 de tasa de bits
cambia el multiplicador para el multiplicador 40 a un factor entre
0 y 1 exclusivamente. Esto lo realiza en la etapa 126. Después de la
etapa 126, el control 36 de tasa de bits se encarga de que la
memoria 38 vuelva a entregar el último bloque de compresión de
valores de audio filtrados \sigma' en el que se basa la
compresión, multiplicándose los mismos a continuación por el factor
ajustado en la etapa 126 y volviendo a alimentarse al cuantificador
28, tras lo cual vuelven a realizarse las etapas 110 a 118 y se
descarta la señal codificada hasta ahora provisional.
Se indica que al realizar de nuevo las etapas
110 a 116, en la etapa 114 evidentemente también se integra el
factor utilizado en la etapa 126 (o la etapa 125) en la señal
codificada.
El sentido del modo de proceder según la etapa
126 consiste en que mediante el factor se aumenta el tamaño de paso
efectivo del cuantificador 28. Esto significa que el ruido de
cuantificación resultante se encuentra de manera uniforme por
encima del umbral de enmascaramiento, lo que lleva a interferencias
audibles o ruido audible, aunque a cambio produce una tasa de bits
reducida. Si tras pasar de nuevo por las etapas 110 a 116 vuelve a
determinarse en la etapa 118 que la cantidad de bits necesaria es
mayor que la fijada por la tasa de bits deseada, entonces vuelve a
reducirse el factor en la etapa 126, etc.
Cuando finalmente los datos se entregan en la
etapa 124 como señal codificada, entonces se realiza el siguiente
bloque de compresión de los valores de audio filtrados,
cuantificados \sigma' siguientes.
Se indica además que también podría utilizarse
otro valor preinicializado para el factor de multiplicación
distinto de 1, concretamente por ejemplo 1. Entonces en cualquier
caso, es decir arriba del todo en la figura 6, tiene lugar ante
todo un ajuste a escala.
La figura 5b ilustra de nuevo la señal
codificada que se obtiene, que en general se indica con 130. La
señal codificada comprende información secundaria y datos
principales situados entre la misma. La información secundaria
comprende, como ya se ha mencionado, información a partir de la
cual, para bloques de audio especiales, concretamente bloques de
audio en los que en la secuencia de bloques de audio se ha obtenido
un cambio significativo en los coeficientes de filtro, puede
derivarse el valor del valor de amplificación y el valor de los
coeficientes de filtro. Dado el caso, la información secundaria
comprende además información adicional que se refiere al valor de
amplificación utilizado para el control de bits. Debido a la
dependencia mutua entre el valor de amplificación y el límite de
potencia de ruido q, la información secundaria puede comprender
opcionalmente, además del valor de amplificación a_{#} para un
punto de referencia #, también el límite de potencia de ruido
q_{#}, o también sólo éste último. En la señal codificada, la
información secundaria está dispuesta preferiblemente de tal modo
que la información secundaria con respecto a coeficientes de filtro
y el valor de amplificación correspondiente o el límite de potencia
de ruido correspondiente, está dispuesta antes de los datos
principales para el bloque de audio de valores de audio filtrados,
cuantificados \sigma', a partir de los que se han derivado estos
coeficientes de filtro con el valor de amplificación correspondiente
o el límite de potencia de ruido correspondiente, es decir, la
información secundaria a_{0}, x_{0}(i) tras el bloque -1
y la información secundaria a_{1}, x_{1}(i) tras el
bloque 1. Dicho de otro modo, los datos principales, es decir, los
valores de audio filtrados, cuantificados \sigma' están dispuestos
desde un bloque de audio exclusive, del tipo en el que se ha
obtenido un cambio significativo en la secuencia de bloques de
audio en los coeficientes de filtro, hasta el siguiente bloque de
audio inclusive de este tipo, en la figura 5b por ejemplo los
valores de audio \sigma' (t_{0}) - \sigma' (t_{255}),
siempre entre el bloque 132 de información secundaria con respecto
al primero de estos dos bloques de audio (bloque -1) y el siguiente
bloque 134 de información secundaria con respecto al segundo de
estos dos bloques de audio (bloque 1). Los valores de audio
\sigma' (t_{0}) - \sigma' (t_{127}) se han obtenido o pueden
decodificarse tal como se ha mencionado anteriormente con
referencia a la figura 5a sólo mediante la información 132
secundaria, mientras que los valores de audio \sigma' (t_{128})
- \sigma' (t_{255}) se han obtenido a través de interpolación
mediante la información 132 secundaria como valores de referencia en
el punto de referencia con el número de valor de muestreo 127 y
mediante la información 134 secundaria como valores de referencia
en el punto de referencia con el número de valor de muestreo 255 y
por tanto sólo pueden decodificarse mediante las dos informaciones
secundarias.
Además, la información secundaria relativa al
valor de amplificación o al límite de potencia de ruido y a los
coeficientes de filtro se integra en cada bloque 132 y 134 de
información secundaria no siempre independientemente entre sí. Más
bien esta información secundaria se transmite en diferencias al
bloque de información secundaria anterior. En la figura 5b, el
bloque 132 de información secundaria contiene por ejemplo el valor
de amplificación a_{0} y los coeficientes de filtro x_{0} con
respecto al punto de referencia en el instante t_{-1}. En el
bloque 132 de información secundaria estos valores pueden derivarse
del propio bloque. Sin embargo, a partir del bloque 134 de
información secundaria ya no puede derivarse de este bloque solo
información secundaria relativa al punto de referencia en el
instante t_{255}. Más bien comprende el bloque 134 de información
secundaria únicamente información acerca de diferencias del valor de
amplificación a_{1} del punto de referencia en el instante
t_{255} respecto al valor de amplificación del punto de referencia
en el instante t_{0} y las diferencias de los coeficientes de
filtro x_{1} respecto a los coeficientes de filtro x_{0}. El
bloque 134 de información secundaria contiene por tanto únicamente
la información con respecto a a_{1} - a_{0} y x_{1}(i)
- x_{0}(i). Sin embargo, en instantes intermitentes
deberían transmitirse los coeficientes de filtro y el valor de
amplificación o el límite de potencia de ruido completamente y no
sólo como diferencia respecto al punto de referencia anterior, como
por ejemplo cada segundo, para permitir a un receptor o
decodificador engancharse a un flujo continuo de datos de
codificación, como aún se explicará a continuación.
Este tipo de integración de la información
secundaria en los bloques 132 y 134 de información secundaria ofrece
la ventaja de la posibilidad de una tasa de compresión más alta. El
motivo para ello consiste en que, aunque la información secundaria
sólo se transmite a ser posible cuando se ha obtenido un cambio
suficiente de los coeficientes de filtro respecto a los
coeficientes de filtro de un punto de referencia anterior, vale la
pena el esfuerzo de la formación de diferencias en el lado del
codificador o la formación de sumas en el lado del decodificador,
ya que las diferencias que se obtienen son pequeñas, a pesar de la
consulta en la etapa 66, para así permitir ventajas en la
codificación de entropía.
Después de que anteriormente se haya descrito un
ejemplo de realización para un codificador de audio, se describe a
continuación un ejemplo de realización para un decodificador de
audio, que es adecuado para decodificar la señal codificada
generada mediante el codificador 10 de audio de la figura 1 en una
señal de audio decodificada, reproducible o que puede seguir
procesándose.
La estructura de este decodificador se muestra
en la figura 8. El decodificador, que en general se indica con 210,
comprende un descompresor 212, una memoria 214 FIFO, un
multiplicador 216 y un postfiltro 218 parametrizable. El
descompresor 212, la memoria 214 FIFO, el multiplicador 216 y el
postfiltro 218 parametrizable están conectados en este orden entre
una entrada 220 de datos y una salida 222 de datos del decodificador
210, obteniéndose en la entrada 220 de datos la señal codificada y
entregándose en la salida 222 de datos la señal de audio
decodificada, que sólo se diferencia de la señal de audio original
en la entrada 12 de datos del codificador 10 de audio por el ruido
de cuantificación generado por el cuantificador 28 en el codificador
10 de audio. El descompresor 212 está unido en una salida de datos
adicional con una entrada de control del multiplicador 216, para
transmitir a la misma un multiplicador, y a través de una salida de
datos adicional con una entrada de parametrización del postfiltro
218 parametrizable.
Como se muestra en la figura 9, el descompresor
212 descomprime en una etapa 224 en primer lugar la señal
comprimida que se encuentra en la entrada 220 de datos, para llegar
a los datos de audio filtrados, cuantificados, concretamente los
valores de muestreo \sigma', así como a la información secundaria
correspondiente en los bloques 132, 134 de información secundaria,
que indican los coeficientes de filtro y valores de amplificación
o, en lugar de los valores de amplificación, los límites de potencia
de ruido, en los puntos de referencia.
Como muestra la figura 10, el descompresor 212
comprueba en una etapa 226 la señal descomprimida en el orden de
llegada de la misma, en cuanto a si en la misma está contenida
información secundaria con coeficientes de filtro, y concretamente
en una forma cerrada en sí misma sin referencia de diferencia a un
bloque de información secundaria anterior. Dicho de otro modo, el
descompresor 212 busca el primer bloque 132 de información
secundaria. Una vez que el descompresor 212 lo ha encontrado, se
almacenan de manera intermedia los valores de audio filtrados,
cuantificados \sigma' en una etapa 228 en la memoria 214 FIFO. Si
durante la etapa 228 se ha almacenado un bloque de audio completo
de valores de audio filtrados, cuantificados \sigma', sin que
inmediatamente siga un bloque de información secundaria, entonces
éste se postfiltra en la etapa 228 en primer lugar mediante la
información contenida en la información secundaria recibida en la
etapa 226 mediante parametrización y el valor de amplificación y se
amplifica en el multiplicador 216, con lo que se decodifica y de
este modo se obtiene el bloque de audio decodificado
correspondiente.
En una etapa 230, el descompresor 212 supervisa
la señal descomprimida respecto a la aparición de un bloque de
información secundaria de cualquier tipo, concretamente con
coeficientes de filtro absolutos o diferencias de coeficientes de
filtro con respecto a un bloque de información secundaria anterior.
En el ejemplo de la figura 5b por ejemplo el descompresor 212
detectaría en la etapa 230, tras la detección del bloque 132 de
información secundaria en la etapa 226, la aparición del bloque 134
de información secundaria. A este respecto en la etapa 228 ya se
habría decodificado el bloque de valores de audio filtrados,
cuantificados \sigma' (t_{0}) - \sigma' (t_{127}), y
concretamente utilizando la información 132 secundaria. Por tanto,
mientras que el bloque 134 de información secundaria en la señal
descomprimida no aparezca todavía, se continúa con el
almacenamiento intermedio y la decodificación eventual de bloques
mediante la información secundaria de la etapa 226, como se
describió anteriormente, en la etapa 228.
Una vez que aparece el bloque 134 de información
secundaria, el descompresor 212 calcula en la etapa 232, mediante
la suma de los valores de diferencia en el bloque 134 de información
secundaria respecto a los valores de parámetro en el bloque 132 de
información secundaria, los valores de parámetro en el punto de
referencia 1, es decir, a_{1}, x_{1}(i). Evidentemente
se suprime la etapa 232 en caso de que el bloque de información
secundaria actual sea un bloque de información secundaria sin
diferencias cerrado en sí mismo, lo que, como se ha descrito
anteriormente, puede ser el caso por ejemplo cada segundo. Para que
el tiempo de espera para el decodificador 210 no sea demasiado
largo, los bloques 132 de información secundaria, en los que los
valores de parámetro pueden derivarse de manera absoluta, es decir
sin relación con otro bloque de información secundaria, se disponen
a distancias lo suficientemente pequeñas, de modo que el tiempo de
conexión o el tiempo muerto al conectar el codificador 210 de audio
en por ejemplo una comunicación por radio o comunicación por
radiodifusión no sea demasiado grande. Preferiblemente, el número
de bloques 134 de información secundaria con los valores de
diferencia dispuestos entremedias también están dispuestos en un
número predeterminado fijo entre los bloques 132 de información
secundaria, de modo que el decodificador sabe cuándo ha de esperarse
de nuevo un bloque de información secundaria de tipo 132 en la
señal codificada. Alternativamente se indican los diferentes tipos
de bloque de información secundaria mediante etiquetas
correspondientes.
Como se muestra ahora en la figura 11, después
de que ahora se haya alcanzado un bloque de información secundaria
para un nuevo punto de referencia, y en concreto especialmente tras
la etapa 226 ó 232, se inicializa en primer lugar un índice de
valor de muestreo j a 0 en la etapa 234. Este valor corresponde a la
posición de muestreo del primer valor de muestreo en el bloque de
audio que queda actualmente en la FIFO 214, al que se refiere la
información secundaria actual. La etapa 234 la realiza el postfiltro
218 parametrizable. El postfiltro 218 realiza a continuación en una
etapa 236 un cálculo del límite de potencia de ruido en el nuevo
punto de referencia, correspondiendo esta etapa a la etapa 84 de la
figura 4 y pudiendo suprimirse dado el caso, cuando por ejemplo el
límite de potencia de ruido en los puntos de referencia se
transfiere adicionalmente a los valores de amplificación. En etapas
238 y 240 posteriores el postfiltro 218 realiza a continuación
interpolaciones respecto a los coeficientes de filtro y los límites
de potencia de ruido, que corresponden a las interpolaciones 88 y
90 de la figura 4. El cálculo posterior en la etapa 242 del valor de
amplificación para la posición de muestreo j basándose en el límite
de potencia de ruido interpolado y en los coeficientes de filtro
interpolados de las etapas 238 y 240 corresponde a la etapa 92 de
la figura 4. En una etapa 244, el postfiltro 218 aplica a
continuación el valor de amplificación calculado en la etapa 242 así
como los coeficientes de filtro interpolados al valor de muestreo
en la posición de muestreo j. Esta etapa se diferencia de la etapa
94 de la figura 4 porque los coeficientes de filtro interpolados se
aplican a los valores de muestreo filtrados, cuantificados \sigma'
de tal modo que la función de transferencia del postfiltro
parametrizable no corresponde a la inversa del umbral de escucha,
sino al propio umbral de escucha. El postfiltro no realiza además
una multiplicación por el valor de amplificación, sino una división
entre el valor de amplificación en el valor de muestreo filtrado,
cuantificado \sigma' o el valor de muestreo filtrado,
cuantificado, ya filtrado de manera inversa, en la posición j.
En caso de que el postfiltro 218 todavía no haya
alcanzado el punto de referencia actual con la posición de muestreo
j, lo que comprueba en la etapa 246, incrementa en la etapa 248 el
índice de posición de muestreo j e inicia las etapas 238 a 246 de
nuevo. Sólo cuando se ha alcanzado el punto de referencia aplica el
valor de amplificación y los coeficientes de filtro del nuevo punto
de referencia al valor de muestreo en el punto de referencia,
concretamente en la etapa 250. De nuevo la aplicación comprende,
como en la etapa 218, en lugar de una multiplicación una división
mediante el valor de amplificación y un filtrado con una función de
transferencia igual al umbral de escucha y no a la inversa de este
último. Tras la etapa 250 el bloque de audio actual se decodifica
mediante interpolación entre dos parametrizaciones de puntos de
referencia.
Como ya se ha mencionado, mediante el filtrado y
la aplicación del valor de amplificación en las etapas 218 y 224 se
adapta el ruido introducido mediante la cuantificación en la
codificación en la etapa 110 ó 112 tanto en forma como en intensidad
al umbral de escucha.
Se indica además que, en caso de que los valores
de audio filtrados, cuantificados, debido al control de la tasa de
bits antes de la codificación en la señal codificada, aún se hayan
sometido a una multiplicación adicional en la etapa 126, también
puede tenerse en cuenta este factor en las etapas 218 y 224. Como
alternativa pueden someterse evidentemente los valores de audio
obtenidos mediante el proceso de la figura 11 a una multiplicación
adicional, para volver a amplificar de manera correspondiente los
valores de audio atenuados por una tasa de bits más baja.
En cuanto a las figuras 3, 4, 6 y 9 a 11 se
indica que las mismas muestran diagramas de flujo, que ilustran el
modo de funcionamiento del codificador de la figura 1 o del
decodificador de la figura 8, y que cada una de las etapas
representadas en estos diagramas de flujo mediante un bloque como se
ha descrito está implementada en un medio correspondiente, como se
describió anteriormente. La implementación de las etapas
individuales puede realizarse a este respecto en hardware, como
parte de circuito ASIC, o en software, como subrutinas. En especial
en estas figuras las explicaciones realizadas en los bloques
muestran de manera general a qué operación se refiere la etapa
respectiva, que corresponde al bloque respectivo, mientras que las
flechas entre los bloques ilustran el orden de las etapas en el
funcionamiento del codificador o del decodificador.
Haciendo referencia a la descripción anterior se
indica aún que el esquema de codificación representado anteriormente
puede variarse en diferentes aspectos. Por ejemplo no es necesario
que una parametrización y un valor de amplificación o un límite de
potencia de ruido, tal como se han determinado para un bloque de
audio determinado, deban considerarse inmediatamente válidos para
un determinado valor de audio, como en el ejemplo de realización
anterior el último valor de audio respectivo de cada bloque de
audio, es decir del valor de orden 128 en este bloque de audio, de
modo que para este valor de audio puede prescindirse de la
interpolación. Más bien es posible referir estos valores de
parámetro de punto de referencia a un punto de referencia que se
encuentra temporalmente entre los instantes de muestreo t_{n} con
n = 0,..., 127 de los valores de audio de este bloque de audio, de
modo que para cada valor de audio sería necesaria una
interpolación. En especial la parametrización determinada para un
bloque de audio o el valor de amplificación determinado para este
bloque de audio también pueden aplicarse inmediatamente a otro
valor, como por ejemplo el valor de audio en la mitad del bloque de
audio, como por ejemplo el valor de audio de orden 64 en el caso
del tamaño de bloque anterior de 128 valores de audio.
Además se indica que el ejemplo de realización
anterior se refería a un esquema de codificación de audio que
estaba diseñado para generar una señal codificada con una tasa de
bits controlada. Sin embargo, el control de la tasa de bits no es
necesario en cada caso de aplicación. Por ello, las etapas 116 a 122
y 126 correspondientes también pueden omitirse.
En cuanto al esquema de compresión mencionado
con referencia a la etapa 114 se remite para completar también al
documento descrito en la introducción de la descripción de Schuller
et al., y especialmente al punto IV, cuyo contenido se
incorpora al presente documento como referencia respecto a la
reducción de redundancia mediante codificación sin pérdida.
Además se hace referencia aún con referencia al
ejemplo de realización anterior a lo siguiente. Aunque anteriormente
se haya descrito que el valor umbral en la cuantificación permanece
siempre constante o que la función escalonada de cuantificación
también permanece siempre constante, es decir, que los artefactos
generados en la señal de audio filtrada siempre se cuantifican o
cortan con una cuantificación más basta, por lo que la calidad de
audio podría empeorarse dado el caso de manera audible, es además
posible utilizar esta medida sólo cuando lo requiera la complejidad
de la señal de audio, concretamente cuando la tasa de bits necesaria
para la codificación supere una tasa de bits deseada. En este caso
podría utilizarse, adicionalmente a las funciones escalonadas de
cuantificación mostradas en las figuras 7a y 7b, por ejemplo una con
un tamaño de paso de cuantificación constante por todo el posible
intervalo de valores en la salida del prefiltro y el cuantificador
reaccionaría por ejemplo a una señal, para utilizar o bien la
función escalonada de cuantificación con un tamaño de paso de
cuantificación siempre constante o bien una de las funciones
escalonadas de cuantificación según las figuras 7a o 7b, de modo
que mediante la señal podría comunicarse al cuantificador que
realice con un ligero empeoramiento en la calidad de audio la
reducción de escalón de cuantificación por encima del valor umbral o
el corte por encima del valor umbral. Alternativamente podría
reducirse también de manera gradual el valor umbral poco a poco. En
este caso podría realizarse la reducción del valor umbral en lugar
de la reducción de escalón de la etapa 126. Después de un primer
intento de compresión sin la etapa 110 podría someterse por tanto la
señal comprimida provisionalmente en una etapa 126 modificada a una
cuantificación de valor umbral selectiva sólo cuando la tasa de
bits siguiera siendo demasiado alta (118). Entonces, en una nueva
pasada etapa 126, se cuantificarían los valores de audio filtrados
con la función escalonada de cuantificación que presenta un
desarrollo plano por encima del umbral de audio. Reducciones de
tasa de bits adicionales podrían realizarse en la etapa 126
modificada aún mediante la reducción del valor umbral y por tanto
una modificación adicional de la función escalonada de
cuantificación
Además, si bien algunos aspectos del ejemplo de
realización anterior son ventajosos, sin embargo no son necesarios.
Así por ejemplo en el esquema de codificación de audio anterior
puede omitirse la interpolación. Además sería posible transferir
las parametrizaciones y el valor de amplificación o las
parametrizaciones y el límite de potencia de ruido con respecto a
cada bloque de audio, respecto al que se calcularon, y no saltarse
ninguno, cuando las parametrizaciones sucesivas se diferencian en
menos de la medida predeterminada mencionada anteriormente.
Además sería posible aplicar la codificación de
diferencias únicamente a las parametrizaciones, pero no al valor de
amplificación o al límite de potencia de ruido.
Además es concebible transferir en el esquema de
codificación anterior los coeficientes de filtro en los bloques 134
secundarios de diferencia también de otro modo, concretamente por
ejemplo en forma de los coeficientes de filtro actuales menos los
coeficientes de filtro transferidos anteriormente menos el umbral
mínimo de la etapa 66.
El esquema de codificación de audio descrito
anteriormente se ocupa por tanto entre otras cosas de la
transferencia de información secundaria en un codificador de audio
con un tiempo de retardo muy reducido de una manera eficaz. La
información secundaria, que debe transferirse para el decodificador,
para que la señal de audio pueda volver a reconstruirse de manera
adecuada, tiene la propiedad de que ésta sólo cambia lentamente en
la mayoría de los casos. Por tanto sólo se transfieren diferencias,
lo que reduce la tasa de bits. Además éstas se transfieren sólo
cuando hay un cambio suficiente. De cuando en cuando se transfiere
el valor absoluto, en caso de que se hayan perdido valores pasados.
Dicho de otro modo, la información secundaria desde el prefiltro o
los coeficientes se transfieren de tal modo que el postfiltro tiene
en el decodificador la función de transferencia inversa, de modo
que la señal de audio pueda volver a reconstruirse de manera
adecuada. Se reduce la tasa de bits necesaria para ello,
transfiriéndose diferencias y también sólo cuando son lo
suficientemente grandes. Estas diferencias tienen valores más
pequeños y aparecen con más frecuencia, por lo que necesitan menos
bits en la codificación. La codificación de diferencias vale la
pena especialmente porque las diferencias en caso de señales de
audio que cambian continuamente también cambian sólo de manera
constante.
En especial se indica que, en función de las
circunstancias, el esquema de codificación de audio según la
invención también puede implementarse en software. La implementación
puede realizarse en un medio de almacenamiento digital,
especialmente un disquete o un CD con señales de control legibles
electrónicamente, que pueden actuar conjuntamente con un sistema
informático programable de tal modo que se realiza el procedimiento
correspondiente. La invención consiste por tanto en general también
en un producto de programa informático con un código de programa
almacenado en un soporte legible por máquina para la realización del
procedimiento según la invención, cuando el producto de programa
informático se ejecuta en un ordenador. Dicho de otro modo, la
invención puede realizarse por tanto como un programa informático
con un código de programa para la realización del procedimiento,
cuando el programa informático se ejecuta en un ordenador.
En especial, las etapas de procedimiento
anteriores en los bloques de los diagramas de flujo pueden
implementarse individualmente o en varias rutinas de subprograma.
De manera alternativa también es posible evidentemente una
implementación de un dispositivo según la invención en forma de un
circuito integrado, en la que estos bloques por ejemplo se
implementan como partes de circuito individuales de un ASIC.
En especial se indica que, en función de las
circunstancias, el esquema según la invención también puede
implementarse en software. La implementación puede realizarse en un
medio de almacenamiento digital, especialmente un disquete o un CD
con señales de control legibles electrónicamente que pueden actuar
conjuntamente con un sistema informático programable de tal modo
que se realiza el procedimiento correspondiente. La invención
consiste por tanto en general también en un producto de programa
informático con un código de programa almacenado en un soporte
legible por máquina para la realización del procedimiento según la
invención, cuando el producto de programa informático se ejecuta en
un ordenador. Dicho de otro modo, la invención puede realizarse por
tanto como un programa informático con un código de programa para
la realización del procedimiento, cuando el programa informático se
ejecuta en un ordenador.
Claims (11)
1. Dispositivo para la codificación de una señal
de audio de una secuencia de valores de audio en una señal
codificada, con
- \quad
- un medio (20) para determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia de valores de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia de valores de audio;
- \quad
- un medio (24) para calcular una versión de una primera parametrización de un filtro (30) parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del segundo umbral de escucha;
- \quad
- un medio (30) para filtrar un bloque predeterminado de valores de audio de la secuencia de valores de audio con el filtro parametrizable utilizando una parametrización predeterminada, que de manera predeterminada depende de la versión de la segunda parametrización, para obtener un bloque de valores de audio filtrados correspondiente al bloque predeterminado;
- \quad
- un medio (28) para cuantificar los valores de audio filtrados, para obtener un bloque de valores de audio filtrados, cuantificados;
- \quad
- un medio para formar una combinación de la versión de la primera parametrización y de la versión de la segunda parametrización, que se suceden entre sí, y que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización; y
- \quad
- un medio para integrar información, a partir de la que pueden derivarse los valores de audio filtrados, cuantificados y una versión de la primera parametrización, y que comprende la combinación, en la señal codificada.
2. Dispositivo según la reivindicación 1, en el
que el medio para filtrar presenta las características
siguientes:
- \quad
- un medio para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado del bloque predeterminado de valores de audio; y
- \quad
- un medio para aplicar la versión de la parametrización interpolada al valor de audio predeterminado.
3. Dispositivo según una de las reivindicaciones
anteriores, en el que el medio para integrar comprende un
codificador de entropía.
4. Dispositivo según una de las reivindicaciones
anteriores, en el que el medio para determinar el primer y el
segundo umbral de escucha y el medio para calcular están
configurados para, a partir del primer bloque de valores de audio,
para una pluralidad de bloques sucesivos posteriores de valores de
audio de la secuencia de valores de audio, determinar un umbral de
escucha o calcular una parametrización del filtro parametrizable,
de modo que la función de transferencia del mismo corresponde
aproximadamente a la inversa de la magnitud del umbral de escucha
respectivo, presentando el dispositivo además la característica
siguiente:
- \quad
- un medio para comprobar las parametrizaciones por orden, en cuanto a si las mismas se diferencian de la primera parametrización en más de una medida predeterminada, y para seleccionar como la segunda parametrización sólo aquella parametrización de entre las parametrizaciones, que por primera vez se diferencia de la primera parametrización en más de la medida predeterminada.
5. Dispositivo según la reivindicación 4, en el
que la combinación presenta la diferencia menos la medida
predeterminada.
6. Dispositivo según una de las reivindicaciones
anteriores, que presenta además un medio (22) para determinar un
primer límite de potencia de ruido en función del primer umbral de
enmascaramiento y un segundo límite de potencia de ruido en función
del segundo umbral de enmascaramiento, y en el que el medio para
filtrar presenta un medio (90) para interpolar entre el primer
límite de potencia de ruido y el segundo límite de potencia de
ruido, para obtener un límite de potencia de ruido interpolado para
un valor de audio predeterminado del bloque predeterminado de
valores de audio, un medio (92) para determinar un valor intermedio
de ajuste a escala en función de una potencia de ruido de
cuantificación provocada por una cuantificación según una norma de
cuantificación predeterminada y el límite de potencia de ruido
interpolado, y un medio (94) para aplicar el valor intermedio de
ajuste a escala al valor de audio predeterminado, para obtener un
valor de audio filtrado, ajustado a escala.
7. Dispositivo según una de las reivindicaciones
anteriores, que está configurado para procesar una pluralidad de
bloques predeterminados sucesivos y a este respecto incorporar en la
señal codificada de manera intermitente información que comprende
los valores de audio filtrados, cuantificados y una versión de la
primera y la segunda parametrización.
8. Procedimiento para codificar una señal de
audio de una secuencia de valores de audio en una señal codificada,
con las etapas siguientes:
- \quad
- determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia de valores de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia de valores de audio;
- \quad
- calcular una versión de una primera parametrización de un filtro (30) parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del segundo umbral de escucha;
- \quad
- filtrar un bloque predeterminado de valores de audio de la secuencia de valores de audio con el filtro parametrizable utilizando una parametrización predeterminada, que de manera predeterminada depende de la versión de la segunda parametrización, para obtener un bloque de valores de audio filtrados correspondiente al bloque predeterminado;
- \quad
- cuantificar los valores de audio filtrados, para obtener un bloque de valores de audio filtrados, cuantificados;
- \quad
- formar una combinación de la versión de la primera parametrización y de la versión de la segunda parametrización, que se suceden entre sí, y que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización; e
- \quad
- integrar información, a partir de la que pueden derivarse los valores de audio filtrados, cuantificados, y que comprende la combinación, en la señal codificada.
9. Dispositivo para decodificar una señal
codificada en una señal de audio, conteniendo la señal codificada
información, a partir de la que pueden derivarse un bloque de
valores de audio filtrados, cuantificados y una versión de una
primera parametrización, según la cual una función de transferencia
de un filtro parametrizable corresponde a la inversa de la magnitud
de un primer umbral de escucha, y que comprende una combinación
entre una versión de una segunda parametrización, según la cual una
función de transferencia del filtro parametrizable corresponde a la
inversa de una magnitud de un segundo umbral de escucha, y la
versión de la primera parametrización, que se suceden entre sí, y
que comprende al menos una diferencia entre la versión de la primera
parametrización y la versión de la segunda parametrización, con
- \quad
- un medio para derivar la versión de la primera parametrización a partir de la señal codificada;
- \quad
- un medio para formar una suma entre la versión de la primera parametrización y la diferencia, para obtener la versión de la segunda parametrización; y
- \quad
- un medio para filtrar el bloque de valores de audio filtrados, cuantificados con un filtro parametrizable utilizando la versión de la segunda parametrización, de modo que su función de transferencia corresponde aproximadamente a la magnitud del umbral de escucha, para obtener un bloque de valores de audio decodificados de la señal de audio.
10. Procedimiento para decodificar una señal
codificada en una señal de audio, conteniendo la señal codificada
información a partir de la que pueden derivarse un bloque de valores
de audio filtrados, cuantificados y una versión de una primera
parametrización, según la cual una función de transferencia de un
filtro parametrizable corresponde a la inversa de la magnitud de un
primer umbral de escucha, y que comprende una combinación entre una
versión de una segunda parametrización, según la cual una función de
transferencia del filtro parametrizable corresponde a la inversa de
una magnitud de un segundo umbral de escucha, y la versión de la
primera parametrización, que se suceden entre sí, y que comprende
al menos una diferencia entre la versión de la primera
parametrización y la versión de la segunda parametrización, con las
etapas siguientes:
- \quad
- derivar la versión de la primera parametrización a partir de la señal codificada;
- \quad
- formar una suma entre la versión de la primera parametrización y la diferencia, para obtener la versión de la segunda parametrización; y
- \quad
- filtrar el bloque de valores de audio filtrados, cuantificados con un filtro parametrizable utilizando la versión de la segunda parametrización, de modo que su función de transferencia corresponde aproximadamente a la magnitud del umbral de escucha, para obtener un bloque de valores de audio decodificados de la señal de audio.
11. Programa informático con un código de
programa para la realización del procedimiento según la
reivindicación 8 ó 10, cuando el programa informático se ejecuta en
un ordenador.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102004007191A DE102004007191B3 (de) | 2004-02-13 | 2004-02-13 | Audiocodierung |
DE102004007191 | 2004-02-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2331889T3 true ES2331889T3 (es) | 2010-01-19 |
Family
ID=34813339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05707322T Active ES2331889T3 (es) | 2004-02-13 | 2005-02-10 | Codificacion de audio. |
Country Status (17)
Country | Link |
---|---|
US (1) | US7716042B2 (es) |
EP (1) | EP1697928B1 (es) |
JP (1) | JP4444297B2 (es) |
KR (1) | KR100848370B1 (es) |
CN (1) | CN1918631B (es) |
AT (1) | ATE441919T1 (es) |
AU (1) | AU2005213770B2 (es) |
BR (1) | BRPI0506628B1 (es) |
CA (1) | CA2556325C (es) |
DE (2) | DE102004007191B3 (es) |
DK (1) | DK1697928T3 (es) |
ES (1) | ES2331889T3 (es) |
HK (1) | HK1094079A1 (es) |
IL (1) | IL177163A (es) |
NO (1) | NO338874B1 (es) |
RU (1) | RU2346339C2 (es) |
WO (1) | WO2005078705A1 (es) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004009955B3 (de) | 2004-03-01 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
WO2008072524A1 (ja) | 2006-12-13 | 2008-06-19 | Panasonic Corporation | オーディオ信号符号化方法及び復号化方法 |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
MX2012004116A (es) * | 2009-10-08 | 2012-05-22 | Fraunhofer Ges Forschung | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, metodo y programa de computacion que usan un modelado de ruido en base a linealidad-prediccion-codi ficacion. |
KR101437896B1 (ko) | 2010-04-09 | 2014-09-16 | 돌비 인터네셔널 에이비 | Mdct-기반의 복소수 예측 스테레오 코딩 |
US9060223B2 (en) | 2013-03-07 | 2015-06-16 | Aphex, Llc | Method and circuitry for processing audio signals |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3506912A1 (de) | 1985-02-27 | 1986-08-28 | Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover | Verfahren zur uebertragung eines audiosignals |
DE3820037A1 (de) * | 1988-06-13 | 1989-12-14 | Ant Nachrichtentech | Bildcodierverfahren und einrichtung |
DE3820038A1 (de) | 1988-06-13 | 1989-12-14 | Ant Nachrichtentech | Verfahren zur aufbereitung und uebertragung einer bildsequenz |
US5581653A (en) * | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
TW295747B (es) * | 1994-06-13 | 1997-01-11 | Sony Co Ltd | |
DE19537338C2 (de) * | 1995-10-06 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren von Audiosignalen |
GB2307833B (en) | 1995-12-01 | 2000-06-07 | Geco As | A data compression method and apparatus for seismic data |
JP2000514207A (ja) | 1996-07-05 | 2000-10-24 | ザ・ビクトリア・ユニバーシティ・オブ・マンチェスター | 音声合成システム |
US6370477B1 (en) * | 1996-11-22 | 2002-04-09 | Schlumberger Technology Corporation | Compression method and apparatus for seismic data |
US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
KR100335609B1 (ko) | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
BRPI0010672B1 (pt) | 1999-04-16 | 2016-06-07 | Dolby Lab Licensing Corp | uso de quantificação de ganho adaptativo e comprimentos de símbolo não-uniformes para uma codificação de áudio |
US6775587B1 (en) * | 1999-10-30 | 2004-08-10 | Stmicroelectronics Asia Pacific Pte Ltd. | Method of encoding frequency coefficients in an AC-3 encoder |
US7110953B1 (en) * | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
ES2399422T3 (es) * | 2002-03-27 | 2013-04-01 | Panasonic Corporation | Procedimiento de codificación de longitud variable, procedimiento de decodificación de longitud variable, soporte de almacenamiento, dispositivo de codificación de longitud variable y flujo de bits |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
JP2007099007A (ja) * | 2005-09-30 | 2007-04-19 | Auto Network Gijutsu Kenkyusho:Kk | ワイヤハーネスの配索構造 |
-
2004
- 2004-02-13 DE DE102004007191A patent/DE102004007191B3/de not_active Expired - Fee Related
-
2005
- 2005-02-10 JP JP2006552550A patent/JP4444297B2/ja active Active
- 2005-02-10 AU AU2005213770A patent/AU2005213770B2/en active Active
- 2005-02-10 EP EP05707322A patent/EP1697928B1/de active Active
- 2005-02-10 DK DK05707322T patent/DK1697928T3/da active
- 2005-02-10 CA CA2556325A patent/CA2556325C/en active Active
- 2005-02-10 KR KR1020067016015A patent/KR100848370B1/ko active IP Right Grant
- 2005-02-10 ES ES05707322T patent/ES2331889T3/es active Active
- 2005-02-10 BR BRPI0506628A patent/BRPI0506628B1/pt active IP Right Grant
- 2005-02-10 DE DE502005008041T patent/DE502005008041D1/de active Active
- 2005-02-10 WO PCT/EP2005/001363 patent/WO2005078705A1/de active Application Filing
- 2005-02-10 CN CN2005800047134A patent/CN1918631B/zh active Active
- 2005-02-10 AT AT05707322T patent/ATE441919T1/de active
- 2005-02-10 RU RU2006132739/09A patent/RU2346339C2/ru active
-
2006
- 2006-07-27 US US11/460,423 patent/US7716042B2/en active Active
- 2006-07-31 IL IL177163A patent/IL177163A/en active IP Right Grant
- 2006-09-12 NO NO20064092A patent/NO338874B1/no unknown
-
2007
- 2007-02-01 HK HK07101127.7A patent/HK1094079A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
RU2006132739A (ru) | 2008-03-20 |
KR100848370B1 (ko) | 2008-07-24 |
NO20064092L (no) | 2006-11-10 |
IL177163A0 (en) | 2006-12-10 |
NO338874B1 (no) | 2016-10-31 |
WO2005078705A1 (de) | 2005-08-25 |
DK1697928T3 (da) | 2009-12-07 |
CN1918631A (zh) | 2007-02-21 |
DE502005008041D1 (de) | 2009-10-15 |
BRPI0506628B1 (pt) | 2018-10-09 |
CA2556325A1 (en) | 2005-08-25 |
EP1697928A1 (de) | 2006-09-06 |
RU2346339C2 (ru) | 2009-02-10 |
ATE441919T1 (de) | 2009-09-15 |
JP2007522511A (ja) | 2007-08-09 |
IL177163A (en) | 2010-11-30 |
BRPI0506628A (pt) | 2007-05-02 |
JP4444297B2 (ja) | 2010-03-31 |
EP1697928B1 (de) | 2009-09-02 |
AU2005213770B2 (en) | 2008-05-15 |
US7716042B2 (en) | 2010-05-11 |
AU2005213770A1 (en) | 2005-08-25 |
CA2556325C (en) | 2010-07-13 |
HK1094079A1 (en) | 2007-03-16 |
US20070016402A1 (en) | 2007-01-18 |
KR20060114002A (ko) | 2006-11-03 |
DE102004007191B3 (de) | 2005-09-01 |
CN1918631B (zh) | 2010-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2300975T3 (es) | Codificacion de audio. | |
ES2294685T3 (es) | Procedimiento y dispositivo para cuantificar una señal de informacion. | |
ES2331889T3 (es) | Codificacion de audio. | |
ES2884133T3 (es) | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC | |
ES2205238T3 (es) | Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio. | |
ES2373741T3 (es) | Medición económica de la intensidad de una señal de audio codificada. | |
ES2354743T3 (es) | Dispositivo y método para el procesamiento posterior de valores espectrales y codificador y decodificador para señales de audio. | |
CN101176147B (zh) | 语音编码装置以及频谱变形方法 | |
RU2752520C1 (ru) | Управление полосой частот в кодерах и/или декодерах | |
JP2002182695A (ja) | 高能率符号化方法及び装置 | |
MXPA06009146A (es) | Codificacion de audio | |
MXPA06009144A (es) | Codificacion de audio | |
CN110534119A (zh) | 一种基于人耳听觉频率尺度信号分解的音频编解码方法 | |
MXPA06009110A (es) | Metodo y dispositivo para cuantificar una señal de informacion |