ES2331889T3

ES2331889T3 - Codificacion de audio.

Info

Publication number: ES2331889T3
Application number: ES05707322T
Authority: ES
Inventors: Gerald Schuller; Stefan Wabnik; Jens Hirschfeld; Manfred Lutzky
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2004-02-13
Filing date: 2005-02-10
Publication date: 2010-01-19
Anticipated expiration: 2025-02-10
Also published as: RU2006132739A; KR100848370B1; NO20064092L; IL177163A0; NO338874B1; WO2005078705A1; DK1697928T3; CN1918631A; DE502005008041D1; BRPI0506628B1; CA2556325A1; EP1697928A1; RU2346339C2; ATE441919T1; JP2007522511A; IL177163A; BRPI0506628A; JP4444297B2; EP1697928B1; AU2005213770B2

Abstract

Dispositivo para la codificación de una señal de audio de una secuencia de valores de audio en una señal codificada, con un medio (20) para determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia de valores de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia de valores de audio; un medio (24) para calcular una versión de una primera parametrización de un filtro (30) parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del segundo umbral de escucha; un medio (30) para filtrar un bloque predeterminado de valores de audio de la secuencia de valores de audio con el filtro parametrizable utilizando una parametrización predeterminada, que de manera predeterminada depende de la versión de la segunda parametrización, para obtener un bloque de valores de audio filtrados correspondiente al bloque predeterminado; un medio (28) para cuantificar los valores de audio filtrados, para obtener un bloque de valores de audio filtrados, cuantificados; un medio para formar una combinación de la versión de la primera parametrización y de la versión de la segunda parametrización, que se suceden entre sí, y que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización; y un medio para integrar información, a partir de la que pueden derivarse los valores de audio filtrados, cuantificados y una versión de la primera parametrización, y que comprende la combinación, en la señal codificada.

Description

Codificación de audio.

La presente invención se refiere a codificadores o decodificadores de audio o a la codificación de audio en general y, especialmente, a codificaciones de audio que permiten una codificación de señales de audio con un tiempo de retardo corto.

El procedimiento de compresión de audio actualmente más conocido es el MPEG-1 capa III. En este procedimiento de compresión se codifican con pérdidas los valores de muestreo o de audio de una señal de audio en una señal codificada. Dicho de otro modo, en la compresión se reducen o de manera ideal se eliminan la irrelevancia y redundancia de la señal de audio original. Para conseguir esto, mediante un modelo psicoacústico se detectan enmascaramientos simultáneos y temporales, es decir, se calcula o determina un umbral de enmascaramiento que varía en el tiempo, dependiente de la señal de audio, que indica a partir de qué volumen empiezan a ser perceptibles los tonos de una determinada frecuencia para el oído humano. Esta información se utiliza a su vez para la codificación de la señal, cuantificándose los valores espectrales de la señal de audio en función del umbral de enmascaramiento de manera más precisa, menos precisa o no cuantificándose en absoluto, e integrándose en la señal codificada.

Los procedimientos de compresión de audio, tales como el formato MP3, experimentan entonces un límite en su aplicabilidad, cuando se trata de transferir datos de audio por un canal de transferencia con una tasa de bits limitada por un lado comprimidos, pero por otro lado con un tiempo de retardo lo más reducido posible. En algunas aplicaciones, el tiempo de retardo no es importante, como por ejemplo en el caso de archivar información de audio. Sin embargo, los codificadores de audio con un tiempo de retardo bajo, también denominados a veces "codificadores de retardo ultrabajo", son necesarios cuando se trata de transferencias críticas en cuanto al tiempo de señales de audio, como por ejemplo en el caso de teleconferencias, altavoces o micrófonos inalámbricos. Para estos campos de aplicación se propone en el artículo de Schuller G. etc. "Perceptual Audio Coding using Adaptive Pre- and Post-Filters and Lossless Compression", IEEE Transactions on Speech and Audio Processing, vol. 10, n.º 6, septiembre de 2002, págs. 379-390, una codificación de audio, en la que la reducción de irrelevancia y la reducción de redundancia se realizan no basándose en una única transformación, sino en dos transformaciones separadas.

El principio se explica a continuación haciendo referencia a las figuras 12 y 13. La codificación parte de una señal 902 de audio, que ya se ha muestreado y por tanto ya está presente como una secuencia 904 de valores 906 de audio o muestreo, indicándose mediante una flecha 908 el orden temporal de los valores 906 de audio. Para bloques sucesivos de valores 906 de audio, que se indican con una numeración creciente con "bloque#", se calcula un umbral de escucha mediante un modelo psicoacústico. La figura 13 muestra por ejemplo un diagrama, en el que, con respecto a la frecuencia f, con la curva a se ha trazado en unidades logarítmicas el espectro de un bloque de señal de 128 valores 906 de audio y en b el umbral de enmascaramiento, tal como se ha calculado mediante un modelo psicoacústico. Como ya se ha mencionado, el umbral de enmascaramiento indica hasta qué intensidad las frecuencias son imperceptibles para el oído humano, concretamente todos los tonos por debajo del umbral de enmascaramiento b. Ahora, basándose en los umbrales de enmascaramiento calculados para cada bloque se consigue una reducción de irrelevancia mediante el control de un filtro parametrizable seguido por un cuantificador. Para un filtro parametrizable se calcula una parametrización de tal modo que la respuesta de frecuencia del mismo corresponde a la inversa de la magnitud del umbral de enmascaramiento. Esta parametrización se indica en la figura 12 mediante x_{#}(i).

Tras el filtrado de los valores 906 de audio se realiza una cuantificación con un tamaño de paso constante, por ejemplo una operación de redondeo al siguiente número entero. El ruido de cuantificación provocado de este modo es ruido blanco. En el lado del decodificador la señal filtrada vuelve a "transformarse de manera inversa" con un filtro parametrizable, cuya función de transferencia se ajusta a la magnitud del propio umbral de enmascaramiento. De este modo no sólo se vuelve a decodificar la señal filtrada sino que también se adapta el ruido de cuantificación en el lado del decodificador a la forma del umbral de enmascaramiento. Para que el ruido de cuantificación corresponda con la mayor precisión posible al umbral de enmascaramiento, en el lado del codificador se calcula para cada conjunto de parámetros o para cada parametrización además un valor de amplificación a_{#}, que se aplica antes de la cuantificación a la señal filtrada. Para que en el lado del decodificador pueda realizarse la transformación inversa se transfieren al codificador el valor de amplificación a y la parametrización x como información 910 secundaria además de los datos principales reales, concretamente los valores 912 de audio filtrados, cuantificados. Para la reducción 914 de redundancia estos datos, es decir, la información 910 secundaria y los datos 912 principales, se someten aún a una compresión sin pérdida, concretamente a una codificación de entropía, con lo cual se obtiene la señal codificada.

El artículo anterior propone como tamaño de bloque un tamaño de 128 valores 906 de muestreo. De este modo se permite un retardo relativamente corto de 8 ms a una tasa de muestreo de 32 kHz. Con respecto a la implementación detallada se describe aún en el artículo, que para aumentar la eficacia de la codificación de información secundaria, la información secundaria, concretamente los coeficientes x_{#} y a_{#} sólo se transfieren cuando existe un cambio suficiente en comparación con un conjunto de parámetros transferido anteriormente, es decir, cuando el cambio supera un valor umbral determinado. Además se describe que la implementación se lleva a cabo preferiblemente de modo que un conjunto de parámetros actual no se aplica directamente a todos los valores de muestreo pertenecientes al bloque respectivo, sino que se utiliza una interpolación lineal de los coeficientes de filtro x_{#} para evitar artefactos audibles. Para realizar la interpolación lineal de los coeficientes de filtro se propone una estructura reticular para el filtro, para evitar la aparición de inestabilidades. Para el caso de que se desee una señal codificada con una tasa de bits controlada, el artículo propone además multiplicar o atenuar aún selectivamente la señal filtrada y ajustada a escala con el factor de amplificación a dependiente del tiempo con un factor diferente de 1, de modo que si bien se generan interferencias audibles, sin embargo puede reducirse la tasa de bits en puntos complejos de codificar de la señal de audio.

Aunque el esquema de codificación de audio descrito en el artículo citado anteriormente ya reduce suficientemente el tiempo de retardo para muchas aplicaciones, un problema del esquema anterior consiste en que, debido a la necesidad de tener que transferir el umbral de enmascaramiento o la función de transferencia del filtro en el lado del codificador, designado a continuación como prefiltro, el canal de transferencia se carga relativamente mucho, aunque los coeficientes de filtro sólo se transfieran al superar un umbral predeterminado.

Otra desventaja del esquema de codificación anterior consiste en que, debido al hecho de que el umbral de enmascaramiento o la inversa del mismo debe ponerse a disposición en el lado del decodificador mediante el conjunto de parámetros x_{#} que ha de transferirse, debe llegarse a un acuerdo entre por un lado una tasa de bits lo más baja posible o una relación de compresión alta y por otro lado una aproximación o parametrización lo más precisa posible del umbral de enmascaramiento o la inversa del mismo. Por tanto es inevitable que el ruido de cuantificación adaptado mediante el esquema de codificación de audio anterior al umbral de enmascaramiento supere en algunas gamas de frecuencia el umbral de enmascaramiento y por tanto lleve a interferencias de audio audibles para el oyente.

La figura 13 muestra por ejemplo con la curva c la respuesta de frecuencia parametrizada del filtro parametrizable en el lado del decodificador. Como puede observarse, hay zonas en las que la función de transferencia del filtro en el lado del decodificador, a continuación denominado también postfiltro, supera el umbral de enmascaramiento b. El problema se agrava ahora porque la parametrización sólo se transfiere de manera intermitente en caso de cambio suficiente entre las parametrizaciones y entremedias se interpola. Una interpolación solo de los coeficientes de filtro x_{#}, como se propone en el artículo, manteniendo constante el valor de amplificación a_{#} de un punto de referencia a otro o de una nueva parametrización a otra, lleva a interferencias audibles. Incluso aunque la interpolación propuesta en el artículo también se aplique al valor de información secundaria a_{#}, es decir, los valores de amplificación transferidos, en la señal de audio entrante en el lado del decodificador pueden quedar artefactos de audio audibles. Otro problema del esquema de codificación de audio según la figura 12 ó 13 consiste en que la señal filtrada, debido al filtrado selectivo en frecuencia, puede adoptar una forma no predecible, en la que especialmente debido a un solapamiento arbitrario de muchos armónicos individuales un único valor de audio o valores de audio individuales de la señal codificada se suman para dar valores muy altos que, debido a su aparición poco frecuente, llevan a su vez, en la reducción de redundancia posterior, a una peor relación de compresión.

El objetivo de la presente invención consiste en crear un esquema de codificación de audio más eficaz.

Este objetivo se soluciona con un procedimiento según la reivindicación 8 ó 10 y un dispositivo según la reivindicación 1 ó 9.

Una codificación según la invención de una señal de audio de una secuencia de valores de audio en una señal codificada comprende determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia de valores de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia de valores de audio; calcular una versión de una primera parametrización de un filtro parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del segundo umbral de escucha; filtrar un bloque predeterminado de valores de audio de la secuencia de valores de audio con el filtro parametrizable utilizando una parametrización predeterminada, que de manera predeterminada depende de la versión de la segunda parametrización, para obtener un bloque de valores de audio filtrados correspondiente al bloque predeterminado; cuantificar los valores de audio filtrados, para obtener un bloque de valores de audio filtrados, cuantificados; formar una combinación de la versión de la primera parametrización y de la versión de la segunda parametrización, que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización; e integrar información, partir de la que pueden derivarse los valores de audio filtrados, cuantificados y una versión de la primera parametrización, y que comprende la combinación, en la señal codificada.

La idea principal de la presente invención consiste en que mediante la transferencia de diferencias de parametrizaciones sucesivas puede conseguirse una mayor relación de compresión.

Si además la transferencia de las parametrizaciones tiene lugar sólo cuando entre las mismas existe una diferencia suficiente, la enseñanza de la presente invención consiste especialmente también en que, igualmente en este caso, aunque las diferencias de parametrización no queden por debajo de la medida de diferenciación mínima, aún así la transferencia de diferencias entre dos parametrizaciones en lugar de la una parametrización proporciona un aumento de compresión, que compensa de manera más que suficiente el esfuerzo adicional de la formación de diferencias en el lado del codificador y la formación de sumas en el lado del decodificador.

Según un ejemplo de realización de la presente invención se transfieren las diferencias netas entre parametrizaciones sucesivas, mientras que, según otro ejemplo de realización, de estas diferencias aún se resta el umbral mínimo a partir del cual empiezan a transferirse las parametrizaciones de puntos de referencia nuevos.

Ejemplos de realización preferidos de la presente invención se explican a continuación con más detalle haciendo referencia a los dibujos adjuntos. Muestran:

la figura 1 un diagrama de bloques de un codificador de audio según un ejemplo de realización de la presente invención;

la figura 2 un diagrama de flujo para ilustrar el modo de funcionamiento del codificador de audio de la figura 1 en la entrada de datos;

la figura 3 un diagrama de flujo para ilustrar el modo de funcionamiento del codificador de audio de la figura 1 en cuanto al análisis de la señal de audio entrante a través de un modelo psicoacústico;

la figura 4 un diagrama de flujo para ilustrar el modo de funcionamiento del codificador de audio de la figura 1 en cuanto a la aplicación del parámetro obtenido a través del modelo psicoacústico a la señal de audio entrante;

la figura 5a un diagrama esquemático para ilustrar la señal de audio entrante, la secuencia de valores de audio de la que ésta se compone, y las etapas de trabajo de la figura 4 en relación con los valores de audio;

la figura 5b un diagrama esquemático para ilustrar la estructura de la señal codificada;

la figura 6 un diagrama de flujo para ilustrar el modo de funcionamiento del codificador de audio de la figura 1 en cuanto al procesamiento final hasta la señal codificada;

la figura 7a un diagrama en el que se muestra un ejemplo de realización de una función escalonada de cuantificación;

la figura 7b un diagrama en el que se muestra otro ejemplo de realización de una función escalonada de cuantificación;

la figura 8 un diagrama de bloques de un decodificador de audio, que puede decodificar una señal de audio codificada mediante el codificador de audio de la figura 1, según un ejemplo de realización de la presente invención;

la figura 9 un diagrama de flujo para ilustrar el modo de funcionamiento del decodificador de la figura 8 en la entrada de datos;

la figura 10 un diagrama de flujo para ilustrar el modo de funcionamiento del decodificador de la figura 8 en cuanto al almacenamiento intermedio de los datos de audio filtrados, cuantificados, predecodificados y el procesamiento de los bloques de audio sin información secundaria correspondiente;

la figura 11 un diagrama de flujo para ilustrar el modo de funcionamiento del decodificador de la figura 8 en cuanto al verdadero filtrado inverso;

la figura 12 un diagrama esquemático para ilustrar un esquema de codificación de audio convencional con un tiempo de retardo corto; y

la figura 13 un diagrama, en el que se muestran a modo de ejemplo un espectro de una señal de audio, un umbral de escucha de la misma y la función de transferencia del postfiltro en el decodificador.

La figura 1 muestra un codificador de audio según un ejemplo de realización de la presente invención. El codificador de audio, que en general se indica con 10, comprende en primer lugar una entrada 12 de datos, en la que éste recibe la señal de audio que va a codificarse, tal como se explicará a continuación aún con más detalle con referencia a la figura 5a, que se compone de una secuencia de valores de audio o valores de muestreo, así como una salida de datos, en la que se entrega la señal codificada, cuyo contenido de información se explicará con más detalle haciendo referencia a la figura 5b.

El codificador 10 de audio de la figura 1 se divide en una parte 16 de reducción de irrelevancia y una parte 18 de reducción de redundancia. La parte 16 de reducción de irrelevancia comprende un medio 20 para determinar un umbral de escucha, un medio 22 para calcular un valor de amplificación, un medio 24 para calcular una parametrización, un medio 26 de comparación de puntos de referencia, un cuantificador 28 y un prefiltro 30 parametrizable así como una memoria 32 intermedia de entrada FIFO (primero en entrar, primero en salir), una memoria intermedia o memoria 38 y un multiplicador o un medio 40 de multiplicación. La parte 18 de reducción de redundancia comprende un compresor 34 y un control 36 de tasa de bits.

La parte 16 de reducción de irrelevancia y la parte 18 de reducción de redundancia están conectadas en serie en este orden entre la entrada 12 de datos y la salida 14 de datos. Especialmente la entrada 12 de datos está unida con una entrada de datos del medio 20 para determinar un umbral de escucha y una entrada de datos de la memoria 32 intermedia de entrada. Una salida de datos del medio 20 para determinar un umbral de escucha está unida con una entrada del medio 24 para calcular una parametrización así como con una entrada de datos del medio 22 para calcular un valor de amplificación, para transmitir a las mismas un umbral de escucha determinado. Los medios 22 y 24 calculan, basándose en el umbral de escucha, una parametrización o un valor de amplificación y están unidos con el medio 26 de comparación de puntos de referencia, para transmitir al mismo estos resultados. El medio 26 de comparación de puntos de referencia transmite según un resultado de comparación, tal como se explicará aún a continuación, los resultados calculados por los medios 22 y 24 como parámetro de entrada o parametrización al prefiltro 30 parametrizable. El prefiltro 30 parametrizable está conectado entre una salida de datos de la memoria 32 intermedia de entrada y una entrada de datos de la memoria 38 intermedia. Entre una salida de datos de la memoria 38 intermedia y el cuantificador 28 está conectado el multiplicador 40. El cuantificador 28 transmite a la parte 18 de reducción de redundancia dado el caso valores de audio multiplicados o ajustados a escala, aunque en cualquier caso filtrados, cuantificados, y concretamente a una entrada de datos del compresor 34. El medio 26 de comparación de puntos de referencia transmite a la parte 18 de reducción de redundancia información, a partir de la que pueden derivarse los parámetros de entrada transmitidos al prefiltro 30 parametrizable, y concretamente a una entrada de datos adicional del compresor 34. El control de tasa de bits está unido con una entrada de control del multiplicador 40 a través de una conexión de control, para ocuparse de que los valores de audio filtrados, cuantificados, tal como se obtienen por el prefiltro 30, se multipliquen mediante el multiplicador 40 por un multiplicador adecuado, como se explicará a continuación aún más detalladamente. El control 36 de tasa de bits está conectado entre una salida de datos del compresor 34 y la salida 14 de datos del codificador 10 de audio, para determinar de manera adecuada el multiplicador para el multiplicador 40. En la primera pasada de cada valor de audio a través del cuantificador 40, el multiplicador está ajustado en primer lugar a un factor de ajuste a escala adecuado, como por ejemplo 1. Sin embargo, la memoria 38 intermedia sigue almacenando cada valor de audio filtrado, para darle al control 36 de tasa de bits, como se describirá a continuación, la oportunidad de cambiar el multiplicador para una pasada adicional de un bloque de valores de audio. Si no se indica un cambio de este tipo mediante el control 36 de tasa de bits, entonces la memoria 38 intermedia puede liberar la memoria ocupada por este bloque.

Una vez descrita anteriormente la estructura del codificador de audio de la figura 1, a continuación se describirá su modo de funcionamiento haciendo referencia a las figuras 2 a 7b.

Como puede deducirse de la figura 2, la señal de audio, cuando llega a la entrada 12 de datos, ya se ha obtenido mediante muestreo 50 de señal de audio de una señal de audio analógica. El muestreo de señal de audio se realiza con una frecuencia de muestreo predeterminada, que habitualmente se encuentra entre 32 y 48 kHz. En la entrada 12 de datos hay por tanto una señal de audio que se compone de una secuencia de valores de muestreo o de audio. Aunque, tal como aún se aclarará a partir de la siguiente descripción, la codificación de la señal de audio no tiene lugar basándose en bloques, los valores de audio en la entrada 12 de datos se agrupan en primer lugar en una etapa 52 para formar bloques de audio. La agrupación para formar bloques de audio se produce, como se aclarará a partir de la siguiente descripción, únicamente para determinar el umbral de escucha y tiene lugar en una fase de entrada del medio 20 para determinar un umbral de escucha. En el presente ejemplo de realización se parte a modo de ejemplo de que en cada caso se agrupan 128 valores de audio sucesivos para formar bloques de audio, y que la agrupación tiene lugar de tal modo que por un lado no se solapan los bloques de audio sucesivos y por otro lado son directamente adyacentes. Esto se explica de nuevo brevemente a modo de ejemplo mediante la figura 5a.

La figura 5a indica con 54 la secuencia de valores de muestreo, estando ilustrado cada valor de muestreo mediante un rectángulo 56. Los valores de muestreo están numerados con fines ilustrativos, mostrándose por motivos de claridad a su vez sólo algunos de los valores de muestreo de la secuencia 54. Tal como se muestra mediante corchetes por encima de la secuencia 54, según el presente ejemplo de realización en cada caso 128 valores de muestreo sucesivos están agrupados en un bloque, formando los 128 valores de muestreo inmediatamente siguientes el siguiente bloque. Sólo por si acaso se indica que la agrupación en bloques también podría realizarse de otra manera, por ejemplo mediante bloques que se solapan o bloques distanciados y bloques con otro tamaño de bloque, aunque a su vez se prefiere el tamaño de bloque de 128, ya que proporciona un buen acuerdo entre por un lado una alta calidad de audio y por otro lado un tiempo de retardo lo más bajo posible.

Mientras se procesan por bloques en el medio 20 para determinar un umbral de escucha los bloques de audio agrupados en la etapa 52 en el medio 20, en la memoria 32 intermedia de entrada se almacenan 54 de manera intermedia los valores de audio entrantes hasta que el prefiltro 30 parametrizable haya obtenido parámetros de entrada desde el medio 26 de comparación de puntos de referencia, para llevar a cabo un prefiltrado, tal como se describirá aún a continuación.

Como puede deducirse de la figura 3, el medio 20 para determinar un umbral de escucha inicia su procesamiento directamente después de que hayan entrado suficientes valores de audio en la entrada 12 de datos para formar un bloque de audio o formar el siguiente bloque de audio, lo que supervisa el medio 20 mediante una comprobación en la etapa 60. Si todavía no está presente un bloque de audio completo procesable, el medio 20 espera. Si está presente un bloque de audio completo para procesar, entonces el medio 20 para determinar un umbral de escucha calcula en una etapa 62 basándose en un modelo psicoacústico adecuado en una etapa 62 un umbral de escucha. Para ilustrar el umbral de escucha se remite a su vez a la figura 12 y especialmente a la curva b, que se ha obtenido basándose en un modelo psicoacústico por ejemplo con respecto a un bloque de audio actual con un espectro a. El umbral de enmascaramiento, que se determina en la etapa 62, es una función dependiente de la frecuencia, que puede variar para bloques de audio sucesivos, y que también puede variar considerablemente de una señal de audio a otra, como por ejemplo de piezas de música rock a piezas de música clásica. El umbral de escucha indica para cada frecuencia un valor umbral, por debajo del cual el oído humano no puede percibir interferencias.

En una etapa 64 siguiente, el medio 24 y el medio 22 calculan a partir del umbral de escucha M(f) calculado (indicando f la frecuencia) un valor de amplificación a o un conjunto de parámetros de N parámetros x(i) (i = 1,..., N). La parametrización x(i), que calcula el medio 24 en la etapa 64, está prevista para el prefiltro 30 parametrizable, que por ejemplo está configurado en una estructura de filtro adaptativo, tal como se utiliza en la codificación LPC (LPC = linear predictive coding = codificación lineal predictiva). Si por ejemplo s(n) con n = 0,... 127 son los 128 valores de audio del bloque de audio momentáneo y s'(n) son los 128 valores de audio filtrados que se obtienen, entonces el filtro está configurado por ejemplo de tal modo que se cumple la ecuación siguiente:

1

siendo K el orden de filtro, y con k = 1,..., K, los coeficientes de filtro, e ilustrando el índice t que los coeficientes de filtro cambian en bloques de audio sucesivos. El medio 24 calcula ahora la parametrización de tal modo que la función de transferencia H(f) del prefiltro 30 parametrizable es aproximadamente igual a la inversa de la magnitud del umbral de enmascaramiento M(f), es decir, de modo que se aplica

2

ilustrando la dependencia de t a su vez que para diferentes bloques de audio cambia el umbral de enmascaramiento M(f). En caso de implementarse el prefiltro 30 como el filtro adaptativo explicado anteriormente se obtienen los coeficientes de filtro de la siguiente manera: la transformada de Fourier discreta inversa de |M(f,t)|^{2} con respecto a la frecuencia para el bloque en el instante t da lugar a la función de autocorrelación objetivo. Entonces resolviendo el sistema de ecuaciones lineal se obtiene:

3

Para que, sin embargo, en la interpolación lineal que aún se describirá con más detalle a continuación entre las parametrizaciones, no aparezcan inestabilidades, se utiliza preferiblemente para el filtro 30 una estructura reticular, reparametrizándose los coeficientes de filtro para la estructura reticular en coeficientes de reflexión. Con respecto a detalles más precisos en cuanto al diseño del prefiltro, el cálculo de los coeficientes y la reparametrización se remite al artículo de Schuller etc. mencionado en la introducción de la descripción y especialmente a la página 381, punto III, que se incorpora a este respecto al presente documento como referencia.

Mientras que a continuación el medio 24 calcula una parametrización para el prefiltro 30 parametrizable de tal modo que su función de transferencia es igual a la inversa del umbral de enmascaramiento, el medio 22, basándose en el umbral de escucha, calcula un límite de potencia de ruido, concretamente un límite que indica qué potencia de ruido puede introducir el cuantificador 28 en la señal de audio filtrada mediante el prefiltro 30, para que el ruido de cuantificación tras el postfiltrado o filtrado inverso en el lado del decodificador esté por debajo del umbral de escucha M(f) o exactamente en el mismo. El medio 22 calcula este límite de potencia de ruido como el área por debajo del cuadrado del valor absoluto del umbral de escucha M, es decir, como \Sigma|M(f)|^{2}. El valor de amplificación a lo calcula el medio 22 a partir del límite de potencia de ruido, calculando la raíz a partir de la fracción de potencia de ruido de cuantificación entre límite de potencia de ruido. El ruido de cuantificación es el ruido provocado por el cuantificador 28. El ruido provocado por el cuantificador 28, tal como aún se describirá, es ruido blanco y, por tanto, depende de la frecuencia. La potencia de ruido de cuantificación es la potencia del ruido de cuantificación.

Como se ha aclarado a partir de la descripción anterior, el medio 22 calcula, además del valor de amplificación a, también el límite de potencia de ruido. Aunque es posible que el medio 26 de comparación de puntos de referencia calcule de nuevo, a partir del valor de amplificación a obtenido desde el medio 22, el límite de potencia de ruido, es además posible que el medio 22, además del valor de amplificación a, también transmita directamente al medio 26 de comparación de puntos de referencia el límite de potencia de ruido determinado.

Tras calcular el valor de amplificación así como la parametrización, el medio 26 de comparación de puntos de referencia comprueba a continuación en una etapa 66, si la parametrización recién calculada se diferencia en más de un umbral predeterminado de la parametrización actual, transmitida en último lugar al prefiltro parametrizable. En caso de que la comprobación en la etapa 66 indique que la parametrización recién calculada se diferencia en más del umbral predeterminado de la actual, entonces se almacenan de manera intermedia los coeficientes de filtro recién calculados y el valor de amplificación recién calculado o el límite de potencia de ruido en el medio 26 de comparación de puntos de referencia para una interpolación que todavía se explicará, y el medio 26 de comparación de puntos de referencia entrega en una etapa 68 los coeficientes de filtro recién calculados y en una etapa 70 el valor de amplificación recién calculado al prefiltro 30. Si éste no es el caso, y la parametrización recién calculada no se diferencia en más del umbral predeterminado de la actual, el medio (26) de comparación de puntos de referencia entrega al prefiltro 30 en la etapa 72 en lugar de la parametrización recién calculada sólo la parametrización de punto de referencia actual, es decir, la parametrización que por última vez llevó en la etapa 66 a un resultado positivo, que por tanto se diferenció en más de un umbral predeterminado de una parametrización de punto de referencia anterior. Después de las etapas 70 y 72, el proceso de la figura 3 vuelve para el procesamiento del siguiente bloque de audio, es decir, a la consulta 60.

En caso de que la parametrización recién calculada no se diferencie de la parametrización de punto de referencia actual y en consecuencia el prefiltro 30 en la etapa 72 vuelva a obtener la parametrización de punto de referencia obtenida ya anteriormente para al menos el último bloque de audio, el prefiltro 30 aplica esta parametrización de punto de referencia a todos los valores de muestreo de este bloque de audio que se encuentra en la FIFO 32, tal como se describirá aún con más detalle a continuación, con lo que este bloque actual se extrae de la FIFO 32 y el cuantificador 28 obtiene un bloque de audio que se produce de valores de audio prefiltrados.

La figura 4 representa con más detalle el modo de funcionamiento del prefiltro 30 parametrizable para el caso de que éste obtenga la parametrización recién calculada y el valor de amplificación recién calculado, porque los mismos se diferencian suficientemente de la parametrización de punto de referencia actual. Tal como se ha descrito con referencia a la figura 3, no se realiza por tanto para cada uno de los bloques de audio sucesivos un procesamiento según la figura 4, sino sólo para bloques de audio en los que la parametrización correspondiente se diferencia suficientemente de la parametrización de punto de referencia actual. Los demás bloques de audio, tal como se acaba de describir, se prefiltran aplicando la parametrización de punto de referencia actual en cada caso y el valor de amplificación actual en cada caso correspondiente a todos los valores de muestreo de estos bloques de audio. En una etapa 80, el prefiltro 30 parametrizable supervisa ahora si ha tenido lugar una entrega de coeficientes de filtro recién calculados desde el medio 26 de comparación de puntos de referencia, o de parametrizaciones de puntos de referencia anteriores. El prefiltro 30 realiza la supervisión 80 hasta que haya tenido lugar una entrega de este tipo.

Una vez ha tenido lugar una entrega de este tipo, el prefiltro 30 parametrizable inicia el procesamiento del bloque de audio actual de valores de audio, que ahora mismo se encuentra en la memoria 32 intermedia, esto es, aquél para el que acaba de calcularse la parametrización. En la figura 5a se ha ilustrado, por ejemplo, que ya se han procesado todos los valores 56 de audio antes del valor de audio con el número 0 y, por tanto, ya han pasado por la memoria 32. El procesamiento del bloque de valores de audio antes del valor de audio con el número 0 se activó en ese momento, porque la parametrización, que se ha calculado para el bloque de audio antes del bloque 0, concretamente x_{0}(i), se diferenció en más del umbral predeterminado de la parametrización de punto de referencia transmitida anteriormente al prefiltro 30. La parametrización x_{0}(i) es por tanto una parametrización de punto de referencia, tal como se designa en la presente invención. El procesamiento de los valores de audio en el bloque de audio antes del valor de audio 0 se realizó basándose en el conjunto de parámetros a_{0}, x_{0}(i).

En la figura 5a se parte de que la parametrización, que se ha calculado para el bloque 0 con los valores de audio 0 a 127, se diferenció en menos del umbral predeterminado de la parametrización x_{0}(i), que se refería al bloque anterior. Por tanto, este bloque 0 también se extrajo ya por el prefiltro 30 de la FIFO 32, se procesó del mismo modo en cuanto a todos sus valores de muestreo 0 a 127 mediante la parametrización x_{0}(i) introducida en la etapa 72, tal como se indica mediante la flecha 81 descrita como "aplicación directa", y a continuación se transmitió al cuantificador 28.

Sin embargo, la parametrización calculada para el bloque 1 que aún se encuentra en la FIFO 32 se diferenció según el ejemplo ilustrativo de la figura 5a, en cambio, en más del umbral predeterminado de la parametrización x_{0}(i) y por tanto se transmitió en la etapa 68 al prefiltro 30 como parametrización x_{1}(i) junto con el valor de amplificación a_{1} (etapa 70) y dado el caso el límite de potencia de ruido correspondiente, debiendo ser los índices de a y x en la figura 5a un índice para los puntos de referencia, tal como se utilizan en la interpolación que se explicará posteriormente que se realiza con respecto a los valores de muestreo 128 a 255 en el bloque 1, se simboliza mediante una flecha 82 y se efectúa mediante las etapas que siguen a la etapa 80 en la figura 4. Con la aparición del bloque de audio con el número 1 se iniciaría por tanto el procesamiento en la etapa 80.

En el momento de la transmisión del conjunto de parámetros a_{1}, x_{1} se encuentran en la memoria 32 por tanto ya sólo los valores de audio 128 a 255, es decir, el bloque de audio actual tras el bloque de audio 0 procesado en último lugar por el prefiltro 30. Después de haberse determinado ahora la entrega de parámetros de puntos de referencia
x_{1}(i) en la etapa 80, el prefiltro 30 determina en la etapa 84 el límite de potencia de ruido q_{1} correspondiente al valor de amplificación a_{1}. Esto puede producirse porque el medio 26 de comparación de puntos de referencia transmita este valor al prefiltro 30, o mediante un nuevo cálculo de este valor mediante el prefiltro 30, tal como se ha descrito anteriormente haciendo referencia a la etapa 64.

A continuación, en una etapa 86, se inicializa un índice j a un valor de muestreo, para indicar el valor de muestreo más antiguo que ha quedado en la memoria 32 FIFO o el primer valor de muestreo del bloque de audio actual "bloque 1", es decir, en el presente ejemplo de la figura 5a, el valor de muestreo 128. En una etapa 88, el prefiltro parametrizable realiza una interpolación entre los coeficientes de filtro x_{0} y x_{1}, valiendo a este respecto la parametrización x_{0} como valor de referencia en el punto de referencia con número de valor de audio 127 del bloque 0 anterior y la parametrización x_{1} como valor de referencia en el punto de referencia con número de valor de audio 255 del bloque 1 actual. Estas posiciones de valor de audio 127 y 255 se denominan a continuación también punto de referencia 0 y punto de referencia 1, estando indicadas en la figura 5a mediante las flechas 90 y 92 las parametrizaciones de puntos de referencia que se refieren a los puntos de referencia.

El prefiltro 30 parametrizable realiza en la etapa 88 la interpolación de los coeficientes de filtro x_{0}, x_{1} entre los dos puntos de referencia en forma de una interpolación lineal, para obtener el coeficiente de filtro interpolado en la posición de muestreo j, es decir, x(t_{j})(i) con i = 1...N.

A continuación, concretamente en la etapa 90, el prefiltro 30 parametrizable realiza una interpolación entre el límite de potencia de ruido q_{1} y q_{0}, para obtener un límite de potencia de ruido interpolado en la posición de muestreo j, es decir, q(t_{j}). En una etapa 92, el prefiltro 30 parametrizable calcula a continuación el valor de amplificación para la posición de muestreo j basándose en el límite de potencia de ruido interpolado y la potencia de ruido de cuantificación así como preferiblemente también los coeficientes de filtro interpolados, concretamente por ejemplo en función de la
{}\hskip17cm raíz de \frac{Potencia \ de \ ruido \ de \ cuantificación}{q(t_{j})}, remitiéndose a este respecto a las realizaciones relativas a la etapa 64 de la figura 3.

A continuación, en una etapa 94, el prefiltro 30 parametrizable aplica el valor de amplificación calculado así como los coeficientes de filtro interpolados al valor de muestreo en la posición de muestreo j, para obtener un valor de muestreo filtrado para esta posición de muestreo, concretamente s'(t_{j}).

A continuación, en una etapa 96, el prefiltro 30 parametrizable comprueba si la posición de muestreo j ha alcanzado el punto de referencia actual, es decir, el punto de referencia 1, en el caso de la figura 5a la posición de muestreo 255, es decir, el valor de muestreo para el que debe valer la parametrización transmitida al prefiltro 30 parametrizable más el valor de amplificación directamente, es decir, sin interpolación. Si éste no es el caso, entonces el prefiltro 30 parametrizable aumenta o incrementa el índice j en 1, volviendo a repetirse las etapas 88 a 96. Sin embargo, en caso de que la comprobación en la etapa 96 resulte ser positiva, entonces en la etapa 100 el prefiltro parametrizable aplica el valor de amplificación transmitido en último lugar por el medio 26 de comparación de puntos de referencia y los coeficientes de filtro transmitidos en último lugar por el medio 26 de comparación de puntos de referencia, directamente sin interpolación al valor de muestreo en el nuevo punto de referencia, tras lo cual se procesa el bloque actual, es decir, en el presente caso el bloque 1, y el proceso se realiza de nuevo en la etapa 80 con respecto al bloque que va a procesarse a continuación que, dependiendo de si la parametrización del siguiente bloque de audio, bloque 2, se diferencia suficientemente de la parametrización x_{1}(i), dado el caso puede ser entonces este siguiente bloque de audio, bloque 2, o bien un bloque de audio posterior.

Antes de describir haciendo referencia a la figura 5 el procedimiento adicional en el procesamiento de los valores de muestreo filtrados s', se describe a continuación la finalidad y la base de la manera de proceder según las figuras 3 y 4. El sentido y la finalidad del filtrado consisten en filtrar la señal de audio en la entrada 12 con un filtro adaptativo, cuya función de transferencia siempre se adapta de la manera más óptima posible a la inversa del umbral de escucha, que también cambia con el tiempo. El motivo de esto es que, en el lado del decodificador, el filtrado inverso mediante un filtro adaptativo, cuya función de transferencia se adapta de manera correspondiente siempre al umbral de escucha, forma el ruido blanco de cuantificación introducido por una cuantificación de la señal de audio filtrada, es decir, el ruido de cuantificación constante en frecuencia, concretamente adaptado a la forma del umbral de escucha.

La aplicación del valor de amplificación en las etapas 94 y 100 en el prefiltro 30 consiste en una multiplicación de la señal de audio o de la señal de audio filtrada, es decir, de los valores de muestreo s o de los valores de muestreo filtrados s', por el factor de amplificación. El sentido consiste en ajustar de este modo el ruido de cuantificación, que se introduce en la señal de audio filtrada por la cuantificación descrita con más detalle a continuación, y que se adapta por el filtrado inverso en el lado del decodificador a la forma del umbral de escucha, a ser posible tan alto que aún así no supere el umbral de escucha. Esto puede ilustrarse mediante la fórmula de Parseval, según la cual el cuadrado del valor absoluto de una función es igual al cuadrado del valor absoluto de la transformada de Fourier. Entonces, cuando en el lado del decodificador vuelve a realizarse en sentido inverso la multiplicación de la señal de audio en el prefiltro por el valor de amplificación, dividiéndose la señal de audio filtrada por el valor de amplificación, se reduce de este modo también la potencia de ruido de cuantificación, concretamente por el factor a^{-2}, siendo a el valor de amplificación. Por consiguiente, mediante la aplicación del valor de amplificación en el prefiltro 30, la potencia de ruido de cuantificación puede ajustarse de manera óptima alta, lo que de este modo es sinónimo de que se aumenta el tamaño de paso de cuantificación y de este modo el número de escalones de cuantificación que van a codificarse, lo que a su vez aumenta la compresión en la parte de reducción de redundancia posterior.

Dicho de otro modo, el efecto del prefiltro puede considerarse como una normalización de la señal a su umbral de enmascaramiento, de modo que el nivel de las interferencias de cuantificación o del ruido de cuantificación puede mantenerse constante tanto en tiempo como en frecuencia. Puesto que la señal de audio está presente en el dominio de tiempo, la cuantificación puede realizarse por tanto paso a paso con una cuantificación constante uniforme, tal como se describirá aún a continuación. De este modo se elimina de manera ideal cualquier tipo de irrelevancia de la señal de audio, y puede utilizarse un esquema de compresión sin pérdida, para eliminar aún la redundancia que queda en la señal de audio prefiltrada y cuantificada, tal como se describirá aún a continuación.

Mediante la figura 5a se destaca además claramente de nuevo que, evidentemente, los coeficientes de filtro y los valores de amplificación a_{0}, a_{1}, x_{0}, x_{1} deben estar disponibles como información secundaria en el lado del decodificador, pero que, sin embargo, el esfuerzo de transferencia para ello se reduce porque simplemente no tienen que volver a utilizarse para cada bloque nuevos coeficientes de filtro y nuevos valores de amplificación. Más bien tiene lugar una comprobación 66 de valor umbral, para transferir las parametrizaciones como información secundaria sólo en caso de un cambio de parametrización suficiente y en caso contrario no se transfiere la información secundaria o las parametrizaciones. En los bloques de audio, para los que se transfirieron las parametrizaciones, tiene lugar a lo largo del intervalo de estos bloques una interpolación de la parametrización anterior a la nueva. La interpolación de los coeficientes de filtro tiene lugar de la manera descrita anteriormente con referencia a la etapa 88. La interpolación en cuanto a la amplificación tiene lugar dando un rodeo, concretamente a través de una interpolación 90 lineal del límite de potencia de ruido q_{0}, q_{1}. En comparación con una interpolación directa a través del valor de amplificación, la interpolación lineal lleva con respecto al límite de potencia de ruido a un mejor resultado de escucha o a menos artefactos audibles.

A continuación se describe ahora mediante la figura 6 el procesamiento adicional de la señal prefiltrada que fundamentalmente comprende una cuantificación y una reducción de redundancia. En primer lugar se almacenan los valores de muestreo filtrados entregados por el prefiltro 30 parametrizable en la memoria 38 intermedia y simultáneamente se pasan de la memoria 38 intermedia al multiplicador 40, en el que, a su vez, puesto que es su primera pasada, en primer lugar sin cambio, concretamente con un factor de ajuste a escala de uno, se transmiten a través del multiplicador 40 al cuantificador 28. En éste se cortan los valores de audio filtrados por encima de un límite superior en una etapa 110 y a continuación se cuantifican en una etapa 112. Las dos etapas 110 y 112 se realizan por el cuantificador 28. Especialmente las dos etapas 110 y 112 se realizan por el cuantificador 28 de manera preferible en una etapa, cuantificando los valores de audio filtrados s' con una función escalonada de cuantificación, que representa los valores de muestreo filtrados s' presentes por ejemplo en una representación en coma flotante en una pluralidad de índices o valores de escalón de cuantificación de número entero y, a partir de un cierto valor umbral, para los valores de muestreo filtrados discurre de una manera plana, de modo que los valores de muestreo filtrados, que son mayores que el valor umbral, se cuantifican en un mismo escalón de cuantificación. Un ejemplo de una función escalonada de cuantificación de este tipo se representa en la figura 7a.

Los valores de muestreo filtrados cuantificados se designan en la figura 7a con \sigma'. La función escalonada de cuantificación es preferiblemente una función escalonada de cuantificación con un tamaño de paso constante por debajo del valor umbral, es decir, el salto al siguiente escalón de cuantificación tiene lugar siempre tras un intervalo constante a lo largo de los valores de entrada S'. En la implementación se ajusta el tamaño de paso al valor umbral de tal modo que el número de escalones de cuantificación corresponde preferiblemente a una potencia de 2. En comparación con la representación en coma flotante de los valores de muestreo filtrados s' entrantes, el valor umbral es menor, de modo que un valor máximo del intervalo que puede representarse de la representación en coma flotante sobrepasa el valor umbral.

El motivo para el valor umbral consiste en que se ha observado que la señal de audio filtrada, que se entrega por el prefiltro 30, presenta individualmente valores de audio, que debido a una acumulación desfavorable de armónicos se suman para dar valores muy grandes. Además se ha observado, que un corte de estos valores, tal como se consigue mediante la función escalonada de cuantificación mostrada en la figura 7a, lleva a una elevada reducción de datos, pero sólo a un ligero perjuicio de la calidad de audio. Más bien se generan estos puntos individualizados en la señal de audio filtrada de manera artificial mediante el filtrado selectivo en frecuencia en el filtro 30 parametrizable, de modo que un corte de los mismos sólo perjudica ligeramente a la calidad de audio.

Un ejemplo algo más concreto para la función escalonada de cuantificación mostrada en la figura 7a sería una que, hasta el valor umbral, redondeara todos los valores de muestreo filtrados s' al siguiente número entero y, a partir de ahí, cuantificara todos los valores de muestreo filtrados situados por encima al escalón de cuantificación más alto, como por ejemplo 256. Este caso se representa en la figura 7a.

Otro ejemplo de una posible función escalonada de cuantificación sería la mostrada en la figura 7b. Hasta el valor umbral, la función escalonada de cuantificación de la figura 7b corresponde a la de la figura 7a. Aunque en lugar de discurrir para valores de muestreo s' por encima del valor umbral de una manera abrupta y plana, la función escalonada de cuantificación sigue discurriendo con una pendiente, que es menor que la pendiente en el intervalo por debajo del valor umbral. Dicho de otro modo, por encima del valor umbral, el tamaño de paso de cuantificación es mayor. De este modo se consigue un efecto similar al de la función de cuantificación de la figura 7a, aunque por un lado con más esfuerzo debido a los diferentes tamaños de paso de la función escalonada de cuantificación por encima y por debajo del valor umbral y, por otro lado, con una mejor calidad de audio, ya que no se cortan completamente valores de audio filtrados s' muy altos, sino que sólo se cuantifican con un tamaño de paso de cuantificación mayor.

Tal como ya se ha descrito anteriormente, en el lado del decodificador no tienen que estar disponibles sólo los valores de audio filtrados y cuantificados \sigma' sino además también los parámetros de entrada para el prefiltro 30, en los que se ha basado el filtrado de estos valores, concretamente la parametrización de punto de referencia incluyendo una indicación del valor de amplificación correspondiente. Por tanto, en una etapa 114, el compresor 34 lleva a cabo un primer intento de compresión y comprime en este caso información secundaria que contiene los valores de amplificación a_{0} y a_{1} en los puntos de referencia, como por ejemplo 127 y 255, así como los coeficientes de filtro x_{0} y x_{1} en los puntos de referencia y los valores de muestreo filtrados, cuantificados \sigma' en una señal filtrada provisional. El compresor 34 es a este respecto un codificador que funciona sin pérdida, como por ejemplo un codificador de Huffman o aritmético con o sin predicción y/o adaptación.

La memoria 38, por la que pasan los valores de audio muestreados \sigma', sirve como memoria intermedia para un tamaño de bloque adecuado, con el que el compresor 34 procesa los valores de audio filtrados, cuantificados \sigma' y, como se describe a continuación, dado el caso ajustados a escala, entregados por el cuantificador 28. El tamaño de bloque puede diferir del tamaño de bloque de los bloques de audio, tal como se utilizan por el medio 20.

Como ya se mencionó para el primer intento de compresión, el control 36 de tasa de bits ha activado el multiplicador 40 con un multiplicador de 1, de modo que los valores de audio filtrados llegan desde el prefiltro 30 sin cambios al cuantificador 28 y desde allí como valores de audio filtrados, cuantificados al compresor 34. El compresor 34 supervisa en una etapa 116, si se ha codificado un determinado tamaño de bloque de compresión, es decir, un determinado número de valores de audio muestreados, cuantificados, en la señal codificada provisional, o si han de codificarse otros valores de audio filtrados, cuantificados \sigma' en la señal codificada provisional actual. En caso de no alcanzarse el tamaño de bloque de compresión, el compresor 34 sigue realizando la compresión 114 actual. Sin embargo, si se alcanza el tamaño de bloque de compresión, el control 36 de tasa de bits comprueba en una etapa 118 si la cantidad de bits necesaria para la compresión es mayor que una cantidad de bits fijada por una tasa de bits deseada. Si éste no es el caso, el control 36 de tasa de bits comprueba, en una etapa 120, si la cantidad de bits necesaria es menor que la cantidad de bits fijada por la tasa de bits deseada. En este caso, el control 36 de tasa de bits añade a la señal codificada en la etapa 122 bits de relleno, hasta que se alcanza la cantidad de bits fijada por la tasa de bits deseada. A continuación se realiza en la etapa 124 la entrega de la señal codificada. Alternativamente a la etapa 122, el control 36 de tasa de bits podría transmitir el bloque de compresión de valores de audio filtrados \sigma' en los que se basa en último lugar la compresión, aún almacenado en la memoria 38, en una forma multiplicada por un multiplicador mayor que 1 mediante el multiplicador 40, al cuantificador 28 para pasar de nuevo por las etapas 110 a 118, hasta que se alcanza la cantidad de bits fijada por la tasa de bits deseada, tal como se indica mediante una etapa 125 con línea discontinua.

Sin embargo, si la comprobación en la etapa 118 da como resultado que la cantidad de bits necesaria es mayor que la fijada por la tasa de bits deseada, el control 36 de tasa de bits cambia el multiplicador para el multiplicador 40 a un factor entre 0 y 1 exclusivamente. Esto lo realiza en la etapa 126. Después de la etapa 126, el control 36 de tasa de bits se encarga de que la memoria 38 vuelva a entregar el último bloque de compresión de valores de audio filtrados \sigma' en el que se basa la compresión, multiplicándose los mismos a continuación por el factor ajustado en la etapa 126 y volviendo a alimentarse al cuantificador 28, tras lo cual vuelven a realizarse las etapas 110 a 118 y se descarta la señal codificada hasta ahora provisional.

Se indica que al realizar de nuevo las etapas 110 a 116, en la etapa 114 evidentemente también se integra el factor utilizado en la etapa 126 (o la etapa 125) en la señal codificada.

El sentido del modo de proceder según la etapa 126 consiste en que mediante el factor se aumenta el tamaño de paso efectivo del cuantificador 28. Esto significa que el ruido de cuantificación resultante se encuentra de manera uniforme por encima del umbral de enmascaramiento, lo que lleva a interferencias audibles o ruido audible, aunque a cambio produce una tasa de bits reducida. Si tras pasar de nuevo por las etapas 110 a 116 vuelve a determinarse en la etapa 118 que la cantidad de bits necesaria es mayor que la fijada por la tasa de bits deseada, entonces vuelve a reducirse el factor en la etapa 126, etc.

Cuando finalmente los datos se entregan en la etapa 124 como señal codificada, entonces se realiza el siguiente bloque de compresión de los valores de audio filtrados, cuantificados \sigma' siguientes.

Se indica además que también podría utilizarse otro valor preinicializado para el factor de multiplicación distinto de 1, concretamente por ejemplo 1. Entonces en cualquier caso, es decir arriba del todo en la figura 6, tiene lugar ante todo un ajuste a escala.

La figura 5b ilustra de nuevo la señal codificada que se obtiene, que en general se indica con 130. La señal codificada comprende información secundaria y datos principales situados entre la misma. La información secundaria comprende, como ya se ha mencionado, información a partir de la cual, para bloques de audio especiales, concretamente bloques de audio en los que en la secuencia de bloques de audio se ha obtenido un cambio significativo en los coeficientes de filtro, puede derivarse el valor del valor de amplificación y el valor de los coeficientes de filtro. Dado el caso, la información secundaria comprende además información adicional que se refiere al valor de amplificación utilizado para el control de bits. Debido a la dependencia mutua entre el valor de amplificación y el límite de potencia de ruido q, la información secundaria puede comprender opcionalmente, además del valor de amplificación a_{#} para un punto de referencia #, también el límite de potencia de ruido q_{#}, o también sólo éste último. En la señal codificada, la información secundaria está dispuesta preferiblemente de tal modo que la información secundaria con respecto a coeficientes de filtro y el valor de amplificación correspondiente o el límite de potencia de ruido correspondiente, está dispuesta antes de los datos principales para el bloque de audio de valores de audio filtrados, cuantificados \sigma', a partir de los que se han derivado estos coeficientes de filtro con el valor de amplificación correspondiente o el límite de potencia de ruido correspondiente, es decir, la información secundaria a_{0}, x_{0}(i) tras el bloque -1 y la información secundaria a_{1}, x_{1}(i) tras el bloque 1. Dicho de otro modo, los datos principales, es decir, los valores de audio filtrados, cuantificados \sigma' están dispuestos desde un bloque de audio exclusive, del tipo en el que se ha obtenido un cambio significativo en la secuencia de bloques de audio en los coeficientes de filtro, hasta el siguiente bloque de audio inclusive de este tipo, en la figura 5b por ejemplo los valores de audio \sigma' (t_{0}) - \sigma' (t_{255}), siempre entre el bloque 132 de información secundaria con respecto al primero de estos dos bloques de audio (bloque -1) y el siguiente bloque 134 de información secundaria con respecto al segundo de estos dos bloques de audio (bloque 1). Los valores de audio \sigma' (t_{0}) - \sigma' (t_{127}) se han obtenido o pueden decodificarse tal como se ha mencionado anteriormente con referencia a la figura 5a sólo mediante la información 132 secundaria, mientras que los valores de audio \sigma' (t_{128}) - \sigma' (t_{255}) se han obtenido a través de interpolación mediante la información 132 secundaria como valores de referencia en el punto de referencia con el número de valor de muestreo 127 y mediante la información 134 secundaria como valores de referencia en el punto de referencia con el número de valor de muestreo 255 y por tanto sólo pueden decodificarse mediante las dos informaciones secundarias.

Además, la información secundaria relativa al valor de amplificación o al límite de potencia de ruido y a los coeficientes de filtro se integra en cada bloque 132 y 134 de información secundaria no siempre independientemente entre sí. Más bien esta información secundaria se transmite en diferencias al bloque de información secundaria anterior. En la figura 5b, el bloque 132 de información secundaria contiene por ejemplo el valor de amplificación a_{0} y los coeficientes de filtro x_{0} con respecto al punto de referencia en el instante t_{-1}. En el bloque 132 de información secundaria estos valores pueden derivarse del propio bloque. Sin embargo, a partir del bloque 134 de información secundaria ya no puede derivarse de este bloque solo información secundaria relativa al punto de referencia en el instante t_{255}. Más bien comprende el bloque 134 de información secundaria únicamente información acerca de diferencias del valor de amplificación a_{1} del punto de referencia en el instante t_{255} respecto al valor de amplificación del punto de referencia en el instante t_{0} y las diferencias de los coeficientes de filtro x_{1} respecto a los coeficientes de filtro x_{0}. El bloque 134 de información secundaria contiene por tanto únicamente la información con respecto a a_{1} - a_{0} y x_{1}(i) - x_{0}(i). Sin embargo, en instantes intermitentes deberían transmitirse los coeficientes de filtro y el valor de amplificación o el límite de potencia de ruido completamente y no sólo como diferencia respecto al punto de referencia anterior, como por ejemplo cada segundo, para permitir a un receptor o decodificador engancharse a un flujo continuo de datos de codificación, como aún se explicará a continuación.

Este tipo de integración de la información secundaria en los bloques 132 y 134 de información secundaria ofrece la ventaja de la posibilidad de una tasa de compresión más alta. El motivo para ello consiste en que, aunque la información secundaria sólo se transmite a ser posible cuando se ha obtenido un cambio suficiente de los coeficientes de filtro respecto a los coeficientes de filtro de un punto de referencia anterior, vale la pena el esfuerzo de la formación de diferencias en el lado del codificador o la formación de sumas en el lado del decodificador, ya que las diferencias que se obtienen son pequeñas, a pesar de la consulta en la etapa 66, para así permitir ventajas en la codificación de entropía.

Después de que anteriormente se haya descrito un ejemplo de realización para un codificador de audio, se describe a continuación un ejemplo de realización para un decodificador de audio, que es adecuado para decodificar la señal codificada generada mediante el codificador 10 de audio de la figura 1 en una señal de audio decodificada, reproducible o que puede seguir procesándose.

La estructura de este decodificador se muestra en la figura 8. El decodificador, que en general se indica con 210, comprende un descompresor 212, una memoria 214 FIFO, un multiplicador 216 y un postfiltro 218 parametrizable. El descompresor 212, la memoria 214 FIFO, el multiplicador 216 y el postfiltro 218 parametrizable están conectados en este orden entre una entrada 220 de datos y una salida 222 de datos del decodificador 210, obteniéndose en la entrada 220 de datos la señal codificada y entregándose en la salida 222 de datos la señal de audio decodificada, que sólo se diferencia de la señal de audio original en la entrada 12 de datos del codificador 10 de audio por el ruido de cuantificación generado por el cuantificador 28 en el codificador 10 de audio. El descompresor 212 está unido en una salida de datos adicional con una entrada de control del multiplicador 216, para transmitir a la misma un multiplicador, y a través de una salida de datos adicional con una entrada de parametrización del postfiltro 218 parametrizable.

Como se muestra en la figura 9, el descompresor 212 descomprime en una etapa 224 en primer lugar la señal comprimida que se encuentra en la entrada 220 de datos, para llegar a los datos de audio filtrados, cuantificados, concretamente los valores de muestreo \sigma', así como a la información secundaria correspondiente en los bloques 132, 134 de información secundaria, que indican los coeficientes de filtro y valores de amplificación o, en lugar de los valores de amplificación, los límites de potencia de ruido, en los puntos de referencia.

Como muestra la figura 10, el descompresor 212 comprueba en una etapa 226 la señal descomprimida en el orden de llegada de la misma, en cuanto a si en la misma está contenida información secundaria con coeficientes de filtro, y concretamente en una forma cerrada en sí misma sin referencia de diferencia a un bloque de información secundaria anterior. Dicho de otro modo, el descompresor 212 busca el primer bloque 132 de información secundaria. Una vez que el descompresor 212 lo ha encontrado, se almacenan de manera intermedia los valores de audio filtrados, cuantificados \sigma' en una etapa 228 en la memoria 214 FIFO. Si durante la etapa 228 se ha almacenado un bloque de audio completo de valores de audio filtrados, cuantificados \sigma', sin que inmediatamente siga un bloque de información secundaria, entonces éste se postfiltra en la etapa 228 en primer lugar mediante la información contenida en la información secundaria recibida en la etapa 226 mediante parametrización y el valor de amplificación y se amplifica en el multiplicador 216, con lo que se decodifica y de este modo se obtiene el bloque de audio decodificado correspondiente.

En una etapa 230, el descompresor 212 supervisa la señal descomprimida respecto a la aparición de un bloque de información secundaria de cualquier tipo, concretamente con coeficientes de filtro absolutos o diferencias de coeficientes de filtro con respecto a un bloque de información secundaria anterior. En el ejemplo de la figura 5b por ejemplo el descompresor 212 detectaría en la etapa 230, tras la detección del bloque 132 de información secundaria en la etapa 226, la aparición del bloque 134 de información secundaria. A este respecto en la etapa 228 ya se habría decodificado el bloque de valores de audio filtrados, cuantificados \sigma' (t_{0}) - \sigma' (t_{127}), y concretamente utilizando la información 132 secundaria. Por tanto, mientras que el bloque 134 de información secundaria en la señal descomprimida no aparezca todavía, se continúa con el almacenamiento intermedio y la decodificación eventual de bloques mediante la información secundaria de la etapa 226, como se describió anteriormente, en la etapa 228.

Una vez que aparece el bloque 134 de información secundaria, el descompresor 212 calcula en la etapa 232, mediante la suma de los valores de diferencia en el bloque 134 de información secundaria respecto a los valores de parámetro en el bloque 132 de información secundaria, los valores de parámetro en el punto de referencia 1, es decir, a_{1}, x_{1}(i). Evidentemente se suprime la etapa 232 en caso de que el bloque de información secundaria actual sea un bloque de información secundaria sin diferencias cerrado en sí mismo, lo que, como se ha descrito anteriormente, puede ser el caso por ejemplo cada segundo. Para que el tiempo de espera para el decodificador 210 no sea demasiado largo, los bloques 132 de información secundaria, en los que los valores de parámetro pueden derivarse de manera absoluta, es decir sin relación con otro bloque de información secundaria, se disponen a distancias lo suficientemente pequeñas, de modo que el tiempo de conexión o el tiempo muerto al conectar el codificador 210 de audio en por ejemplo una comunicación por radio o comunicación por radiodifusión no sea demasiado grande. Preferiblemente, el número de bloques 134 de información secundaria con los valores de diferencia dispuestos entremedias también están dispuestos en un número predeterminado fijo entre los bloques 132 de información secundaria, de modo que el decodificador sabe cuándo ha de esperarse de nuevo un bloque de información secundaria de tipo 132 en la señal codificada. Alternativamente se indican los diferentes tipos de bloque de información secundaria mediante etiquetas correspondientes.

Como se muestra ahora en la figura 11, después de que ahora se haya alcanzado un bloque de información secundaria para un nuevo punto de referencia, y en concreto especialmente tras la etapa 226 ó 232, se inicializa en primer lugar un índice de valor de muestreo j a 0 en la etapa 234. Este valor corresponde a la posición de muestreo del primer valor de muestreo en el bloque de audio que queda actualmente en la FIFO 214, al que se refiere la información secundaria actual. La etapa 234 la realiza el postfiltro 218 parametrizable. El postfiltro 218 realiza a continuación en una etapa 236 un cálculo del límite de potencia de ruido en el nuevo punto de referencia, correspondiendo esta etapa a la etapa 84 de la figura 4 y pudiendo suprimirse dado el caso, cuando por ejemplo el límite de potencia de ruido en los puntos de referencia se transfiere adicionalmente a los valores de amplificación. En etapas 238 y 240 posteriores el postfiltro 218 realiza a continuación interpolaciones respecto a los coeficientes de filtro y los límites de potencia de ruido, que corresponden a las interpolaciones 88 y 90 de la figura 4. El cálculo posterior en la etapa 242 del valor de amplificación para la posición de muestreo j basándose en el límite de potencia de ruido interpolado y en los coeficientes de filtro interpolados de las etapas 238 y 240 corresponde a la etapa 92 de la figura 4. En una etapa 244, el postfiltro 218 aplica a continuación el valor de amplificación calculado en la etapa 242 así como los coeficientes de filtro interpolados al valor de muestreo en la posición de muestreo j. Esta etapa se diferencia de la etapa 94 de la figura 4 porque los coeficientes de filtro interpolados se aplican a los valores de muestreo filtrados, cuantificados \sigma' de tal modo que la función de transferencia del postfiltro parametrizable no corresponde a la inversa del umbral de escucha, sino al propio umbral de escucha. El postfiltro no realiza además una multiplicación por el valor de amplificación, sino una división entre el valor de amplificación en el valor de muestreo filtrado, cuantificado \sigma' o el valor de muestreo filtrado, cuantificado, ya filtrado de manera inversa, en la posición j.

En caso de que el postfiltro 218 todavía no haya alcanzado el punto de referencia actual con la posición de muestreo j, lo que comprueba en la etapa 246, incrementa en la etapa 248 el índice de posición de muestreo j e inicia las etapas 238 a 246 de nuevo. Sólo cuando se ha alcanzado el punto de referencia aplica el valor de amplificación y los coeficientes de filtro del nuevo punto de referencia al valor de muestreo en el punto de referencia, concretamente en la etapa 250. De nuevo la aplicación comprende, como en la etapa 218, en lugar de una multiplicación una división mediante el valor de amplificación y un filtrado con una función de transferencia igual al umbral de escucha y no a la inversa de este último. Tras la etapa 250 el bloque de audio actual se decodifica mediante interpolación entre dos parametrizaciones de puntos de referencia.

Como ya se ha mencionado, mediante el filtrado y la aplicación del valor de amplificación en las etapas 218 y 224 se adapta el ruido introducido mediante la cuantificación en la codificación en la etapa 110 ó 112 tanto en forma como en intensidad al umbral de escucha.

Se indica además que, en caso de que los valores de audio filtrados, cuantificados, debido al control de la tasa de bits antes de la codificación en la señal codificada, aún se hayan sometido a una multiplicación adicional en la etapa 126, también puede tenerse en cuenta este factor en las etapas 218 y 224. Como alternativa pueden someterse evidentemente los valores de audio obtenidos mediante el proceso de la figura 11 a una multiplicación adicional, para volver a amplificar de manera correspondiente los valores de audio atenuados por una tasa de bits más baja.

En cuanto a las figuras 3, 4, 6 y 9 a 11 se indica que las mismas muestran diagramas de flujo, que ilustran el modo de funcionamiento del codificador de la figura 1 o del decodificador de la figura 8, y que cada una de las etapas representadas en estos diagramas de flujo mediante un bloque como se ha descrito está implementada en un medio correspondiente, como se describió anteriormente. La implementación de las etapas individuales puede realizarse a este respecto en hardware, como parte de circuito ASIC, o en software, como subrutinas. En especial en estas figuras las explicaciones realizadas en los bloques muestran de manera general a qué operación se refiere la etapa respectiva, que corresponde al bloque respectivo, mientras que las flechas entre los bloques ilustran el orden de las etapas en el funcionamiento del codificador o del decodificador.

Haciendo referencia a la descripción anterior se indica aún que el esquema de codificación representado anteriormente puede variarse en diferentes aspectos. Por ejemplo no es necesario que una parametrización y un valor de amplificación o un límite de potencia de ruido, tal como se han determinado para un bloque de audio determinado, deban considerarse inmediatamente válidos para un determinado valor de audio, como en el ejemplo de realización anterior el último valor de audio respectivo de cada bloque de audio, es decir del valor de orden 128 en este bloque de audio, de modo que para este valor de audio puede prescindirse de la interpolación. Más bien es posible referir estos valores de parámetro de punto de referencia a un punto de referencia que se encuentra temporalmente entre los instantes de muestreo t_{n} con n = 0,..., 127 de los valores de audio de este bloque de audio, de modo que para cada valor de audio sería necesaria una interpolación. En especial la parametrización determinada para un bloque de audio o el valor de amplificación determinado para este bloque de audio también pueden aplicarse inmediatamente a otro valor, como por ejemplo el valor de audio en la mitad del bloque de audio, como por ejemplo el valor de audio de orden 64 en el caso del tamaño de bloque anterior de 128 valores de audio.

Además se indica que el ejemplo de realización anterior se refería a un esquema de codificación de audio que estaba diseñado para generar una señal codificada con una tasa de bits controlada. Sin embargo, el control de la tasa de bits no es necesario en cada caso de aplicación. Por ello, las etapas 116 a 122 y 126 correspondientes también pueden omitirse.

En cuanto al esquema de compresión mencionado con referencia a la etapa 114 se remite para completar también al documento descrito en la introducción de la descripción de Schuller et al., y especialmente al punto IV, cuyo contenido se incorpora al presente documento como referencia respecto a la reducción de redundancia mediante codificación sin pérdida.

Además se hace referencia aún con referencia al ejemplo de realización anterior a lo siguiente. Aunque anteriormente se haya descrito que el valor umbral en la cuantificación permanece siempre constante o que la función escalonada de cuantificación también permanece siempre constante, es decir, que los artefactos generados en la señal de audio filtrada siempre se cuantifican o cortan con una cuantificación más basta, por lo que la calidad de audio podría empeorarse dado el caso de manera audible, es además posible utilizar esta medida sólo cuando lo requiera la complejidad de la señal de audio, concretamente cuando la tasa de bits necesaria para la codificación supere una tasa de bits deseada. En este caso podría utilizarse, adicionalmente a las funciones escalonadas de cuantificación mostradas en las figuras 7a y 7b, por ejemplo una con un tamaño de paso de cuantificación constante por todo el posible intervalo de valores en la salida del prefiltro y el cuantificador reaccionaría por ejemplo a una señal, para utilizar o bien la función escalonada de cuantificación con un tamaño de paso de cuantificación siempre constante o bien una de las funciones escalonadas de cuantificación según las figuras 7a o 7b, de modo que mediante la señal podría comunicarse al cuantificador que realice con un ligero empeoramiento en la calidad de audio la reducción de escalón de cuantificación por encima del valor umbral o el corte por encima del valor umbral. Alternativamente podría reducirse también de manera gradual el valor umbral poco a poco. En este caso podría realizarse la reducción del valor umbral en lugar de la reducción de escalón de la etapa 126. Después de un primer intento de compresión sin la etapa 110 podría someterse por tanto la señal comprimida provisionalmente en una etapa 126 modificada a una cuantificación de valor umbral selectiva sólo cuando la tasa de bits siguiera siendo demasiado alta (118). Entonces, en una nueva pasada etapa 126, se cuantificarían los valores de audio filtrados con la función escalonada de cuantificación que presenta un desarrollo plano por encima del umbral de audio. Reducciones de tasa de bits adicionales podrían realizarse en la etapa 126 modificada aún mediante la reducción del valor umbral y por tanto una modificación adicional de la función escalonada de cuantificación

Además, si bien algunos aspectos del ejemplo de realización anterior son ventajosos, sin embargo no son necesarios. Así por ejemplo en el esquema de codificación de audio anterior puede omitirse la interpolación. Además sería posible transferir las parametrizaciones y el valor de amplificación o las parametrizaciones y el límite de potencia de ruido con respecto a cada bloque de audio, respecto al que se calcularon, y no saltarse ninguno, cuando las parametrizaciones sucesivas se diferencian en menos de la medida predeterminada mencionada anteriormente.

Además sería posible aplicar la codificación de diferencias únicamente a las parametrizaciones, pero no al valor de amplificación o al límite de potencia de ruido.

Además es concebible transferir en el esquema de codificación anterior los coeficientes de filtro en los bloques 134 secundarios de diferencia también de otro modo, concretamente por ejemplo en forma de los coeficientes de filtro actuales menos los coeficientes de filtro transferidos anteriormente menos el umbral mínimo de la etapa 66.

El esquema de codificación de audio descrito anteriormente se ocupa por tanto entre otras cosas de la transferencia de información secundaria en un codificador de audio con un tiempo de retardo muy reducido de una manera eficaz. La información secundaria, que debe transferirse para el decodificador, para que la señal de audio pueda volver a reconstruirse de manera adecuada, tiene la propiedad de que ésta sólo cambia lentamente en la mayoría de los casos. Por tanto sólo se transfieren diferencias, lo que reduce la tasa de bits. Además éstas se transfieren sólo cuando hay un cambio suficiente. De cuando en cuando se transfiere el valor absoluto, en caso de que se hayan perdido valores pasados. Dicho de otro modo, la información secundaria desde el prefiltro o los coeficientes se transfieren de tal modo que el postfiltro tiene en el decodificador la función de transferencia inversa, de modo que la señal de audio pueda volver a reconstruirse de manera adecuada. Se reduce la tasa de bits necesaria para ello, transfiriéndose diferencias y también sólo cuando son lo suficientemente grandes. Estas diferencias tienen valores más pequeños y aparecen con más frecuencia, por lo que necesitan menos bits en la codificación. La codificación de diferencias vale la pena especialmente porque las diferencias en caso de señales de audio que cambian continuamente también cambian sólo de manera constante.

En especial se indica que, en función de las circunstancias, el esquema de codificación de audio según la invención también puede implementarse en software. La implementación puede realizarse en un medio de almacenamiento digital, especialmente un disquete o un CD con señales de control legibles electrónicamente, que pueden actuar conjuntamente con un sistema informático programable de tal modo que se realiza el procedimiento correspondiente. La invención consiste por tanto en general también en un producto de programa informático con un código de programa almacenado en un soporte legible por máquina para la realización del procedimiento según la invención, cuando el producto de programa informático se ejecuta en un ordenador. Dicho de otro modo, la invención puede realizarse por tanto como un programa informático con un código de programa para la realización del procedimiento, cuando el programa informático se ejecuta en un ordenador.

En especial, las etapas de procedimiento anteriores en los bloques de los diagramas de flujo pueden implementarse individualmente o en varias rutinas de subprograma. De manera alternativa también es posible evidentemente una implementación de un dispositivo según la invención en forma de un circuito integrado, en la que estos bloques por ejemplo se implementan como partes de circuito individuales de un ASIC.

En especial se indica que, en función de las circunstancias, el esquema según la invención también puede implementarse en software. La implementación puede realizarse en un medio de almacenamiento digital, especialmente un disquete o un CD con señales de control legibles electrónicamente que pueden actuar conjuntamente con un sistema informático programable de tal modo que se realiza el procedimiento correspondiente. La invención consiste por tanto en general también en un producto de programa informático con un código de programa almacenado en un soporte legible por máquina para la realización del procedimiento según la invención, cuando el producto de programa informático se ejecuta en un ordenador. Dicho de otro modo, la invención puede realizarse por tanto como un programa informático con un código de programa para la realización del procedimiento, cuando el programa informático se ejecuta en un ordenador.

Claims

1. Dispositivo para la codificación de una señal de audio de una secuencia de valores de audio en una señal codificada, con

\quad: un medio (20) para determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia de valores de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia de valores de audio;

\quad: un medio (24) para calcular una versión de una primera parametrización de un filtro (30) parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del segundo umbral de escucha;

\quad: un medio (30) para filtrar un bloque predeterminado de valores de audio de la secuencia de valores de audio con el filtro parametrizable utilizando una parametrización predeterminada, que de manera predeterminada depende de la versión de la segunda parametrización, para obtener un bloque de valores de audio filtrados correspondiente al bloque predeterminado;

\quad: un medio (28) para cuantificar los valores de audio filtrados, para obtener un bloque de valores de audio filtrados, cuantificados;

\quad: un medio para formar una combinación de la versión de la primera parametrización y de la versión de la segunda parametrización, que se suceden entre sí, y que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización; y

\quad: un medio para integrar información, a partir de la que pueden derivarse los valores de audio filtrados, cuantificados y una versión de la primera parametrización, y que comprende la combinación, en la señal codificada.

2. Dispositivo según la reivindicación 1, en el que el medio para filtrar presenta las características siguientes:

\quad: un medio para interpolar entre la versión de la primera parametrización y la versión de la segunda parametrización, para obtener una versión de una parametrización interpolada para un valor de audio predeterminado del bloque predeterminado de valores de audio; y

\quad: un medio para aplicar la versión de la parametrización interpolada al valor de audio predeterminado.

3. Dispositivo según una de las reivindicaciones anteriores, en el que el medio para integrar comprende un codificador de entropía.

4. Dispositivo según una de las reivindicaciones anteriores, en el que el medio para determinar el primer y el segundo umbral de escucha y el medio para calcular están configurados para, a partir del primer bloque de valores de audio, para una pluralidad de bloques sucesivos posteriores de valores de audio de la secuencia de valores de audio, determinar un umbral de escucha o calcular una parametrización del filtro parametrizable, de modo que la función de transferencia del mismo corresponde aproximadamente a la inversa de la magnitud del umbral de escucha respectivo, presentando el dispositivo además la característica siguiente:

\quad: un medio para comprobar las parametrizaciones por orden, en cuanto a si las mismas se diferencian de la primera parametrización en más de una medida predeterminada, y para seleccionar como la segunda parametrización sólo aquella parametrización de entre las parametrizaciones, que por primera vez se diferencia de la primera parametrización en más de la medida predeterminada.

5. Dispositivo según la reivindicación 4, en el que la combinación presenta la diferencia menos la medida predeterminada.

6. Dispositivo según una de las reivindicaciones anteriores, que presenta además un medio (22) para determinar un primer límite de potencia de ruido en función del primer umbral de enmascaramiento y un segundo límite de potencia de ruido en función del segundo umbral de enmascaramiento, y en el que el medio para filtrar presenta un medio (90) para interpolar entre el primer límite de potencia de ruido y el segundo límite de potencia de ruido, para obtener un límite de potencia de ruido interpolado para un valor de audio predeterminado del bloque predeterminado de valores de audio, un medio (92) para determinar un valor intermedio de ajuste a escala en función de una potencia de ruido de cuantificación provocada por una cuantificación según una norma de cuantificación predeterminada y el límite de potencia de ruido interpolado, y un medio (94) para aplicar el valor intermedio de ajuste a escala al valor de audio predeterminado, para obtener un valor de audio filtrado, ajustado a escala.

7. Dispositivo según una de las reivindicaciones anteriores, que está configurado para procesar una pluralidad de bloques predeterminados sucesivos y a este respecto incorporar en la señal codificada de manera intermitente información que comprende los valores de audio filtrados, cuantificados y una versión de la primera y la segunda parametrización.

8. Procedimiento para codificar una señal de audio de una secuencia de valores de audio en una señal codificada, con las etapas siguientes:

\quad: determinar un primer umbral de escucha para un primer bloque de valores de audio de la secuencia de valores de audio y un segundo umbral de escucha para un segundo bloque de valores de audio de la secuencia de valores de audio;

\quad: calcular una versión de una primera parametrización de un filtro (30) parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del primer umbral de escucha, y una versión de una segunda parametrización del filtro parametrizable, de modo que su función de transferencia corresponde aproximadamente a la inversa de la magnitud del segundo umbral de escucha;

\quad: filtrar un bloque predeterminado de valores de audio de la secuencia de valores de audio con el filtro parametrizable utilizando una parametrización predeterminada, que de manera predeterminada depende de la versión de la segunda parametrización, para obtener un bloque de valores de audio filtrados correspondiente al bloque predeterminado;

\quad: cuantificar los valores de audio filtrados, para obtener un bloque de valores de audio filtrados, cuantificados;

\quad: formar una combinación de la versión de la primera parametrización y de la versión de la segunda parametrización, que se suceden entre sí, y que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización; e

\quad: integrar información, a partir de la que pueden derivarse los valores de audio filtrados, cuantificados, y que comprende la combinación, en la señal codificada.

9. Dispositivo para decodificar una señal codificada en una señal de audio, conteniendo la señal codificada información, a partir de la que pueden derivarse un bloque de valores de audio filtrados, cuantificados y una versión de una primera parametrización, según la cual una función de transferencia de un filtro parametrizable corresponde a la inversa de la magnitud de un primer umbral de escucha, y que comprende una combinación entre una versión de una segunda parametrización, según la cual una función de transferencia del filtro parametrizable corresponde a la inversa de una magnitud de un segundo umbral de escucha, y la versión de la primera parametrización, que se suceden entre sí, y que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización, con

\quad: un medio para derivar la versión de la primera parametrización a partir de la señal codificada;

\quad: un medio para formar una suma entre la versión de la primera parametrización y la diferencia, para obtener la versión de la segunda parametrización; y

\quad: un medio para filtrar el bloque de valores de audio filtrados, cuantificados con un filtro parametrizable utilizando la versión de la segunda parametrización, de modo que su función de transferencia corresponde aproximadamente a la magnitud del umbral de escucha, para obtener un bloque de valores de audio decodificados de la señal de audio.

10. Procedimiento para decodificar una señal codificada en una señal de audio, conteniendo la señal codificada información a partir de la que pueden derivarse un bloque de valores de audio filtrados, cuantificados y una versión de una primera parametrización, según la cual una función de transferencia de un filtro parametrizable corresponde a la inversa de la magnitud de un primer umbral de escucha, y que comprende una combinación entre una versión de una segunda parametrización, según la cual una función de transferencia del filtro parametrizable corresponde a la inversa de una magnitud de un segundo umbral de escucha, y la versión de la primera parametrización, que se suceden entre sí, y que comprende al menos una diferencia entre la versión de la primera parametrización y la versión de la segunda parametrización, con las etapas siguientes:

\quad: derivar la versión de la primera parametrización a partir de la señal codificada;

\quad: formar una suma entre la versión de la primera parametrización y la diferencia, para obtener la versión de la segunda parametrización; y

\quad: filtrar el bloque de valores de audio filtrados, cuantificados con un filtro parametrizable utilizando la versión de la segunda parametrización, de modo que su función de transferencia corresponde aproximadamente a la magnitud del umbral de escucha, para obtener un bloque de valores de audio decodificados de la señal de audio.

11. Programa informático con un código de programa para la realización del procedimiento según la reivindicación 8 ó 10, cuando el programa informático se ejecuta en un ordenador.