ES2298568T3

ES2298568T3 - Descodificacion de audio.

Info

Publication number: ES2298568T3
Application number: ES03758591T
Authority: ES
Inventors: Albertus C. Den Brinker; Andreas J. Gerrits; Robert J. Sluijter
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-11-29
Filing date: 2003-11-06
Publication date: 2008-05-16
Anticipated expiration: 2023-11-06
Also published as: BR0316663A; DE60318102T2; CN100559467C; MXPA05005601A; EP1568012B1; JP2006508394A; CN1717719A; US20060036431A1; ATE381092T1; KR20050086871A; US7664633B2; RU2353980C2; DE60318102D1; AU2003274617A8; AU2003274617A1; PL376861A1; RU2005120380A; KR101016995B1; JP4606171B2; EP1568012A1

Abstract

Procedimiento de descodificación de un flujo de audio, comprendiendo el procedimiento las etapas de: leer un flujo de audio (AS¿) codificado que incluye códigos (r) sinusoidales que representan una fase (psi) para cada pista de componentes sinusoidales enlazadas, para cada pista, generar (56) un valor ( ¿psi) monótonamente cambiante en general a partir de dichos códigos (r) que representan dicha fase; filtrar (58) dicho valor generado para proporcionar una estimación de frecuencia ( ¿omega) para una pista; y emplear (32) dichos valores generados y dichas estimaciones de frecuencia para sintetizar dichas componentes sinusoidales de dicha señal de audio.

Description

Descodificación de audio.

\global\parskip0.930000\baselineskip

Campo de la invención

La presente invención se refiere a codificación y descodificación de señales de audio.

Antecedentes de la invención

En referencia ahora a la figura 1, se describe un esquema de codificación paramétrica, en particular un codificador sinusoidal, en la solicitud de patente PCT Nº WO01/69593. En este codificador, se divide una señal x(t) de audio de entrada en varios segmentos o tramas (superposición), normalmente de 20 ms de longitud. Cada segmento se descompone en componentes transitorias, sinusoidales y de ruido. (También es posible obtener otras componentes de la señal de audio de entrada tales como complejos armónicos aunque estos no son muy importantes para los fines de la presente invención).

En el analizador 130 sinusoidal, la señal x2 para cada segmento se modela utilizando un número de sinusoides representadas por parámetros de amplitud, frecuencia y fase. Esta información se extrae normalmente para un intervalo de análisis realizando una transformada de Fourier (FT, Fourier Transform) que proporciona una representación espectral del intervalo que incluye: frecuencias; amplitudes para cada frecuencia; y fases para cada frecuencia donde cada fase está en el intervalo {-\pi, \pi}. Una vez que se estima la información sinusoidal para un segmento, se inicia un algoritmo de seguimiento. Este algoritmo utiliza una función de coste para enlazar sinusoides entre sí segmento por segmento para obtener las denominadas pistas. Por tanto, el algoritmo de seguimiento da como resultado códigos C_{S} sinusoidales que comprenden pistas sinusoidales que empiezan en un momento de tiempo específico, evolucionan durante una cierta cantidad de tiempo sobre una pluralidad de segmentos de tiempo y entonces se detienen.

En tal codificación sinusoidal, normalmente se transmite información de frecuencia para las pistas formadas en el codificador. Esto puede realizarse de forma económica, puesto que las pistas se definen como que tienen una frecuencia que varía lentamente y, por lo tanto, puede transmitirse la frecuencia eficazmente mediante codificación diferencial en tiempo. (En general, también puede codificarse diferencialmente la amplitud en el tiempo).

Al contrario de la de frecuencia, la transmisión de fase se considera costosa. En principio, si la frecuencia es (casi) constante, la fase en función del índice de segmento de pista debería cumplir con un comportamiento (casi) lineal. Sin embargo, cuando se transmite, la fase está limitada al intervalo {-\pi, \pi} tal como se proporciona mediante la transformada de Fourier. Debido a esta representación de fase de módulo 2\pi, la relación entre tramas estructurales de la fase se pierde y, a primera vista parece ser una variable estocástica blanca.

Sin embargo, puesto que la fase es la integral de la frecuencia, la fase no necesita transmitirse, en principio. Esto se llama continuación de fase y reduce la tasa de bits significativamente.

En continuación de fase, sólo se transmite la frecuencia y la fase se recupera en el descodificador a partir de los datos de frecuencia aprovechando la relación integral entre fase y frecuencia. Sin embargo, se sabe que la fase puede recuperarse sólo de manera aproximada utilizando continuación de fase. Si se producen errores de frecuencia, debido a errores de medición en la frecuencia o debido a ruido de cuantificación, la fase, que se reconstruye utilizando la relación integral, mostrará normalmente un error que tenga el carácter de un desplazamiento. Esto es porque los errores de frecuencia tienen aproximadamente un carácter de ruido blanco. La integración amplifica los errores de baja frecuencia y, por consiguiente, la fase recuperada tenderá a desplazarse alejándose de la fase medida realmente. Esto lleva a artefactos audibles.

Esto se ilustra en la figura 2(a) donde \psi y \Omega son la frecuencia y fase reales para una pista. Tanto en el codificador como en el descodificador la frecuencia y la fase tienen una relación integral representada por I. El proceso de cuantificación en el codificador se modela como un ruido n blanco aditivo. En el descodificador, la fase \hat{\psi} recuperada incluye por tanto dos componentes: la fase \psi real y una componente \varepsilon_{2} de ruido, donde tanto el espectro de la fase recuperada como la función de densidad espectral de potencia del ruido \varepsilon_{2} tienen un carácter pronunciado de baja frecuencia.

Por tanto, puede verse que en continuación de fase, puesto que la fase recuperada es la integral de una señal de baja frecuencia, la fase recuperada es en sí una señal de baja frecuencia. Sin embargo, el ruido introducido en el proceso de reconstrucción también es predominante en este rango de baja frecuencia. Por lo tanto, es difícil separar estas fuentes con la idea de filtrar el ruido n introducido durante la codificación.

Descripción de la invención

Según la presente invención se proporciona un procedimiento según la reivindicación 1, y un reproductor de audio según la reivindicación 2.

Según la invención, en el descodificador, la frecuencia puede recuperarse de manera aproximada a partir de la información de fase cuantificada utilizando diferencias finitas como una aproximación para la diferenciación. La componente de ruido de la frecuencia recuperada tiene un comportamiento pronunciado de alta frecuencia bajo la suposición de que el ruido introducido por la cuantificación de fase es casi espectralmente plano. Esto se ilustra en la figura 2(b), donde dentro del codificador y el descodificador, la frecuencia se representa como el diferencial (D) de fase. De nuevo, se introduce ruido n en el codificador y por tanto en el descodificador, la frecuencia \hat{\Omega} recuperada incluye dos componentes: la frecuencia \Omega real y una componente \varepsilon_{4} de ruido, donde la frecuencia es casi una señal CC y el ruido está principalmente en el rango de alta frecuencia. Sin embargo, puesto que la frecuencia subyacente tiene un comportamiento de baja frecuencia y el ruido añadido un comportamiento de alta frecuencia, la componente \varepsilon_{4} de ruido de la frecuencia recuperada puede reducirse mediante un filtro paso bajo.

Breve descripción de los dibujos

La figura 1 muestra un codificador de audio;

las figuras 2(a) y 2(b) ilustran la relación entre la fase y la frecuencia en sistemas de la técnica anterior y en sistemas de audio según la presente invención, respectivamente;

las figuras 3(a) y 3(b) muestran un componente codificador sinusoidal del codificador de audio de la figura 1;

la figura 4 muestra un reproductor de audio en el que se implementa una realización de la invención; y

las figuras 5(a) y 5(b) muestran una realización preferida de un componente sintetizador sinusoidal del reproductor de audio de la figura 4; y

la figura 6 muestra un sistema que comprende un codificador de audio y un reproductor de audio según la invención.

Descripción de la realización preferida

A continuación se describirán realizaciones preferidas de la invención con referencia a los dibujos adjuntos, en los que a componentes similares se les ha dado números de referencia similares y, a menos que se exprese lo contrario, realizan una función similar. El codificador 1 es un codificador sinusoidal del tipo descrito en la solicitud de patente PCT Nº WO 01/69593, figura 1. El funcionamiento de este codificador de la técnica anterior y su descodificador correspondiente se ha describo bien y la descripción sólo se proporciona en el presente documento en lo que es importante para la presente invención.

El codificador 1 de audio muestrea una señal de audio de entrada a una cierta frecuencia de muestreo que da como resultado una representación x(t) digital de la señal de audio. El codificador 1 entonces separa la señal de entrada muestreada en tres componentes: componentes de señal transitorias, componentes determinísticas continuas, y componentes estocásticas continuas. El codificador 1 de audio comprende un codificador 11 de transitorios, un codificador 13 sinusoidal y un codificador 14 de ruido.

El codificador 11 de transitorios comprende un detector 110 de transitorios (TD, transient detector), un analizador 111 de transitorios (TA, transient analyzer) y un sintetizador 112 de transitorios(TS, transient synthesizer). En primer lugar, la señal x(t) entra en el detector 110 de transitorios. Este detector 110 estima si hay una componente de señal transitoria y su posición. Esta información se suministra al analizador 111 de transitorios. Si se determina la posición de una componente de señal transitoria, el analizador 111 de transitorios intenta extraer (la parte principal de) la componente de señal transitoria. Compara una función de forma con un segmento de señal que empieza preferiblemente en una posición de inicio estimada, y determina el contenido bajo la función de forma, empleando por ejemplo un (pequeño) número de componentes sinusoidales. Esta información se contiene en el código C_{T} de transitorios y en la solicitud de patente PCT Nº WO 01/69593 se proporciona información más detallada sobre la generación del código C_{T} de transitorios.

El código C_{T} de transitorios se proporciona al sintetizador 112 de transitorios. La componente de señal transitoria sintetizada se resta de la señal x(t) de entrada en el restador 16, dando como resultado una señal x1. Se utiliza un mecanismo (12) de control de ganancia (GC, gain control) para producir x2 a partir de x1.

La señal x2 se proporciona al codificador 13 sinusoidal donde se analiza en un analizador 130 sinusoidal (SA, sinusoidal analyzer), que determina las componentes sinusoidales (determinísticas). Por lo tanto, se observará que aunque la presencia del analizador de transitorios es deseable, no es necesaria y la invención puede implementarse sin un analizador de este tipo. Como alternativa, tal como se mencionó anteriormente, la invención también puede implementarse con por ejemplo un analizador de complejos armónicos.

En resumen, el codificador sinusoidal codifica la señal x2 de entrada como pistas de componentes sinusoidales enlazadas de un segmento de trama con el siguiente. En referencia ahora a la figura 3(a), de la misma manera que en la técnica anterior, cada segmento de la señal x2 de entrada se transforma al dominio de frecuencia en una unidad 40 de transformada de Fourier (FT). Para cada segmento, la unidad FT proporciona amplitudes A, fases \phi y frecuencias \omega medidas. Tal como se mencionó previamente, el intervalo de fases proporcionado por la transformada de Fourier está restringido a -\pi \leq \phi < \pi. Una unidad 42 de algoritmo de seguimiento (TA, tracking algorithm) toma la información para cada segmento y empleando una función de coste adecuada, enlaza sinusoides de un segmento con el siguiente, produciendo así una secuencia de fases \phi(k) y frecuencias \omega(k) medidas para cada pista.

\global\parskip1.000000\baselineskip

Al contrario de la técnica anterior, según la presente invención los códigos C_{S} sinusoidales producidos en último término por al analizador 130 incluyen información de fase, y la frecuencia se reconstruye a partir de esta información en el descodificador.

Tal como se mencionó anteriormente, sin embargo, la fase medida está restringida a una representación de módulo 2\pi. Por lo tanto, en el codificador 1 el analizador comprende un desempaquetador 44 de fase (PU, phase unwrapper) donde la representación de fase de módulo 2\pi se desempaqueta para exponer el comportamiento de fase entre tramas estructurales para una pista \psi. Cuando la frecuencia en pistas sinusoidales es casi constante, se observará que la fase \psi desempaquetada será normalmente una función creciente (o decreciente) linealmente y esto hace posible transmisión de fase económica. La fase \psi desempaquetada se proporciona como entrada a un codificador 46 de fase (PE, phase encoder) que proporciona como salida niveles r de representación adecuados para ser transmitidos.

En referencia ahora al funcionamiento del desempaquetador 44 de fase, tal como se mencionó anteriormente, la fase \psi real y la frecuencia \Omega real para una pista están relacionadas por:

1

siendo T_{o} un instante de tiempo de referencia.

Una pista sinusoidal en tramas k = K, K+1... K+L-1 tiene frecuencias \omega(k) medidas (expresadas en radianes por segundo) y fases \phi(k) medidas (expresadas en radianes). La distancia entre el centro de las tramas viene dada por U (tasa de actualización expresada en segundos). Se supone que las frecuencias medidas son muestras de la pista \Omega de frecuencia continua en el tiempo subyacente supuesta con \omega(k)=\Omega(kU) y, de manera similar, las fases medidas son muestras de la pista \psi de fase continua en el tiempo asociada con \phi(k)=\psi(kU)mod(2\pi). Para codificación sinusoidal se supone que \Omega es una función casi constante.

Suponiendo que las frecuencias son casi constantes dentro de un segmento, la ecuación 1 puede aproximarse según lo siguiente:

2

Por lo tanto, se observará que conociendo la fase y la frecuencia para un segmento dado y la frecuencia del siguiente segmento, es posible estimar un valor de fase desempaquetada para el siguiente segmento, y así sucesivamente para cada segmento en una pista.

En la realización preferida, el desempaquetador de fase determina un factor m(k) de desempaquetado en el instante k:

3

El factor m(k) de desempaquetado dice al desempaquetador 44 de fase el número de ciclos que tienen que añadirse para obtener la fase desempaquetada.

Combinando las ecuaciones 2 y 3, el desempaquetador de fase determina un factor e de desempaquetado incremental según lo siguiente:

4

donde e debería ser un entero. Sin embargo, debido a errores de medición y de modelo, el factor de desempaquetado incremental no será exactamente un entero, por lo que:

5

suponiendo que los errores de modelo y medición son pequeños.

Teniendo el factor e de desempaquetado incremental, se calcula el m(k) a partir de la ecuación (3) como la suma acumulativa donde, sin pérdida de generalidad, el desempaquetador de fase empieza en la primera trama K con m(K)=0, y a partir de m(k) y \phi(k) se determina la fase \psi(kU) (desempaquetada).

En la práctica, los datos \psi(kU) y \Omega(kU) muestreados están distorsionados por errores de medición:

6

donde \varepsilon_{1} y \varepsilon_{2} son errores de fase y frecuencia, respectivamente. Con el fin de impedir que la determinación del factor de desempaquetado se vuelva ambigua, los datos de medición necesitan determinarse con suficiente precisión. Por tanto, en el codificador 1, el seguimiento está restringido de manera que:

7

donde \delta es el error en la operación de redondeo. El error \delta se determina principalmente mediante los errores en \omega debido a la multiplicación con U. Supóngase que \omega se determina a partir de la máxima del valor absoluto de la transformada de Fourier a partir de una versión muestreada de la señal de entrada con frecuencia F_{s} de muestreo y que la resolución de la transformada de Fourier es 2\pi/L_{a} siendo L_{a} el tamaño de análisis. Con el fin de estar dentro del límite considerado, se tiene que:

8

Esto significa que el tamaño de análisis debería ser unas pocas veces mayor que el tamaño de actualización para que el desempaquetamiento sea preciso, por ejemplo, ajustando \delta_{0}= 1/4, el tamaño de análisis debería ser cuatro veces el tamaño de actualización (despreciando los errores \varepsilon_{1} en la medición de fase).

La segunda precaución que puede tomarse para evitar errores de decisión en la operación de redondeo es definir pistas de manera apropiada. En la unidad 42 de seguimiento, las pistas sinusoidales se definen normalmente considerando diferencias de amplitud y frecuencia. Adicionalmente, también es posible tener en cuenta información de fase en el criterio de enlace. Por ejemplo, puede definirse el error \varepsilon de predicción como la diferencia entre el valor medido y el valor \tilde{\phi} predicho según

9

donde el valor predicho puede tomarse como

10

Por tanto, preferiblemente la unidad 42 de seguimiento prohíbe pistas en las que \varepsilon sea mayor que un cierto valor (por ejemplo \varepsilon>\pi/2), dando como resultado una definición inequívoca de e(k).

Adicionalmente, el codificador puede calcular las fases y frecuencias tal como estarán disponibles en el descodificador. Si las fases o frecuencias que se convertirán en disponibles en el descodificador difieren demasiado de las fases y/o frecuencias tal como están presentes en el codificador, puede decidirse interrumpir una pista, es decir, para señalizar el fin de una pista y empezar una nueva utilizando la frecuencia y fase actuales y sus datos sinusoidales enlazados.

La fase \psi(kU) desempaquetada muestreada producida por el desempaquetador 44 de fase (PU) se proporciona como entrada al codificador 46 de fase (PE) para producir un conjunto de niveles r de representación. Se conocen técnicas para la transmisión eficaz de una característica monótonamente cambiante en general tal como la fase desempaquetada. En la figura 3(b), se emplea modulación de código de pulsos diferencial adaptativa (ADPCM, Adaptive Differential Pulse Code Modulation). En este caso, se utiliza un predictor 48 (PF) para estimar la fase del siguiente segmento de pista y codificar la diferencia sólo en un cuantificador 50 (Q). Puesto que se espera que \psi sea una función casi lineal y por razones de simplicidad, el predictor 48 se elige como un filtro de segundo orden de la forma:

11

donde x es la entrada e y es la salida. Sin embargo, se observará que también es posible tomar otras relaciones funcionales (incluyendo relaciones de orden superior) e incluir adaptación (hacia atrás o hacia delante) adaptativa de los coeficientes del filtro. En el codificador 46 de fase, se utiliza un mecanismo 52 de control adaptativo hacia atrás (QC) por simplicidad para controlar el cuantificador 50. Asimismo, también es posible un control adaptativo hacia delante pero requeriría sobrecarga de tasa de bits adicional.

Tal como puede observarse, la inicialización del codificador (y el descodificador) para una pista empieza con el conocimiento de la fase \phi(0) y la frecuencia \omega(0) de inicio. Éstas se cuantifican y se transmiten mediante un mecanismo separado. Adicionalmente, el paso de cuantificación inicial utilizada en el controlador 52 de cuantificación del codificador y el controlador 62 correspondiente en el descodificador, figura 5(b), o bien se transmite o bien se ajusta a un cierto valor tanto en el codificador como en el descodificador. Finalmente, el fin de una pista puede señalizarse o bien en un flujo lateral separado o bien como un símbolo único en el flujo de bits de las fases.

A partir del código C_{S} sinusoidal generado con el codificador sinusoidal, se reconstruye la componente de señal sinusoidal mediante un sintetizador 131 sinusoidal(SS, sinusoidal synthesizer) de la misma manera que se describirá para el sintetizador 32 sinusoidal (SS) del descodificador. Esta señal se resta en el restador 17 de la entrada x2 al codificador 13 sinusoidal, dando como resultado una señal x3 restante. La señal x3 residual producida por el codificador 13 sinusoidal se pasa al analizador 14 de ruido del codificador 1 que produce un código C_{N} de ruido representativo de este ruido, tal como se describe en, por ejemplo, la solicitud de patente PCT Nº PCT/EP00/04599.

Finalmente, en un multiplexador 15, se constituye un flujo de audio AS (audio stream) que incluye los códigos C_{T}, C_{S} y C_{N}. El flujo de audio AS se proporciona a, por ejemplo, un bus de datos, un sistema de antena, un medio de almacenamiento, etc.

La figura 4 muestra un reproductor 3 de audio adecuado para descodificar un flujo de audio AS', por ejemplo, generado por un codificador 1 de la figura 1, obtenido a partir de un bus de datos, sistema de antena, medio de almacenamiento, etc. El flujo de audio AS' se demultiplexa en un demultiplexador 30 para obtener los códigos C_{T}, C_{S} y C_{N}. Estos códigos se proporcionan a un sintetizador 31 de transitorios, un sintetizador 32 sinusoidal y un sintetizador 33 de ruido respectivamente. A partir del código C_{T} de transitorios, se calculan las componentes de señal transitorias en el sintetizador 31 de transitorios. En caso de que el código de transitorios indique una función de forma, la forma se calcula basándose en los parámetros recibidos. Además, el contenido de forma se calcula basándose en las frecuencias y amplitudes de las componentes sinusoidales. Si el código C_{T} de transitorios indica un paso, entonces no se calcula ningún transitorio. La señal y_{T} transitoria total es una suma de todos los transitorios.

El código C_{S} sinusoidal que incluye la información codificada por el analizador 130 lo utiliza el sintetizador 32 sinusoidal para generar la señal y_{S}. En referencia ahora a las figuras 5(a) y (b), el sintetizador 32 sinusoidal comprende un descodificador 56 de fase (PD, phase decoder) compatible con el codificador 46 de fase. En este caso, el descuantificador 60 (DQ, dequantiser) conjuntamente con un filtro 64 de predicción (PF, prediction filter) de segundo orden produce (una estimación de) la fase \hat{\psi} desempaquetada a partir de: los niveles r de representación, la información inicial \hat{\phi}(0), \hat{\omega}(0) proporcionada al filtro 64 de predicción (PF) y el paso de cuantificación inicial para el controlador 62 de cuantificación (QC).

Tal como se ilustra en la figura 2(b), la frecuencia puede recuperarse a partir de la fase \hat{\psi} desempaquetada mediante diferenciación. Suponiendo que el error de fase en el descodificador es aproximadamente blanco y puesto que la diferenciación amplifica las altas frecuencias, la diferenciación puede combinarse con un filtro paso bajo para reducir el ruido y, por tanto, para obtener una estimación precisa de la frecuencia en el descodificador.

En la realización preferida, una unidad 58 de filtrado (FR, filtering unit) aproxima la diferenciación que es necesaria para obtener la frecuencia \hat{\omega} a partir de la fase desempaquetada mediante procedimientos como diferencias hacia delante, hacia atrás o centrales. Esto permite al descodificador producir como salida las fases \hat{\psi} y frecuencias \hat{\omega} que pueden utilizarse de una manera convencional para sintetizar la componente sinusoidal de la señal codificada.

Al mismo tiempo, cuando están sintetizándose las componentes sinusoidales de la señal, el código C_{N} de ruido se proporciona a un sintetizador 33 de ruido NS (noise synthesizer), que es principalmente un filtro, que tiene una respuesta en frecuencia que se aproxima al espectro del ruido. El NS 33 genera ruido y_{N} reconstruido filtrando una señal de ruido blanco con el código C_{N} de ruido. La señal y(t) total comprende la suma de la señal y_{T} transitoria y el producto de cualquier descompresión (g) de amplitud y la suma de la señal y_{S} sinusoidal y la señal y_{N} de ruido. El reproductor de audio comprende dos sumadores 36 y 37 para sumar las respectivas señales. La señal total se proporciona a una unidad 35 de salida, que es por ejemplo un altavoz.

La figura 6 muestra un sistema de audio según la invención que comprende un codificador 1 de audio tal como se muestra en la figura 1 y un reproductor 3 de audio tal como se muestra en la figura 4. Tal sistema ofrece características de reproducción y grabación. El flujo de audio AS se proporciona desde el codificador de audio al reproductor de audio sobre un canal 2 de comunicación, que puede ser una conexión inalámbrica, un bus de datos 20 o un medio de almacenamiento. En caso de que el canal 2 de comunicación sea un medio de almacenamiento, el medio de almacenamiento puede estar fijado en el sistema o puede ser un disco extraíble, tarjeta de memoria, etc. El canal 2 de comunicación puede ser parte del sistema de audio, pero sin embargo, a menudo estará fuera del sistema de audio.

Claims

1. Procedimiento de descodificación de un flujo de audio, comprendiendo el procedimiento las etapas de:

leer un flujo de audio (AS') codificado que incluye códigos (r) sinusoidales que representan una fase (\psi) para cada pista de componentes sinusoidales enlazadas,

para cada pista, generar (56) un valor (\hat{\psi}) monótonamente cambiante en general a partir de dichos códigos (r) que representan dicha fase;

filtrar (58) dicho valor generado para proporcionar una estimación de frecuencia (\hat{\omega}) para una pista; y

emplear (32) dichos valores generados y dichas estimaciones de frecuencia para sintetizar dichas componentes sinusoidales de dicha señal de audio.

2. Reproductor (3) de audio que comprende:

medios para leer un flujo de audio (AS') codificado que incluye códigos (r) sinusoidales que representan una fase (\psi) para cada pista de componentes sinusoidales enlazadas,

un desempaquetador (56) de fase para generar, para cada pista, un valor (\hat{\psi}) monótonamente cambiante en general a partir de dichos códigos (r) que representan dicha fase;

un filtro (58) para filtrar dicho valor generado para proporcionar una estimación de frecuencia (\hat{\omega}) para una pista; y

un sintetizador (32) dispuesto para emplear dichos valores generados y dichas estimaciones de frecuencia para sintetizar dichas componentes sinusoidales de dicha señal de audio.

3. Sistema de audio que comprende un codificador (1) de audio y un reproductor (3) de audio según la reivindicación 2.