ES2209383T3

ES2209383T3 - Procedimiento de decodificacion de una señal audio con correccion de los errores de transmision.

Info

Publication number: ES2209383T3
Application number: ES99901696T
Authority: ES
Inventors: Stephane Proust
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 1998-02-06
Filing date: 1999-02-03
Publication date: 2004-06-16
Anticipated expiration: 2019-02-03
Also published as: EP1051703B1; CA2285650C; JP2001511917A; AU2170699A; KR20010006091A; CN1133151C; WO1999040573A1; JP3565869B2; KR100395458B1; DE69911169D1; FR2774827A1; DE69911169T2; HK1027892A1; US6408267B1; AU756082B2; BRPI9904776B1; CN1263625A; EP1051703A1; FR2774827B1; BR9904776A

Abstract

Procedimiento de decodificación de un flujo binario (F) representativo de una señal audio (Sn(t)) codificada por tramas sucesivas, siendo el flujo binario recibido con una información (BFI) que indica eventuales tramas borradas, en el cual, para cada trama, se forma una señal de excitación k(n)) a partir de parámetros de excitación (EX(n)) que son recuperados en el flujo binario si la trama es válida y estimados de otra manera si la trama está borrada, y se filtra la señal de excitación por medio de un filtro de síntesis (22) para obtener una señal audio decodificada (n(t)), y en el cual se efectúa un análisis por predicción lineal sobre la base de la señal audio decodificada obtenida hasta la trama precedente para estimar por lo menos en parte un filtro de síntesis relativamente en la trama actual, siendo los filtros de síntesis sucesivamente utilizados para filtrar la señal de excitación en tanto ninguna trama está borrada conformes con los filtros de síntesis estimados, caracterizado porque, si una trama n0 está borrada, se determina por lo menos un filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama subsiguiente n0+i por una combinación ponderada del filtro de síntesis estimado relativamente en la trama n0+i y de por lo menos un filtro de síntesis que ha sido utilizado desde la trama n0.

Description

Procedimiento de decodificación de una señal audio con corrección de los errores de transmisión.

La presente invención se refiere al campo de la codificación digital de las señales audio. La misma se refiere más particularmente a un procedimiento de decodificación utilizado para reconstituir una señal audio codificada según un procedimiento que recurre a un filtro de síntesis a corto plazo con adaptación hacia atrás, o filtro "LPC backward".

Los sistemas de codificación predictiva por bloques analizan unas tramas sucesivas de muestras de la señal audio (palabra o música en general) a codificar para extraer para cada una de estas tramas un cierto número de parámetros. Estos parámetros son cuantificados para formar un flujo binario enviado por un canal de transmisión.

Según la calidad de este canal y el tipo de transporte, unas perturbaciones pueden afectar la señal transmitida y producir unos errores en el flujo binario recibido por el decodificador. Estos errores pueden intervenir de forma aislada en el flujo binario. Pero las mismas se producen muy frecuentemente por ráfagas, en particular en el caso de canales radiomóviles muy perturbados o de redes de transmisión por paquetes. Es entonces todo un paquete de bits correspondiente a una (o varias) tramas de señal el que es erróneo o no recibido.

Frecuentemente, el sistema de transmisión empleado permite detectar las tramas erróneas o defectuosas a nivel del decodificador. Se utilizan entonces unos procedimientos denominados de "recuperación de tramas borradas". Estos procedimientos permiten extrapolar al decodificador las muestras de la señal defectuosa a partir de las muestras reconstituidas en las tramas que preceden y eventualmente que siguen a las zonas borradas.

La presente invención prevé mejorar las técnicas de recuperación de tramas borradas, de manera que limiten en gran manera la degradación subjetiva de la señal percibida en el decodificador en presencia de tramas borradas. La misma se interesa más particularmente en el caso de los codificadores predictivos que utilizan, de forma permanente o intermitente, un filtro de predicción lineal calculado hacia atrás sobre la señal de síntesis, técnica generalmente denominada "analyse LPC backward" (o "análisis LPC hacia atrás") en la literatura, significando "LPC" Linear Prediction Coding (codificación por predicción lineal), y "backward" (hacia atrás) que indica que el análisis se efectúa sobre las señales que preceden a la trama actual. Esta técnica es particularmente sensible a los errores de transmisión en general y a los borrados de trama en particular.

Entre los sistemas de codificación por predicción lineal, los codificadores de tipo CELP ("Code-Excited Linear Predictive") son los más extendidos. La utilización del análisis LPC hacia atrás en un codificador CELP ha sido utilizado por primera vez en el codificador LD-CELP adoptado por la UIT-T (véase Recomendación UIT-T G.728). Este codificador ha permitido una reducción del caudal de 64 kbit/s a 16 kbit/s sin degradación de la calidad subjetiva percibida.

El análisis LPC hacia atrás consiste en efectuar el análisis LPC, no sobre la trama actual de la señal audio original, sino sobre la señal de síntesis. En realidad, este análisis se realiza sobre las muestras de la señal de síntesis de las tramas que preceden a la trama actual puesto que esta señal está disponible a la vez en el codificador (por medio de una decodificación local generalmente útil en los codificadores de análisis por síntesis) y al codificador distante. Dado que este análisis se efectúa en el codificador y en el decodificador, los coeficientes de LPC obtenidos no tienen que ser transmitidos.

Con respecto a un análisis LPC "forward" (análisis LPC hacia adelante) más clásico, en el cual la predicción lineal se refiere a la señal de entrada del codificador, y el análisis LPC hacia atrás permite por tanto disponer de más caudal, por ejemplo para enriquecer los diccionarios de excitación en el caso del CELP. El mismo autoriza además, sin aumento del caudal, un aumento considerable del orden de análisis, teniendo el filtro de síntesis LPC típicamente 50 coeficientes para el codificador LD-CELP contra 10 coeficientes para la mayor parte de los codificadores que utilizan un análisis LPC hacia adelante.

El análisis LPC hacia atrás permite por tanto, gracias a un orden de filtro LPC más elevado, modelizar mejor las señales musicales, cuyo espectro es sensiblemente más rico que las señales de palabra. Otra razón por la cual esta técnica está bien adaptada a la codificación de las señales musicales es que estas señales tienen un espectro generalmente más estacionario que las señales de palabra, lo cual mejora las características del análisis LPC hacia atrás. En contrapartida, un buen funcionamiento del análisis LPC hacia atrás exige 3 condiciones:

(i): una buena calidad de la señal de síntesis, que debe ser muy próxima a la señal original. Esto impone un caudal de codificación relativamente elevado, 13 kbit/s parece ser el límite inferior teniendo en cuenta la calidad actual de los codificadores CELP;

(ii): una trama de longitud reducida o una señal suficientemente estacionaria. Existe en efecto un retardo de una trama entre la señal analizada y la señal a codificar. La longitud de trama debe por tanto ser pequeña con respecto al tiempo de estacionariedad medio de la señal;

\newpage

(iii): pocos errores de transmisión entre el codificador y el decodificador. Desde que las señales de síntesis resultan diferentes, el codificador y el decodificador no calculan ya el mismo filtro. Unas divergencias importantes pueden entonces existir y amplificarse, incluso en ausencia de cualquier nueva perturbación.

La sensibilidad de los codificadores/decodificadores de análisis LPC hacia atrás a los errores de transmisión provienen principalmente del fenómeno recursivo siguiente: la diferencia entre la señal de síntesis generada a nivel del codificador (decodificador local) y la señal de síntesis reconstruida en el decodificador por un dispositivo de recuperación de trama borrada provoca para la trama siguiente, una diferencia entre el filtro LPC hacia atrás calculado en el decodificador y el calculado en el codificador puesto que éstos son calculados sobre estas señales diferentes. Estos filtros son utilizados a su vez para generar las señales de síntesis de la trama siguiente que serán por tanto diferentes en el codificador y en el decodificador. El fenómeno puede por tanto propagarse, amplificarse y provocar divergencias graves e irreversibles entre codificador y decodificador. Como los filtros LPC hacia atrás tienen un orden generalmente elevado (30 a 50 coeficientes), su contribución al espectro de la señal de síntesis es importante (ganancias de predicción elevadas).

Numerosos algoritmos de codificación utilizan unas técnicas de recuperación de tramas borradas. El decodificador es informado de la producción de una trama borrada de una manera o de otra (por ejemplo, en el caso de los sistemas radiomóviles, por la recepción de la información de borrado de trama que proviene del decodificador de canal que detecta unos errores de transmisión y puede corregir algunos). Los dispositivos de recuperación de tramas borradas tienen como objetivo, a partir de una o varias de las últimas tramas precedentes consideradas como válidas, extrapolar las muestras de la trama borrada. Algunos dispositivos extrapolan estas muestras por unas técnicas de sustitución de formas de onda que extraen directamente unas muestras en la señales decodificadas pasadas (véase D.J. Goodman, et al.: "Waveform Substitution Techniques for Recovering Missing Speech Segments in Packet Voice Communications", IEEE Trans. on ASSP, Vol. ASSP-34, nº 6, diciembre 1986). En el caso de decodificadores predictivos, de tipo CELP por ejemplo, se utilizan, para reemplazar las muestras de las tramas borradas, el modelo de síntesis utilizado para sintetizar las tramas válidas. El procedimiento de recuperación de las tramas borradas debe entonces proporcionar los parámetros necesarios para la síntesis, que no están disponibles para las tramas borradas (ver por ejemplo Recomendaciones UIT-T-G.723.1 y G.729). Algunos parámetros manipulados o codificados por los codificadores predictivos presentan una fuerte correlación intertramas. Es en particular el caso de los parámetros LPC, y de los parámetros de predicción a largo plazo (retardo LTP y ganancia asociada) para los sonidos vocalizados. Debido a esta correlación, es más ventajoso reutilizar los parámetros de la última trama válida para sintetizar la trama borrada más bien que utilizar unos parámetros erróneos o aleatorios.

Para el algoritmo de codificación CELP, los parámetros de la trama borrada son clásicamente obtenidos de la manera siguiente:

-: el filtro LPC se obtiene a partir de los parámetros LPC de la última trama válida o bien por simple recopia de los parámetros, o bien introduciendo una cierta amortiguación;

-: una detección vocalizada/no vocalizada permite determinar el grado de armonicidad de la señal al nivel de la trama borrada (ver recomendación UIT-T G.723.1);

-: en el caso no vocalizado, una señal de excitación es generada de forma parcialmente aleatoria, por ejemplo por edición aleatoria de una palabra de código y por recuperación de la ganancia de la excitación pasada ligeramente amortiguada (ver Recomendación UIT-T G.729), o selección aleatoria en la excitación pasada (ver Recomendación UIT-T G.728);

-: en el caso de una señal vocalizada, el retardo LTP es generalmente el calculado para la trama anterior, eventualmente con una ligera "distorsión" para evitar un sonido resonante demasiado prolongado, la ganancia LTP es tomada muy próxima a 1 o igual a 1. La señal de excitación está generalmente limitada a la predicción a largo plazo efectuada a partir de la excitación pasada.

En el caso de un sistema de codificación que utiliza un análisis LPC hacia adelante, los parámetros del filtro LPC son extrapolados de forma simple a partir de los parámetros de la trama precedente: el filtro LPC utilizado para la primera trama borrada es generalmente el filtro de la trama precedente, eventualmente amortiguado (contornos del espectro hechos ligeramente más planos, disminución de la ganancia de predicción). Esta amortiguación puede obtenerse por un coeficiente de expansión espectral aplicado a los coeficientes del filtro o, si estos coeficientes están representados por unos LSP (pares de líneas espectrales), imponiendo una separación mínima de los pares de líneas espectrales (Recomendación UIT-T G.723.1).

La técnica de expansión espectral ha sido propuesta en el caso del codificador de la Recomendación UIT-T G. 728, que utiliza un análisis LPC hacia atrás: en la primera trama borrada, un conjunto de parámetros LPC es en primer lugar calculado sobre la señal de síntesis (válida) pasada. Se aplica a este filtro un factor de expansión de 0,97, factor que es interactivamente multiplicado por 0,97 a cada nueva trama borrada. Se observará que esta técnica sólo es utilizada cuando la trama está borrada. Desde la primera trama no borrada que sigue, los parámetros LPC utilizados por el decodificador son los calculados normalmente, es decir sobre la señal de síntesis.

\newpage

En el caso de un análisis LPC hacia adelante, no hay fenómeno de memorización del error en lo que concierne a los filtros LPC, salvo cuando la cuantificación de los filtros LPC utiliza una predicción (en cuyo caso se prevén unos mecanismos que permiten la resincronización del predictor al cabo de cierto número de tramas válidas, utilizando unos factores de fuga en la predicción, o una predicción de tipo MA).

En el caso del análisis hacia atrás, el error se propaga por medio de la señal de síntesis errónea que es utilizada en el decodificador para generar los filtros LPC de las tramas válidas que siguen a la zona borrada. La mejoría de la señal de síntesis producida cuando tiene lugar la trama borrada (extrapolación de la señal de excitación y de las ganancias) es por tanto un medio para garantizar que los filtros LPC siguientes (calculados sobre la señal de síntesis precedente) serán más próximos a los calculados en el codificador.

Las condiciones (i) a (iii) evocadas anteriormente muestran que un análisis atrás puro encuentra rápidamente sus límites cuando se desea operar a unos caudales sensiblemente inferiores a 16 kbit/s. Además de la disminución de calidad de la señal de síntesis que degrada las características del filtro LPC, a menudo es necesario, para reducir el caudal, dar una longitud de trama más importante (de 10 a 30 ms). Se destaca entonces que la degradación interviene sobre todo cuando tienen lugar transiciones de espectro y más generalmente en las zonas poco estacionarias. En las zonas estacionarias y para unas señales globalmente muy estacionarias como la música, el análisis LPC hacia atrás conserva una ventaja muy clara sobre el análisis LPC hacia adelante.

A fin de conservar las ventajas del análisis hacia atrás, en particular las buenas características para la codificación de las señales musicales, prosiguiendo al mismo tiempo la reducción de caudal, han sido realizados unos sistemas de codificación de análisis LPC mixto "forward/backward", o hacia adelante/atrás, (ver S. Proust et al.: "Dual Rate Low Delay CELP Coding (8kbits/s 16 bits/s) using a Mixed Backward/Forward Adaptive LPC Prediction", Proc. of the IEEE Workshop on Speech Coding for Telecommunications, septiembre 1995, páginas 37-38; y solicitud de patente francesa n1 97 04684).

La asociación de los dos tipos de análisis LPC permite aprovechar unas ventajas de las dos técnicas: el análisis LPC hacia adelante sirve para codificar las transiciones y las zonas no estacionarias, mientras que el análisis LPC hacia atrás, de orden más elevado, sirve para codificar las zonas estacionarias.

La introducción de tramas codificadas hacia adelante entre unas tramas codificadas atrás permite además al codificador y al decodificador converger en caso de errores de transmisión, y ofrece por tanto una robustez a estos errores netamente superior a una codificación hacia atrás pura. Sin embargo, la codificación de las señales estacionarias se realiza muy mayoritariamente en el modo atrás para el cual resulta crucial el problema de los errores de transmisión.

Estos sistemas mixtos hacia adelante/atrás prevén por ejemplo unas aplicaciones multimedia sobre unas redes con recursos limitados o compartidos, o las comunicaciones radiomóviles de calidad mejorada. Para este tipo de aplicaciones, la pérdida de paquetes de bits es altamente probable, lo que penaliza a priori las técnicas sensibles a las pérdidas de tramas tal como al análisis LPC hacia atrás. La presente invención, que permite disminuir en gran manera el efecto de las tramas borradas en unos sistemas que utilizan el análisis LPC hacia atrás o el análisis LPC mixto hacia adelante/atrás, está por tanto particularmente adaptada a este tipo de aplicaciones.

Se señala también la existencia de otros tipos de sistemas de codificación audio que recurren a la vez a un análisis LPC hacia adelante y a un análisis LPC hacia atrás. El filtro de síntesis puede en particular ser una combinación (convolución de las respuestas de impulsos) de un filtro LPC hacia adelante y un filtro LPC hacia atrás (ver EP-A-0 782 128). Los coeficientes del filtro LPC hacia adelante son entonces calculados por el codificador y transmitidos en forma cuantificada, mientras que los coeficientes del filtro LPC hacia atrás son determinados conjuntamente en el codificador y el decodificador, según un proceso de análisis LPC hacia atrás efectuado como se ha explicado anteriormente después de haber sometido la señal sintetizada a un filtro inverso del filtro LPC hacia adelante.

La presente invención tiene por objetivo mejorar, en los sistemas de codificación predictiva por bloques que utilizan un análisis LPC de tipo hacia atrás o de tipo mixto hacia adelante/atrás, la calidad subjetiva de la señal de palabra restituida por el decodificador cuando, a causa de una mala calidad del canal de transmisión o a consecuencia de la pérdida o no recepción de un paquete en un sistema de transmisión por paquetes, una o varias tramas han sido borradas.

La invención propone así, en el caso de un sistema que recurre constantemente a un análisis LPC hacia atrás, un procedimiento de decodificación de un flujo binario representativo de una señal audio codificada por tramas sucesivas, siendo el flujo binario recibido con una información que indica eventuales tramas borradas,

en el cual, para cada trama, se forma una señal de excitación a partir de parámetros de excitación que son recuperados en el flujo binario si la trama es válida y estimados de otra manera si la trama está borrada, y se filtra la señal de excitación por medio de un filtro de síntesis para obtener una señal audio decodificada,

en el cual se efectúa un análisis por predicción lineal sobre la base de la señal audio decodificada obtenida hasta la trama precedente para estimar por lo menos en parte un filtro de síntesis con respecto a la trama actual, siendo los filtros de síntesis sucesivamente utilizados para filtrar la señal de excitación en tanto que ninguna trama está borrada estando de acuerdo con los filtros de síntesis estimados;

y en el cual, si una trama n_{0} es borrada, se determina por lo menos un filtro de síntesis utilizado para filtrar la señal de excitación relativa a una trama subsiguiente n_{0}+i por una combinación ponderada del filtro de síntesis estimado relativamente en la trama n_{0}+i y de por lo menos un filtro de síntesis que se ha utilizado desde la trama n_{0}.

Después de la producción de una o varias tramas borradas, y durante un cierto número de tramas, los filtros LPC hacia atrás estimados por el decodificador sobre la señal de síntesis pasada no son los que utiliza efectivamente para reconstruir la señal de síntesis. El decodificador utiliza para su síntesis un filtro LPC que depende del filtro hacia atrás así estimado, pero también de los filtros utilizados para la síntesis de una o varias tramas precedentes, desde el último filtro calculado sobre una señal de síntesis válida. Esto se realiza con la ayuda de la combinación ponderada aplicada a los filtros LPC que siguen a la trama borrada, que realiza un lisado y permite forzar una cierta estacionariedad espectral. Esta combinación puede variar en función de la distancia a la última trama válida transmitida. El lisado de la trayectoria de los filtros LPC utilizados como síntesis después de producción de una trama borrada tiene por efecto limitar en gran manera los fenómenos de divergencia y mejorar así notablemente la calidad subjetiva de la señal decodificada.

La sensibilidad de los análisis LPC hacia atrás a los errores de transmisión es principalmente debida al fenómeno de divergencia anteriormente explicado. La principal fuente de degradación es debida a la divergencia progresiva entre los filtros calculados en el decodificador distante y los frutos calculados en el decodificador local, divergencia susceptible de crear unas distorsiones catastróficas en la señal de síntesis. Es importante por tanto minimizar la diferencia (en términos de distancia espectral) entre los dos filtros calculados, y hacer de manera que esta diferencia tienda hacia 0 cuando el número de tramas sin errores que siguen a la (o las) trama(s) borrada(s) aumenta (propiedad de reconvergencia del sistema de codificación). Los filtros hacia atrás, de orden generalmente elevado, tienen una influencia capital sobre el espectro de la señal de síntesis. La convergencia de los filtros, favorecida por la invención, asegura la convergencia de las señales de síntesis. La calidad subjetiva de la señal sintetizada en presencia de tramas borradas está por tanto mejorada.

Si la trama n_{0}+1 que sigue a una trama borrada n_{0} es también una trama borrada, se determina preferentemente el filtro de síntesis utilizado para filtrar la señal de excitación relativa a la trama n_{0}+1 a partir del filtro de síntesis utilizado para filtrar la señal de excitación relativa a la trama n_{0}. Estos dos filtros pueden en particular ser idénticos. El segundo podría también ser determinado aplicando un coeficiente de expansión espectral como se ha explicado anteriormente.

En un modo de realización preferido, unos coeficientes de ponderación empleados en dicha combinación ponderada dependen del número i de tramas que separan la trama n_{0} + i de la última trama borrada n_{0}, de manera que el filtro de síntesis utilizado se aproxima progresivamente al filtro de síntesis estimado.

En particular, estando cada filtro de síntesis utilizado para filtrar la señal de excitación relativa a una trama n representada por K parámetros P^{k}(n) (1\leqk\leqK), los parámetros P^{k}(n_{0}+ i) del filtro de síntesis utilizado para filtrar la señal de excitación relativa a una trama n_{0}+ i, que siguen a i-1 tramas válidas (i\geq1) precedidas por una trama borrada n_{0}, pueden ser calculados según la combinación:

(1)P^{k} (n_{0}+i) = [1-\alpha (i)] \cdot \tilde{P}^{K} (n_{0}+i) +\alpha(i) \cdot P^{k} (n_{0})

donde \tilde{P}^{k}(n_{0}+i) designa el k-ésimo parámetro del filtro de síntesis estimado relativamente en la trama n_{0}+i, y \alpha(i) es un coeficiente ponderador positivo o nulo, que decrece con i a partir de un valor \alpha(1)=\alpha_{max} como máximo igual a 1.

El decrecimiento del coeficiente \alpha(i) permite obtener, en las primeras tramas válidas que siguen una trama borrada, un filtro de síntesis relativamente próximo al utilizado para la trama n_{0}, que ha sido generalmente determinado en buenas condiciones, y perder progresivamente la memoria de este filtro de la trama n_{0} para aproximarse al filtro estimado para la trama n_{0}+i.

Los parámetros P_{k}(n) pueden ser los coeficientes del filtro de síntesis, es decir su respuesta de impulsos. Los parámetros P_{k}(n) pueden también ser otras representaciones de estos coeficientes, tales como las utilizadas clásicamente en los codificadores de predicción lineal: coeficiente de reflexión, LAR (log-area-ratio), PARCOR (partial correlation), LSP (line spectrum pairs)...

El coeficiente \alpha(i) para i>1 puede en particular ser calculado por la recurrencia:

(2)\alpha (i) = max \{0, \alpha(i-1)- \beta \}

siendo \beta un coeficiente comprendido entre 0 y 1.

En un modo de realización preferido de la invención, los coeficientes de ponderación empleados en la combinación ponderada dependen de una estimación de un grado de estacionariedad espectral de la señal audio, de manera que, en el caso de una señal débilmente estacionaria, el filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama n_{0} + i que sigue a una trama borrada n_{0}(i \geq 1) esté más próxima al filtro de síntesis estimado que en el caso de una señal muy estacionaria.

Se adapta así la servidumbre del filtro LPC hacia atrás, y la estacionariedad espectral que induce, en función de una medición de la estacionariedad espectral real media de la señal. El lisado es aumentado (y por tanto la estacionariedad espectral) cuando la estacionariedad real de la señal es elevada, y disminuida en el caso contrario. En caso de estacionariedad espectral fuerte, los filtros hacia atrás sucesivos varían muy poco. Se puede por tanto someter en gran manera a los filtros sucesivos. Esto limita los riesgos de divergencia y asegura la estacionariedad deseada.

El grado de estacionariedad espectral de la señal audio puede ser estimada a partir de una información incluida en cada trama válida del flujo binario. En ciertos sistemas, se puede en efecto decidir destinar caudal a la transmisión de este tipo de información, permitiendo al decodificador determinar que la señal codificada es más o menos estacionaria.

Como variante, el grado de estacionariedad espectral de la señal audio puede ser estimada a partir de un análisis comparativo de los filtros de síntesis sucesivamente utilizados por el decodificador para filtrar la señal de excitación. La medición de estacionariedad espectral puede ser obtenida con la ayuda de diversos procedimientos de medición de distancias espectrales entre los filtros LPC hacia atrás sucesivamente utilizados por el decodificador (distancia de Itakura por ejemplo).

El grado de estacionariedad de la señal puede ser tenido en cuenta en un cálculo de los parámetros del filtro de síntesis efectuado de acuerdo con la relación (1) anterior. El coeficiente ponderador \alpha(i) para i > 1 es entonces una función creciente del grado de estacionariedad espectral estimado de la señal audio. El filtro utilizado por el decodificador se aproxima por tanto menos rápidamente al filtro estimado tanto cuando la estacionariedad es fuerte como cuando es débil.

En particular, cuando \alpha(i) es calculado según la relación (2), el coeficiente \beta puede ser una función decreciente del grado de estacionariedad espectral estimado de la señal audio.

Tal como se ha expuesto anteriormente, el procedimiento según la invención es aplicable a los sistemas puramente de análisis LPC hacia atrás, para los cuales el filtro de síntesis tiene una función de transferencia de la forma 1/A_{B}(z), en la que A_{B}(z) es un polinomio en z^{-1} cuyos coeficientes se obtienen por el decodificador a partir del análisis por predicción lineal que se refiere a la señal audio decodificada.

También es aplicable a unos sistemas en los cuales el análisis LPC hacia atrás es combinado con un análisis LPC hacia adelante, con una convolución de las respuestas de impulso de los filtros LPC hacia adelante y hacia atrás, de la manera descrita en EP-A-0 782 128. En este caso, el filtro de síntesis tiene una función de transferencia de la forma 1/[A_{F}(z).A_{B}(z)], en la que A_{F}(z) y A_{B}(z) son unos polinomios en z^{-1}, siendo los coeficientes del polinomio A_{F}(z) obtenidos a partir de parámetros incluidos en las tramas válidas del flujo binario, y siendo los coeficientes del polinomio A_{B}(z) obtenidos por el decodificador a partir del análisis por predicción lineal que se refiere a una señal obtenida filtrando la señal audio decodificada por un filtro de función de transferencia A_{F}(z).

En el marco de un sistema de codificación por análisis LPC mixto hacia adelante/atrás, la presente invención propone un procedimiento de decodificación de un flujo binario representativo de una señal audio codificada por tramas sucesivas, siendo el flujo binario recibido con una información que indica eventuales tramas borradas, incluyendo cada trama válida del flujo binario una información que indica qué modo de codificación ha sido aplicado para codificar la señal audio relativa en la trama entre un primer modo de codificación, en el cual la trama contiene unos parámetros espectrales, y un segundo modo de codificación,

siendo el filtro de síntesis utilizado para filtrar la señal de excitación construido a partir de estos dichos parámetros espectrales si el flujo binario indica el primer modo de codificación,

en el cual se efectúa un análisis por predicción lineal sobre la base de la señal audio decodificada obtenida hasta la trama precedente para estimar por lo menos en parte un filtro de síntesis relativamente en la trama actual, y en el cual, en tanto que ninguna trama está borrada y que el flujo binario indica el segundo modo de codificación, los filtros de síntesis sucesivamente utilizados para filtrar la señal de excitación están de acuerdo con los filtros de síntesis estimados,

y en el cual, si una trama n_{0} es borrada, el flujo binario que ha indicado el segundo modo de codificación para la precedente trama válida, siendo la trama n_{0} seguida por varias tramas válidas para las cuales el flujo binario indica el segundo modo de codificación, se determina por lo menos un filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama subsiguiente n_{0}+i por una combinación ponderada del filtro de síntesis estimado relativamente en la trama n_{0}+i y de por lo menos un filtro de síntesis que ha sido utilizado desde la trama n_{0}.

\newpage

Estas disposiciones regulan el caso de los borrados que tienen lugar en unos períodos en los que el codificador funciona en modo hacia atrás, esencialmente de la misma manera que en el caso de los sistemas puramente de codificación hacia atrás.

Los modos de realización preferidos evocados anteriormente para los sistemas puramente de codificación hacia atrás son directamente transponibles al caso de los sistemas mixtos hacia adelante/atrás.

Es interesante observar que el grado de estacionariedad espectral de la señal audio, cuando es utilizado, puede ser estimado a partir de la información presente en el flujo binario para indicar trama por trama el modo de codificación de la señal audio.

El grado de estacionariedad espectral estimado puede en particular ser deducido de un recuento de tramas tratadas según el segundo modo de codificación y de tramas tratadas según el primer modo de codificación, que pertenecen a una ventana temporal que precede a la trama actual y que tiene una duración del orden de N tramas, siendo N un entero predefinido.

Para el caso de un borrado que se produce mientras el codificador está pasando del modo hacia adelante al modo atrás, se indica que, si una trama n_{0} está borrada, el flujo binario que ha indicado el primer modo de codificación (o por otra parte el segundo modo de codificación) para la trama válida precedente, siendo la trama n_{0} + 1 seguida por lo menos por una trama válida para la cual el flujo binario indica el segundo modo de codificación, entonces se puede determinar el filtro de síntesis utilizado para filtrar la señal de excitación relativo en la trama siguiente n_{0} + 1 a partir del filtro de síntesis estimado relativamente en la trama n_{0}. El filtro utilizado para filtrar la señal de excitación relativa en la trama siguiente n_{0}+1 puede en particular ser tomado idéntico al filtro de síntesis estimado relativamente en la trama n_{0}.

Otras particularidades y ventajas de la presente invención se pondrán de manifiesto a partir de la descripción siguiente de ejemplos de realización no limitativos, con referencia a los planos anexos, en los cuales:

- la figura 1 es un esquema de principio de un codificador audio cuyo flujo binario de salida puede ser decodificado de acuerdo con la invención;

- la figura 2 es un esquema de principio de un decodificador audio que utiliza un filtro LPC hacia atrás de acuerdo con la presente invención;

- la figura 3 es un organigrama de un procedimiento de estimación de la estacionariedad espectral de la señal, aplicable en el decodificador de la figura 2; y

- la figura 4 es un organigrama del cálculo del filtro LPC hacia atrás, aplicable en el decodificador de la figura 2.

El codificador audio representado en la figura 1 es un codificador de análisis LPC mixto hacia adelante/atrás.

La señal audio a codificar S_{n}(t) es recibida en forma de tramas numéricas sucesivas indexadas por el entero n. Cada trama se compone de un número L de muestras. A título de ejemplo, la trama puede tener una duración de 10 ms, o sea L= 80 para una frecuencia de muestreado de 8 kHz.

El codificador comprende un filtro de síntesis 5, de función de transferencia 1/A(z), en la que A(z) es un polinomio en z^{-1}. Este filtro 5 es normalmente idéntico al filtro de síntesis utilizado por el decodificador asociado. El filtro 5 recibe una señal de excitación E_{n}(t) proporcionada por un módulo 6 de codificación de residuo, y forma localmente una versión \sum_{n}(t) de la señal sintética que el decodificador produce en ausencia de errores de transmisión.

La señal de excitación E_{n}(t) proporcionada por el módulo 6 está caracterizada por unos parámetros de excitación EX(n). La codificación realizada por el módulo 6 prevé hacer la señal de síntesis local \sum_{n}(t) tan próxima como sea posible a la señal de entrada S_{n}(t) en el sentido de un cierto criterio. Este criterio corresponde de forma clásica a una minimización del error de codificación \sum_{n}(t) - S_{n}(t) filtrado por un filtro de ponderación perceptual determinado a partir de los coeficientes del filtro de síntesis 5. El módulo de codificación 6 utiliza generalmente unos bloques más cortos que las tramas (subtramas). La anotación EX(n) designa aquí el conjunto de los parámetros de excitación determinados por el módulo 6 para las subtramas de la trama n.

De manera clásica, el módulo de codificación 6 puede realizar por una parte una predicción a largo plazo para determinar un retardo de predicción a largo plazo y una ganancia asociada que da cuenta de la altura tonal de la palabra, y por otra parte una secuencia de excitación residual y una ganancia asociada. La forma de la secuencia de excitación residual depende del tipo de codificador considerado. En el caso de un codificador del tipo MP-LPC, la misma corresponde a un conjunto de impulsos cuyas posiciones y/o amplitudes están cuantificadas. En el caso de un codificador del tipo CELP, la misma corresponde a una palabra de código que pertenece a un diccionario predeterminado.

El polinomio A(z), inversa de la función de transferencia del filtro de síntesis 5, es de la forma:

(3)A(z) = 1+ \sum\limits^{K}_{k=1} a^{k} (n) \cdot z ^{-k}

en la que los a^{k}(n) son los coeficientes de predicción lineal determinados para la trama n. Como se ha simbolizado por el conmutador 7 en la figura 1, son proporcionados o bien por un módulo de análisis LPC hacia adelante 10, o bien por un módulo de análisis LPC hacia atrás 12, según el valor de un bit d(n) determinado por un módulo de decisión 8 que diferencia las tramas para las cuales el análisis LPC se efectúa hacia delante (d(n)=0) de las tramas para las cuales el análisis LPC se efectúa hacia atrás (d(n)=1).

La señal a codificar S_{n}(t) es proporcionada al módulo de análisis por predicción lineal 10 que efectúa el análisis LPC hacia adelante de la señal S_{n}(t). Un módulo de memorización 11 recibe la señal S_{n}(t), y la memoriza en una ventana temporal de análisis que cubre típicamente varias tramas hasta la trama actual. El módulo 10 efectúa un cálculo de predicción lineal de orden KF (típicamente KF \approx 10) sobre esta ventana de la señal S_{n}(t), para determinar un filtro de predicción lineal cuya función de transferencia A_{F}(z) es de la forma:

(4)A_{F} (z) = 1 +\sum\limits^{KF}_{k=1} P^{k}_{F}(n) \cdot z^{-k}

en la que P^{k}_{F}(n) designa el coeficiente de predicción de orden k obtenido después del tratamiento de la trama n.

Los procedimientos de análisis por predicción lineal que pueden ser utilizados para calcular estos coeficientes P^{k}_{F}(n) son bien conocidos en la técnica de la codificación digital. Se podrá por ejemplo hacer referencia a las obras "Digital Processing of Speech Signals" de L.R. Rabiner y R.W. Shafer, Prentice-Hall Int., 1978 y "Linear Prediction of Speech" de J.D. Markel y A.H. Gray, Springer Verlag Berlin Heidelberg, 1976.

Cuando d(n)=0 (modo hacia adelante), los coeficientes P^{k}_{F} (n) calculados por el módulo 10 son proporcionados al filtro de síntesis 5, es decir que K=KF y a^{k}(n)= P^{k}_{F}(n) para 1\leq k\leq K. El módulo 10 procede también a la cuantificación del filtro LPC hacia adelante. Determina así unos parámetros de cuantificación Q(n) para cada trama para la cual d(n)=0. Pueden ser aplicados diversos procedimientos de cuantificación. Los parámetros Q(n) determinados para la trama n pueden representar directamente los coeficientes P^{k}_{F}(n) del filtro. La cuantificación puede también ser realizada sobre los coeficientes de la reflexión, los LAR (log-area-ratio), los LSP (line spectrum pairs)... Los coeficientes P^{k}_{F}(n) que son proporcionados al filtro 5 cuando d(n)=0 corresponden a los valores cuantificados.

La señal de síntesis local \sum_{n}(t) es proporcionada al módulo de análisis por predicción lineal 12 que efectúa el análisis LPC hacia atrás. Un módulo de memorización 13 recibe la señal \sum_{n}(t), y la memoriza en una ventana temporal de análisis que cubre típicamente varias tramas hasta la trama que precede a la trama actual. El módulo 12 efectúa un cálculo de predicción lineal de orden KB (típicamente KB \approx 50) sobre esta ventana de la señal de síntesis, para determinar un filtro de predicción lineal cuya función de transferencia A_{B}(z) es la forma:

(5)A_{B} (z) = 1 +\sum\limits^{KB}_{k=1} P^{k}_{B} (n) \cdot z ^{-k}

en la que P^{k}_{B}(n) designa el coeficiente de predicción de orden k obtenido después del tratamiento de la trama n-1.

Los procedimientos de predicción empleados por el módulo 12 pueden ser los mismos que los empleados por el módulo 10. Sin embargo, el módulo 12 no tiene necesidad de realizar ninguna cuantificación del filtro A_{B}(z).

Cuando d(n)=1 (modo atrás), los coeficientes P^{k}_{B} (n) calculados por el módulo 12 son proporcionados al filtro de síntesis 5, es decir que K=KB y a^{k}(n)= P^{k}_{B}(n) para 1 \leq k \leq K.

Cada uno de los módulos 10, 12 proporciona una ganancia de predicción G_{F}(n), G_{B}(n) que ha maximizado para obtener sus coeficientes de predicción respectivos P^{k}_{F} (n), P^{k}_{B} (n). El módulo de decisión 8 analiza los valores de estas ganancias G_{F}(n), G_{B}(n) de las tramas poco a poco, para decidir unos instantes en los que el codificador funcionará en modo hacia adelante y en modo atrás.

En general, cuando la ganancia G_{B}(n) de la predicción hacia atrás es relativamente elevada con respecto a la ganancia G_{F}(n) de la predicción hacia adelante, se puede suponer que la señal a codificar es más bien estacionaria. Cuando esta circunstancia se produce en un gran número de tramas consecutivas, es juicioso hacer funcionar el codificador en modo atrás, de manera que el módulo 8 toma d(n)= 1. Al contrario, en las zonas no estacionarias, toma d(n)=0. Para un procedimiento detallado de decisión hacia adelante/atrás, se hace referencia a la solicitud de patente francesa nº 97 04684.

\newpage

En la figura 1, la referencia 14 designa el multiplexador de salida del codificador, que pone en forma el flujo binario F. El flujo F incluye el bit de decisión hacia adelante/atrás d(n) para cada trama.

Cuando d(n)=0 (modo hacia adelante) la trama n del flujo F incluye los parámetros espectrales Q(n) que cuantifican los coeficientes P^{k}_{F}(n) del filtro LPC hacia adelante. El resto de la trama incluye los parámetros de excitación EX(n) determinados por el módulo 6.

Cuando d(n)=1 (modo atrás), la trama n del flujo F no contiene parámetros espectrales Q(n). Siendo el caudal binario de salida el mismo, se dispone de más bits para la codificación de la excitación residual. El módulo 6 puede por tanto enriquecer la codificación del residuo, o bien atribuyendo aún más bits a la cuantificación de algunos parámetros (retardo LTP, ganancias...) o bien aumentando el tamaño del diccionario CELP.

A título de ejemplo, el caudal binario puede ser de 11,8 kbits/s para un codificador de tipo ACELP (CELP con diccionarios algebraicos) que funcionan en banda telefónica (300 B 3400 Hz), con unas tramas de 10 ms (L=80), un análisis LPC hacia adelante de rden KF=10, un análisis LPC hacia atrás de orden KB=30, y una separación de cada trama en dos subtramas (los filtros LPC hacia adelante y hacia atrás calculados para cada trama son utilizados en el tratamiento de la segunda subtrama; en el tratamiento de la primera subtrama, se utiliza una interpolación entre estos filtros y los calculados para la trama precedente).

El decodificador, del que la figura 2 muestra el esquema de principio, recibe, además del flujo binario F, una información BFI que indica las tramas borradas.

El flujo binario de salida F del codificador es generalmente sometido a un codificador de canal que introduce la redundancia según un código que tiene unas capacidades de detección y/o de corrección de errores de transmisión. Corriente arriba del decodificador audio, un decodificador de canal asociado explota esta redundancia para detectar unos errores de transmisión y eventualmente corregir algunos de ellos. Si la transmisión de una trama es tan mala que las capacidades de corrección del decodificador de canal son insuficientes, éste activa el indicador BFI para que el decodificador audio adopte el comportamiento apropiado.

En la figura 2, la referencia 20 designa el desmultiplexador de entrada del decodificador, que suministra, para cada trama válida n del flujo binario recibido, el bit de decisión hacia adelante/atrás d(n), los parámetros de excitación EX(n) y, si d(n)=0, los parámetros espectrales Q(n).

Cuando una trama n está indicada como borrada, el decodificador considera que el modo de codificación permanece idéntico al de la última trama válida. Adopta por tanto el valor d(n) = d(n-1).

Para una trama válida en modo hacia adelante (d(n)=0 leído en el flujo F), el módulo 21 calcula los coeficientes P^{k}_{F}(n) del filtro LPC hacia adelante (1 \leq k \leq KF) a partir de los índices de cuantificación recibidos Q(n). Estando los conmutadores 23, 24 en las posiciones representadas en la figura 2, los coeficientes calculados P^{k}_{F} (n) son proporcionados al filtro de síntesis 22, cuya función de transferencia es entonces 1/A(z)=1/A_{F}(z), con A_{F}(z) dado por la relación (3).

Si d(n)=0 para una trama borrada, el decodificador continúa funcionando en modo hacia adelante, proporcionando al filtro de síntesis KF coeficientes a^{k}(n) proporcionados por un módulo de estimación 36.

En el caso de una trama n en modo atrás, (d(n)=1 leído en el flujo o conservado en caso de borrado), los coeficientes del filtro de síntesis 22 son unos coeficientes P^{k}(n) 1 \leq k \leq K = KB determinados por un módulo 25 de cálculo del filtro LPC hacia atrás, que será descrito más hacia adelante. La función de transferencia del filtro de síntesis 22 es entonces 1/A(z), con

(5)A(z) = 1 + \sum\limits^{KB}_{k=1} P^{k} (n) \cdot z^{-k}

El filtro de síntesis 22 recibe por la trama n una señal de excitación \tilde{E}_{n}(t) suministrada por un módulo 26 de síntesis de residuo de codificación LPC.

Para una trama n válida, el módulo de síntesis 26 calcula la señal de excitación \tilde{E}_{n}(t) a partir de los parámetros de excitación EX(n) leídos en el flujo, estando el conmutador 27 en la posición representada en la figura 2. En este caso, la señal de excitación \tilde{E}_{n}(t) producida por el módulo de síntesis 26 es idéntica a la señal de excitación \tilde{E}_{n}(t) suministrada para la misma trama por el módulo 6 del codificador. De la misma manera que en el codificador, el modo de cálculo de la señal de excitación depende del bit de decisión hacia adelante/atrás d(n).

La señal de salida \tilde{E}_{n}(t) del filtro 22 constituye la señal de síntesis obtenida por el decodificador. De manera clásica, esta señal de síntesis puede ser a continuación sometida a uno o varios postfiltros de puesta en forma previstos en el decodificador (no representados).

\newpage

La señal de síntesis \tilde{E}_{n}(t) es proporcionada a un módulo de análisis por predicción lineal 30 que efectúa el análisis LPC hacia atrás de la misma manera que el módulo 12 del decodificador de la figura 1, para estimar un filtro de síntesis, cuyos coeficientes \tilde{P}^{k}(n)(1 \leq k \leq KB) son suministrados al módulo de cálculo 25. Los coeficientes \tilde{P}^{k}(n) relativos a la trama n se obtienen después de tomar en cuenta la señal sintetizada hasta la trama n-1. Un módulo de memorización 31 recibe la señal \tilde{E}_{n}(t) y la memoriza sobre la misma ventana temporal de análisis que el módulo 13 de la figura 1. El módulo de análisis 30 procede entonces a los mismos cálculos que el módulo 12 sobre la base de la señal de síntesis memorizada.

En tanto no hay ninguna trama borrada, el módulo 25 suministra unos coeficientes \tilde{P}_{k}(n) iguales a los coeficientes estimados \tilde{P}^{k}(n) proporcionados por el módulo de análisis 30. Por consiguiente, en tanto no hay ninguna trama borra-
da, la señal de síntesis \tilde{E}_{n}(t) suministrada por el decodificador es exactamente idéntica a la señal de síntesis \sum_{n}(t) que ha sido determinada en el codificador, a condición desde luego de que no haya ningún bit erróneo en las tramas válidas del flujo F.

Los parámetros de excitación EX(n) recibidos por el decodificador, así como los coeficientes P^{k}_{F}(n) del filtro LPC hacia adelante si d(n)=0, son memorizados durante por lo menos una trama por unos módulos respectivos 33, 34 a fin de poder restituir unos parámetros de excitación y/o unos parámetros LPC hacia adelante si sobreviene una trama borrada. Los parámetros utilizados entonces son unas estimaciones proporcionadas por unos módulos respectivos 35, 36 sobre la base del contenido de las memorias 33, 34 cuando la información BFI indica una trama borrada. Los procedimientos de estimación utilizables por los módulos 35 y 36 pueden ser seleccionados de entre los procedimientos evocados más arriba. En particular, los parámetros de excitación pueden ser estimados por el módulo 35 teniendo en cuenta una información sobre el carácter más o menos vocalizado de la señal de síntesis \tilde{\sum}_{n}(t), proporcionada por un detector vocalizado/no vocalizado 37.

La recuperación de los coeficientes del filtro LPC hacia atrás cuando se indica una trama borrada se desprende del cálculo de los coeficientes P^{k}(n) efectuado por el módulo 25. Este cálculo depende ventajosamente de una estimación I_{stat}(n) del grado de estacionariedad de la señal audio, obtenida por un módulo 38 de estimación de estacionariedad.

Este módulo 38 puede funcionar de acuerdo con el organigrama representado en la figura 3. Según este procedimiento, el módulo 38 utiliza dos contadores cuyos valores son anotados N_{0} y N_{1}. Su relación N_{1}/N_{0} es representativa de la proporción de tramas codificadas hacia adelante sobre una ventana temporal definida por un número N, cuya duración representa del orden de N tramas de señal (típicamente N \approx 100, o sea una ventana del orden de 1 s).

El grado de estacionariedad I_{stat}(n) estimado para la trama n es una función f de los números N_{0} y N_{1}. Puede en particular ser una función binaria tal como por ejemplo:

f(N_{0}, N_{1})=1 si N_{1}>4N_{0} (señal más bien estacionaria)

f(N_{0}, N_{1})=0 si N_{1}\leq 4N_{0} (señal poco estacionaria)

Si la energía (\tilde{\sum}_{n}) de la señal de síntesis \tilde{\sum }_{n}(t) suministrada por el filtro 22 sobre la trama actual n es inferior a un umbral elegido a fin de que las tramas demasiado poco energéticas sean ignoradas (test 40), los contadores N_{0} y N_{1} no son modificados cuando tiene lugar la trama n, calculando el módulo 38 directamente el grado de estacionariedad I_{stat}(n) en la etapa 41. Si no, examina en el test 42 el modo de codificación indicado para la trama n (d(n) leído en el flujo o d(n)=d(n-1) en caso de borrado). Si d(n)=0, el contador N_{0} es incrementado en la etapa 43. Si d(n)=1 el contador N_{1} es incrementado en la etapa 44. El módulo 38 calcula a continuación el grado de estacionariedad I_{stat}(n) en la etapa 41, a menos que la suma N_{0}+N_{1} alcance el número N (test 45), en cuyo caso los valores de los dos contadores N_{0} y N_{1}son en primer lugar divididos por 2.

El procedimiento de cálculo de los coeficientes P^{K}(n) (1 \leq k \leq KB) por el módulo 25 puede estar de acuerdo con el organigrama de la figura 4. De observarse que este procedimiento es ejecutado por todas las tramas n, válidas o borradas, codificadas hacia adelante o hacia atrás. El filtro calculado depende de un coeficiente ponderador \alpha, a su vez dependiente del número de tramas transcurridas desde de la última trama borrada y de los grados de estacionariedad sucesivamente estimados. El índice de la última trama borrada que precede a la trama actual está anotado n_{0}.

Al principio del tratamiento efectuado para una trama n, el módulo 25 produce los KB coeficientes P^{k}(n) que, en el caso en que d(n)=1, son proporcionados al filtro 22 para sintetizar la señal \tilde{\sum }_{n}(n) de la trama n. Si d(n)=0, estos coeficientes P^{k}(n) son simplemente calculados y memorizados. Este cálculo se efectúa en la etapa 50 según la relación:

(6)P^{k} (n) = (1- \alpha) \cdot \tilde{P}^{k} (n) + \alpha (i) \cdot P^{k} (n_{0})

en la que los \tilde{P}^{k}(n) son los coeficientes estimados por el módulo 30 relativamente en la trama n (es decir teniendo en cuenta la señal sintetizada hasta la trama n-1), los P^{k}(n_{0}) son los coeficientes que el módulo 25 ha calculado relativamente en la última trama borrada n_{0}, y á es el coeficiente ponderador, inicializado en 0.

La relación (6) corresponde a la relación (1) cuando por lo menos una trama válida n_{0}+i sigue a la trama borrada n_{0} (i=1,2...).

Si la trama n es válida (test 51), el módulo 25 examina el bit de decisión hacia adelante/atrás d(n) leído en el flujo en la etapa 52.

Si d(n)=1, el módulo 25 calcula el nuevo valor del coeficiente \alpha de acuerdo con la relación (2) en las etapas 53 a 57, siendo el coeficiente \beta elegido como una función decreciente del grado de estacionariedad I_{stat}(n) estimado por el módulo 38 relativamente en la trama n. Si I_{stat}(n)=0 en la etapa 53 (señal poco estacionaria), el coeficiente \alpha es disminuido en una cantidad \beta=\beta_{0} en la etapa 54. Si I_{stat}(n=1) en la etapa 53 (señal más bien estacionaria), el coeficiente á es disminuido en una cantidad \beta=\beta_{1} en la etapa 55. En el caso en que el grado de estacionariedad I_{stat} (n) es determinado de forma binaria como se ha explicado anteriormente, las cantidades \beta_{0} y \beta_{1} pueden ser respectivamente iguales a 0,5 y a 0,1. En la etapa 56, el nuevo valor de \alpha es comparado a 0. El tratamiento relativo a la trama n es terminado si \alpha \geq 0. Si \alpha <0, este coeficiente \alpha es puesto a 0 en la etapa 57.

En el caso de una trama n codificada hacia adelante (d(n)=0 en la etapa 52), el coeficiente \alpha es directamente puesto a 0 en la etapa 57.

En el caso en que la trama n es borrada (test 51), el índice n de la trama actual es asignado al índice n_{0} que designa la última trama borrada, y el coeficiente \alpha es inicializado en su valor máximo \alpha_{max} en la etapa 58 (0< \alpha_{max} \leq1).

El valor máximo \alpha_{max} del coeficiente \alpha puede ser inferior a 1. Sin embargo, se elige preferentemente \alpha_{max}=1. Así, cuando una trama n_{0} es borrada, el próximo filtro P^{k}(n_{0}+1) calculado por el módulo 25 corresponde al filtro que ha calculado después de la recepción de la última trama válida. Si se suceden varias tramas borradas, el filtro calculado por el módulo 25 permanece igual al calculado después de la recepción de la última trama válida.

Si la primera trama válida recibida después de un borrado está codificada hacia adelante (d(n_{0}+1)=0, el filtro de síntesis 22 recibe los coeficientes válidos P^{k}_{F}(n_{0}+1) calculados por el módulo 21 así como una señal de excitación válida. En consecuencia, la señal sintetizada \tilde{\sum} n_{0+1}(t) es relativamente fiable, al igual que la estimación \tilde{P}^{K}(n_{0}+2) del filtro de síntesis realizada por el módulo de análisis 30. Gracias a la puesta a 0 del coeficiente \alpha en la etapa 57, esta estimación \tilde{P}^{K}(n_{0}+2) podrá ser adoptada por el módulo de cálculo 25 para la trama siguiente n_{0}+2.

Si la primera trama válida recibida después de un borrado está codificada hacia atrás (d(n_{0}+1)=1), el filtro de síntesis 22 recibe los coeficientes P^{k}(n_{0}+1) para esta trama válida. Con la elección \alpha_{max}=1, se evita completamente tomar en cuenta, en el cálculo de estos coeficientes, la estimación \tilde{P}^{k}(n_{0}+1) que ha sido determinada de manera poco fiable por el módulo 30 después del tratamiento de la señal de síntesis (\tilde{\sum}_{n0}(t) de la trama borrada n_{0}(\tilde{\sum}_{n0} (t)) ha sido obtenida por filtrado de una señal de excitación errónea).

Si las tramas siguientes n_{0}+2... permanecen codificadas hacia atrás, el filtro de síntesis utilizado será alisado con la ayuda del coeficiente \alpha cuyo valor es disminuido más o menos rápidamente según que se encuentre en una zona poco estacionaria o muy estacionaria de la señal. Al cabo de un cierto número de tramas (10 en el caso estacionario, y 2 tramas en el caso no estacionario con los valores indicados de \beta_{1} y \beta_{0}), el coeficiente \alpha resulta nulo, es decir que el filtro P^{k}(n_{0}+i) utilizado si el modo de codificación permanece hacia atrás resulta idéntico al filtro \tilde{P}^{k}(n_{0}+i) estimado por el módulo 30 a partir de la señal de síntesis.

En lo que precede, se ha descrito en detalle el ejemplo de un sistema de codificación mixto hacia adelante/atrás. La utilización de la invención es muy parecida en el caso de un codificador puramente hacia atrás:

-: el flujo de salida F no contiene el bit de decisión d(n) y los parámetros espectrales Q(n), sino solamente los parámetros de excitación EX(n);

-: las unidades funcionales 7, 8, 10 y 11 del codificador de la figura 1 no son necesarias, siendo los coeficientes P^{K}_{B}(n) calculados por el módulo 12 de análisis LPC hacia atrás que son directamente utilizados por el filtro de síntesis 5;

-: las unidades funcionales 21, 23, 24, 34 y 36 del decodificador de la figura 2 no son necesarias, siendo los coeficientes \tilde{P}^{K}(n) calculados por el módulo 25 que son directamente utilizados por el filtro de síntesis 22.

No estando ya el bit de decisión d(n) disponible a nivel del decodificador, de grado de estacionariedad I_{stat}(n), si es utilizado por el módulo de cálculo 25, debe ser calculado de otra manera. Si el flujo binario transmitido no contiene ninguna información particular que permita al decodificador estimar la estacionariedad, esta estimación puede estar fundada en un análisis comparativo de los filtros de síntesis P^{k}(n) sucesivamente calculados por el módulo 25. Si las distancias espectrales medidas entre estos filtros sucesivos continúan siendo relativamente pequeñas en una cierta ventana temporal, se puede estimar que la señal es más bien estacionaria.

Claims

1. Procedimiento de decodificación de un flujo binario (F) representativo de una señal audio (S_{n}(t)) codificada por tramas sucesivas, siendo el flujo binario recibido con una información (BFI) que indica eventuales tramas borradas,

en el cual, para cada trama, se forma una señal de excitación \tilde{\sum}^{k}(n)) a partir de parámetros de excitación (EX(n)) que son recuperados en el flujo binario si la trama es válida y estimados de otra manera si la trama está borrada, y se filtra la señal de excitación por medio de un filtro de síntesis (22) para obtener una señal audio decodificada (\tilde{\sum}_{n}(t)),

y en el cual se efectúa un análisis por predicción lineal sobre la base de la señal audio decodificada obtenida hasta la trama precedente para estimar por lo menos en parte un filtro de síntesis relativamente en la trama actual, siendo los filtros de síntesis sucesivamente utilizados para filtrar la señal de excitación en tanto ninguna trama está borrada conformes con los filtros de síntesis estimados,

caracterizado porque, si una trama n_{0} está borrada, se determina por lo menos un filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama subsiguiente n_{0}+i por una combinación ponderada del filtro de síntesis estimado relativamente en la trama n_{0}+i y de por lo menos un filtro de síntesis que ha sido utilizado desde la trama n_{0}.

2. Procedimiento según la reivindicación 1, en el cual, si la trama n_{0}+1 que sigue a una trama borrada n_{0} es también una trama borrada, se determina el filtro de síntesis utilizado para filtrar la señal de excitación relativa en la trama n_{0}+1 a partir del filtro de síntesis utilizado para filtrar la señal de excitación relativa en la trama n.

3. Procedimiento según la reivindicación 1 ó 2, en el cual unos coeficientes de ponderación (\alpha(i), 1-\alpha(i)) empleados en dicha combinación ponderada dependen del número i de tramas que separan la trama n_{0}+i de la última trama borrada n_{0} de manera que el filtro de síntesis utilizado se aproxime progresivamente al filtro de síntesis estimado.

4. Procedimiento según la reivindicación 3, en el cual cada filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama n está representado por K parámetros P^{k}(n) (1 \leq k \leq K), y en el cual los parámetros P^{k}(n_{0}+i) del filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama n_{0}+i, que siguen a i-1 tramas válidas (i\geq1) precedidas por la trama borrada n_{0}, se calculan según la combinación:

P^{K} (n_{0}+i) = [1-\alpha (i)] \cdot \tilde{P} ^{K} (n_{0}+i) + \alpha (i) \cdot P^{K} (n_{0})

en la que \tilde{K}(n_{0}+i) designa el k-ésimo parámetro del filtro de síntesis estimado relativamente en la trama n_{0}+i, y \alpha(i) es un coeficiente ponderador positivo o nulo, decreciente con i a partir de un valor \alpha(1) =\alpha_{max} como máximo igual 1.

5. Procedimiento según la reivindicación 4, en el cual \alpha_{max}=1.

6. Procedimiento según la reivindicación 4 ó 5, en el cual el coeficiente \alpha(i) para i>1 es calculado por la recurrencia \alpha(i)=max{0,\alpha(i-1)-\beta}, siendo \beta un coeficiente comprendido entre 0 y 1.

7. Procedimiento según cualquiera de las reivindicaciones 1 a 6, en el cual los coeficientes de ponderación empleados en dicha combinación ponderada dependen de una estimación de un grado de estacionariedad espectral de la señal audio (I_{stat}(n)), de manera que, en el caso de una señal débilmente estacionaria, el filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama n_{0}+i que sigue a una trama borrada n_{0}(i\geq1) esté más próxima al filtro de síntesis estimado que en el caso de una señal muy estacionaria.

8. Procedimiento según la reivindicación 7, en el cual el grado de estacionariedad espectral de la señal audio (I_{stat}(n)) es estimado a partir de una información incluida en cada trama válida del flujo binario.

9. Procedimiento según la reivindicación 7, en el cual el grado de estacionariedad espectral de la señal audio (I_{stat}(n)) es estimado a partir de un análisis comparativo de los filtros de síntesis sucesivamente utilizados para filtrar la señal de excitación.

10. Procedimiento según la reivindicación 4 y cualquiera de las reivindicaciones 7 a 9, en el cual el coeficiente ponderador \alpha(i) para i>1 es una función creciente del grado de estacionariedad espectral estimado de la señal audio (I_{stat}(n)).

11. Procedimiento según las reivindicaciones 6 y 10, en el cual el coeficiente \beta es una función decreciente del grado de estacionariedad espectral estimado de la señal audio (I_{stat}(n)).

12. Procedimiento según la reivindicación 11, en el cual el grado de estacionariedad espectral de la señal audio (I_{stat}(n)) es estimado de forma binaria, tomando el coeficiente \beta el valor 0,5 ó 0,1 según el grado de estacionariedad espectral estimado.

13. Procedimiento según cualquiera de las reivindicaciones 1 a 12, en el cual el filtro de síntesis (22) tiene una función de transferencia de la forma 1/A_{B}(z), en la que A_{B}(z) es un polinomio en z^{-1} cuyos coeficientes (P^{K}_{B}(n)) se obtienen a partir de dicho análisis por predicción lineal que se refiere a la señal audio decodificada \tilde{\sum}(_{n}(t)).

14. Procedimiento según cualquiera de las reivindicaciones 1 a 12, en el cual el filtro de síntesis (22) tiene una función de transferencia de la forma 1/[A_{F}(z) \cdot A_{B}(z)], en la que A_{F}(z) y A_{B}(z) son unos polinomios en z^{-1}, siendo los coeficientes (P^{K}_{F}(n)) del polinomio A_{F}(z) obtenidos a partir de parámetros (Q(n)) incluidos en las tramas válidas del flujo binario, y siendo los coeficientes(P^{K}_{B}(n))del polinomio A_{B}(z) obtenidos a partir de dicho análisis por predicción lineal que se refiere a una señal obtenida filtrando la señal audio decodificada \tilde{\sum}(_{n}(t)) por un filtro de función de transferencia (A_{F}(z).

15. Procedimiento de decodificación de un flujo binario (F) representativo de una señal audio (S_{n}(t)) codificado por tramas sucesivas, siendo el flujo binario recibido con una información (BFI) que indica eventuales tramas borradas, incluyendo cada trama válida del flujo binario una información (d(n)) que indica qué modo de codificación ha sido aplicado para codificar la señal audio relativa en la trama entre un primer modo de codificación, en el cual la trama contiene unos parámetros espectrales (Q(n)), y un segundo modo de codificación, en el cual la trama no contiene parámetros espectrales,

en el cual, para cada trama, se forma una señal de excitación (\tilde{\sum}^{k}(n)) a partir de parámetros de excitación (EX(n)) que son recuperados en el flujo binario si la trama es válida y estimados de otra manera si la trama está borrada, y se filtra una señal de excitación por medio de un filtro de síntesis (22) para obtener una señal audio decodificada (\tilde{\sum}_{n}(t)),

siendo el filtro de síntesis utilizado para filtrar la señal de excitación construida a partir de dichos parámetros espectrales si el flujo binario indica el primer modo de codificación,

en el cual se efectúa una análisis por proyección lineal sobre la base de la señal audio decodificada obtenida hasta la trama precedente para estimar por lo menos en parte un filtro de síntesis relativamente en la trama actual, y en el cual, en tanto que ninguna trama ha sido borrada y que el flujo binario indica el segundo modo de codificación, los filtros de síntesis sucesivamente utilizados para filtrar la señal de excitación están de acuerdo con los filtros de síntesis estimados,

caracterizado porque, si una trama n_{0} está borrada, el flujo binario que ha indicado al segundo modo de codificación para la trama válida precedente, estando la trama n_{0} seguida por varias tramas válidas para las cuales el flujo binario indica el segundo modo de codificación, se determina por lo menos un filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama subsiguiente n_{0}+i por una combinación ponderada del filtro de síntesis estimado relativamente en la trama n_{0}+i y de por lo menos un filtro de síntesis que ha sido utilizado desde la trama n_{0}.

16. Procedimiento según la reivindicación 15, en el cual, si una trama n_{0} está borrada y seguida por lo menos por una trama válida para la cual el flujo binario indica el segundo modo de codificación, se determina el filtro de síntesis utilizado para filtrar la señal de excitación relativa en la trama siguiente n_{0}+1 a partir del filtro de síntesis estimado relativamente en la trama n_{0}.

17. Procedimiento según la reivindicación 15 ó 16, en el cual, si dos tramas consecutivas n_{0} y n_{0}+1 son ambas unas tramas borradas, habiendo el flujo binario indicado el segundo modo de codificación para la precedente trama válida, se determina el filtro de síntesis utilizado para filtrar la señal de excitación relativa en la trama n_{0}+1 a partir del filtro de síntesis utilizado para filtrar la señal de excitación relativa en la trama n_{0}.

18. Procedimiento según cualquiera de las reivindicaciones 15 a 17, en el cual unos coeficientes de ponderación (\alpha(i), 1-\alpha(i)) empleados en dicha combinación ponderada dependen del número i de tramas que separan la trama n_{0}+i de la última trama borrada n_{0}, de manera que el filtro de síntesis utilizado se aproxima progresivamente al filtro de síntesis estimado.

19. Procedimiento según la reivindicación 18, en el cual cada filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama n para la cual el flujo binario indica el segundo modo de codificación está representado por K parámetros P^{k}(n) (1\leqk\leqK), y en el cual los parámetros P^{k}(n_{0}+i) del filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama n_{0}+i para la cual el flujo binario indica el segundo modo de codificación, que sigue a i-1 tramas válidas (i\geq1) precedidas por una trama borrada n_{0}, se calculan según la combinación:

P^{K} (n_{0}+i) = [1-\alpha (i)] \cdot \tilde{P}^{K} (n_{0}+i) + \alpha (i) \cdot P^{K}(n_{0})

en la que \tilde{P}^{K}(n_{0}+i) designa el k-ésimo parámetro del filtro de síntesis estimado relativamente en la trama n_{0}+i, y \alpha(i) es un coeficiente ponderador positivo o nulo, decreciente con i a partir de un valor \alpha(1)=\alpha_{max} como máximo igual a 1.

20. Procedimiento según la reivindicación 19, en el cual \alpha_{max}=1.

\newpage

21. Procedimiento según la reivindicación 19 ó 20, en la cual el coeficiente \alpha(i) para i>1 es calculado por la recurrencia \alpha(i)=max{0, \alpha(i-1)-\beta}, siendo \beta un coeficiente comprendido entre 0 y 1.

22. Procedimiento según cualquiera de las reivindicaciones 15 a 21, en el cual los coeficientes de ponderación empleados en dicha combinación ponderada dependen de una estimación (I_{stat}(n)) de un grado de estacionariedad espectral de la señal audio, de manera que, en el caso de una señal débilmente estacionaria, el filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama n_{0}+i que sigue a una trama borrada n_{0}, y para la cual el flujo binario indica el segundo modo de codificación (i\geq1), esté más próximo al filtro de síntesis estimado que en el caso de una señal muy estacionaria.

23. Procedimiento según la reivindicación 22, en el cual el grado de estacionariedad espectral de la señal audio (I_{stat}(n)) es estimado a partir de una información (d(n)) incluida en cada trama válida del flujo binario (F).

24. Procedimiento según la reivindicación 23, en el cual dicha información a partir de la cual es estimado el grado de estacionariedad espectral de la señal audio (I_{stat}(n)) es la información (d(n)) que indica el modo de codificación de la señal audio.

25. Procedimiento según la reivindicación 24, en el cual el grado de estacionariedad espectral estimado (I_{stat}(n)) es deducido de un descuento de tramas tratadas según el segundo modo de codificación y de tramas tratadas según el primer modo de codificación, que pertenecen a una ventana temporal que precede a la trama actual y que tiene una duración del orden de N tramas, siendo N un entero previamente definido.

26. Procedimiento según la reivindicación 25, en el cual el grado de estacionariedad espectral (I_{stat}(n)) es estimado de forma recursiva con la ayuda de dos contadores, uno cuyo valor N_{0} es incrementado para cada trama tratada según el primer modo de codificación, y el otro cuyo valor N_{1} es incrementado para cada trama tratada según el segundo modo de codificación, siendo los valores de los dos contadores disminuidos conjuntamente cuando la suma de estos dos valores alcanza el número N, siendo el grado de estacionariedad espectral estimado una función creciente de la relación N_{1}/N_{0}.

27. Procedimiento según la reivindicación 26, en el cual el grado de estacionariedad espectral estimado (I_{stat}(n)) es una función binaria de la relación N_{1}/N_{0}.

28. Procedimiento según la reivindicación 22, en el cual el grado de estacionariedad espectral de la señal audio (I_{stat}(n)) es estimado a partir de un análisis comparativo de los filtros de síntesis sucesivamente utilizados para filtrar la señal de excitación (\tilde{\sum}^{k}(n)).

29. Procedimiento según la reivindicación 19 y cualquiera de las reivindicaciones 22 a 28, en el cual el coeficiente ponderador \alpha(i) para i>1 es una función creciente del grado de estacionariedad espectral estimado de la señal audio (I_{stat}(n)).

30. Procedimiento según las reivindicaciones 21 y 29, en el cual el coeficiente \beta es una función decreciente del grado de estacionariedad espectral estimado de la señal audio (I_{stat}(n)).

31. Procedimiento según las reivindicaciones 27 y 30, en el cual el coeficiente \beta toma el valor 0,5 ó 0,1 según el grado de estacionariedad espectral estimado (I_{stat}(n)).

32. Procedimiento según cualquiera de las reivindicaciones 15 a 31, en el cual el filtro de síntesis utilizado cuando el flujo binario indica el segundo modo de codificación tiene una función de transferencia de la forma 1/A_{B}(z), en la que A_{-B}(z) es un polinomio en z^{-1} cuyos coeficientes ((P^{K}_{B}(n)) se obtienen a partir de dicho análisis por predicción lineal que se refiere a la señal audio decodificada (\tilde{\sum}_{n}(t))

33. Procedimiento según cualquiera de las reivindicaciones 15 a 31, en el cual el filtro de síntesis utilizado cuando el flujo binario indica el segundo modo de codificación tiene una función de transferencia de la forma 1/[A_{F}(z).A_{B}(z)], en la que A_{F}(z) y A_{F}(z) son unos polinomios en z^{-1}, siendo los coeficientes (P^{K}_{B}(n)) del polinomio A_{F}(z) obtenidos a partir de parámetros (Q(n)) incluidos en las tramas válidas de flujo binario, y siendo los coeficientes (P^{K}_{B}(n)) del polinomio A_{B}(z) obtenidos a partir de dicho análisis por predicción lineal que se refiere a una señal obtenida filtrando la señal audio decodificada (\tilde{\sum}_{n}(t)) por un filtro de función de transferencia A_{F}(z).