ES2209383T3 - Procedimiento de decodificacion de una señal audio con correccion de los errores de transmision. - Google Patents
Procedimiento de decodificacion de una señal audio con correccion de los errores de transmision.Info
- Publication number
- ES2209383T3 ES2209383T3 ES99901696T ES99901696T ES2209383T3 ES 2209383 T3 ES2209383 T3 ES 2209383T3 ES 99901696 T ES99901696 T ES 99901696T ES 99901696 T ES99901696 T ES 99901696T ES 2209383 T3 ES2209383 T3 ES 2209383T3
- Authority
- ES
- Spain
- Prior art keywords
- frame
- filter
- signal
- estimated
- synthesis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/14—Digital recording or reproducing using self-clocking codes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Abstract
Procedimiento de decodificación de un flujo binario (F) representativo de una señal audio (Sn(t)) codificada por tramas sucesivas, siendo el flujo binario recibido con una información (BFI) que indica eventuales tramas borradas, en el cual, para cada trama, se forma una señal de excitación k(n)) a partir de parámetros de excitación (EX(n)) que son recuperados en el flujo binario si la trama es válida y estimados de otra manera si la trama está borrada, y se filtra la señal de excitación por medio de un filtro de síntesis (22) para obtener una señal audio decodificada (n(t)), y en el cual se efectúa un análisis por predicción lineal sobre la base de la señal audio decodificada obtenida hasta la trama precedente para estimar por lo menos en parte un filtro de síntesis relativamente en la trama actual, siendo los filtros de síntesis sucesivamente utilizados para filtrar la señal de excitación en tanto ninguna trama está borrada conformes con los filtros de síntesis estimados, caracterizado porque, si una trama n0 está borrada, se determina por lo menos un filtro de síntesis utilizado para filtrar la señal de excitación relativa en una trama subsiguiente n0+i por una combinación ponderada del filtro de síntesis estimado relativamente en la trama n0+i y de por lo menos un filtro de síntesis que ha sido utilizado desde la trama n0.
Description
Procedimiento de decodificación de una señal
audio con corrección de los errores de transmisión.
La presente invención se refiere al campo de la
codificación digital de las señales audio. La misma se refiere más
particularmente a un procedimiento de decodificación utilizado para
reconstituir una señal audio codificada según un procedimiento que
recurre a un filtro de síntesis a corto plazo con adaptación hacia
atrás, o filtro "LPC backward".
Los sistemas de codificación predictiva por
bloques analizan unas tramas sucesivas de muestras de la señal audio
(palabra o música en general) a codificar para extraer para cada
una de estas tramas un cierto número de parámetros. Estos
parámetros son cuantificados para formar un flujo binario enviado
por un canal de transmisión.
Según la calidad de este canal y el tipo de
transporte, unas perturbaciones pueden afectar la señal transmitida
y producir unos errores en el flujo binario recibido por el
decodificador. Estos errores pueden intervenir de forma aislada en
el flujo binario. Pero las mismas se producen muy frecuentemente
por ráfagas, en particular en el caso de canales radiomóviles muy
perturbados o de redes de transmisión por paquetes. Es entonces todo
un paquete de bits correspondiente a una (o varias) tramas de señal
el que es erróneo o no recibido.
Frecuentemente, el sistema de transmisión
empleado permite detectar las tramas erróneas o defectuosas a nivel
del decodificador. Se utilizan entonces unos procedimientos
denominados de "recuperación de tramas borradas". Estos
procedimientos permiten extrapolar al decodificador las muestras de
la señal defectuosa a partir de las muestras reconstituidas en las
tramas que preceden y eventualmente que siguen a las zonas
borradas.
La presente invención prevé mejorar las técnicas
de recuperación de tramas borradas, de manera que limiten en gran
manera la degradación subjetiva de la señal percibida en el
decodificador en presencia de tramas borradas. La misma se interesa
más particularmente en el caso de los codificadores predictivos que
utilizan, de forma permanente o intermitente, un filtro de
predicción lineal calculado hacia atrás sobre la señal de síntesis,
técnica generalmente denominada "analyse LPC backward" (o
"análisis LPC hacia atrás") en la literatura, significando
"LPC" Linear Prediction Coding (codificación por predicción
lineal), y "backward" (hacia atrás) que indica que el análisis
se efectúa sobre las señales que preceden a la trama actual. Esta
técnica es particularmente sensible a los errores de transmisión en
general y a los borrados de trama en particular.
Entre los sistemas de codificación por predicción
lineal, los codificadores de tipo CELP
("Code-Excited Linear Predictive") son los más
extendidos. La utilización del análisis LPC hacia atrás en un
codificador CELP ha sido utilizado por primera vez en el
codificador LD-CELP adoptado por la
UIT-T (véase Recomendación UIT-T
G.728). Este codificador ha permitido una reducción del caudal de
64 kbit/s a 16 kbit/s sin degradación de la calidad subjetiva
percibida.
El análisis LPC hacia atrás consiste en efectuar
el análisis LPC, no sobre la trama actual de la señal audio
original, sino sobre la señal de síntesis. En realidad, este
análisis se realiza sobre las muestras de la señal de síntesis de
las tramas que preceden a la trama actual puesto que esta señal está
disponible a la vez en el codificador (por medio de una
decodificación local generalmente útil en los codificadores de
análisis por síntesis) y al codificador distante. Dado que este
análisis se efectúa en el codificador y en el decodificador, los
coeficientes de LPC obtenidos no tienen que ser transmitidos.
Con respecto a un análisis LPC "forward"
(análisis LPC hacia adelante) más clásico, en el cual la predicción
lineal se refiere a la señal de entrada del codificador, y el
análisis LPC hacia atrás permite por tanto disponer de más caudal,
por ejemplo para enriquecer los diccionarios de excitación en el
caso del CELP. El mismo autoriza además, sin aumento del caudal, un
aumento considerable del orden de análisis, teniendo el filtro de
síntesis LPC típicamente 50 coeficientes para el codificador
LD-CELP contra 10 coeficientes para la mayor parte
de los codificadores que utilizan un análisis LPC hacia
adelante.
El análisis LPC hacia atrás permite por tanto,
gracias a un orden de filtro LPC más elevado, modelizar mejor las
señales musicales, cuyo espectro es sensiblemente más rico que las
señales de palabra. Otra razón por la cual esta técnica está bien
adaptada a la codificación de las señales musicales es que estas
señales tienen un espectro generalmente más estacionario que las
señales de palabra, lo cual mejora las características del análisis
LPC hacia atrás. En contrapartida, un buen funcionamiento del
análisis LPC hacia atrás exige 3 condiciones:
- (i)
- una buena calidad de la señal de síntesis, que debe ser muy próxima a la señal original. Esto impone un caudal de codificación relativamente elevado, 13 kbit/s parece ser el límite inferior teniendo en cuenta la calidad actual de los codificadores CELP;
- (ii)
- una trama de longitud reducida o una señal suficientemente estacionaria. Existe en efecto un retardo de una trama entre la señal analizada y la señal a codificar. La longitud de trama debe por tanto ser pequeña con respecto al tiempo de estacionariedad medio de la señal;
\newpage
- (iii)
- pocos errores de transmisión entre el codificador y el decodificador. Desde que las señales de síntesis resultan diferentes, el codificador y el decodificador no calculan ya el mismo filtro. Unas divergencias importantes pueden entonces existir y amplificarse, incluso en ausencia de cualquier nueva perturbación.
La sensibilidad de los
codificadores/decodificadores de análisis LPC hacia atrás a los
errores de transmisión provienen principalmente del fenómeno
recursivo siguiente: la diferencia entre la señal de síntesis
generada a nivel del codificador (decodificador local) y la señal
de síntesis reconstruida en el decodificador por un dispositivo de
recuperación de trama borrada provoca para la trama siguiente, una
diferencia entre el filtro LPC hacia atrás calculado en el
decodificador y el calculado en el codificador puesto que éstos son
calculados sobre estas señales diferentes. Estos filtros son
utilizados a su vez para generar las señales de síntesis de la trama
siguiente que serán por tanto diferentes en el codificador y en el
decodificador. El fenómeno puede por tanto propagarse, amplificarse
y provocar divergencias graves e irreversibles entre codificador y
decodificador. Como los filtros LPC hacia atrás tienen un orden
generalmente elevado (30 a 50 coeficientes), su contribución al
espectro de la señal de síntesis es importante (ganancias de
predicción elevadas).
Numerosos algoritmos de codificación utilizan
unas técnicas de recuperación de tramas borradas. El decodificador
es informado de la producción de una trama borrada de una manera o
de otra (por ejemplo, en el caso de los sistemas radiomóviles, por
la recepción de la información de borrado de trama que proviene del
decodificador de canal que detecta unos errores de transmisión y
puede corregir algunos). Los dispositivos de recuperación de tramas
borradas tienen como objetivo, a partir de una o varias de las
últimas tramas precedentes consideradas como válidas, extrapolar
las muestras de la trama borrada. Algunos dispositivos extrapolan
estas muestras por unas técnicas de sustitución de formas de onda
que extraen directamente unas muestras en la señales decodificadas
pasadas (véase D.J. Goodman, et al.: "Waveform Substitution
Techniques for Recovering Missing Speech Segments in Packet Voice
Communications", IEEE Trans. on ASSP, Vol.
ASSP-34, nº 6, diciembre 1986). En el caso de
decodificadores predictivos, de tipo CELP por ejemplo, se utilizan,
para reemplazar las muestras de las tramas borradas, el modelo de
síntesis utilizado para sintetizar las tramas válidas. El
procedimiento de recuperación de las tramas borradas debe entonces
proporcionar los parámetros necesarios para la síntesis, que no
están disponibles para las tramas borradas (ver por ejemplo
Recomendaciones UIT-T-G.723.1 y
G.729). Algunos parámetros manipulados o codificados por los
codificadores predictivos presentan una fuerte correlación
intertramas. Es en particular el caso de los parámetros LPC, y de
los parámetros de predicción a largo plazo (retardo LTP y ganancia
asociada) para los sonidos vocalizados. Debido a esta correlación,
es más ventajoso reutilizar los parámetros de la última trama
válida para sintetizar la trama borrada más bien que utilizar unos
parámetros erróneos o aleatorios.
Para el algoritmo de codificación CELP, los
parámetros de la trama borrada son clásicamente obtenidos de la
manera siguiente:
- -
- el filtro LPC se obtiene a partir de los parámetros LPC de la última trama válida o bien por simple recopia de los parámetros, o bien introduciendo una cierta amortiguación;
- -
- una detección vocalizada/no vocalizada permite determinar el grado de armonicidad de la señal al nivel de la trama borrada (ver recomendación UIT-T G.723.1);
- -
- en el caso no vocalizado, una señal de excitación es generada de forma parcialmente aleatoria, por ejemplo por edición aleatoria de una palabra de código y por recuperación de la ganancia de la excitación pasada ligeramente amortiguada (ver Recomendación UIT-T G.729), o selección aleatoria en la excitación pasada (ver Recomendación UIT-T G.728);
- -
- en el caso de una señal vocalizada, el retardo LTP es generalmente el calculado para la trama anterior, eventualmente con una ligera "distorsión" para evitar un sonido resonante demasiado prolongado, la ganancia LTP es tomada muy próxima a 1 o igual a 1. La señal de excitación está generalmente limitada a la predicción a largo plazo efectuada a partir de la excitación pasada.
En el caso de un sistema de codificación que
utiliza un análisis LPC hacia adelante, los parámetros del filtro
LPC son extrapolados de forma simple a partir de los parámetros de
la trama precedente: el filtro LPC utilizado para la primera trama
borrada es generalmente el filtro de la trama precedente,
eventualmente amortiguado (contornos del espectro hechos ligeramente
más planos, disminución de la ganancia de predicción). Esta
amortiguación puede obtenerse por un coeficiente de expansión
espectral aplicado a los coeficientes del filtro o, si estos
coeficientes están representados por unos LSP (pares de líneas
espectrales), imponiendo una separación mínima de los pares de
líneas espectrales (Recomendación UIT-T
G.723.1).
La técnica de expansión espectral ha sido
propuesta en el caso del codificador de la Recomendación
UIT-T G. 728, que utiliza un análisis LPC hacia
atrás: en la primera trama borrada, un conjunto de parámetros LPC es
en primer lugar calculado sobre la señal de síntesis (válida)
pasada. Se aplica a este filtro un factor de expansión de 0,97,
factor que es interactivamente multiplicado por 0,97 a cada nueva
trama borrada. Se observará que esta técnica sólo es utilizada
cuando la trama está borrada. Desde la primera trama no borrada que
sigue, los parámetros LPC utilizados por el decodificador son los
calculados normalmente, es decir sobre la señal de síntesis.
\newpage
En el caso de un análisis LPC hacia adelante, no
hay fenómeno de memorización del error en lo que concierne a los
filtros LPC, salvo cuando la cuantificación de los filtros LPC
utiliza una predicción (en cuyo caso se prevén unos mecanismos que
permiten la resincronización del predictor al cabo de cierto número
de tramas válidas, utilizando unos factores de fuga en la
predicción, o una predicción de tipo MA).
En el caso del análisis hacia atrás, el error se
propaga por medio de la señal de síntesis errónea que es utilizada
en el decodificador para generar los filtros LPC de las tramas
válidas que siguen a la zona borrada. La mejoría de la señal de
síntesis producida cuando tiene lugar la trama borrada
(extrapolación de la señal de excitación y de las ganancias) es por
tanto un medio para garantizar que los filtros LPC siguientes
(calculados sobre la señal de síntesis precedente) serán más
próximos a los calculados en el codificador.
Las condiciones (i) a (iii) evocadas
anteriormente muestran que un análisis atrás puro encuentra
rápidamente sus límites cuando se desea operar a unos caudales
sensiblemente inferiores a 16 kbit/s. Además de la disminución de
calidad de la señal de síntesis que degrada las características del
filtro LPC, a menudo es necesario, para reducir el caudal, dar una
longitud de trama más importante (de 10 a 30 ms). Se destaca
entonces que la degradación interviene sobre todo cuando tienen
lugar transiciones de espectro y más generalmente en las zonas poco
estacionarias. En las zonas estacionarias y para unas señales
globalmente muy estacionarias como la música, el análisis LPC hacia
atrás conserva una ventaja muy clara sobre el análisis LPC hacia
adelante.
A fin de conservar las ventajas del análisis
hacia atrás, en particular las buenas características para la
codificación de las señales musicales, prosiguiendo al mismo tiempo
la reducción de caudal, han sido realizados unos sistemas de
codificación de análisis LPC mixto "forward/backward", o hacia
adelante/atrás, (ver S. Proust et al.: "Dual Rate Low
Delay CELP Coding (8kbits/s 16 bits/s) using a Mixed
Backward/Forward Adaptive LPC Prediction", Proc. of the IEEE
Workshop on Speech Coding for Telecommunications, septiembre 1995,
páginas 37-38; y solicitud de patente francesa n1 97
04684).
La asociación de los dos tipos de análisis LPC
permite aprovechar unas ventajas de las dos técnicas: el análisis
LPC hacia adelante sirve para codificar las transiciones y las
zonas no estacionarias, mientras que el análisis LPC hacia atrás,
de orden más elevado, sirve para codificar las zonas
estacionarias.
La introducción de tramas codificadas hacia
adelante entre unas tramas codificadas atrás permite además al
codificador y al decodificador converger en caso de errores de
transmisión, y ofrece por tanto una robustez a estos errores
netamente superior a una codificación hacia atrás pura. Sin embargo,
la codificación de las señales estacionarias se realiza muy
mayoritariamente en el modo atrás para el cual resulta crucial el
problema de los errores de transmisión.
Estos sistemas mixtos hacia adelante/atrás prevén
por ejemplo unas aplicaciones multimedia sobre unas redes con
recursos limitados o compartidos, o las comunicaciones radiomóviles
de calidad mejorada. Para este tipo de aplicaciones, la pérdida de
paquetes de bits es altamente probable, lo que penaliza a
priori las técnicas sensibles a las pérdidas de tramas tal como
al análisis LPC hacia atrás. La presente invención, que permite
disminuir en gran manera el efecto de las tramas borradas en unos
sistemas que utilizan el análisis LPC hacia atrás o el análisis LPC
mixto hacia adelante/atrás, está por tanto particularmente adaptada
a este tipo de aplicaciones.
Se señala también la existencia de otros tipos de
sistemas de codificación audio que recurren a la vez a un análisis
LPC hacia adelante y a un análisis LPC hacia atrás. El filtro de
síntesis puede en particular ser una combinación (convolución de
las respuestas de impulsos) de un filtro LPC hacia adelante y un
filtro LPC hacia atrás (ver EP-A-0
782 128). Los coeficientes del filtro LPC hacia adelante son
entonces calculados por el codificador y transmitidos en forma
cuantificada, mientras que los coeficientes del filtro LPC hacia
atrás son determinados conjuntamente en el codificador y el
decodificador, según un proceso de análisis LPC hacia atrás
efectuado como se ha explicado anteriormente después de haber
sometido la señal sintetizada a un filtro inverso del filtro LPC
hacia adelante.
La presente invención tiene por objetivo mejorar,
en los sistemas de codificación predictiva por bloques que utilizan
un análisis LPC de tipo hacia atrás o de tipo mixto hacia
adelante/atrás, la calidad subjetiva de la señal de palabra
restituida por el decodificador cuando, a causa de una mala calidad
del canal de transmisión o a consecuencia de la pérdida o no
recepción de un paquete en un sistema de transmisión por paquetes,
una o varias tramas han sido borradas.
La invención propone así, en el caso de un
sistema que recurre constantemente a un análisis LPC hacia atrás,
un procedimiento de decodificación de un flujo binario
representativo de una señal audio codificada por tramas sucesivas,
siendo el flujo binario recibido con una información que indica
eventuales tramas borradas,
en el cual, para cada trama, se forma una señal
de excitación a partir de parámetros de excitación que son
recuperados en el flujo binario si la trama es válida y estimados
de otra manera si la trama está borrada, y se filtra la señal de
excitación por medio de un filtro de síntesis para obtener una señal
audio decodificada,
en el cual se efectúa un análisis por predicción
lineal sobre la base de la señal audio decodificada obtenida hasta
la trama precedente para estimar por lo menos en parte un filtro de
síntesis con respecto a la trama actual, siendo los filtros de
síntesis sucesivamente utilizados para filtrar la señal de
excitación en tanto que ninguna trama está borrada estando de
acuerdo con los filtros de síntesis estimados;
y en el cual, si una trama n_{0} es borrada, se
determina por lo menos un filtro de síntesis utilizado para filtrar
la señal de excitación relativa a una trama subsiguiente n_{0}+i
por una combinación ponderada del filtro de síntesis estimado
relativamente en la trama n_{0}+i y de por lo menos un filtro de
síntesis que se ha utilizado desde la trama n_{0}.
Después de la producción de una o varias tramas
borradas, y durante un cierto número de tramas, los filtros LPC
hacia atrás estimados por el decodificador sobre la señal de
síntesis pasada no son los que utiliza efectivamente para
reconstruir la señal de síntesis. El decodificador utiliza para su
síntesis un filtro LPC que depende del filtro hacia atrás así
estimado, pero también de los filtros utilizados para la síntesis
de una o varias tramas precedentes, desde el último filtro calculado
sobre una señal de síntesis válida. Esto se realiza con la ayuda de
la combinación ponderada aplicada a los filtros LPC que siguen a la
trama borrada, que realiza un lisado y permite forzar una cierta
estacionariedad espectral. Esta combinación puede variar en función
de la distancia a la última trama válida transmitida. El lisado de
la trayectoria de los filtros LPC utilizados como síntesis después
de producción de una trama borrada tiene por efecto limitar en gran
manera los fenómenos de divergencia y mejorar así notablemente la
calidad subjetiva de la señal decodificada.
La sensibilidad de los análisis LPC hacia atrás a
los errores de transmisión es principalmente debida al fenómeno de
divergencia anteriormente explicado. La principal fuente de
degradación es debida a la divergencia progresiva entre los filtros
calculados en el decodificador distante y los frutos calculados en
el decodificador local, divergencia susceptible de crear unas
distorsiones catastróficas en la señal de síntesis. Es importante
por tanto minimizar la diferencia (en términos de distancia
espectral) entre los dos filtros calculados, y hacer de manera que
esta diferencia tienda hacia 0 cuando el número de tramas sin
errores que siguen a la (o las) trama(s) borrada(s)
aumenta (propiedad de reconvergencia del sistema de codificación).
Los filtros hacia atrás, de orden generalmente elevado, tienen una
influencia capital sobre el espectro de la señal de síntesis. La
convergencia de los filtros, favorecida por la invención, asegura
la convergencia de las señales de síntesis. La calidad subjetiva de
la señal sintetizada en presencia de tramas borradas está por tanto
mejorada.
Si la trama n_{0}+1 que sigue a una trama
borrada n_{0} es también una trama borrada, se determina
preferentemente el filtro de síntesis utilizado para filtrar la
señal de excitación relativa a la trama n_{0}+1 a partir del
filtro de síntesis utilizado para filtrar la señal de excitación
relativa a la trama n_{0}. Estos dos filtros pueden en particular
ser idénticos. El segundo podría también ser determinado aplicando
un coeficiente de expansión espectral como se ha explicado
anteriormente.
En un modo de realización preferido, unos
coeficientes de ponderación empleados en dicha combinación
ponderada dependen del número i de tramas que separan la trama
n_{0} + i de la última trama borrada n_{0}, de manera que el
filtro de síntesis utilizado se aproxima progresivamente al filtro
de síntesis estimado.
En particular, estando cada filtro de síntesis
utilizado para filtrar la señal de excitación relativa a una trama
n representada por K parámetros P^{k}(n)
(1\leqk\leqK), los parámetros P^{k}(n_{0}+ i) del
filtro de síntesis utilizado para filtrar la señal de excitación
relativa a una trama n_{0}+ i, que siguen a i-1
tramas válidas (i\geq1) precedidas por una trama borrada n_{0},
pueden ser calculados según la combinación:
(1)P^{k} (n_{0}+i) =
[1-\alpha (i)] \cdot \tilde{P}^{K} (n_{0}+i) +\alpha(i)
\cdot P^{k}
(n_{0})
donde \tilde{P}^{k}(n_{0}+i) designa
el k-ésimo parámetro del filtro de síntesis estimado relativamente
en la trama n_{0}+i, y \alpha(i) es un coeficiente
ponderador positivo o nulo, que decrece con i a partir de un valor
\alpha(1)=\alpha_{max} como máximo igual a
1.
El decrecimiento del coeficiente
\alpha(i) permite obtener, en las primeras tramas válidas
que siguen una trama borrada, un filtro de síntesis relativamente
próximo al utilizado para la trama n_{0}, que ha sido
generalmente determinado en buenas condiciones, y perder
progresivamente la memoria de este filtro de la trama n_{0} para
aproximarse al filtro estimado para la trama n_{0}+i.
Los parámetros P_{k}(n) pueden ser los
coeficientes del filtro de síntesis, es decir su respuesta de
impulsos. Los parámetros P_{k}(n) pueden también ser otras
representaciones de estos coeficientes, tales como las utilizadas
clásicamente en los codificadores de predicción lineal: coeficiente
de reflexión, LAR (log-area-ratio),
PARCOR (partial correlation), LSP (line spectrum pairs)...
El coeficiente \alpha(i) para i>1
puede en particular ser calculado por la recurrencia:
(2)\alpha (i) = max \{0,
\alpha(i-1)- \beta
\}
siendo \beta un coeficiente comprendido entre 0
y
1.
En un modo de realización preferido de la
invención, los coeficientes de ponderación empleados en la
combinación ponderada dependen de una estimación de un grado de
estacionariedad espectral de la señal audio, de manera que, en el
caso de una señal débilmente estacionaria, el filtro de síntesis
utilizado para filtrar la señal de excitación relativa en una trama
n_{0} + i que sigue a una trama borrada n_{0}(i \geq
1) esté más próxima al filtro de síntesis estimado que en el caso
de una señal muy estacionaria.
Se adapta así la servidumbre del filtro LPC hacia
atrás, y la estacionariedad espectral que induce, en función de una
medición de la estacionariedad espectral real media de la señal. El
lisado es aumentado (y por tanto la estacionariedad espectral)
cuando la estacionariedad real de la señal es elevada, y disminuida
en el caso contrario. En caso de estacionariedad espectral fuerte,
los filtros hacia atrás sucesivos varían muy poco. Se puede por
tanto someter en gran manera a los filtros sucesivos. Esto limita
los riesgos de divergencia y asegura la estacionariedad
deseada.
El grado de estacionariedad espectral de la señal
audio puede ser estimada a partir de una información incluida en
cada trama válida del flujo binario. En ciertos sistemas, se puede
en efecto decidir destinar caudal a la transmisión de este tipo de
información, permitiendo al decodificador determinar que la señal
codificada es más o menos estacionaria.
Como variante, el grado de estacionariedad
espectral de la señal audio puede ser estimada a partir de un
análisis comparativo de los filtros de síntesis sucesivamente
utilizados por el decodificador para filtrar la señal de
excitación. La medición de estacionariedad espectral puede ser
obtenida con la ayuda de diversos procedimientos de medición de
distancias espectrales entre los filtros LPC hacia atrás
sucesivamente utilizados por el decodificador (distancia de Itakura
por ejemplo).
El grado de estacionariedad de la señal puede ser
tenido en cuenta en un cálculo de los parámetros del filtro de
síntesis efectuado de acuerdo con la relación (1) anterior. El
coeficiente ponderador \alpha(i) para i > 1 es entonces
una función creciente del grado de estacionariedad espectral
estimado de la señal audio. El filtro utilizado por el
decodificador se aproxima por tanto menos rápidamente al filtro
estimado tanto cuando la estacionariedad es fuerte como cuando es
débil.
En particular, cuando \alpha(i) es
calculado según la relación (2), el coeficiente \beta puede ser
una función decreciente del grado de estacionariedad espectral
estimado de la señal audio.
Tal como se ha expuesto anteriormente, el
procedimiento según la invención es aplicable a los sistemas
puramente de análisis LPC hacia atrás, para los cuales el filtro de
síntesis tiene una función de transferencia de la forma
1/A_{B}(z), en la que A_{B}(z) es un polinomio en
z^{-1} cuyos coeficientes se obtienen por el decodificador a
partir del análisis por predicción lineal que se refiere a la señal
audio decodificada.
También es aplicable a unos sistemas en los
cuales el análisis LPC hacia atrás es combinado con un análisis LPC
hacia adelante, con una convolución de las respuestas de impulso de
los filtros LPC hacia adelante y hacia atrás, de la manera descrita
en EP-A-0 782 128. En este caso, el
filtro de síntesis tiene una función de transferencia de la forma
1/[A_{F}(z).A_{B}(z)], en la que
A_{F}(z) y A_{B}(z) son unos polinomios en
z^{-1}, siendo los coeficientes del polinomio A_{F}(z)
obtenidos a partir de parámetros incluidos en las tramas válidas
del flujo binario, y siendo los coeficientes del polinomio
A_{B}(z) obtenidos por el decodificador a partir del
análisis por predicción lineal que se refiere a una señal obtenida
filtrando la señal audio decodificada por un filtro de función de
transferencia A_{F}(z).
En el marco de un sistema de codificación por
análisis LPC mixto hacia adelante/atrás, la presente invención
propone un procedimiento de decodificación de un flujo binario
representativo de una señal audio codificada por tramas sucesivas,
siendo el flujo binario recibido con una información que indica
eventuales tramas borradas, incluyendo cada trama válida del flujo
binario una información que indica qué modo de codificación ha sido
aplicado para codificar la señal audio relativa en la trama entre
un primer modo de codificación, en el cual la trama contiene unos
parámetros espectrales, y un segundo modo de codificación,
en el cual, para cada trama, se forma una señal
de excitación a partir de parámetros de excitación que son
recuperados en el flujo binario si la trama es válida y estimados
de otra manera si la trama está borrada, y se filtra la señal de
excitación por medio de un filtro de síntesis para obtener una señal
audio decodificada,
siendo el filtro de síntesis utilizado para
filtrar la señal de excitación construido a partir de estos dichos
parámetros espectrales si el flujo binario indica el primer modo de
codificación,
en el cual se efectúa un análisis por predicción
lineal sobre la base de la señal audio decodificada obtenida hasta
la trama precedente para estimar por lo menos en parte un filtro de
síntesis relativamente en la trama actual, y en el cual, en tanto
que ninguna trama está borrada y que el flujo binario indica el
segundo modo de codificación, los filtros de síntesis sucesivamente
utilizados para filtrar la señal de excitación están de acuerdo con
los filtros de síntesis estimados,
y en el cual, si una trama n_{0} es borrada, el
flujo binario que ha indicado el segundo modo de codificación para
la precedente trama válida, siendo la trama n_{0} seguida por
varias tramas válidas para las cuales el flujo binario indica el
segundo modo de codificación, se determina por lo menos un filtro
de síntesis utilizado para filtrar la señal de excitación relativa
en una trama subsiguiente n_{0}+i por una combinación ponderada
del filtro de síntesis estimado relativamente en la trama n_{0}+i
y de por lo menos un filtro de síntesis que ha sido utilizado desde
la trama n_{0}.
\newpage
Estas disposiciones regulan el caso de los
borrados que tienen lugar en unos períodos en los que el
codificador funciona en modo hacia atrás, esencialmente de la misma
manera que en el caso de los sistemas puramente de codificación
hacia atrás.
Los modos de realización preferidos evocados
anteriormente para los sistemas puramente de codificación hacia
atrás son directamente transponibles al caso de los sistemas mixtos
hacia adelante/atrás.
Es interesante observar que el grado de
estacionariedad espectral de la señal audio, cuando es utilizado,
puede ser estimado a partir de la información presente en el flujo
binario para indicar trama por trama el modo de codificación de la
señal audio.
El grado de estacionariedad espectral estimado
puede en particular ser deducido de un recuento de tramas tratadas
según el segundo modo de codificación y de tramas tratadas según el
primer modo de codificación, que pertenecen a una ventana temporal
que precede a la trama actual y que tiene una duración del orden de
N tramas, siendo N un entero predefinido.
Para el caso de un borrado que se produce
mientras el codificador está pasando del modo hacia adelante al
modo atrás, se indica que, si una trama n_{0} está borrada, el
flujo binario que ha indicado el primer modo de codificación (o por
otra parte el segundo modo de codificación) para la trama válida
precedente, siendo la trama n_{0} + 1 seguida por lo menos por una
trama válida para la cual el flujo binario indica el segundo modo
de codificación, entonces se puede determinar el filtro de síntesis
utilizado para filtrar la señal de excitación relativo en la trama
siguiente n_{0} + 1 a partir del filtro de síntesis estimado
relativamente en la trama n_{0}. El filtro utilizado para filtrar
la señal de excitación relativa en la trama siguiente n_{0}+1
puede en particular ser tomado idéntico al filtro de síntesis
estimado relativamente en la trama n_{0}.
Otras particularidades y ventajas de la presente
invención se pondrán de manifiesto a partir de la descripción
siguiente de ejemplos de realización no limitativos, con referencia
a los planos anexos, en los cuales:
- la figura 1 es un esquema de principio de un
codificador audio cuyo flujo binario de salida puede ser
decodificado de acuerdo con la invención;
- la figura 2 es un esquema de principio de un
decodificador audio que utiliza un filtro LPC hacia atrás de acuerdo
con la presente invención;
- la figura 3 es un organigrama de un
procedimiento de estimación de la estacionariedad espectral de la
señal, aplicable en el decodificador de la figura 2; y
- la figura 4 es un organigrama del cálculo del
filtro LPC hacia atrás, aplicable en el decodificador de la figura
2.
El codificador audio representado en la figura 1
es un codificador de análisis LPC mixto hacia adelante/atrás.
La señal audio a codificar S_{n}(t) es
recibida en forma de tramas numéricas sucesivas indexadas por el
entero n. Cada trama se compone de un número L de muestras. A
título de ejemplo, la trama puede tener una duración de 10 ms, o
sea L= 80 para una frecuencia de muestreado de 8 kHz.
El codificador comprende un filtro de síntesis 5,
de función de transferencia 1/A(z), en la que A(z) es
un polinomio en z^{-1}. Este filtro 5 es normalmente idéntico al
filtro de síntesis utilizado por el decodificador asociado. El
filtro 5 recibe una señal de excitación E_{n}(t)
proporcionada por un módulo 6 de codificación de residuo, y forma
localmente una versión \sum_{n}(t) de la señal sintética
que el decodificador produce en ausencia de errores de
transmisión.
La señal de excitación E_{n}(t)
proporcionada por el módulo 6 está caracterizada por unos
parámetros de excitación EX(n). La codificación realizada
por el módulo 6 prevé hacer la señal de síntesis local
\sum_{n}(t) tan próxima como sea posible a la señal de
entrada S_{n}(t) en el sentido de un cierto criterio. Este
criterio corresponde de forma clásica a una minimización del error
de codificación \sum_{n}(t) - S_{n}(t) filtrado
por un filtro de ponderación perceptual determinado a partir de los
coeficientes del filtro de síntesis 5. El módulo de codificación 6
utiliza generalmente unos bloques más cortos que las tramas
(subtramas). La anotación EX(n) designa aquí el conjunto de
los parámetros de excitación determinados por el módulo 6 para las
subtramas de la trama n.
De manera clásica, el módulo de codificación 6
puede realizar por una parte una predicción a largo plazo para
determinar un retardo de predicción a largo plazo y una ganancia
asociada que da cuenta de la altura tonal de la palabra, y por otra
parte una secuencia de excitación residual y una ganancia asociada.
La forma de la secuencia de excitación residual depende del tipo de
codificador considerado. En el caso de un codificador del tipo
MP-LPC, la misma corresponde a un conjunto de
impulsos cuyas posiciones y/o amplitudes están cuantificadas. En el
caso de un codificador del tipo CELP, la misma corresponde a una
palabra de código que pertenece a un diccionario
predeterminado.
El polinomio A(z), inversa de la función
de transferencia del filtro de síntesis 5, es de la forma:
(3)A(z) = 1+
\sum\limits^{K}_{k=1} a^{k} (n) \cdot z
^{-k}
en la que los a^{k}(n) son los
coeficientes de predicción lineal determinados para la trama n.
Como se ha simbolizado por el conmutador 7 en la figura 1, son
proporcionados o bien por un módulo de análisis LPC hacia adelante
10, o bien por un módulo de análisis LPC hacia atrás 12, según el
valor de un bit d(n) determinado por un módulo de decisión 8
que diferencia las tramas para las cuales el análisis LPC se
efectúa hacia delante (d(n)=0) de las tramas para las cuales
el análisis LPC se efectúa hacia atrás
(d(n)=1).
La señal a codificar S_{n}(t) es
proporcionada al módulo de análisis por predicción lineal 10 que
efectúa el análisis LPC hacia adelante de la señal
S_{n}(t). Un módulo de memorización 11 recibe la señal
S_{n}(t), y la memoriza en una ventana temporal de
análisis que cubre típicamente varias tramas hasta la trama actual.
El módulo 10 efectúa un cálculo de predicción lineal de orden KF
(típicamente KF \approx 10) sobre esta ventana de la señal
S_{n}(t), para determinar un filtro de predicción lineal
cuya función de transferencia A_{F}(z) es de la forma:
(4)A_{F} (z) = 1
+\sum\limits^{KF}_{k=1} P^{k}_{F}(n) \cdot
z^{-k}
en la que P^{k}_{F}(n) designa el
coeficiente de predicción de orden k obtenido después del
tratamiento de la trama
n.
Los procedimientos de análisis por predicción
lineal que pueden ser utilizados para calcular estos coeficientes
P^{k}_{F}(n) son bien conocidos en la técnica de la
codificación digital. Se podrá por ejemplo hacer referencia a las
obras "Digital Processing of Speech Signals" de L.R. Rabiner y
R.W. Shafer, Prentice-Hall Int., 1978 y "Linear
Prediction of Speech" de J.D. Markel y A.H. Gray, Springer
Verlag Berlin Heidelberg, 1976.
Cuando d(n)=0 (modo hacia adelante), los
coeficientes P^{k}_{F} (n) calculados por el módulo 10 son
proporcionados al filtro de síntesis 5, es decir que K=KF y
a^{k}(n)= P^{k}_{F}(n) para 1\leq k\leq K. El
módulo 10 procede también a la cuantificación del filtro LPC hacia
adelante. Determina así unos parámetros de cuantificación
Q(n) para cada trama para la cual d(n)=0. Pueden ser
aplicados diversos procedimientos de cuantificación. Los parámetros
Q(n) determinados para la trama n pueden representar
directamente los coeficientes P^{k}_{F}(n) del filtro. La
cuantificación puede también ser realizada sobre los coeficientes
de la reflexión, los LAR
(log-area-ratio), los LSP (line
spectrum pairs)... Los coeficientes P^{k}_{F}(n) que son
proporcionados al filtro 5 cuando d(n)=0 corresponden a los
valores cuantificados.
La señal de síntesis local \sum_{n}(t)
es proporcionada al módulo de análisis por predicción lineal 12 que
efectúa el análisis LPC hacia atrás. Un módulo de memorización 13
recibe la señal \sum_{n}(t), y la memoriza en una ventana
temporal de análisis que cubre típicamente varias tramas hasta la
trama que precede a la trama actual. El módulo 12 efectúa un
cálculo de predicción lineal de orden KB (típicamente KB \approx
50) sobre esta ventana de la señal de síntesis, para determinar un
filtro de predicción lineal cuya función de transferencia
A_{B}(z) es la forma:
(5)A_{B} (z) = 1
+\sum\limits^{KB}_{k=1} P^{k}_{B} (n) \cdot z
^{-k}
en la que P^{k}_{B}(n) designa el
coeficiente de predicción de orden k obtenido después del
tratamiento de la trama
n-1.
Los procedimientos de predicción empleados por el
módulo 12 pueden ser los mismos que los empleados por el módulo 10.
Sin embargo, el módulo 12 no tiene necesidad de realizar ninguna
cuantificación del filtro A_{B}(z).
Cuando d(n)=1 (modo atrás), los
coeficientes P^{k}_{B} (n) calculados por el módulo 12 son
proporcionados al filtro de síntesis 5, es decir que K=KB y
a^{k}(n)= P^{k}_{B}(n) para 1 \leq k \leq
K.
Cada uno de los módulos 10, 12 proporciona una
ganancia de predicción G_{F}(n), G_{B}(n) que ha
maximizado para obtener sus coeficientes de predicción respectivos
P^{k}_{F} (n), P^{k}_{B} (n). El módulo de decisión 8 analiza
los valores de estas ganancias G_{F}(n), G_{B}(n)
de las tramas poco a poco, para decidir unos instantes en los que
el codificador funcionará en modo hacia adelante y en modo
atrás.
En general, cuando la ganancia G_{B}(n)
de la predicción hacia atrás es relativamente elevada con respecto
a la ganancia G_{F}(n) de la predicción hacia adelante, se
puede suponer que la señal a codificar es más bien estacionaria.
Cuando esta circunstancia se produce en un gran número de tramas
consecutivas, es juicioso hacer funcionar el codificador en modo
atrás, de manera que el módulo 8 toma d(n)= 1. Al contrario,
en las zonas no estacionarias, toma d(n)=0. Para un
procedimiento detallado de decisión hacia adelante/atrás, se hace
referencia a la solicitud de patente francesa nº 97 04684.
\newpage
En la figura 1, la referencia 14 designa el
multiplexador de salida del codificador, que pone en forma el flujo
binario F. El flujo F incluye el bit de decisión hacia
adelante/atrás d(n) para cada trama.
Cuando d(n)=0 (modo hacia adelante) la
trama n del flujo F incluye los parámetros espectrales Q(n)
que cuantifican los coeficientes P^{k}_{F}(n) del filtro
LPC hacia adelante. El resto de la trama incluye los parámetros de
excitación EX(n) determinados por el módulo 6.
Cuando d(n)=1 (modo atrás), la trama n del
flujo F no contiene parámetros espectrales Q(n). Siendo el
caudal binario de salida el mismo, se dispone de más bits para la
codificación de la excitación residual. El módulo 6 puede por tanto
enriquecer la codificación del residuo, o bien atribuyendo aún más
bits a la cuantificación de algunos parámetros (retardo LTP,
ganancias...) o bien aumentando el tamaño del diccionario CELP.
A título de ejemplo, el caudal binario puede ser
de 11,8 kbits/s para un codificador de tipo ACELP (CELP con
diccionarios algebraicos) que funcionan en banda telefónica (300 B
3400 Hz), con unas tramas de 10 ms (L=80), un análisis LPC hacia
adelante de rden KF=10, un análisis LPC hacia atrás de orden KB=30,
y una separación de cada trama en dos subtramas (los filtros LPC
hacia adelante y hacia atrás calculados para cada trama son
utilizados en el tratamiento de la segunda subtrama; en el
tratamiento de la primera subtrama, se utiliza una interpolación
entre estos filtros y los calculados para la trama precedente).
El decodificador, del que la figura 2 muestra el
esquema de principio, recibe, además del flujo binario F, una
información BFI que indica las tramas borradas.
El flujo binario de salida F del codificador es
generalmente sometido a un codificador de canal que introduce la
redundancia según un código que tiene unas capacidades de detección
y/o de corrección de errores de transmisión. Corriente arriba del
decodificador audio, un decodificador de canal asociado explota esta
redundancia para detectar unos errores de transmisión y
eventualmente corregir algunos de ellos. Si la transmisión de una
trama es tan mala que las capacidades de corrección del
decodificador de canal son insuficientes, éste activa el indicador
BFI para que el decodificador audio adopte el comportamiento
apropiado.
En la figura 2, la referencia 20 designa el
desmultiplexador de entrada del decodificador, que suministra, para
cada trama válida n del flujo binario recibido, el bit de decisión
hacia adelante/atrás d(n), los parámetros de excitación
EX(n) y, si d(n)=0, los parámetros espectrales
Q(n).
Cuando una trama n está indicada como borrada, el
decodificador considera que el modo de codificación permanece
idéntico al de la última trama válida. Adopta por tanto el valor
d(n) = d(n-1).
Para una trama válida en modo hacia adelante
(d(n)=0 leído en el flujo F), el módulo 21 calcula los
coeficientes P^{k}_{F}(n) del filtro LPC hacia adelante (1
\leq k \leq KF) a partir de los índices de cuantificación
recibidos Q(n). Estando los conmutadores 23, 24 en las
posiciones representadas en la figura 2, los coeficientes
calculados P^{k}_{F} (n) son proporcionados al filtro de síntesis
22, cuya función de transferencia es entonces
1/A(z)=1/A_{F}(z), con A_{F}(z) dado por la
relación (3).
Si d(n)=0 para una trama borrada, el
decodificador continúa funcionando en modo hacia adelante,
proporcionando al filtro de síntesis KF coeficientes
a^{k}(n) proporcionados por un módulo de estimación 36.
En el caso de una trama n en modo atrás,
(d(n)=1 leído en el flujo o conservado en caso de borrado),
los coeficientes del filtro de síntesis 22 son unos coeficientes
P^{k}(n) 1 \leq k \leq K = KB determinados por un
módulo 25 de cálculo del filtro LPC hacia atrás, que será descrito
más hacia adelante. La función de transferencia del filtro de
síntesis 22 es entonces 1/A(z), con
(5)A(z) = 1 +
\sum\limits^{KB}_{k=1} P^{k} (n) \cdot z^{-k}
El filtro de síntesis 22 recibe por la trama n
una señal de excitación \tilde{E}_{n}(t) suministrada
por un módulo 26 de síntesis de residuo de codificación LPC.
Para una trama n válida, el módulo de síntesis 26
calcula la señal de excitación \tilde{E}_{n}(t) a partir
de los parámetros de excitación EX(n) leídos en el flujo,
estando el conmutador 27 en la posición representada en la figura
2. En este caso, la señal de excitación \tilde{E}_{n}(t)
producida por el módulo de síntesis 26 es idéntica a la señal de
excitación \tilde{E}_{n}(t) suministrada para la misma
trama por el módulo 6 del codificador. De la misma manera que en el
codificador, el modo de cálculo de la señal de excitación depende
del bit de decisión hacia adelante/atrás d(n).
La señal de salida \tilde{E}_{n}(t)
del filtro 22 constituye la señal de síntesis obtenida por el
decodificador. De manera clásica, esta señal de síntesis puede ser
a continuación sometida a uno o varios postfiltros de puesta en
forma previstos en el decodificador (no representados).
\newpage
La señal de síntesis \tilde{E}_{n}(t)
es proporcionada a un módulo de análisis por predicción lineal 30
que efectúa el análisis LPC hacia atrás de la misma manera que el
módulo 12 del decodificador de la figura 1, para estimar un filtro
de síntesis, cuyos coeficientes \tilde{P}^{k}(n)(1 \leq
k \leq KB) son suministrados al módulo de cálculo 25. Los
coeficientes \tilde{P}^{k}(n) relativos a la trama n
se obtienen después de tomar en cuenta la señal sintetizada hasta la
trama n-1. Un módulo de memorización 31 recibe la
señal \tilde{E}_{n}(t) y la memoriza sobre la misma
ventana temporal de análisis que el módulo 13 de la figura 1. El
módulo de análisis 30 procede entonces a los mismos cálculos que el
módulo 12 sobre la base de la señal de síntesis memorizada.
En tanto no hay ninguna trama borrada, el módulo
25 suministra unos coeficientes \tilde{P}_{k}(n) iguales
a los coeficientes estimados \tilde{P}^{k}(n)
proporcionados por el módulo de análisis 30. Por consiguiente, en
tanto no hay ninguna trama borra-
da, la señal de síntesis \tilde{E}_{n}(t) suministrada por el decodificador es exactamente idéntica a la señal de síntesis \sum_{n}(t) que ha sido determinada en el codificador, a condición desde luego de que no haya ningún bit erróneo en las tramas válidas del flujo F.
da, la señal de síntesis \tilde{E}_{n}(t) suministrada por el decodificador es exactamente idéntica a la señal de síntesis \sum_{n}(t) que ha sido determinada en el codificador, a condición desde luego de que no haya ningún bit erróneo en las tramas válidas del flujo F.
Los parámetros de excitación EX(n)
recibidos por el decodificador, así como los coeficientes
P^{k}_{F}(n) del filtro LPC hacia adelante si
d(n)=0, son memorizados durante por lo menos una trama por
unos módulos respectivos 33, 34 a fin de poder restituir unos
parámetros de excitación y/o unos parámetros LPC hacia adelante si
sobreviene una trama borrada. Los parámetros utilizados entonces
son unas estimaciones proporcionadas por unos módulos respectivos
35, 36 sobre la base del contenido de las memorias 33, 34 cuando la
información BFI indica una trama borrada. Los procedimientos de
estimación utilizables por los módulos 35 y 36 pueden ser
seleccionados de entre los procedimientos evocados más arriba. En
particular, los parámetros de excitación pueden ser estimados por
el módulo 35 teniendo en cuenta una información sobre el carácter
más o menos vocalizado de la señal de síntesis
\tilde{\sum}_{n}(t), proporcionada por un detector
vocalizado/no vocalizado 37.
La recuperación de los coeficientes del filtro
LPC hacia atrás cuando se indica una trama borrada se desprende del
cálculo de los coeficientes P^{k}(n) efectuado por el
módulo 25. Este cálculo depende ventajosamente de una estimación
I_{stat}(n) del grado de estacionariedad de la señal audio,
obtenida por un módulo 38 de estimación de estacionariedad.
Este módulo 38 puede funcionar de acuerdo con el
organigrama representado en la figura 3. Según este procedimiento,
el módulo 38 utiliza dos contadores cuyos valores son anotados
N_{0} y N_{1}. Su relación N_{1}/N_{0} es representativa de
la proporción de tramas codificadas hacia adelante sobre una
ventana temporal definida por un número N, cuya duración representa
del orden de N tramas de señal (típicamente N \approx 100, o sea
una ventana del orden de 1 s).
El grado de estacionariedad I_{stat}(n)
estimado para la trama n es una función f de los números N_{0} y
N_{1}. Puede en particular ser una función binaria tal como por
ejemplo:
f(N_{0}, N_{1})=1 si
N_{1}>4N_{0} (señal más bien estacionaria)
f(N_{0}, N_{1})=0 si N_{1}\leq
4N_{0} (señal poco estacionaria)
Si la energía (\tilde{\sum}_{n}) de la señal
de síntesis \tilde{\sum }_{n}(t) suministrada por el
filtro 22 sobre la trama actual n es inferior a un umbral elegido a
fin de que las tramas demasiado poco energéticas sean ignoradas
(test 40), los contadores N_{0} y N_{1} no son modificados
cuando tiene lugar la trama n, calculando el módulo 38 directamente
el grado de estacionariedad I_{stat}(n) en la etapa 41. Si
no, examina en el test 42 el modo de codificación indicado para la
trama n (d(n) leído en el flujo o
d(n)=d(n-1) en caso de borrado). Si
d(n)=0, el contador N_{0} es incrementado en la etapa 43.
Si d(n)=1 el contador N_{1} es incrementado en la etapa
44. El módulo 38 calcula a continuación el grado de estacionariedad
I_{stat}(n) en la etapa 41, a menos que la suma
N_{0}+N_{1} alcance el número N (test 45), en cuyo caso los
valores de los dos contadores N_{0} y N_{1}son en primer lugar
divididos por 2.
El procedimiento de cálculo de los coeficientes
P^{K}(n) (1 \leq k \leq KB) por el módulo 25 puede
estar de acuerdo con el organigrama de la figura 4. De observarse
que este procedimiento es ejecutado por todas las tramas n, válidas
o borradas, codificadas hacia adelante o hacia atrás. El filtro
calculado depende de un coeficiente ponderador \alpha, a su vez
dependiente del número de tramas transcurridas desde de la última
trama borrada y de los grados de estacionariedad sucesivamente
estimados. El índice de la última trama borrada que precede a la
trama actual está anotado n_{0}.
Al principio del tratamiento efectuado para una
trama n, el módulo 25 produce los KB coeficientes P^{k}(n)
que, en el caso en que d(n)=1, son proporcionados al filtro
22 para sintetizar la señal \tilde{\sum }_{n}(n) de la
trama n. Si d(n)=0, estos coeficientes P^{k}(n) son
simplemente calculados y memorizados. Este cálculo se efectúa en la
etapa 50 según la relación:
(6)P^{k} (n) = (1- \alpha)
\cdot \tilde{P}^{k} (n) + \alpha (i) \cdot P^{k} (n_{0})
en la que los \tilde{P}^{k}(n) son los
coeficientes estimados por el módulo 30 relativamente en la trama n
(es decir teniendo en cuenta la señal sintetizada hasta la trama
n-1), los P^{k}(n_{0}) son los
coeficientes que el módulo 25 ha calculado relativamente en la
última trama borrada n_{0}, y á es el coeficiente ponderador,
inicializado en
0.
La relación (6) corresponde a la relación (1)
cuando por lo menos una trama válida n_{0}+i sigue a la trama
borrada n_{0} (i=1,2...).
Si la trama n es válida (test 51), el módulo 25
examina el bit de decisión hacia adelante/atrás d(n) leído
en el flujo en la etapa 52.
Si d(n)=1, el módulo 25 calcula el nuevo
valor del coeficiente \alpha de acuerdo con la relación (2) en
las etapas 53 a 57, siendo el coeficiente \beta elegido como una
función decreciente del grado de estacionariedad
I_{stat}(n) estimado por el módulo 38 relativamente en la
trama n. Si I_{stat}(n)=0 en la etapa 53 (señal poco
estacionaria), el coeficiente \alpha es disminuido en una
cantidad \beta=\beta_{0} en la etapa 54. Si
I_{stat}(n=1) en la etapa 53 (señal más bien
estacionaria), el coeficiente á es disminuido en una cantidad
\beta=\beta_{1} en la etapa 55. En el caso en que el grado de
estacionariedad I_{stat} (n) es determinado de forma binaria como
se ha explicado anteriormente, las cantidades \beta_{0} y
\beta_{1} pueden ser respectivamente iguales a 0,5 y a 0,1. En
la etapa 56, el nuevo valor de \alpha es comparado a 0. El
tratamiento relativo a la trama n es terminado si \alpha \geq
0. Si \alpha <0, este coeficiente \alpha es puesto a 0 en la
etapa 57.
En el caso de una trama n codificada hacia
adelante (d(n)=0 en la etapa 52), el coeficiente \alpha
es directamente puesto a 0 en la etapa 57.
En el caso en que la trama n es borrada (test
51), el índice n de la trama actual es asignado al índice n_{0}
que designa la última trama borrada, y el coeficiente \alpha es
inicializado en su valor máximo \alpha_{max} en la etapa 58
(0< \alpha_{max} \leq1).
El valor máximo \alpha_{max} del coeficiente
\alpha puede ser inferior a 1. Sin embargo, se elige
preferentemente \alpha_{max}=1. Así, cuando una trama n_{0}
es borrada, el próximo filtro P^{k}(n_{0}+1) calculado
por el módulo 25 corresponde al filtro que ha calculado después de
la recepción de la última trama válida. Si se suceden varias
tramas borradas, el filtro calculado por el módulo 25 permanece
igual al calculado después de la recepción de la última trama
válida.
Si la primera trama válida recibida después de un
borrado está codificada hacia adelante (d(n_{0}+1)=0, el
filtro de síntesis 22 recibe los coeficientes válidos
P^{k}_{F}(n_{0}+1) calculados por el módulo 21 así como
una señal de excitación válida. En consecuencia, la señal
sintetizada \tilde{\sum} n_{0+1}(t) es relativamente
fiable, al igual que la estimación
\tilde{P}^{K}(n_{0}+2) del filtro de síntesis realizada
por el módulo de análisis 30. Gracias a la puesta a 0 del
coeficiente \alpha en la etapa 57, esta estimación
\tilde{P}^{K}(n_{0}+2) podrá ser adoptada por el módulo
de cálculo 25 para la trama siguiente n_{0}+2.
Si la primera trama válida recibida después de un
borrado está codificada hacia atrás (d(n_{0}+1)=1), el
filtro de síntesis 22 recibe los coeficientes
P^{k}(n_{0}+1) para esta trama válida. Con la elección
\alpha_{max}=1, se evita completamente tomar en cuenta, en el
cálculo de estos coeficientes, la estimación
\tilde{P}^{k}(n_{0}+1) que ha sido determinada de
manera poco fiable por el módulo 30 después del tratamiento de la
señal de síntesis (\tilde{\sum}_{n0}(t) de la trama
borrada n_{0}(\tilde{\sum}_{n0} (t)) ha sido obtenida
por filtrado de una señal de excitación errónea).
Si las tramas siguientes n_{0}+2... permanecen
codificadas hacia atrás, el filtro de síntesis utilizado será
alisado con la ayuda del coeficiente \alpha cuyo valor es
disminuido más o menos rápidamente según que se encuentre en una
zona poco estacionaria o muy estacionaria de la señal. Al cabo de
un cierto número de tramas (10 en el caso estacionario, y 2 tramas
en el caso no estacionario con los valores indicados de
\beta_{1} y \beta_{0}), el coeficiente \alpha resulta nulo,
es decir que el filtro P^{k}(n_{0}+i) utilizado si el
modo de codificación permanece hacia atrás resulta idéntico al
filtro \tilde{P}^{k}(n_{0}+i) estimado por el módulo 30
a partir de la señal de síntesis.
En lo que precede, se ha descrito en detalle el
ejemplo de un sistema de codificación mixto hacia adelante/atrás.
La utilización de la invención es muy parecida en el caso de un
codificador puramente hacia atrás:
- -
- el flujo de salida F no contiene el bit de decisión d(n) y los parámetros espectrales Q(n), sino solamente los parámetros de excitación EX(n);
- -
- las unidades funcionales 7, 8, 10 y 11 del codificador de la figura 1 no son necesarias, siendo los coeficientes P^{K}_{B}(n) calculados por el módulo 12 de análisis LPC hacia atrás que son directamente utilizados por el filtro de síntesis 5;
- -
- las unidades funcionales 21, 23, 24, 34 y 36 del decodificador de la figura 2 no son necesarias, siendo los coeficientes \tilde{P}^{K}(n) calculados por el módulo 25 que son directamente utilizados por el filtro de síntesis 22.
No estando ya el bit de decisión d(n)
disponible a nivel del decodificador, de grado de estacionariedad
I_{stat}(n), si es utilizado por el módulo de cálculo 25,
debe ser calculado de otra manera. Si el flujo binario transmitido
no contiene ninguna información particular que permita al
decodificador estimar la estacionariedad, esta estimación puede
estar fundada en un análisis comparativo de los filtros de síntesis
P^{k}(n) sucesivamente calculados por el módulo 25. Si las
distancias espectrales medidas entre estos filtros sucesivos
continúan siendo relativamente pequeñas en una cierta ventana
temporal, se puede estimar que la señal es más bien
estacionaria.
Claims (33)
1. Procedimiento de decodificación de un flujo
binario (F) representativo de una señal audio (S_{n}(t))
codificada por tramas sucesivas, siendo el flujo binario recibido
con una información (BFI) que indica eventuales tramas
borradas,
en el cual, para cada trama, se forma una señal
de excitación \tilde{\sum}^{k}(n)) a partir de
parámetros de excitación (EX(n)) que son recuperados en el
flujo binario si la trama es válida y estimados de otra manera si
la trama está borrada, y se filtra la señal de excitación por medio
de un filtro de síntesis (22) para obtener una señal audio
decodificada (\tilde{\sum}_{n}(t)),
y en el cual se efectúa un análisis por
predicción lineal sobre la base de la señal audio decodificada
obtenida hasta la trama precedente para estimar por lo menos en
parte un filtro de síntesis relativamente en la trama actual, siendo
los filtros de síntesis sucesivamente utilizados para filtrar la
señal de excitación en tanto ninguna trama está borrada conformes
con los filtros de síntesis estimados,
caracterizado porque, si una trama n_{0}
está borrada, se determina por lo menos un filtro de síntesis
utilizado para filtrar la señal de excitación relativa en una trama
subsiguiente n_{0}+i por una combinación ponderada del filtro de
síntesis estimado relativamente en la trama n_{0}+i y de por lo
menos un filtro de síntesis que ha sido utilizado desde la trama
n_{0}.
2. Procedimiento según la reivindicación 1, en el
cual, si la trama n_{0}+1 que sigue a una trama borrada n_{0}
es también una trama borrada, se determina el filtro de síntesis
utilizado para filtrar la señal de excitación relativa en la trama
n_{0}+1 a partir del filtro de síntesis utilizado para filtrar la
señal de excitación relativa en la trama n.
3. Procedimiento según la reivindicación 1 ó 2,
en el cual unos coeficientes de ponderación (\alpha(i),
1-\alpha(i)) empleados en dicha
combinación ponderada dependen del número i de tramas que separan la
trama n_{0}+i de la última trama borrada n_{0} de manera que el
filtro de síntesis utilizado se aproxime progresivamente al filtro
de síntesis estimado.
4. Procedimiento según la reivindicación 3, en el
cual cada filtro de síntesis utilizado para filtrar la señal de
excitación relativa en una trama n está representado por K
parámetros P^{k}(n) (1 \leq k \leq K), y en el cual
los parámetros P^{k}(n_{0}+i) del filtro de síntesis
utilizado para filtrar la señal de excitación relativa en una trama
n_{0}+i, que siguen a i-1 tramas válidas
(i\geq1) precedidas por la trama borrada n_{0}, se calculan
según la combinación:
P^{K} (n_{0}+i) = [1-\alpha
(i)] \cdot \tilde{P} ^{K} (n_{0}+i) + \alpha (i) \cdot P^{K}
(n_{0})
en la que \tilde{K}(n_{0}+i) designa
el k-ésimo parámetro del filtro de síntesis estimado relativamente
en la trama n_{0}+i, y \alpha(i) es un coeficiente
ponderador positivo o nulo, decreciente con i a partir de un valor
\alpha(1) =\alpha_{max} como máximo igual
1.
5. Procedimiento según la reivindicación 4, en el
cual \alpha_{max}=1.
6. Procedimiento según la reivindicación 4 ó 5,
en el cual el coeficiente \alpha(i) para i>1 es
calculado por la recurrencia
\alpha(i)=max{0,\alpha(i-1)-\beta},
siendo \beta un coeficiente comprendido entre 0 y 1.
7. Procedimiento según cualquiera de las
reivindicaciones 1 a 6, en el cual los coeficientes de ponderación
empleados en dicha combinación ponderada dependen de una estimación
de un grado de estacionariedad espectral de la señal audio
(I_{stat}(n)), de manera que, en el caso de una señal
débilmente estacionaria, el filtro de síntesis utilizado para
filtrar la señal de excitación relativa en una trama n_{0}+i que
sigue a una trama borrada n_{0}(i\geq1) esté más
próxima al filtro de síntesis estimado que en el caso de una señal
muy estacionaria.
8. Procedimiento según la reivindicación 7, en el
cual el grado de estacionariedad espectral de la señal audio
(I_{stat}(n)) es estimado a partir de una información
incluida en cada trama válida del flujo binario.
9. Procedimiento según la reivindicación 7, en el
cual el grado de estacionariedad espectral de la señal audio
(I_{stat}(n)) es estimado a partir de un análisis
comparativo de los filtros de síntesis sucesivamente utilizados
para filtrar la señal de excitación.
10. Procedimiento según la reivindicación 4 y
cualquiera de las reivindicaciones 7 a 9, en el cual el coeficiente
ponderador \alpha(i) para i>1 es una función creciente
del grado de estacionariedad espectral estimado de la señal audio
(I_{stat}(n)).
11. Procedimiento según las reivindicaciones 6 y
10, en el cual el coeficiente \beta es una función decreciente
del grado de estacionariedad espectral estimado de la señal audio
(I_{stat}(n)).
12. Procedimiento según la reivindicación 11, en
el cual el grado de estacionariedad espectral de la señal audio
(I_{stat}(n)) es estimado de forma binaria, tomando el
coeficiente \beta el valor 0,5 ó 0,1 según el grado de
estacionariedad espectral estimado.
13. Procedimiento según cualquiera de las
reivindicaciones 1 a 12, en el cual el filtro de síntesis (22)
tiene una función de transferencia de la forma 1/A_{B}(z),
en la que A_{B}(z) es un polinomio en z^{-1} cuyos
coeficientes (P^{K}_{B}(n)) se obtienen a partir de dicho
análisis por predicción lineal que se refiere a la señal audio
decodificada \tilde{\sum}(_{n}(t)).
14. Procedimiento según cualquiera de las
reivindicaciones 1 a 12, en el cual el filtro de síntesis (22)
tiene una función de transferencia de la forma 1/[A_{F}(z)
\cdot A_{B}(z)], en la que A_{F}(z) y
A_{B}(z) son unos polinomios en z^{-1}, siendo los
coeficientes (P^{K}_{F}(n)) del polinomio
A_{F}(z) obtenidos a partir de parámetros (Q(n))
incluidos en las tramas válidas del flujo binario, y siendo los
coeficientes(P^{K}_{B}(n))del polinomio
A_{B}(z) obtenidos a partir de dicho análisis por
predicción lineal que se refiere a una señal obtenida filtrando la
señal audio decodificada \tilde{\sum}(_{n}(t))
por un filtro de función de transferencia (A_{F}(z).
15. Procedimiento de decodificación de un flujo
binario (F) representativo de una señal audio (S_{n}(t))
codificado por tramas sucesivas, siendo el flujo binario recibido
con una información (BFI) que indica eventuales tramas borradas,
incluyendo cada trama válida del flujo binario una información
(d(n)) que indica qué modo de codificación ha sido aplicado
para codificar la señal audio relativa en la trama entre un primer
modo de codificación, en el cual la trama contiene unos parámetros
espectrales (Q(n)), y un segundo modo de codificación, en el
cual la trama no contiene parámetros espectrales,
en el cual, para cada trama, se forma una señal
de excitación (\tilde{\sum}^{k}(n)) a partir de
parámetros de excitación (EX(n)) que son recuperados en el
flujo binario si la trama es válida y estimados de otra manera si
la trama está borrada, y se filtra una señal de excitación por medio
de un filtro de síntesis (22) para obtener una señal audio
decodificada (\tilde{\sum}_{n}(t)),
siendo el filtro de síntesis utilizado para
filtrar la señal de excitación construida a partir de dichos
parámetros espectrales si el flujo binario indica el primer modo de
codificación,
en el cual se efectúa una análisis por proyección
lineal sobre la base de la señal audio decodificada obtenida hasta
la trama precedente para estimar por lo menos en parte un filtro de
síntesis relativamente en la trama actual, y en el cual, en tanto
que ninguna trama ha sido borrada y que el flujo binario indica el
segundo modo de codificación, los filtros de síntesis sucesivamente
utilizados para filtrar la señal de excitación están de acuerdo con
los filtros de síntesis estimados,
caracterizado porque, si una trama n_{0}
está borrada, el flujo binario que ha indicado al segundo modo de
codificación para la trama válida precedente, estando la trama
n_{0} seguida por varias tramas válidas para las cuales el flujo
binario indica el segundo modo de codificación, se determina por lo
menos un filtro de síntesis utilizado para filtrar la señal de
excitación relativa en una trama subsiguiente n_{0}+i por una
combinación ponderada del filtro de síntesis estimado relativamente
en la trama n_{0}+i y de por lo menos un filtro de síntesis que
ha sido utilizado desde la trama n_{0}.
16. Procedimiento según la reivindicación 15, en
el cual, si una trama n_{0} está borrada y seguida por lo menos
por una trama válida para la cual el flujo binario indica el
segundo modo de codificación, se determina el filtro de síntesis
utilizado para filtrar la señal de excitación relativa en la trama
siguiente n_{0}+1 a partir del filtro de síntesis estimado
relativamente en la trama n_{0}.
17. Procedimiento según la reivindicación 15 ó
16, en el cual, si dos tramas consecutivas n_{0} y n_{0}+1 son
ambas unas tramas borradas, habiendo el flujo binario indicado el
segundo modo de codificación para la precedente trama válida, se
determina el filtro de síntesis utilizado para filtrar la señal de
excitación relativa en la trama n_{0}+1 a partir del filtro de
síntesis utilizado para filtrar la señal de excitación relativa en
la trama n_{0}.
18. Procedimiento según cualquiera de las
reivindicaciones 15 a 17, en el cual unos coeficientes de
ponderación (\alpha(i),
1-\alpha(i)) empleados en dicha
combinación ponderada dependen del número i de tramas que separan la
trama n_{0}+i de la última trama borrada n_{0}, de manera que
el filtro de síntesis utilizado se aproxima progresivamente al
filtro de síntesis estimado.
19. Procedimiento según la reivindicación 18, en
el cual cada filtro de síntesis utilizado para filtrar la señal de
excitación relativa en una trama n para la cual el flujo binario
indica el segundo modo de codificación está representado por K
parámetros P^{k}(n) (1\leqk\leqK), y en el cual los
parámetros P^{k}(n_{0}+i) del filtro de síntesis
utilizado para filtrar la señal de excitación relativa en una trama
n_{0}+i para la cual el flujo binario indica el segundo modo de
codificación, que sigue a i-1 tramas válidas
(i\geq1) precedidas por una trama borrada n_{0}, se calculan
según la combinación:
P^{K} (n_{0}+i) = [1-\alpha
(i)] \cdot \tilde{P}^{K} (n_{0}+i) + \alpha (i) \cdot
P^{K}(n_{0})
en la que \tilde{P}^{K}(n_{0}+i)
designa el k-ésimo parámetro del filtro de síntesis estimado
relativamente en la trama n_{0}+i, y \alpha(i) es un
coeficiente ponderador positivo o nulo, decreciente con i a partir
de un valor \alpha(1)=\alpha_{max} como máximo igual a
1.
20. Procedimiento según la reivindicación 19, en
el cual \alpha_{max}=1.
\newpage
21. Procedimiento según la reivindicación 19 ó
20, en la cual el coeficiente \alpha(i) para i>1 es
calculado por la recurrencia \alpha(i)=max{0,
\alpha(i-1)-\beta},
siendo \beta un coeficiente comprendido entre 0 y 1.
22. Procedimiento según cualquiera de las
reivindicaciones 15 a 21, en el cual los coeficientes de
ponderación empleados en dicha combinación ponderada dependen de
una estimación (I_{stat}(n)) de un grado de estacionariedad
espectral de la señal audio, de manera que, en el caso de una señal
débilmente estacionaria, el filtro de síntesis utilizado para
filtrar la señal de excitación relativa en una trama n_{0}+i que
sigue a una trama borrada n_{0}, y para la cual el flujo binario
indica el segundo modo de codificación (i\geq1), esté más próximo
al filtro de síntesis estimado que en el caso de una señal muy
estacionaria.
23. Procedimiento según la reivindicación 22, en
el cual el grado de estacionariedad espectral de la señal audio
(I_{stat}(n)) es estimado a partir de una información
(d(n)) incluida en cada trama válida del flujo binario
(F).
24. Procedimiento según la reivindicación 23, en
el cual dicha información a partir de la cual es estimado el grado
de estacionariedad espectral de la señal audio
(I_{stat}(n)) es la información (d(n)) que indica el
modo de codificación de la señal audio.
25. Procedimiento según la reivindicación 24, en
el cual el grado de estacionariedad espectral estimado
(I_{stat}(n)) es deducido de un descuento de tramas
tratadas según el segundo modo de codificación y de tramas tratadas
según el primer modo de codificación, que pertenecen a una ventana
temporal que precede a la trama actual y que tiene una duración del
orden de N tramas, siendo N un entero previamente definido.
26. Procedimiento según la reivindicación 25, en
el cual el grado de estacionariedad espectral
(I_{stat}(n)) es estimado de forma recursiva con la ayuda
de dos contadores, uno cuyo valor N_{0} es incrementado para cada
trama tratada según el primer modo de codificación, y el otro cuyo
valor N_{1} es incrementado para cada trama tratada según el
segundo modo de codificación, siendo los valores de los dos
contadores disminuidos conjuntamente cuando la suma de estos dos
valores alcanza el número N, siendo el grado de estacionariedad
espectral estimado una función creciente de la relación
N_{1}/N_{0}.
27. Procedimiento según la reivindicación 26, en
el cual el grado de estacionariedad espectral estimado
(I_{stat}(n)) es una función binaria de la relación
N_{1}/N_{0}.
28. Procedimiento según la reivindicación 22, en
el cual el grado de estacionariedad espectral de la señal audio
(I_{stat}(n)) es estimado a partir de un análisis
comparativo de los filtros de síntesis sucesivamente utilizados
para filtrar la señal de excitación
(\tilde{\sum}^{k}(n)).
29. Procedimiento según la reivindicación 19 y
cualquiera de las reivindicaciones 22 a 28, en el cual el
coeficiente ponderador \alpha(i) para i>1 es una
función creciente del grado de estacionariedad espectral estimado de
la señal audio (I_{stat}(n)).
30. Procedimiento según las reivindicaciones 21 y
29, en el cual el coeficiente \beta es una función decreciente
del grado de estacionariedad espectral estimado de la señal audio
(I_{stat}(n)).
31. Procedimiento según las reivindicaciones 27 y
30, en el cual el coeficiente \beta toma el valor 0,5 ó 0,1 según
el grado de estacionariedad espectral estimado
(I_{stat}(n)).
32. Procedimiento según cualquiera de las
reivindicaciones 15 a 31, en el cual el filtro de síntesis
utilizado cuando el flujo binario indica el segundo modo de
codificación tiene una función de transferencia de la forma
1/A_{B}(z), en la que A_{-B}(z) es un polinomio en
z^{-1} cuyos coeficientes ((P^{K}_{B}(n)) se obtienen a
partir de dicho análisis por predicción lineal que se refiere a la
señal audio decodificada (\tilde{\sum}_{n}(t))
33. Procedimiento según cualquiera de las
reivindicaciones 15 a 31, en el cual el filtro de síntesis
utilizado cuando el flujo binario indica el segundo modo de
codificación tiene una función de transferencia de la forma
1/[A_{F}(z).A_{B}(z)], en la que A_{F}(z)
y A_{F}(z) son unos polinomios en z^{-1}, siendo los
coeficientes (P^{K}_{B}(n)) del polinomio A_{F}(z)
obtenidos a partir de parámetros (Q(n)) incluidos en las
tramas válidas de flujo binario, y siendo los coeficientes
(P^{K}_{B}(n)) del polinomio A_{B}(z) obtenidos a
partir de dicho análisis por predicción lineal que se refiere a una
señal obtenida filtrando la señal audio decodificada
(\tilde{\sum}_{n}(t)) por un filtro de función de
transferencia A_{F}(z).
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9801441 | 1998-02-06 | ||
FR9801441A FR2774827B1 (fr) | 1998-02-06 | 1998-02-06 | Procede de decodage d'un flux binaire representatif d'un signal audio |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2209383T3 true ES2209383T3 (es) | 2004-06-16 |
Family
ID=9522700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES99901696T Expired - Lifetime ES2209383T3 (es) | 1998-02-06 | 1999-02-03 | Procedimiento de decodificacion de una señal audio con correccion de los errores de transmision. |
Country Status (13)
Country | Link |
---|---|
US (1) | US6408267B1 (es) |
EP (1) | EP1051703B1 (es) |
JP (1) | JP3565869B2 (es) |
KR (1) | KR100395458B1 (es) |
CN (1) | CN1133151C (es) |
AU (1) | AU756082B2 (es) |
BR (1) | BRPI9904776B1 (es) |
CA (1) | CA2285650C (es) |
DE (1) | DE69911169T2 (es) |
ES (1) | ES2209383T3 (es) |
FR (1) | FR2774827B1 (es) |
HK (1) | HK1027892A1 (es) |
WO (1) | WO1999040573A1 (es) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2784218B1 (fr) * | 1998-10-06 | 2000-12-08 | Thomson Csf | Procede de codage de la parole a bas debit |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
FR2830970B1 (fr) * | 2001-10-12 | 2004-01-30 | France Telecom | Procede et dispositif de synthese de trames de substitution, dans une succession de trames representant un signal de parole |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP4445328B2 (ja) * | 2004-05-24 | 2010-04-07 | パナソニック株式会社 | 音声・楽音復号化装置および音声・楽音復号化方法 |
US7706481B2 (en) * | 2004-08-20 | 2010-04-27 | Broadcom Corporation | Method and system for improving reception in wired and wireless receivers through redundancy and iterative processing |
US20060059411A1 (en) * | 2004-09-16 | 2006-03-16 | Sony Corporation And Sony Electronics, Inc. | Method and system for increasing channel coding gain |
KR100708123B1 (ko) * | 2005-02-04 | 2007-04-16 | 삼성전자주식회사 | 자동으로 오디오 볼륨을 조절하는 방법 및 장치 |
JP4606264B2 (ja) * | 2005-07-19 | 2011-01-05 | 三洋電機株式会社 | ノイズキャンセラ |
KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
CN101375330B (zh) * | 2006-08-15 | 2012-02-08 | 美国博通公司 | 丢包后解码音频信号的时间扭曲的方法 |
KR101046982B1 (ko) * | 2006-08-15 | 2011-07-07 | 브로드콤 코포레이션 | 전대역 오디오 파형의 외삽법에 기초한 부분대역 예측코딩에 대한 패킷 손실 은닉 기법 |
JP2008058667A (ja) * | 2006-08-31 | 2008-03-13 | Sony Corp | 信号処理装置および方法、記録媒体、並びにプログラム |
CN100578618C (zh) * | 2006-12-04 | 2010-01-06 | 华为技术有限公司 | 一种解码方法及装置 |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
EP2242048B1 (en) * | 2008-01-09 | 2017-06-14 | LG Electronics Inc. | Method and apparatus for identifying frame type |
CN101894565B (zh) * | 2009-05-19 | 2013-03-20 | 华为技术有限公司 | 语音信号修复方法和装置 |
US8344186B2 (en) * | 2010-02-02 | 2013-01-01 | Celanese International Corporation | Processes for producing ethanol from acetaldehyde |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
EP4095854A1 (en) * | 2014-01-15 | 2022-11-30 | Samsung Electronics Co., Ltd. | Weight function determination device and method for quantizing linear prediction coding coefficient |
CN105225666B (zh) * | 2014-06-25 | 2016-12-28 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3102015B2 (ja) * | 1990-05-28 | 2000-10-23 | 日本電気株式会社 | 音声復号化方法 |
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
FR2742568B1 (fr) | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
FR2762464B1 (fr) * | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
-
1998
- 1998-02-06 FR FR9801441A patent/FR2774827B1/fr not_active Expired - Lifetime
-
1999
- 1999-02-03 CA CA002285650A patent/CA2285650C/fr not_active Expired - Lifetime
- 1999-02-03 ES ES99901696T patent/ES2209383T3/es not_active Expired - Lifetime
- 1999-02-03 US US09/402,529 patent/US6408267B1/en not_active Expired - Lifetime
- 1999-02-03 JP JP54008199A patent/JP3565869B2/ja not_active Expired - Lifetime
- 1999-02-03 KR KR10-1999-7009169A patent/KR100395458B1/ko not_active IP Right Cessation
- 1999-02-03 DE DE69911169T patent/DE69911169T2/de not_active Expired - Lifetime
- 1999-02-03 WO PCT/FR1999/000221 patent/WO1999040573A1/fr active IP Right Grant
- 1999-02-03 BR BRPI9904776-4A patent/BRPI9904776B1/pt active IP Right Grant
- 1999-02-03 CN CN998004812A patent/CN1133151C/zh not_active Expired - Lifetime
- 1999-02-03 EP EP99901696A patent/EP1051703B1/fr not_active Expired - Lifetime
- 1999-02-03 AU AU21706/99A patent/AU756082B2/en not_active Expired
-
2000
- 2000-11-08 HK HK00107084A patent/HK1027892A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP1051703B1 (fr) | 2003-09-10 |
CA2285650C (fr) | 2003-09-16 |
JP2001511917A (ja) | 2001-08-14 |
AU2170699A (en) | 1999-08-23 |
KR20010006091A (ko) | 2001-01-15 |
CN1133151C (zh) | 2003-12-31 |
WO1999040573A1 (fr) | 1999-08-12 |
JP3565869B2 (ja) | 2004-09-15 |
KR100395458B1 (ko) | 2003-08-25 |
DE69911169D1 (de) | 2003-10-16 |
FR2774827A1 (fr) | 1999-08-13 |
DE69911169T2 (de) | 2004-06-17 |
HK1027892A1 (en) | 2001-01-23 |
US6408267B1 (en) | 2002-06-18 |
AU756082B2 (en) | 2003-01-02 |
BRPI9904776B1 (pt) | 2015-07-14 |
CN1263625A (zh) | 2000-08-16 |
EP1051703A1 (fr) | 2000-11-15 |
FR2774827B1 (fr) | 2000-04-14 |
BR9904776A (pt) | 2000-03-08 |
CA2285650A1 (fr) | 1999-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2209383T3 (es) | Procedimiento de decodificacion de una señal audio con correccion de los errores de transmision. | |
ES2298261T3 (es) | Disimulacion de errores de transmision en una señal de audio. | |
JP4199281B2 (ja) | Tdma無線システムにおけるソフト誤り補正 | |
ES2387943T3 (es) | Ocultación de error de transmisión en una señal de audio digital en una estructura de decodificación jerárquica | |
ES2266281T3 (es) | Metodo y sistema para ocultacion de error en tramas de voz en la decodificacion de voz. | |
EP2026330B1 (en) | Device and method for lost frame concealment | |
JP3155952B2 (ja) | 音声復号装置 | |
US20090043569A1 (en) | Pitch prediction for use by a speech decoder to conceal packet loss | |
CN104781876A (zh) | 音频编码装置、音频编码方法和音频编码程序以及音频解码装置、音频解码方法和音频解码程序 | |
US20080140392A1 (en) | Codec mode decoding method and apparatus for adaptive multi-rate system | |
US8078457B2 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
ES2378972T3 (es) | Atenuación de la sobresonorización, en particular para la generación de una excitación en un decodificador, en ausencia de información | |
CN101166071A (zh) | 差错帧隐藏装置与方法 | |
CN103456307B (zh) | 音频解码器中帧差错隐藏的谱代替方法及系统 | |
KR20070059860A (ko) | 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치 | |
ES2286714T3 (es) | Ocultacion de errores en sistemas multicanales de audio. | |
JP3265339B2 (ja) | 音声復号化装置 | |
KR20090083585A (ko) | 이동통신 시스템의 복호 장치 및 방법 | |
Fingscheidt et al. | Robust GSM speech decoding using the channel decoder's soft output. | |
JPH0612095A (ja) | 音声復号化方法 | |
JP3583550B2 (ja) | 補間装置 | |
KR20070091512A (ko) | 복호화된 오디오 신호의 오류 은폐 방법 및 장치 | |
JPH07202956A (ja) | 最小コストインデックスレジスタを有すデジタル受信機 | |
KR100585829B1 (ko) | 음성 부호화기의 오류 제어 방법 | |
MXPA99009122A (es) | Metodo para descodificar una señal de audio con correccion de errores de transmision |