ES2262323T3 - Metodo y aparato de ocultacion de paquetes retrasados. - Google Patents
Metodo y aparato de ocultacion de paquetes retrasados.Info
- Publication number
- ES2262323T3 ES2262323T3 ES99927021T ES99927021T ES2262323T3 ES 2262323 T3 ES2262323 T3 ES 2262323T3 ES 99927021 T ES99927021 T ES 99927021T ES 99927021 T ES99927021 T ES 99927021T ES 2262323 T3 ES2262323 T3 ES 2262323T3
- Authority
- ES
- Spain
- Prior art keywords
- decoder
- delayed
- initial state
- parameters
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0045—Arrangements at the receiver end
- H04L1/0047—Decoding adapted to other signal detection operation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/64—Hybrid switching systems
- H04L12/6418—Hybrid transport
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/64—Hybrid switching systems
- H04L12/6418—Hybrid transport
- H04L2012/6481—Speech, voice
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un método de ocultación de paquetes retrasados en una red de paquetes que usa los parámetros de la trama retrasada para mejorar la ocultación de los paquetes retrasados, caracterizado por realizar los siguientes pasos cuando se retrasa un paquete: guardar una copia del estado inicial del decodificador que existe después de decodificar el último paquete no retrasado (S8); decodificar y disimular el paquete retrasado usando los parámetros de trama predichos y dicho estado inicial del decodificador, produciendo por ello un estado inicial del decodificador erróneo (S4, S5); decodificar usando los parámetros de trama actualizados de dicho paquete retrasado y dicho estado inicial del decodificador guardado, produciendo por ello un estado inicial del decodificador corregido (S11); decodificar usando un conjunto de parámetros de trama y dicho estado inicial erróneo del decodificador, produciendo por ello una primera señal de salida y además un estado inicial del decodificador erróneo (S12); decodificar usando dicho conjunto de parámetros de trama y dicho estado inicial del decodificador corregido, produciendo por ello una segunda señal de salida (S13); y combinar dichas primera y segunda señales de salida (S14).
Description
Método y aparato de ocultación de paquetes
retrasados.
La presente invención se refiere a un método de
ocultación de paquetes retrasados y un aparato en una red de
paquetes que usa parámetros retrasados para mejorar la ocultación de
paquetes retrasados.
Las señales de voz comprimidas digitalmente se
transmiten frecuentemente en paquetes que contienen parámetros de la
voz para la reconstrucción de las tramas de voz en el decodificador
del extremo receptor. Ejemplos típicos de tales redes de paquetes
son las redes IP y ATM. Cuando los paquetes se retrasan o se
pierden se usa algún tipo de método de ocultación para cubrir
parámetros de voz retrasados o perdidos (ver [1]). Típicamente
estos métodos de ocultación comprenden predecir los parámetros de
voz para un paquete retrasado o perdido a partir de los parámetros
recibidos previamente, y aplicar los parámetros predichos al proceso
de decodificación en lugar de los parámetros retrasados o perdidos.
Los parámetros del primer paquete retrasado o perdido usualmente
simplemente se copian del paquete previo. Si se retrasan o se
pierden más paquetes, aun se usan los mismos parámetros, pero en
este caso la señal de salida se silencia gradualmente. Un rasgo
característico de estos métodos es que se usa la misma estrategia
para ambos, paquetes retrasados y paquetes perdidos. Un
inconveniente de estos métodos es que la información en los paquetes
retrasados simplemente se descarta, aunque está más actualizada que
la información que se usa para la predicción de parámetros.
En [2] se describe un método que distingue entre
paquetes retrasados y paquetes perdidos. En el método descrito en
esta referencia, los parámetros de voz de los paquetes retrasados
reemplazan a los parámetros predichos tan pronto como llega el
paquete retrasado. Sin embargo, un rasgo característico de este
método es que no considera el hecho de que el decodificador está
basado en filtrado digital. Los filtros digitales en el
decodificador alcanzan los estados de filtro finales después de la
decodificación de una trama. Estos estados de filtro finales se usan
como estados de filtro inicial para la decodificación de la
siguiente trama (con los nuevos parámetros de voz). Si la señal de
salida decodificada fuese la misma señal que la señal óptima que se
produjo en el codificador del extremo de transmisión en el proceso
de análisis por síntesis, los parámetros de voz y los estados de los
filtros iniciales deberían ser ambos los mismos. En el método
descrito en [2], sólo se usarán los parámetros de voz correctos
cuando llega eventualmente un paquete retrasado. No obstante, entre
tanto los estados de los filtros han derivado desde el estado final
de la trama previa durante la fase de predicción, lo que conduce a
molestos cambios abruptos de la señal de salida cuando se aplican de
repente los parámetros de voz retrasados.
Un objetivo de la presente invención es
proporcionar un método de ocultación de paquetes retrasados y un
aparato que usa la información de los paquetes retrasados, pero en
el cual se minimizan o incluso se eliminan tales molestos cambios
abruptos de la señal de salida.
Este objetivo se consigue de acuerdo con las
reivindicaciones de patente adjuntas.
Brevemente, la presente invención concierne al
uso de la información recibida en los paquetes retrasados para
actualizar no sólo los parámetros de la voz, sino también el estado
inicial del decodificador. Durante la ocultación de paquetes de
datos retrasados se generan dos señales de salida decodificadas con
los mismos parámetros de voz, uno basado en los estados derivados
del decodificador y otro basado en los estados actualizados del
decodificador. Más adelante estas dos señales se ponderan juntas en
la señal de salida final. Este procedimiento produce una transición
suave desde los parámetros de voz predichos a los actualizados.
La invención, junto con ulteriores objetivos y
ventajas de la misma, pueden entenderse mejor haciendo referencia a
la siguiente descripción junto con los dibujos que acompañan, en los
cuales:
La Fig. 1 es un diagrama de bloques de un
decodificador de voz típico;
La Fig. 2 es un diagrama de bloques de un filtro
FIR;
La Fig. 3 es un diagrama de bloques de otro
decodificador de voz típico;
La Fig. 4 es un diagrama de tiempos que ilustra
el método de ocultación de paquetes retrasados de una técnica
anterior;
La Fig. 5 es un diagrama de tiempos que ilustra
el método de ocultación de paquetes retrasados de otra técnica
anterior;
La Fig. 6 es un diagrama de tiempos que ilustra
el método de ocultación de paquetes retrasados de acuerdo con la
presente invención;
La Fig. 7 es otro diagrama de tiempos que
ilustra el método de ocultación de paquetes retrasados de acuerdo
con la presente invención;
La Fig. 8 es un diagrama de bloques del aparato
de ocultación de paquetes retrasados de acuerdo con la presente
invención;
La Fig. 9 es una realización preferida de un
decodificador adecuado para implementar el aparato de ocultación de
paquetes retrasados de la fig. 8; y
La Fig. 10 es un diagrama de flujo que ilustra
el método de ocultación de paquetes retrasados de la presente
invención.
La Fig. 1 es un diagrama de bloques de un
decodificador de voz típico 10. La tabla de muestras (codebook) fija
12 contiene los vectores de excitación que se usan para reconstruir
la señal de voz. El vector de excitación seleccionado de la tabla de
muestras fija 12 se pondera con un factor de ganancia G. Este vector
de excitación final se envía a un predictor de larga duración
(filtro digital) 16. La señal de salida del predictor de larga
duración 16 se envía a un predictor de corta duración (otro filtro
digital) 18, que produce las muestras de voz decodificadas. El
decodificador descrito se controla por los parámetros de voz
recibidos. Estos parámetros pueden dividirse en dos grupos, a saber
parámetros de excitación 20 y coeficientes de los filtros 22. Los
parámetros de excitación 20 controlan la selección del vector de la
tabla de muestras fija y fija el factor de ganancia G. Los
coeficientes del filtro 22 determinan las funciones de transferencia
de los predictores de larga duración y corta duración 16, 18.
Para explicar la presente invención, en primer
lugar discutiremos algunos aspectos característicos de los filtros
digitales con referencia a la Fig. 2.
Fig. 2 es un diagrama de bloques de un filtro
FIR. Este tipo de filtro puede usarse en el predictor de corta
duración 20. El filtro incluye una cadena de elementos de retardo D
(la Figura sólo muestra 3 elementos de retardo, pero son posibles
más elementos de retardo por supuesto). Un conjunto de
multiplicadores M0, M1, M2, M3 toman la señal de entrada X(N)
y las señales retardadas X(N-1),
X(N-2), X(N-3) y
multiplican estas señales por los coeficientes del filtro C0, C1,
C2, C3, respectivamente. Finalmente estas señales multiplicadas se
suman en los sumadores A1-A3 para formar la señal de
salida del filtro Y(N). El conjunto de señales X(N),
X(N-1), X(N-2),
X(N-3) forman el estado del filtro. A partir
de esta descripción está claro que la señal de salida del filtro
Y(N) dependerá no sólo de los coeficientes del filtro, sino
también del estado inicial del filtro. Se dice que el filtro tiene
"memoria". Esta memoria es la causa de los cambios de señal
abruptos que ocurren en los decodificadores de técnica anterior
cuando sólo se actualizan los coeficientes de los filtros. En el
caso de un filtro FIR la influencia de un estado de filtro erróneo
dependerá de la longitud del filtro. Menos etapas de filtro darán
una memoria más corta. Por el contrario, en el caso de un filtro
IIR, como el que se usa típicamente en el predictor de larga
duración 18, la memoria es infinita.
En la realización de la Fig. 1 el decodificador
10 se ha realizado por implementación de un predictor de larga
duración 18 como un filtro digital. Otra realización es un
decodificador en el cual el predictor de larga duración se
implementa en cambio como una tabla de muestras adaptable, como se
muestra en la Fig. 3. Una tabla de muestras adaptable realiza la
misma función que un predictor de larga duración, pero no se
implementa exactamente como un filtro digital. En su lugar la tabla
de muestras adaptable 16 es un gran almacén de muestras de voz que
se está actualizando continuamente por la línea de realimentación 15
como los procedimientos de decodificación. Los vectores se
seleccionan apuntando a ciertas partes de este gran almacén. En esta
realización los parámetros de excitación contendrán tal puntero y
también el factor de ganancia G_{A} para el vector de la tabla de
muestras adaptable seleccionado. Ya que la tabla de muestras
adaptable se actualiza con cada nueva muestra como procedimiento de
decodificación, se aprecia que las muestras de voz decodificadas de
una trama dependerán del estado inicial de la lista de muestras
adaptable. De este modo, la lista de muestras adaptable tiene
"memoria" como un filtro digital. Por consiguiente puede usarse
el término "estado del decodificador inicial" para cubrir ambas
realizaciones.
La Fig. 4 es un diagrame de tiempos que ilustra
un método de ocultación de paquetes retardados con la técnica
anterior. Un receptor que incluye un decodificador recibe los
paquetes 1-9. Se extraen los parámetros de voz
P1-P3 y P7-P9 de los paquetes que se
reciben a tiempo para decodificar, mientras que los paquetes
retrasados 4-6 son simplemente ignorados. Los
parámetros extraídos P1-P3 se envían al
decodificador y junto con los correspondientes estados iniciales de
decodificador S1-S3 producirán la señal de voz para
las tramas 1-3. Las líneas punteadas entre los
estados del decodificador iniciales, por ejemplo entre los estados
del decodificador iniciales S2 y S3, indican que el estado del
decodificador posterior se obtiene a partir del estado del
decodificador inicial previo si se usan los parámetros de voz
indicados (P2 en este ejemplo) para decodificar. Ya que el paquete 4
se retrasa, los parámetros de voz para la trama 4 no están
disponibles. En consecuencia estos parámetros de voz se predicen a
partir de los parámetros de voz previos P3. Un método de predicción
usado frecuentemente es simplemente usar los mismos parámetros de
voz que en la trama previa. Los parámetros de voz predichos para la
trama 4 se denominan P4P en la Figura. De ese modo, la trama 4 se
decodificará con el estado del decodificador inicial correcto S4,
pero con parámetros de voz predichos P4P. Ya que el paquete 5 está
también retrasado, los parámetros de voz deben predecirse también
para la trama 5. Sin embargo, ya que el paquete 5 se ha ignorado la
nueva predicción P5P tiene que basarse en la predicción previa P4P.
Un método de predicción usado frecuentemente es simplemente usar de
nuevo los mismos parámetros de voz que en la trama previa, pero
reducir la energía de la señal de salida. Además, ya que la trama 4
se decodificó con los parámetros de voz predichos P4P, el estado del
decodificador inicial para la trama 5 no será el estado del
decodificador inicial correcto S5, sino el estado del decodificador
inicial erróneo S5E. Ya que el paquete 6 está también retrasado, se
repite el mismo proceso que con la trama 5 para la trama 6 (copia de
los parámetros de voz de la trama previa, reducción de energía y
decodificación basada en un estado del decodificador inicial
erróneo). Ya que el paquete 7 llega a tiempo, sus parámetros de voz
P7 se usarán para decodificar la trama 7. No obstante, ya que las
tramas previas se han decodificado con parámetros de voz predichos,
el estado del decodificador inicial S7E será erróneo. Esta
circunstancia, junto con el abrupto aumento de amplitud debido a los
parámetros de voz recibidos correctamente producirá un cambio
abrupto en la señal decodificada. Después de la decodificación de la
trama 7 la influencia de la "memoria" en el decodificador es
perjudicial (en algunos tipos de decodificadores; otros tipos pueden
tener mayor "memoria"), y por esto la trama 8 se decodificará
correctamente si el paquete 8 llega a tiempo.
Fig. 5 es un diagrama de tiempo que ilustra
otro método de ocultación de paquetes retrasados descrito en [2] de
técnica anterior. Como previamente los paquetes 1-3
llegan a tiempo se decodifican normalmente. Los parámetros de voz
para la trama 4 se predicen, ya que la trama 4 esta retrasada. Estos
parámetros de voz predichos se usan para arrancar la decodificación
de la trama 4. Sin embargo cuando llega la trama 4 no se ignora como
en la Fig. 4. En su lugar los parámetros de voz P4 se extraen y se
usan inmediatamente para decodificar. Las muestras de voz predichas
que aun no han salido se reemplazan entonces por las muestras de voz
basadas en parámetros de voz correctos P4 pero estado inicial del
decodificador erróneo S4E. No obstante, esto conduce a un molesto
cambio abrupto en la señal de salida. Asumiendo que el paquete 5
esta también retrasado, los parámetros de voz P5P se predicen desde
los parámetros de voz P4. Estos parámetros predichos P5P y el estado
del decodificador erróneo S5E se usan para decodificar la trama 5.
Una vez que llega el paquete 5, las muestras de voz predichas que no
han salido aun se reemplazarán por las muestras de voz decodificadas
basadas en los parámetros de voz P5 llegados a última hora y un
estado inicial del decodificador erróneo S5E (los dos últimos
estados denominados S5E no necesariamente tienen que ser los mismos,
la notación sólo indica que son erróneos). Esto conduce a otro
cambio abrupto en la señal de salida. Cuando llega el paquete 6 a
tiempo se usa para decodificar la trama 6. En lo sucesivo la
decodificación es normal de nuevo, ya que los paquetes
7-9 llegan a tiempo.
La Fig. 6 es un diagrama de tiempos que ilustra
el método de ocultación de paquetes retrasados de acuerdo con la
presente invención. Las primeras tres tramas normales se tratan de
la misma forma en las fig. 4 y 5. La trama 4 se predice en un primer
decodificador del mismo modo que en la fig. 4. No obstante, antes de
que la trama se decodifique el estado del decodificador inicial se
copia y esta copia se guarda para uso futuro. Tan pronto como llega
el paquete retrasado 4 se extraen sus parámetros de voz P4 y se usan
en un segundo decodificador para actualizar el estado inicial del
decodificador al estado correcto S5. Las muestras de voz actuales
que producirían tal decodificación se ignoran. El propósito de esta
segunda decodificación es sólo actualizar el estado inicial del
decodificador. Ya que el paquete 5 se retrasa también sus parámetros
de voz se tendrán que predecir. No obstante, ya que ahora se conocen
los parámetros de voz más recientes P4, se usarán estos parámetros
para la predicción de los parámetros P5P. Además, se realizarán las
dos decodificaciones de la trama 5, a saber una decodificación
basada en los parámetros de voz predichos P5P y el estado inicial
erróneo del decodificador S5E, y otra decodificación basada en los
mismos parámetros de voz y el estado del decodificador inicial
correcto S5. A continuación de la decodificación se combinan las dos
tramas de muestras de voz para formar la señal de salida final.
Como se muestra en la parte inferior de la fig.
6 las dos señales decodificadas se ponderan, y más tarde se suman
las señales ponderadas. La ponderación se realiza de tal modo que la
señal 1 del decodificador 1 tiene un alto peso inicial y un bajo
peso final (línea continua) mientras que la señal 2 del
decodificador 2 tiene un bajo peso inicial y un alto peso final
(línea discontinua). La señal puede combinarse por ejemplo de
acuerdo con la fórmula:
y(n) =
k(n)y_{1}(n) + (1 -
k(n))y_{2}(n)
donde n indica el número de muestra
en la trama, y_{1}(n) indica la muestra decodificada n de
la señal 1, y_{2}(n) indica la muestra decodificada n de la
señal 2 y k(n) es la función de ponderación, definida por
ejemplo
como
k(n) =
1 - \frac{log (n)}{log
(N)}
donde N indica el tamaño de trama.
El factor de ponderación k(n) puede calcularse también por
supuesto de otra formas. El ejemplo da una curva decreciente
exponencialmente como en la fig. 6. De este modo hay una transición
suave desde la señal 1 a la señal 2 más
precisa.
Volviendo a la figura 6, ya que el paquete 5
está retrasado el estado inicial del decodificador S5 se copia y se
guarda para actualización posterior por el decodificador 2 cuando
llega el paquete 5. Además, ya que la señal 2 está enfatizada
(debido a la ponderación) al final de la trama 5, el estado del
decodificador inicial S6E del decodificador 1 usado para
decodificación de la trama 6 se toma más del decodificador 2 después
de la decodificación de la trama 5. Ya que la trama 6 esta retrasada
también, los parámetros de voz P6P predichos a partir del paquete 5
se usan para decodificar la trama 6 con ambos estados iniciales del
decodificador el erróneo y el corregido S6E y S6, respectivamente.
Más tarde las dos señales de salida se ponderan y se combinan. Ya
que el paquete 6 está retrasado el estado inicial del decodificador
correcto S6 se copia y se guarda para actualización posterior por el
decodificador 2 cuando llega el paquete 6. Como en la trama previa,
el estado inicial del decodificador S7E del decodificador 1 usado
para decodificación de la trama 7 se toma más del decodificador 2
después de la decodificación de la trama 6. Ya que la trama 7 está a
tiempo, pueden usarse los parámetros de voz P7 para decodificar sin
necesidad de predicción. Más tarde las dos señales de salida se
ponderan y se combinan. Ya que los paquetes 8 y 9 están también a
tiempo, el decodificador 2 no se necesita más, y la decodificación
puede proseguir como en el caso normal en el decodificador 1. En la
trama 8 el estado inicial del decodificador S8 se usa desde el
decodificador 2, ya que este es correcto con garantía.
La fig. 7 es otro diagrama de tiempo que ilustra
el método de ocultación de paquetes diferidos de acuerdo con la
presente invención. Este diagrama es similar al diagrama de la fig.
6, pero ilustra otro caso, a saber cuando el paquete 4 se retrasa en
más de una trama. Este caso difiere del caso previo en que tienen
que usarse los métodos de ocultación convencionales en ambas tramas
4 y 5, y que el estado inicial del decodificador se actualiza dos
veces en la trama 5 debido a la llegada del paquete 4 muy tarde. Más
tarde se realizan los mismos pasos que en la fig. 6.
La fig. 8 es un diagrama de bloques de un
aparato de ocultación de paquetes diferidos de acuerdo con la
presente invención. Los parámetros de voz se envían a los dos
decodificadores 30 y 32, respectivamente. Las señales de salida de
estos decodificadores se combinan en un sumador 34 para producir las
muestras de voz actuales. Entre los decodificadores 30, 32 se provee
un segmento de memoria extra 36 para almacenamiento de una copia del
estado inicial del decodificador que se actualizará.
La fig. 9 es una realización preferida de un
decodificador adecuado para implementar el aparato de ocultación de
paquetes de la fig. 8. Esta realización implementa el decodificador
de acuerdo con los principios descritos con referencia a la fig. 1
es decir con filtros digitales en ambos predictores el de corta
duración y el de larga duración. Ya que el decodificador 2 se usa
sólo cuando hay paquetes retrasados, no es necesario actualmente
implementar en hardware dos decodificadores separados, de los cuales
sólo uno se usa la mayor parte del tiempo. En una realización
preferida de la presente invención el decodificador está basado por
lo tanto en una combinación de microprocesador y procesador de señal
40, que implementa ambos decodificadores 1 y 2, en diferentes
tiempos. El procesador 40 está conectado a segmentos de memoria que
contienen la ganancia G, la tabla de muestras fija 12, los
parámetros de excitación 20 y los coeficientes de filtros 22. El
segmento de memoria 42 se provee para almacenar y recuperar los
coeficientes de filtro predichos. Los estados actuales del filtro
del decodificador para los decodificadores 1 y 2 se almacenan en el
segmento de memoria 44 y 46, respectivamente. El segmento de memoria
36 almacena una copia del estado inicial del filtro correcto cuando
un paquete se retrasa. La voz decodificada del decodificador 1 se
almacena en el almacén 48 y la voz decodificada del decodificador 2
se almacena en el almacén 50. Las muestras de voz de cada almacén se
ponderan por los bloques de ponderación 52 y 54, respectivamente
antes de que se sumen en el sumador 34. Dos conmutadores SW1 Y SW2
controlados por las señales de control C1, C2 desde el procesador 40
determinan qué procesador decodificador se implementa en cada
momento. Si los conmutadores están en la posición mostrada en la
figura, se implementa el decodificador 1, mientras que la otra
posición implementa el decodificador 2. La línea entre los segmentos
de memoria 46 y 44 indica la transferencia de los estados iniciales
de filtro desde el decodificador 2 al 1, como se indicó al comienzo
de las tramas 5 y 6 en la fig. 6. Esta operación así como la
transferencia de estados de filtro desde el segmento de memoria 44
al segmento de memoria 36 y la transferencia de estados de filtro
desde el segmento de memoria 46 al segmento de memoria 36 y la
transferencia de estados de filtro desde el segmento de memoria 46
al segmento de memoria 36 y viceversa se controlan también por el
procesador 4, pero se han omitido las correspondientes señales de
control para evitar el desorden de la figura.
A veces los paquetes pueden llegar en orden
equivocado. Dependiendo del tipo de decodificador tales casos pueden
requerir varios segmentos de memoria 36 para almacenar los estados
iniciales de los filtros. El número de segmentos de memoria que se
requieren para almacenar los estados iniciales de los filtros
depende de la memoria del decodificador así como del tamaño de la
trama de voz. La memoria debe ser capaz de almacenar la historia de
los estados del decodificador así como parámetros recibidos
eventualmente durante el periodo en el cual los parámetros pueden
afectar a la salida, que por supuesto es dependiente del método de
codificación. No obstante, para un decodificador de voz que utiliza
los métodos de predicción directa para predecir el comportamiento de
periodo corto y un tamaño de trama de 20 mseg., pueden ser
apropiados alrededor de 10 segmentos de memoria que cubran 200 mseg.
de voz.
La fig. 10 es un diagrama de flujo que ilustra
el método de ocultación de paquetes retrasados de la presente
invención. En la etapa S1se pregunta si el siguiente paquete
esperado esta retrasado. Si no lo está, la siguiente trama se
decodifica como una trama normal en el decodificador 1 en la etapa
2, y más tarde la rutina vuelve a la etapa S1. Si el paquete está
retrasado, el último estado correcto del filtro se salva en la etapa
S3 para actualización posterior. Ya que el paquete se retrasó, el
decodificador 1 realiza una ocultación tradicional prediciendo los
parámetros de voz y generando una trama de voz que cubre el retardo
en las etapas S4 y S5, respectivamente. La etapa S6 comprueba si el
paquete esperado sigue aun retrasado (como en la fig. 7). Si este es
el caso, se repiten las etapas S4 - S6. Si no es así, la rutina
prosigue en los pasos S7 y S8, en los cuales el nuevo paquete
llegado se usa para actualizar los parámetros de voz y el estado de
filtro guardado. La etapa S9 comprueba si el paquete próximo está
también retrasado. Si el paquete está retrasado, se guarda una copia
del estado del filtro del decodificador 2 en la etapa S10 para
futuras actualizaciones. En la etapa S11 los parámetros de voz se
predicen a partir de la trama previa y se usan en las etapas S12 y
S13 para generar las señales de salida de los decodificadores 1 y 2,
respectivamente. En la etapa S14 estas señales de salida se combinan
(preferiblemente después de la ponderación) para formar la trama de
voz final. En la etapa S15 el estado final del filtro del
decodificador 2 se transfiere al decodificador 1 (como en la trama 5
en la fig. 6). Más tarde la rutina vuelve a los pasos S7 y S8.
Cuando finalmente un paquete está a tiempo de nuevo, la pregunta de
la etapa S9 transfiere la rutina a las etapas S16 y S17, en las
cuales se generan las señales de salida en los decodificadores 1 y
2, respectivamente basadas en parámetros de voz correctos. En la
etapa S18 estas señales se combinan (preferiblemente después de
ponderar). Ahora vuelve todo a normal y la rutina prosigue en la
etapa S1.
La presente invención se ha descrito con
referencia a señales de voz y los correspondientes parámetros de
voz. No obstante, se aprecia que en la actualidad estos parámetros
no representan necesariamente sólo voz. Un término más correcto
sería parámetros de audio, ya que la música y los sonidos de fondo,
por ejemplo, se representan de la misma forma. Además, pueden
aplicarse los mismos principios también a otras señales en paquetes
que requieren filtros digitales para decodificar, tales como las
señales de vídeo. De este modo, un término más general que voz o
parámetros de audio es parámetros de trama, el cual se usa en las
reivindicaciones. Así, se aprecia que el método de ocultación de la
presente invención es aplicable en todos los ámbitos en los que se
transfieren en modo paquetes datos en tiempo real predecibles, y
donde los paquetes se retrasan en un modo no predecible.
Se entenderá por los expertos en la materia que
pueden hacerse varios cambios y modificaciones en la presente
invención sin salirse del espíritu y el ámbito de la misma, lo que
se define en las reivindicaciones adjuntas.
1 K. Cluver, "An ATM Speech Codec with
Improved Reconstruction of Lost Cells", Proceedings Eusipco,
1996.
2 Patente de EEUU 5 615 214 (Motorola Inc)
Claims (15)
1. Un método de ocultación de paquetes
retrasados en una red de paquetes que usa los parámetros de la trama
retrasada para mejorar la ocultación de los paquetes retrasados,
caracterizado por realizar los siguientes pasos cuando se
retrasa un paquete:
guardar una copia del estado inicial del
decodificador que existe después de decodificar el último paquete no
retrasado (S8);
decodificar y disimular el paquete retrasado
usando los parámetros de trama predichos y dicho estado inicial del
decodificador, produciendo por ello un estado inicial del
decodificador erróneo (S4,S5);
decodificar usando los parámetros de trama
actualizados de dicho paquete retrasado y dicho estado inicial del
decodificador guardado, produciendo por ello un estado inicial del
decodificador corregido (S11);
decodificar usando un conjunto de parámetros de
trama y dicho estado inicial erróneo del decodificador, produciendo
por ello una primera señal de salida y además un estado inicial del
decodificador erróneo (S12);
decodificar usando dicho conjunto de parámetros
de trama y dicho estado inicial del decodificador corregido,
produciendo por ello una segunda señal de salida (S13); y
combinar dichas primera y segunda señales de
salida (S14)
2. El método de la reivindicación 1,
caracterizado en que dicho conjunto de parámetros de trama se
obtiene de un paquete que no está retrasado.
3. El método de la reivindicación 1,
caracterizado en que dicho conjunto de parámetros de trama se
predice de un paquete previo cuando el paquete posterior está
retrasado.
4. El método de la reivindicación 3,
caracterizado por:
almacenar una copia del estado inicial del
decodificador corregido;
decodificar usando los parámetros de trama
actualizados a partir de dicho paquete posterior retrasado y dicho
estado inicial del decodificador corregido, produciendo por ello un
estado inicial del decodificador posterior corregido;
decodificar usando un conjunto posterior de
parámetros de trama y dicho estado inicial del decodificador erróneo
posterior, produciendo por ello una tercera señal de salida;
decodificar usando dicho conjunto posterior de
parámetros de trama y dicho estado inicial del decodificador
corregido posterior, produciendo por ello una cuarta señal de
salida; y
combinar dichas tercera y cuarta señales de
salida.
5. El método de la reivindicación 4,
caracterizado en que dicho conjunto posterior de parámetros
de trama se obtiene de un paquete que no está retrasado.
6. El método de la reivindicación 4,
caracterizado en que dicho conjunto posterior de parámetros
de trama se predice a partir de un paquete previo cuando otro
paquete esta aun retrasado.
7. El método de la reivindicación 1,
caracterizado en que dicho estado inicial del decodificador
incluye un estado inicial del predictor de corta duración.
8. El método de la reivindicación 1,
caracterizado en que dicho estado inicial del decodificador
incluye un estado inicial del predictor de larga duración.
9. El método de la reivindicación 1,
caracterizado en que dicho estado inicial del decodificador
incluye un estado inicial de la tabla de muestras adaptable.
10. Un aparato de ocultación de paquetes
retrasados en una red de paquetes que usa parámetros de trama
retrasada para mejorar la ocultación de paquetes retrasados,
caracterizado por:
un medio (36) para guardar una copia del estado
inicial del decodificador que existía después de decodificar el
último paquete no retrasado;
un medio (30) para decodificar y ocultar el
retraso del paquete usando parámetros de trama predichos y dicho
estado inicial del decodificador, produciendo por ello un estado
inicial del decodificador erróneo;
un medio (32) para decodificar usando los
parámetros de trama actualizados de dicha trama retrasada y dicho
estado inicial del decodificador guardado, produciendo por ello un
estado inicial del decodificador corregido;
un medio (30) para decodificar usando un
conjunto de parámetros de trama y dicho estado del decodificador
inicial erróneo, produciendo por ello una primera señal de salida y
un estado inicial del decodificador erróneo;
un medio (32) para decodificar usando dicho
conjunto de parámetros de trama y dicho estado del decodificador
inicial corregido, produciendo por ello una segunda señal de salida;
y
un medio (34) para combinar dichas señales de
salida primera y segunda.
11. El aparato de la reivindicación 10, un medio
(40) caracterizado por extraer dicho conjunto de parámetros
de trama de un paquete que no está retrasado.
12. El aparato de la reivindicación10, un medio
(40) caracterizado por predecir dicho conjunto de parámetros
de trama desde un paquete previo cuando un paquete posterior está
retrasado.
13. El aparato de la reivindicación 11,
caracterizado por:
un medio (36) para guardar una copia de dicho
estado inicial del decodificador corregido;
un medio (32) para decodificar usando los
parámetros de trama actualizados a partir de dicho paquete retrasado
posterior y dicho estado inicial del decodificador corregido
guardado, produciendo por ello un estado inicial del decodificador
corregido posterior;
un medio (30) para decodificar usando un
conjunto posterior de parámetros de trama y dicho estado inicial del
decodificador erróneo posterior, produciendo por ello una tercera
señal de salida;
un medio (32) para decodificar usando dicho
conjunto posterior de parámetros de trama y dicho estado inicial del
decodificador erróneo posterior, produciendo por ello una cuarta
señal de salida;
un medio (34) para combinar dichas tercera y
cuarta señales de salida.
14. El aparato de la reivindicación 13, un medio
caracterizado (40) por extraer de dicho conjunto posterior de
parámetros de una trama que no está diferida.
15. El aparato de la reivindicación 13,
caracterizado por medios (40) para predecir dicho conjunto
posterior de parámetros de trama a partir de un paquete previo
cuando otro paquete está aún retrasado.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE9801725A SE513520C2 (sv) | 1998-05-14 | 1998-05-14 | Förfarande och anordning för maskering av fördröjda paket |
SE9801725 | 1998-05-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2262323T3 true ES2262323T3 (es) | 2006-11-16 |
Family
ID=20411339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES99927021T Expired - Lifetime ES2262323T3 (es) | 1998-05-14 | 1999-04-28 | Metodo y aparato de ocultacion de paquetes retrasados. |
Country Status (13)
Country | Link |
---|---|
US (1) | US6721327B1 (es) |
EP (1) | EP1076965B1 (es) |
JP (1) | JP4651194B2 (es) |
KR (1) | KR100376909B1 (es) |
CN (1) | CN1112007C (es) |
AU (1) | AU4402099A (es) |
CA (1) | CA2329176A1 (es) |
DE (1) | DE69930929T2 (es) |
ES (1) | ES2262323T3 (es) |
MY (1) | MY121820A (es) |
SE (1) | SE513520C2 (es) |
TW (1) | TW511356B (es) |
WO (1) | WO1999059282A2 (es) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7177278B2 (en) | 1999-12-09 | 2007-02-13 | Broadcom Corporation | Late frame recovery method |
JP4597360B2 (ja) * | 2000-12-26 | 2010-12-15 | パナソニック株式会社 | 音声復号装置及び音声復号方法 |
JP2002268697A (ja) * | 2001-03-13 | 2002-09-20 | Nec Corp | パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法 |
US7095710B2 (en) * | 2001-12-21 | 2006-08-22 | Qualcomm | Decoding using walsh space information |
DE602005020130D1 (de) | 2004-05-10 | 2010-05-06 | Nippon Telegraph & Telephone | E, sendeverfahren, empfangsverfahren und einrichtung und programm dafür |
WO2006079348A1 (en) * | 2005-01-31 | 2006-08-03 | Sonorit Aps | Method for generating concealment frames in communication system |
KR100723409B1 (ko) | 2005-07-27 | 2007-05-30 | 삼성전자주식회사 | 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치 |
US20070174047A1 (en) * | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
CN101305417B (zh) * | 2005-11-07 | 2011-08-10 | 艾利森电话股份有限公司 | 移动电信网络中的方法和装置 |
FI20095273A0 (fi) * | 2009-03-17 | 2009-03-17 | On2 Technologies Finland Oy | Digitaalinen videokoodaus |
WO2010150767A1 (ja) * | 2009-06-23 | 2010-12-29 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの方法を用いた装置、プログラム |
EP2302845B1 (en) | 2009-09-23 | 2012-06-20 | Google, Inc. | Method and device for determining a jitter buffer level |
EP2405661B1 (en) * | 2010-07-06 | 2017-03-22 | Google, Inc. | Loss-robust video transmission using two decoders |
US8630412B2 (en) | 2010-08-25 | 2014-01-14 | Motorola Mobility Llc | Transport of partially encrypted media |
US8477050B1 (en) | 2010-09-16 | 2013-07-02 | Google Inc. | Apparatus and method for encoding using signal fragments for redundant transmission of data |
US8838680B1 (en) | 2011-02-08 | 2014-09-16 | Google Inc. | Buffer objects for web-based configurable pipeline media processing |
US9014265B1 (en) | 2011-12-29 | 2015-04-21 | Google Inc. | Video coding using edge detection and block partitioning for intra prediction |
US9210424B1 (en) | 2013-02-28 | 2015-12-08 | Google Inc. | Adaptive prediction block size in video coding |
US9313493B1 (en) | 2013-06-27 | 2016-04-12 | Google Inc. | Advanced motion estimation |
GB2515362B (en) * | 2013-12-16 | 2015-12-09 | Imagination Tech Ltd | Decoding frames |
US9807416B2 (en) | 2015-09-21 | 2017-10-31 | Google Inc. | Low-latency two-pass video coding |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4726019A (en) * | 1986-02-28 | 1988-02-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital encoder and decoder synchronization in the presence of late arriving packets |
DE4317951C1 (de) | 1993-05-28 | 1994-05-26 | Siemens Ag | Verfahren und Schaltungsanordnung zur Übertragung von Nachrichtenpaketen nach dem Asynchronen Transfermodus in einem Kommunikationsnetz |
SE502244C2 (sv) * | 1993-06-11 | 1995-09-25 | Ericsson Telefon Ab L M | Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation |
SE503547C2 (sv) * | 1993-06-11 | 1996-07-01 | Ericsson Telefon Ab L M | Anordning och förfarande för döljande av förlorade ramar |
JP3240832B2 (ja) * | 1994-06-06 | 2001-12-25 | 日本電信電話株式会社 | パケット音声復号方法 |
JP3630460B2 (ja) * | 1995-01-23 | 2005-03-16 | 富士通株式会社 | データ長補正システム |
JP2861889B2 (ja) * | 1995-10-18 | 1999-02-24 | 日本電気株式会社 | 音声パケット伝送システム |
US5615214A (en) * | 1995-10-30 | 1997-03-25 | Motorola, Inc. | System and method of compensating propagation time variations and substituting for lost packets in a packetized voice communication system |
US5764646A (en) * | 1996-04-02 | 1998-06-09 | Ericsson Inc. | Packet data transmission with clash subtraction |
US5960010A (en) * | 1996-05-03 | 1999-09-28 | Texas Instruments Incorporated | Error detection and error concealment of convolutionally encoded data |
US6175871B1 (en) * | 1997-10-01 | 2001-01-16 | 3Com Corporation | Method and apparatus for real time communication over packet networks |
-
1998
- 1998-05-14 SE SE9801725A patent/SE513520C2/sv not_active IP Right Cessation
-
1999
- 1999-04-28 AU AU44020/99A patent/AU4402099A/en not_active Abandoned
- 1999-04-28 KR KR10-2000-7012780A patent/KR100376909B1/ko not_active IP Right Cessation
- 1999-04-28 ES ES99927021T patent/ES2262323T3/es not_active Expired - Lifetime
- 1999-04-28 DE DE69930929T patent/DE69930929T2/de not_active Expired - Lifetime
- 1999-04-28 JP JP2000548987A patent/JP4651194B2/ja not_active Expired - Lifetime
- 1999-04-28 WO PCT/SE1999/000689 patent/WO1999059282A2/en active IP Right Grant
- 1999-04-28 CN CN99806070A patent/CN1112007C/zh not_active Expired - Lifetime
- 1999-04-28 CA CA002329176A patent/CA2329176A1/en not_active Abandoned
- 1999-04-28 EP EP99927021A patent/EP1076965B1/en not_active Expired - Lifetime
- 1999-05-04 TW TW088107236A patent/TW511356B/zh not_active IP Right Cessation
- 1999-05-10 MY MYPI99001846A patent/MY121820A/en unknown
- 1999-05-14 US US09/312,557 patent/US6721327B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
AU4402099A (en) | 1999-11-29 |
KR100376909B1 (ko) | 2003-03-26 |
DE69930929D1 (de) | 2006-05-24 |
WO1999059282A3 (en) | 2000-02-03 |
JP2002515612A (ja) | 2002-05-28 |
US6721327B1 (en) | 2004-04-13 |
JP4651194B2 (ja) | 2011-03-16 |
EP1076965B1 (en) | 2006-04-19 |
DE69930929T2 (de) | 2006-12-07 |
WO1999059282A2 (en) | 1999-11-18 |
KR20010052353A (ko) | 2001-06-25 |
EP1076965A2 (en) | 2001-02-21 |
CA2329176A1 (en) | 1999-11-18 |
SE513520C2 (sv) | 2000-09-25 |
TW511356B (en) | 2002-11-21 |
MY121820A (en) | 2006-02-28 |
CN1300491A (zh) | 2001-06-20 |
SE9801725D0 (sv) | 1998-05-14 |
SE9801725L (sv) | 1999-11-15 |
CN1112007C (zh) | 2003-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2262323T3 (es) | Metodo y aparato de ocultacion de paquetes retrasados. | |
CN1989548B (zh) | 语音解码装置及补偿帧生成方法 | |
ES2287133T3 (es) | Configuracion y metodo relativo a la comunicacion del habla. | |
US20040204935A1 (en) | Adaptive voice playout in VOP | |
KR101344110B1 (ko) | 로버스트 디코더 | |
ES2625952T3 (es) | Método para la generación de tramas de ocultación en sistema de comunicación | |
ES2266312T3 (es) | Indexacion de posiciones y señales de pulso en codigos de cifrado y descifrado algebraicos para la codificacion de señales de banda ancha. | |
JP5065254B2 (ja) | 順方向エラー訂正コードをデコードするためのシステム及び方法 | |
JPH0728495A (ja) | 音声信号の組み込み式コード化システム | |
US8401865B2 (en) | Flexible parameter update in audio/speech coded signals | |
KR20090026818A (ko) | 인터넷 프로토콜을 통한 음성통화용 적응성 디-지터 버퍼 | |
JP2019070866A (ja) | 音声符号化装置および音声符号化方法 | |
WO2001018790A1 (en) | Method and apparatus in a telecommunications system | |
ES2340545T3 (es) | Control de escalado en el tiempo de una señal de audio. | |
KR100622133B1 (ko) | VoIP 환경에서의 프레임 손실 복원 방법 | |
JP3266372B2 (ja) | 音声情報符号化方法およびその装置 | |
US7366193B2 (en) | System and method for compensating packet delay variations | |
JP4437052B2 (ja) | 音声復号化装置および音声復号化方法 | |
EP1813045B1 (en) | Methods and devices for providing protection in packet switched communication networks | |
ES2267176T3 (es) | Sistema de transmision de voz. | |
JP2002132300A (ja) | 音声符号化方法、音声復号化方法及び電子装置 | |
KR20050024651A (ko) | 패킷 망에서의 프레임 손실 은닉 방법 및 장치 | |
JPS6268350A (ja) | 音声パケツト通信方式 | |
Cohen | Analytical analysis of QoS for lossy network congestion control |