ES2676834T3 - Gestión de la pérdida de trama en un contexto de transición FD/LPD - Google Patents

Gestión de la pérdida de trama en un contexto de transición FD/LPD Download PDF

Info

Publication number
ES2676834T3
ES2676834T3 ES15757533.3T ES15757533T ES2676834T3 ES 2676834 T3 ES2676834 T3 ES 2676834T3 ES 15757533 T ES15757533 T ES 15757533T ES 2676834 T3 ES2676834 T3 ES 2676834T3
Authority
ES
Spain
Prior art keywords
frame
digital signal
segment
supplementary
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15757533.3T
Other languages
English (en)
Inventor
Julien Faure
Stéphane RAGOT
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Application granted granted Critical
Publication of ES2676834T3 publication Critical patent/ES2676834T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Procedimiento de decodificación de una señal digital codificada según una codificación predictiva y según una codificación por transformada, que comprende las siguientes etapas: - decodificación (304) predictiva de una trama precedente de la señal digital, codificada mediante un conjunto de parámetros de codificación predictiva; - detección (302) de la pérdida de una trama actual de la señal digital codificada; - generación (312) por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de una trama de sustitución de la trama actual; - generación (316) por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de un segmento suplementario de señal digital; - almacenamiento (317) temporal de este segmento suplementario de señal digital.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Gestión de la pérdida de trama en un contexto de transición FD/LPD
La presente invención se refiere al campo de la codificación/decodificación de señales digitales en particular para la corrección de la pérdida de trama.
La invención se aplica ventajosamente a la codificación/decodificación de sonidos que pueden contener voz y música mezclados o alternadamente.
Para codificar eficazmente los sonidos de voz con baja velocidad, se preconizan las técnicas de tipo CELP ("Code Excited Linear Predictiorí’). Para codificar eficazmente sonidos musicales, se preconizan más bien las técnicas de codificación por transformada.
Los codificadores de tipo CELP son unos codificadores predictivos. Tienen por objetivo modelizar la producción de la voz a partir de diversos elementos: una predicción lineal a corto término para modelizar el conducto vocal, una predicción a largo término para modelizar la vibración de las cuerdas vocales en periodo sonoro, y una excitación derivada de un diccionario fijo (ruido blanco, excitación algebraica) para representar la "innovación” que no ha podido modelizarse.
Los codificadores por transformada tales como MPEG AAC, AAC-LD, AAC-ELD o ITU-T G.722.1 Anexo C utilizan unas transformadas de muestreo crítico con el fin de compactar la señal en el dominio transformado. Se denomina "transformada de muestreo crítico”, a una transformada para la que el número de coeficientes en el dominio transformado es igual al número de muestras temporales en cada trama analizada.
Una solución para codificar eficazmente una señal de contenido mixto voz/música consiste en seleccionar en el curso del tiempo la mejor técnica entre al menos dos modos de codificación, uno de tipo CELP, el otro de tipo transformada.
Este es el caso por ejemplo de los códecs 3GPP AMR-WB + y MPEG USAC (por “Unified Speech Audio Coding” en inglés). Las aplicaciones dirigidas por AMR-WB + y USAC no son conversacionales, sino que corresponden a servicios de difusión y almacenamiento, sin fuertes restricciones sobre el retardo algorítmico.
La versión inicial del códec USAC, denominado (Reference Model 0), se describe en el artículo de M. Neuendorf et al., A Novel Scheme for Low Bitrate Unified Speech and Audio Coding - MPEG RM0, 7-10 de mayo de 2009, 126th AES Convention. Este códec RMO alterna entre varios modos de codificación:
• Para las señales de tipo voz: modos LPD (por "Linear Predictive Domain” en inglés) que comprenden dos modos diferentes derivados de la codificación AMR-WB+:
- Un modo ACELP
- Un modo (por "Transform Coded eXcitation” en inglés) denominado wLPT (por "weighted Linear Predictive Transform” en inglés) que utiliza una transformada de tipo MDCT (contrariamente al códec AMR-WB+) que utiliza la transformada FFT.
• Para las señales de tipo música: modo FD (por "Frequency Domain” en inglés) que utilizan la codificación por transformada MDCT (por "Modified Discrete Cosine Transform” en inglés) de tipo MPEG AAC (por "Advanced Audio Coding” en inglés) sobre 1024 muestras.
En el códec USAC, las transiciones entre modos LPD y FD son cruciales para asegurar una calidad suficiente sin defecto de conmutación, sabiendo que cada modo (ACELP, TCX, FD) tiene una "firma” específica (en términos de artificiosidades) y que los modos FD y LPD son de naturalezas diferentes —el modo FD se basa en una codificación por transformada en el dominio de la señal, mientras que los modos LPD utilizan una codificación lineal predictiva en el dominio perceptualmente ponderado con unas memorias de filtro a gestionar correctamente—. La gestión de las conmutaciones intermodos en el códec USAC RMO se detalla en el artículo de J. Lecomte et al., "Efficient cross- fade Windows for transitions between LPC-based and non-LPC based audio coding”, 7-10 mayo de 2009, 126th AES Convention. Como se explica en este artículo, la dificultad principal reside en las transiciones entre modos LPD hacia FD y viceversa. No se conserva aquí más que el caso de las transiciones de ACELP hacia FD.
Para comprender mejor el funcionamiento, se recuerda aquí el principio de la codificación por transformada MDCT a través de un ejemplo típico de realización.
En el codificador la transformación MDCT se divide típicamente entre tres etapas, estando dividida la señal en tramas de M muestras antes de la codificación MDCT:
• Ponderación de la señal mediante una ventana denominada en este caso "ventana MDCT” de longitud 2M;
5
10
15
20
25
30
35
40
45
50
55
60
65
• Repliegue temporal (o “time-domain aliasing" en inglés) para formar un bloque de longitud M;
• Transformación DCT (por “Discrete Cosine Transform" en inglés) de longitud M.
La ventana MDCT se divide en 4 porciones adyacentes de longitudes iguales a M/2, denominadas en este caso “cuartos”.
La señal se multiplica por la ventana de análisis y posteriormente se efectúan los repliegues: el primer cuarto (en ventana) se repliega (es decir invertido en el tiempo y puesto como recubrimiento) sobre el segundo cuarto y el cuarto cuarto se repliega sobre el tercero.
Más precisamente, el repliegue temporal de un cuarto sobre otro se efectúa de la manera siguiente: la primera muestra del primer cuarto se suma (o resta) a la última muestra del segundo cuarto, la segunda muestra del primer cuarto se suma (o resta) a la anteúltima muestra del segundo cuarto, y así sucesivamente hasta que se sume (o reste) la última muestra del primer cuarto a la primera muestra del segundo cuarto.
Se obtienen por tanto, a partir de 4 cuartos, 2 cuartos replegados en los que cada muestra es el resultado de una combinación lineal de 2 muestras de la señal a codificar. Esta combinación lineal induce un repliegue temporal.
Los 2 cuartos replegados se codifican a continuación conjuntamente después de la transformación DCT (de tipo IV). Para la trama siguiente se desplaza en una mitad de ventana (es decir 50 % de recubrimiento), el tercer y cuarto cuartos de la trama precedentes se convierten entonces en el primer y segundo cuartos de la trama actual. Después del repliegue, se envía una segunda combinación lineal de los mismos pares de muestras como en la trama precedente, pero con unos pesos diferentes.
En el decodificador, después de la transformación DCP inversa se obtiene por tanto la versión decodificada de estas señales replegadas. Dos tramas consecutivas contienen el resultado de 2 repliegues diferentes de los mismos cuartos, es decir para cada par de muestras se tiene el resultado de 2 combinaciones lineales con unos pesos diferentes pero conocidos: se resuelve por tanto un sistema de ecuaciones para obtener la versión decodificada de la señal de entrada, el repliegue temporal puede suprimirse así utilizando 2 tramas decodificadas consecutivas.
La resolución de los sistemas de ecuaciones mencionados puede realizarse en general implícitamente por despliegue, multiplicación por una ventana de síntesis razonablemente elegida y posteriormente suma-recubrimiento de las partes comunes. Esta suma-recubrimiento asegura al mismo tiempo la transición suave (sin discontinuidad debida a los errores de cuantificación) entre 2 tramas decodificadas consecutivas, en efecto esta operación se comporta como un fundido encadenado. En cuanto a la ventana para el primer cuarto o el cuarto cuarto está a cero para cada muestra, se habla de una transformación MDCT sin repliegue temporal en esta parte de la ventana. En este caso la transición suave no se asegura por la transformación MDCT, debe hacerse por otros medios como por ejemplo un fundido encadenado exterior.
Se ha de observar que existen unas variantes de implementación de la transformación MDCT, en particular sobre la definición de la transformada DCT, sobre la manera de replegar temporalmente el bloque a transformar (por ejemplo, se pueden invertir los signos aplicados a los cuartos replegados a izquierda y derecha, o replegar el segundo y tercer cuartos sobre respectivamente el primer y cuarto cuartos), etc. Estas variantes no cambian el principio del análisis-síntesis MDCT con la reducción del bloque de muestras por ventanaje, repliegue temporal y posteriormente transformación y finalmente ventanaje, repliegue y suma-recubrimiento.
Con el fin de evitar las artificiosidades en el momento de las transiciones entre la codificación de tipo CELP y la codificación de tipo MDCT, la solicitud de patente internacional WO2012/085451, cuyo contenido se incorpora por referencia en la presente solicitud, propone un método para codificar una trama de transición. La trama de transición se define como la trama actual codificada por transformada que sucede a una trama precedente codificada mediante una codificación predictiva. Según el nuevo método antes citado, una parte de la trama de transición, por ejemplo una subtrama de 5 ms, en el caso de una codificación de núcleo CELP a 12,8 kHz, y dos tramas CELP suplementarias de 4 ms cada una, en el caso de una codificación de núcleo CELP a 16 kHz, se codifican mediante una codificación predictiva restringida con relación a la codificación predictiva de la trama anterior.
La codificación predictiva restringida consiste en utilizar los parámetros estables de la trama anterior codificada mediante una codificación predictiva, como por ejemplo los coeficientes del filtro de predicción lineal y no codificar más que algunos parámetros mínimos para la subtrama suplementaria en la trama de transición.
Como la trama precedente no se ha codificado con una codificación por transformada, la anulación del repliegue temporal en la primera parte de la trama es imposible. La solicitud de patente WO2012/085451 antes mencionada propone además modificar la primera mitad de la ventana MDCT de manera que no haya repliegue temporal en el primer cuarto normalmente replegado. Se propone así integrar una parte de la suma-recubrimiento (también llamada “fundido encadenado” o también “overlap-add” en inglés) entre la trama CELP decodificada y la trama MDCT decodificada modificando los coeficientes de la ventana de análisis/síntesis. Con referencia a la figura 4e de la solicitud antes citada, los trazos mixtos (líneas alternando puntos y trazos) corresponden a las líneas de repliegue de
5
10
15
20
25
30
35
40
45
50
55
60
65
codificación MDCT (figura de arriba) y a las líneas de despliegue de decodificación MDCT (figura de abajo). En la figura de arriba, las líneas en grueso separan las tramas de nuevas muestras a la entrada del codificador. La codificación de una nueva trama MDCT puede comenzar cuando una trama así definida de nuevas muestras de entrada está enteramente disponible. Es importante remarcar que estas líneas en grueso en el codificador no corresponden a la trama actual sino al bloque de nuevas muestras que llegan para cada trama: la trama actual está retardada de hecho 5 ms que corresponden a una anticipación, denominada “lookahead" en inglés. En la figura de abajo, las líneas en grueso separan las tramas decodificadas a la salida del decodificador.
En el codificador, la ventana de transición es nula hasta el punto de repliegue. De ese modo los coeficientes de la parte izquierda de la ventana replegada serán idénticos a los de la ventana replegada. La parte entre el punto de repliegue y el final de la subtrama CELP de transición (TR) corresponde a un (semi-) ventana sinusoidal. En el decodificador, después del despliegue, se aplica la misma ventana la señal. En el segmento entre el punto de repliegue y el comienzo de la trama MDCT, los coeficientes de la ventana corresponden a una ventana de forma sen2. Para asegurar la suma-recubrimiento entre la subtrama CELP decodificada y la señal procedente de la MDCT, es suficiente aplicar una ventana de tipo cos2 a la parte de la subtrama CELP en recubrimiento y sumar esta última con la trama MDCT. El método es una reconstrucción perfecta.
Sin embargo, pueden perderse unas tramas de la señal de audio codificada en el canal entre el codificador y el decodificador.
Las técnicas de corrección de pérdida de trama existentes muy frecuentemente son muy dependientes del tipo de codificación utilizado. Un ejemplo se propone en el documento US2014/0019142 A1. En el caso de la codificación de la voz basada en tecnologías predictivas, de tipo CELP por ejemplo, la corrección de la pérdida de trama se vincula frecuentemente al modelo de voz. Por ejemplo, la norma G.722.2 del IUT-T, en su versión de julio de 2003, propone sustituir un paquete perdido prolongando la ganancia de predicción a largo término atenuándola, y prolongando las frecuencias de líneas espectrales (ISF en inglés por “Immitance Spectral Frequencies"), que representan los coeficientes A(z) del filtro LPC, haciéndoles tender hacia sus medias respectivas. El periodo fundamental (o “tono") se repite también. La contribución del diccionario fijo se sustituye por su parte con unos valores aleatorios. La aplicación de dichos métodos para los decodificadores por transformada o PCM necesitaría un análisis de tipo CELP a nivel del decodificador, lo que introduciría una complejidad suplementaria significativa. Se observará igualmente que se describen unos métodos más avanzados de corrección de la pérdida de trama durante una decodificación CELP en la norma UIT-T G.718 para las velocidades de 8 y 12 kbit/s así como a las velocidades de decodificación interoperativa con AMR-WB.
Otra solución se presenta en la norma G.711 del ITU-T, que describe un codificador por transformada para el que el algoritmo de corrección de pérdida de trama, tratado en la parte “Apéndice I" consiste en encontrar un retardo tonal (un periodo fundamental) en la señal ya decodificada y repetirlo aplicando una suma-recubrimiento entre la señal ya decodificada y la señal repetida. Esta suma con recubrimiento permite borrar las artificiosidades de audio pero necesita un retardo suplementario en el decodificador (correspondiente a la duración de la suma-recubrimiento) para ser implementada.
En el caso de una codificación por transformada, una técnica extendida para corregir una pérdida de trama consiste en repetir la última trama recibida. Una técnica de ese tipo se implementa en varios codificadores/decodificadores normalizados (G.719, G.722.1 y G.722.1C principalmente). Por ejemplo, en el caso del decodificador G.722.1, una transformada MLT (por “Modulated Lapped Transform" en inglés), equivalente a una transformada MDCT, con un recubrimiento del 50 % y una ventana de forma sinusoidal, permite asegurar una transición suficientemente lenta entre la última trama perdida y la trama repetida para suprimir las artificiosidades ligadas a la simple repetición de la trama.
Una técnica de ese tipo es poco costosa pero tiene como defecto principal la incoherencia entre la señal hasta antes de la pérdida de trama y la señal repetida. Da como resultado una discontinuidad de fase que puede introducir unas artificiosidades de audio importantes si la duración de recubrimiento entre las dos tramas es reducida, como es el caso cuando las ventanas utilizadas para la transformada MLT son unas ventanas llamadas de reducido retardo.
A nivel del decodificador, según las técnicas existentes, cuando falta una trama, se genera una trama de sustitución utilizando un algoritmo de enmascarado del paquete perdido PLC adaptado (por “Packet Loss Concealment" en inglés). Se observará que en general un paquete puede contener varias tramas, así el término PLC puede ser ambiguo, y es en este caso retomado para indicar una corrección de la trama actual perdida. Por ejemplo, a continuación de la trama CELP correctamente recibida y decodificada, si se pierde la trama siguiente, se utiliza una trama de sustitución basada en un PLC adaptado a la codificación CELP utilizada, aprovechando las memorias del codificador CELP. A continuación de una trama MDCT correctamente recibida y decodificada, si se pierde la trama siguiente, se genera una trama de sustitución basada en un PLC adaptado a la codificación MDCT.
En el contexto de la transición entre tramas CELP y MDCT, y considerando que la trama de transición está compuesta por una subtrama CELP (que es de la misma frecuencia de muestreo que la trama CELP directamente
5
10
15
20
25
30
35
40
45
50
55
60
65
precedente) y por una trama MDCT que incluye una ventana MDCT modificada anulando el repliegue “a izquierda”, existen situaciones para las que las técnicas existentes no aportan ninguna solución.
En una primera situación, se ha recibido y decodificado correctamente una trama CELP precedente, se pierde una trama actual de transición y la trama siguiente es una trama MDCT. En este caso, el algoritmo de PLC, después de la recepción de la trama CELP, no sabe que la trama perdida es una trama de transición y genera en consecuencia la trama CELP de sustitución. De ese modo, tal como se ha explicado anteriormente, la primera parte replegada de la trama siguiente MDCT no puede compensarse y el retardo entre los dos tipos de codificador no puede rellenarse con la subtrama CELP contenida en la trama de transición (que se está perdida con la trama de transición). Ninguna solución conocida propone tratar esta situación.
En una segunda situación, una trama precedente en CELP a 12,8 kHz se recibe y decodifica correctamente, se pierde una trama CELP actual a 16 kHz, y la trama siguiente es una trama de transición. El algoritmo de PLC genera entonces una trama CELP a la frecuencia de la última trama correctamente recibida, es decir 12,8 kHz, y la subtrama CELP de transición (codificada parcialmente a partir de parámetros CELP de la trama CELP a 16 kHz perdida) no puede decodificarse.
La presente invención se dirige a mejorar esta situación.
Con este fin, un primer aspecto de la invención se refiere a un procedimiento de decodificación de una señal digital codificada según una codificación predictiva y según una codificación por transformada, que comprende las siguientes etapas:
- decodificación predictiva de una trama precedente de la señal digital, codificada mediante un conjunto de parámetros de codificación predictiva;
- detección de la pérdida de una trama actual de la señal digital codificada;
- generación por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de una trama de sustitución de la trama actual;
- generación por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de un segmento suplementario de señal digital;
- almacenamiento temporal de este segmento suplementario de señal digital.
De ese modo, está disponible un segmento suplementario de señal digital cada vez que se genera una trama CELP de sustitución. Esta decodificación predictiva de la trama precedente engloba la decodificación predictiva de la trama CELP correctamente recibida o la generación de una trama CELP de sustitución mediante un algoritmo de PCL adaptado al CELP.
Por un lado, este segmento suplementario hace posible una transición entre una codificación CELP y una codificación por transformada, incluso en el caso de una pérdida de trama.
En efecto, en la primera situación descrita anteriormente, la transición con la trama MDCT siguiente puede asegurarse por el segmento suplementario. Como se describe en el presente documento a continuación, el segmento suplementario puede añadirse a la trama MDCT siguiente para compensar la primera parte replegada de esta trama MDCT gracias a un fundido encadenado sobre la zona que contiene el repliegue temporal no anulado.
En la segunda situación descrita anteriormente, la decodificación de la trama de transición se hace posible mediante la utilización del segmento suplementario. En efecto, si no es posible decodificar la subtrama CELP de transición (indisponibilidad de los parámetros CELP de la trama precedente codificada a 16 kHz), es posible sustituirla por el segmento suplementario como se describe en el presente documento a continuación.
Por otro lado, los cálculos relativos a la gestión de la pérdida de trama y a la transición se reparten en el tiempo. En efecto, el segmento suplementario se genera y posteriormente se almacena para cada trama CELP de sustitución generada. El segmento de transición se genera por tanto desde que se detecta una pérdida de trama, sin esperar a que se detecte posteriormente una transición. La transición se anticipa por tanto con cada pérdida de trama, lo que evita tener que gestionar un “pico de complejidad” en el momento en el que se recibe y decodifica una nueva trama correcta.
En un modo de realización, el procedimiento incluye además las etapas siguientes:
- recepción de una trama siguiente de señal digital codificada que comprende al menos un segmento codificado por transformada; y
- decodificación de la trama siguiente comprendiendo una subetapa de suma con recubrimiento entre el segmento suplementario de señal digital y el segmento codificado por transformada. La subetapa de suma con recubrimiento hace posible un fundido-encadenado de la señal de salida. Un fundido-encadenado de ese tipo limita la aparición de artificiosidades sonoras (por ejemplo de tipo “ruido metálico”) y asegura una coherencia energética de la señal.
5
10
15
20
25
30
35
40
45
50
55
60
65
En otro modo de realización, se codifica completamente la trama siguiente según una codificación por transformada y la trama actual perdida es una trama de transición entre la trama precedente codificada según una codificación predictiva y la trama siguiente codificada según una codificación por transformada.
En una variante, la trama precedente se codifica según una codificación predictiva por un núcleo de codificador predictivo funcionando a una primera frecuencia. En esta variante, la trama siguiente es una trama de transición que comprende al menos una subtrama codificada según una codificación predictiva por un núcleo de codificador predictivo funcionando a una segunda frecuencia distinta de la primera frecuencia. Con este fin, la trama de transición siguiente puede comprender un bit que indica la frecuencia del núcleo de codificación predictiva utilizado.
De ese modo, el tipo de codificación CELP (12,8 o 16 kHz) utilizado en la subtrama CELP de transición puede indicarse en el tren binario de la trama de transición. La invención prevé así añadir una indicación sistemática (un bit) en una trama de transición, con el fin de permitir la detección de una diferencia de frecuencia de codificación/ decodificación CELP entre la subtrama CELP de transición y la trama CELP precedente.
En otro modo de realización, la suma con recubrimiento se da por aplicación de la fórmula siguiente que implementa una ponderación lineal:
r es un coeficiente representativo de la longitud del segmento suplementario generado; i un instante de una muestra de la trama siguiente, comprendido entre 0 y L/r;
L la longitud de la trama siguiente;
S(i) la amplitud de la trama siguiente después de la suma, para la muestra i;
B(i) la amplitud del segmento decodificado por transformada, para la muestra i;
T(i) la amplitud del segmento suplementario de señal digital, para la muestra i. La suma con recubrimiento puede efectuarse por tanto a partir de combinaciones lineales y de operaciones simples de implementar. El tiempo requerido para la decodificación se reduce así en tanto que se solicita menos del o de los procesadores utilizados por estos cálculos. En unas variantes, pueden implementarse otras formas de fundido encadenado sin cambiar el principio de la invención.
En un modo de realización, la etapa de generación por predicción de la trama de sustitución incluye además una actualización de memorias internas del decodificador, la etapa de generación por predicción del segmento suplementario de señal digital puede incluir las subetapas siguientes:
- copia en una memoria temporal, de las memorias del decodificador actualizadas durante la etapa de generación por predicción de la trama de sustitución;
- generación del segmento suplementario de señal digital por medio de la memoria temporal.
De ese modo, las memorias internas del decodificador no se actualizan para la generación del segmento suplementario. En consecuencia, la generación del segmento de señal suplementaria no impacta en la decodificación de la trama siguiente, en el caso eventual de que la trama siguiente sea una trama CELP.
En efecto, si la trama siguiente es una trama CELP, las memorias internas del decodificador deben corresponder a los estados del decodificador a la salida de la trama de sustitución.
En un modo de realización, la etapa de generación por predicción de un segmento suplementario de señal digital incluye las subetapas siguientes:
- generación por predicción de la trama suplementaria, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente;
- extracción de un segmento de la trama suplementaria.
En este modo de realización, el segmento suplementario de señal digital corresponde a la primera mitad de la trama suplementaria. De ese modo, la eficacia del procedimiento se mejora aún porque los datos temporales de cálculo utilizados para la generación de la trama CELP de sustitución están directamente disponibles para la generación de la trama CELP suplementaria. Típicamente, los registros y memorias caché, en los que se almacenan los datos temporales de cálculo, pueden no actualizarse con el fin de reutilizar directamente estos datos para la generación de la trama CELP suplementaria.
Un segundo aspecto de la invención se dirige a un programa informático que incluye unas instrucciones para la implementación del procedimiento según el primer aspecto de la invención, cuando estas instrucciones se ejecutan por un procesador.
imagen1
en la que:
5
10
15
20
25
30
35
40
45
50
55
60
65
Un tercer aspecto de la invención se dirige a un decodificador de una señal digital codificada según una codificación predictiva y según una codificación por transformada, que comprende:
- una unidad de detección de la pérdida de una trama actual de la señal digital;
- un decodificador predictivo que incluye un procesador dispuesto para efectuar las operaciones siguientes:
* decodificación predictiva de una trama precedente de la señal digital, codificada mediante un conjunto de parámetros de codificación predictiva;
* generación por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de una trama de sustitución de la trama actual;
* generación por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de un segmento suplementario de señal digital;
* almacenamiento temporal de este segmento suplementario de señal digital en una memoria temporal.
En un modo de realización, el decodificador según el tercer aspecto de la invención comprende además un decodificador por transformada que incluye un procesador dispuesto para efectuar las operaciones siguientes:
* recepción de una trama siguiente de señal digital codificada que comprende al menos un segmento codificado por transformada; y
* decodificación de la trama siguiente que comprende una subetapa de suma con recubrimiento entre el segmento suplementario de señal digital y el segmento codificado por transformada.
A nivel del codificador, la invención puede comprender la inserción en la trama de transición de un bit de información sobre el núcleo de CELP empleado para la codificación de la subtrama de transición.
Surgirán otras características y ventajas de la invención con el examen de la descripción detallada a continuación, y de los dibujos adjuntos en los que:
- La figura 1 ilustra un decodificador de audio según un modo de realización de la invención;
- la figura 2 ilustra un decodificador CELP de un decodificador de audio, tal como el decodificador de audio de la figura 1, según un modo de realización de la invención.
- La figura 3 es un diagrama que ilustra las etapas del procedimiento de decodificación, implementado por el decodificador de audio de la figura 1, según un modo de realización de la invención;
- la figura 4 ilustra un dispositivo de cálculo según un modo de realización de la invención.
La figura 1 ilustra un decodificador de audio 100 según un modo de realización de la invención.
No está presente ninguna estructura de codificador de audio. Sin embargo, la señal de audio digital codificada recibida por el decodificador según la invención puede ser el resultado de un codificador adecuado para codificar una señal de audio bajo la forma de tramas CELP, de tramas MDCT y de tramas de transición CELP/MDCT, tal como el codificador descrito en la solicitud WO2012/085451. Con este fin, una trama de transición, codificada por transformada, puede comprender además un segmento (una subtrama por ejemplo) codificada mediante una codificación predictiva. El codificador puede añadir además un bit en la trama de transición para identificar la frecuencia del núcleo CELP utilizado. El ejemplo de codificación CELP se da a título ilustrativo para describir cualquier tipo de codificación predictiva. Igualmente, el ejemplo de codificación MDCT se da a título ilustrativo para describir cualquier tipo de codificación por transformada.
El decodificador 100 comprende una unidad de recepción 101 de la señal de audio digital codificada. La señal digital está codificada bajo la forma de tramas CELP, de tramas MDCT y de tramas de transición CELP/MDCT. En unas variantes de la invención, son posibles otros modos diferentes a los modos CELP y MDCT, y se pueden plantear por tanto otras combinaciones de modos, sin cambiar el principio de la invención. Por otro lado, la codificación CELP se podrá sustituir por otro tipo de codificación predictiva, y la codificación MDCT se podrá sustituir por otro tipo de codificación por transformada.
El decodificador 100 comprende además una unidad de clasificación 102 adecuada para determinar —en general por simple lectura del tren binario e interpretación de las indicaciones recibidas del codificador— si una trama actual es una trama CELP, una trama MDCT, o una trama de transición. En función de la clasificación de la trama actual, esta última puede transmitirse a un decodificador CELP 103 o a un decodificador MDCT 104 (o a los dos, en el caso de una trama de transición, siendo transmitida la subtrama CELP de transición a una unidad de decodificación 105 descrita en el presente documento a continuación). Además, en el caso de que la trama actual sea una trama correcta (o recibida) de transición y en la que la codificación CELP puede funcionar a al menos dos frecuencias (12,8 y 16 kHz), la unidad de clasificación 102 puede determinar el tipo de codificación CELP utilizado en la subtrama CELP suplementaria —indicando este tipo de codificación la velocidad binaria a la salida del codificador—.
Un ejemplo de estructura de decodificador CELP 103 se representa con referencia a la figura 2.
5
10
15
20
25
30
35
40
45
50
55
60
65
Una unidad de recepción 201, que puede comprender una función de desmultiplexado, es adecuada para recibir unos parámetros de codificación CELP de la trama actual. Estos parámetros pueden comprender unos parámetros de excitación (vectores de ganancia, vector de diccionario fijo, vector de diccionario adaptativo por ejemplo) transmitidos a una unidad de decodificación 202 adecuada para generar una excitación. Además, los parámetros de codificación CELP pueden comprender unos coeficientes LPC representados bajo la forma de LSF o de ISF por ejemplo. Los coeficientes LPC se decodifican por una unidad de decodificación 203 adecuada para proporcionar los coeficientes LPC a un filtro LPC de síntesis 205.
El filtro de síntesis 205, excitado por la excitación generada por la unidad 202, sintetiza una trama, o generalmente una subtrama) de señal digital transmitida a un filtro de des-énfasis o desacentuación 206 (función de la forma 1/(1-az"1) con por ejemplo a=0,68). En la salida del filtro de des-énfasis, el decodificador CELP 103 puede comprender un pos-tratamiento de las bajas frecuencias 207 (o “bass-post filíe?’ en inglés) similar al descrito en la norma UIT-T G.718. El decodificador CELP 103 comprende además un re-muestreo 208 de la señal sintetizada a la frecuencia de salida (la frecuencia de salida del decodificador MDCT 104), y una interfaz de salida 209. En unas variantes de la invención, pueden implementarse unos pos-tratamientos suplementarios de la síntesis CELP antes o después del re-muestreo.
Además, en el caso de que la señal digital se descomponga en bandas de frecuencias altas y bajas antes de la codificación, el decodificador CELP 103 puede comprender una unidad de decodificación de las altas frecuencias 204, siendo decodificada la señal de bajas frecuencias por las unidades 202 a 208 descritas anteriormente en el presente documento. La síntesis CELP puede implicar la actualización de estados internos del codificador CELP (o la actualización de memorias internas), tales como:
- unos estados que sirven para la decodificación de la excitación;
- la memoria del filtro de síntesis 205;
- la memoria del filtro de des-énfasis 206;
- unas memorias de pos-tratamiento 207;
- unas memorias de la unidad re-muestreo 208.
Con referencia a la figura 1, el decodificador comprende además una unidad de gestión de la pérdida de trama 108 y una memoria temporal 107.
Con el fin de decodificar una trama de transición, el decodificador 100 comprende además una unidad de decodificación 105 adecuada para recibir la subtrama CELP de transición y la trama de transición decodificada por transformada a la salida del decodificador MDCT 104, con el fin de decodificar la trama de transición por suma con recubrimiento de las señales recibidas. El decodificador 100 puede comprender además una interfaz de salida 106.
El funcionamiento del decodificador 100 según la invención se comprenderá mejor con referencia a la figura 3 que es un diagrama que presenta las etapas del procedimiento según un modo de realización de la invención.
En una etapa 301, puede recibirse o no una trama actual de señal de audio digital codificada por la unidad de recepción 101, procedente de un codificador. Se considera que la trama precedente de señal de audio es una trama correctamente recibida y decodificada o una trama de sustitución.
Se detecta en una etapa 302 si la trama actual codificada es una faltante o si se ha recibido por la unidad de recepción 101.
En el caso de que la trama actual codificada se haya recibido bien, se determina en una etapa 303, por la unidad de clasificación 102, si la trama actual codificada es una trama CELP.
En el caso de que la trama actual codificada sea una trama CELP, el procedimiento comprende una etapa 304 de decodificación y de re-muestreo de la trama CELP codificada, por el decodificador CELP 103. Las memorias internas antes citadas del decodificador CELP 103 pueden actualizarse a continuación en una etapa 305. En una etapa 306, la señal decodificada y re-muestreada se transmite a la salida del decodificador 100. Los parámetros de excitación de la trama actual, así como los coeficientes LPC, pueden almacenarse en la memoria 107.
En el caso de que la trama actual codificada no sea una trama CELP, la trama actual comprende al menos un segmento codificado según una codificación por transformada (trama MDCT o trama de transición). Se verifica entonces en una etapa 307 si la trama actual codificada es una trama MDCT. Si tal es el caso, la trama actual se decodifica en una etapa 308 por el decodificador MDCT 104 y la señal decodificada se transmite a la salida del decodificador 100 en la etapa 306.
Si por el contrario la trama actual no es una trama MDCT, entonces es una trama de transición que se decodifica en una etapa 309 decodificando a la vez la subtrama de transición CELP y trama actual codificada por transformada MDCT y efectuando la suma con recubrimiento de las señales procedentes del decodificador CELP y del
5
10
15
20
25
30
35
40
45
50
55
60
65
decodificador MDCT con el fin de obtener una señal digital transmitida a la salida del decodificador 100 en la etapa 306.
En el caso de que la subtrama actual se haya perdido, se determina en una etapa 310 si la trama precedente recibida y decodificada era una trama CELP. Si tal no es el caso, un algoritmo de PLC adaptado a la MDCT, implementado en la unidad de gestión de pérdida de trama 108 genera una trama de sustitución MDCT decodificada por el decodificador MDCT 104 con el fin de obtener una señal digital de salida, en una etapa 311.
Si la última trama correctamente recibida era una trama CELP, se implementa un algoritmo de PLC adaptado a la CELP por la unidad de gestión de pérdida de trama 108 y el decodificador CELP 103 con el fin de generar una trama CELP de sustitución, en una etapa 312.
El algoritmo de PLC puede comprender las etapas siguientes:
- estimación por interpolación de los parámetros LSF y del filtro LPC en función de los parámetros LSF de la trama precedente, actualizando, en una etapa 313, las memorias de los cuantificadores predictivos LSF (que pueden ser por ejemplo de tipo AR o MA) —se da un ejemplo de implementación de la estimación de los parámetros LPC en caso de pérdida de trama para el caso de los parámetros ISF en las cláusulas 7.11.1.2 “¡SF estimation and interpolatiorí’ y 7.11.1.7 “Spectral envelope concealment, synthesis, and updates" de la norma UIT-T G.718—. Alternativamente la estimación descrita en la cláusula I.5.2.3.3 de la norma UIT-T G.722.2 Apéndice I podrá utilizarse igualmente en el caso de una cuantificación de tipo MA;
- estimación de la excitación a partir de la ganancia adaptativa y de la ganancia fija de la trama precedente, actualizando estos valores, en la etapa 313, para la trama siguiente. Un ejemplo de estimación de la excitación se describe en las cláusulas 7.11.1.3 “Extrapolation of future pitch’’, 7.11.1.4 “Construction of the periodic part of the excitation’’, 7.11.1.15 “Glottal pulse resynchronization in low-delay’, 7.11.1.6 “Construction of the random part of the excitation’’. El vector del diccionario fijo se sustituye típicamente en cada subtrama por una señal aleatoria, el diccionario adaptativo utiliza un tono eXtrapolado y las ganancias de diccionarios procedentes de la trama precedente se han atenuado típicamente según la clase de la señal en la última trama recibida. Alternativamente, podrá utilizarse igualmente la estimación de la excitación descrita en la norma UIT-T G.722.2 Apéndice I;
- sintetizar la señal a partir de la excitación y del filtro de síntesis 205 actualizado y utilizando la memoria de síntesis de la trama precedente, actualizando la memoria de síntesis de la trama precedente en la etapa 313;
- des-énfasis de la señal sintetizada utilizando la unidad de des-énfasis 206, y actualizando, en la etapa 313, la memoria de la unidad de des-énfasis 206;
- de manera opcional, pos-tratamiento 207 de la señal de síntesis actualizando, en la etapa 313, la memoria del pos-tratamiento —se puede observar que el pos-tratamiento puede desactivarse durante la corrección de pérdida de trama porque las informaciones que utiliza no son fiables porque son simplemente extrapoladas, en este caso las memorias del pos-tratamiento deben por su parte actualizarse para permitir un funcionamiento normal de la próxima trama recibida—;
- re-muestreo de la señal sintetizada a la frecuencia de salida por el re-muestreo 208, actualizando la memoria del filtro 208 en la etapa 313.
La actualización de las memorias internas permite la decodificación de una eventual trama siguiente codificada por predicción CELP sin discontinuidad. A observar que, en la norma UIT-T G.718, se emplean igualmente unas técnicas de “recovery” y de control de la energía de la síntesis (por ejemplo las cláusulas 7.11.1.8 y 7.11.1.8.1) durante la decodificación de una trama recibida después de una corrección de pérdida de trama. Este aspecto no se considera aquí porque se sale del marco de la invención.
En una etapa 314, las memorias así actualizadas pueden copiarse en la memoria temporal 107. La trama CELP de sustitución decodificada se transmite a la salida del decodificador en una etapa 315.
En una etapa 316, el procedimiento según la invención prevé la generación por predicción, de un segmento suplementario de señal digital, implementando un algoritmo de PLC adaptado al CELP. La etapa 316 puede comprender las subetapas siguientes:
- estimación por interpolación de los parámetros LSF y del filtro LPC en función de los parámetros LSF de la trama CELP precedente, sin actualizar las memorias de los cuantificadores LSF. La estimación por interpolación puede implementarse según el mismo método que el empleado para la estimación por interpolación para la trama de sustitución descrita en el presente documento anteriormente (sin actualización de las memorias de los cuantificadores LSF);
- estimación de la excitación con ayuda de la ganancia adaptativa y de la ganancia fija de la trama CELP precedente, sin actualizar estos valores para la trama siguiente. La excitación puede determinarse según el mismo método que el empleado para la determinación de la excitación para la trama de sustitución (sin la actualización de los valores de ganancia adaptativa y de ganancia fija);
- sintetizar un segmento de señal (una semitrama o una subtrama por ejemplo) a partir de la excitación y del filtro de síntesis 205 recalculado y utilizando la memoria de síntesis de la trama precedente;
5
10
15
20
25
30
35
40
45
50
55
60
65
- des-énfasis de la señal sintetizada utilizando la unidad de des-énfasis 206;
- de manera opcional, pos-tratamiento de la señal sintetizada utilizando la memoria del pos-tratamiento 207;
- re-muestreo de la señal de síntesis a la frecuencia de salida por el re-muestreo 208, utilizando las memorias de re-muestreo 208.
Es importante observar que para cada una de las etapas, la invención prevé memorizar en unas variables temporales los estados de la decodificación CELP que se modifican en cada una de las etapas, antes de efectuar estas etapas, de manera que puedan restablecerse los estados predeterminados a sus valores memorizados después de la generación del segmento temporal.
El segmento de señal suplementaria generado se almacena en la memoria 107 en una etapa 317.
En una etapa 318, se recibe una trama siguiente de señal digital por la unidad de recepción 101. Se verifica en una etapa 319 que la trama siguiente es una trama MDCT o una trama de transición.
Si tal no es el caso, entonces la trama siguiente es una trama CELP y se decodifica por el decodificador CELP 103 en una etapa 320. El segmento suplementario sintetizado en la etapa 316 no se utiliza y puede suprimirse de la memoria 107.
En el caso en el que la trama siguiente es una trama MDCT o una trama de transición, se decodifica por el decodificador MDCT 104 en una etapa 322. En paralelo, el segmento de señal digital suplementario almacenado en la memoria 107 se recupera en una etapa 323 por la unidad de gestión 108 y se transmite a la unidad de decodificación 105.
En el caso en el que la trama siguiente es una trama MDCT, el segmento de señal suplementario obtenido permite efectuar una suma-recubrimiento por la unidad 103 con el fin de decodificar correctamente la primera parte de la trama MDCT siguiente, en una etapa 324. Por ejemplo, cuando el segmento suplementario es una mitad de subtrama, puede aplicarse una ganancia lineal entre 0 y 1 durante la suma-recubrimiento sobre la primera mitad de la trama MDCT y se aplica una ganancia lineal entre 1 y 0 sobre el segmento de señal suplementario. Sin este segmento de señal suplementario, la decodificación MDCT puede dar lugar a unas discontinuidades debidas a los errores de cuantificación.
En el caso en el que la trama siguiente es una trama de transición, se han de distinguir dos casos como se considera en el presente documento a continuación. Se recuerda que la decodificación de la trama de transición se apoya no solamente en la clasificación de la trama actual como “trama de transición” sino también en una indicación del tipo de codificación CELP (12,8 o 16 kHz) cuando son posibles varias frecuencias de codificación CELP. De ese modo:
- si la trama CELP precedente se ha codificado mediante un núcleo a una primera frecuencia (por ejemplo 12,8 kHz) y la subtrama CELP de transición se ha codificado por un núcleo a una segunda frecuencia (por ejemplo 16 kHz), entonces la subtrama de transición no puede decodificarse, y el segmento de señal suplementario permite entonces a la unidad de decodificación 105 asegurar la suma recubrimiento con la señal procedente de la decodificación MDCT de la etapa 322. Por ejemplo, cuando el segmento suplementario es una mitad de subtrama, puede aplicarse una ganancia lineal entre 0 y 1 durante la suma recubrimiento sobre la primera mitad de la trama MDCT y se aplica una ganancia lineal entre 1 y 0 sobre el segmento de señal suplementario;
- si la trama CELP precedente y la subtrama CELP de transición se han codificado por un núcleo a la misma frecuencia, entonces la subtrama CELP de transición puede decodificarse y utilizarse por la unidad de decodificación 105 para la suma-recubrimiento con la señal digital procedente del decodificador MDCT 104 habiendo decodificado la trama de transición.
La suma con recubrimiento entre el segmento de señal suplementario y la trama MDCT decodificada puede darse por la fórmula siguiente:
imagen2
imagen3
en la que:
- r un coeficiente representativo de la longitud del segmento suplementario generado, siendo la longitud igual a L/r. No se asigna ninguna restricción al valor r, que se elegirá de manera que permita un recubrimiento suficiente entre el segmento de señal suplementario y trama MDCT de transición decodificada. Por ejemplo, r puede ser igual a 2;
- i un instante correspondiente a una muestra de la trama siguiente, comprendido entre 0 y L/r;
- L la longitud de la trama siguiente (por ejemplo 20 ms);
5
10
15
20
25
30
35
40
- S(i) la amplitud de la trama siguiente después de la suma, para la muestra i;
- B(i) la amplitud del segmento decodificado por transformada, para la muestra i;
- T(i) la amplitud del segmento suplementario de la señal digital, para la muestra i.
La señal digital obtenida después de la suma recubrimiento se transmite a la salida del decodificador en una etapa 325.
De ese modo, la invención prevé, con la pérdida de una trama actual que sigue a una trama CELP precedente, la generación de un segmento suplementario además de una trama de sustitución. En ciertos casos, y principalmente si la trama siguiente es una trama CELP, un segmento suplementario de ese tipo no se utiliza. Sin embargo, su cálculo no induce ninguna complejidad suplementaria en la medida en la que la que se reutilizan los parámetros de codificación de la trama precedente. Por el contrario, cuando la trama siguiente es una trama MDCT o una trama de transición con una subtrama CELP a una frecuencia de núcleo diferente de la frecuencia de núcleo utilizada para la codificación de la trama CELP precedente, el segmento de señal suplementario generado y almacenado permite la decodificación de la trama siguiente, lo que no se permitía por la técnica anterior.
La figura 4 representa un ejemplo de dispositivo de cálculo 400 que puede integrarse en el codificador CELP 103 y en el codificador MDCT 104.
El dispositivo 400 comprende una memoria volátil 404 y un procesador 403 para almacenar unas instrucciones que permitan la implementación de etapas del procedimiento descrito anteriormente en el presente documento (implementadas por el codificador CELP 103 o por el codificador MDCT 104). El dispositivo incluye también una memoria masiva 405 para almacenamiento de datos destinados al ser conservados después de la aplicación del procedimiento. El dispositivo 400 incluye además una interfaz de entrada 401 y una interfaz de salida 406 respectivamente destinadas a recibir las tramas de la señal digital y transmitir las tramas de señal decodificadas.
El dispositivo 400 puede incluir además un procesador de señal digital (DSP) 402. Este DSP 402 recibe las tramas de señal digital para poner en forma, demodular y amplificar, de manera conocida por sí misma estas tramas.
La presente invención no se limita a las formas de realización descritas en el presente documento anteriormente a título de ejemplos; se extiende a otras variantes.
De ese modo, se ha descrito en el presente documento anteriormente un modo de realización en el que el decodificador es una entidad completa. Por supuesto, un decodificador de ese tipo puede integrarse en cualquier tipo de dispositivo mayor como por ejemplo un teléfono portátil, un ordenador, etc.
Además, se ha descrito un modo de realización que propone una arquitectura particular del decodificador. Estas arquitecturas no se dan más que a título ilustrativo. De ese modo, se puede plantear igualmente una disposición de los componentes y un reparto diferente de las tareas asignadas a cada uno de estos componentes.

Claims (11)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Procedimiento de decodificación de una señal digital codificada según una codificación predictiva y según una codificación por transformada, que comprende las siguientes etapas:
    - decodificación (304) predictiva de una trama precedente de la señal digital, codificada mediante un conjunto de parámetros de codificación predictiva;
    - detección (302) de la pérdida de una trama actual de la señal digital codificada;
    - generación (312) por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de una trama de sustitución de la trama actual;
    - generación (316) por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de un segmento suplementario de señal digital;
    - almacenamiento (317) temporal de este segmento suplementario de señal digital.
  2. 2. Procedimiento según la reivindicación 1, que comprende además las siguientes etapas:
    - recepción (318) de una trama siguiente de señal digital codificada que comprende al menos un segmento codificado por transformada; y
    - decodificación (322; 323; 324) de la trama siguiente comprendiendo una subetapa de suma con recubrimiento entre el segmento suplementario de señal digital y dicho segmento codificado por transformada.
  3. 3. Procedimiento según la reivindicación 2, en el que se codifica completamente la trama siguiente según una codificación por transformada, y
    en el que la trama actual perdida es una trama de transición entre la trama precedente codificada según una codificación predictiva y la trama siguiente codificada según una codificación por transformada.
  4. 4. Procedimiento según la reivindicación 2, en el que la trama precedente se codifica según una codificación predictiva por un núcleo de codificador predictivo funcionando a una primera frecuencia, y
    en el que la trama siguiente es una trama de transición que comprende al menos una subtrama codificada según una codificación predictiva por un núcleo de codificador predictivo funcionando a una segunda frecuencia distinta de la primera frecuencia.
  5. 5. Procedimiento según la reivindicación 4, en el que la trama siguiente comprende un bit que indica la frecuencia del núcleo de codificación predictiva utilizado.
  6. 6. Procedimiento según una de las reivindicaciones 2 a 5, en el que la suma con recubrimiento se da por aplicación de la fórmula siguiente:
    - r es un coeficiente representativo de la longitud del segmento suplementario generado;
    - i un instante que corresponde a una muestra de la trama siguiente, comprendido entre 0 y L/r;
    - L la longitud de la trama siguiente;
    - S(i) la amplitud de la trama siguiente después de la suma, para la muestra i;
    - B(i) la amplitud del segmento decodificado por transformada, para la muestra i;
    - T(i) la amplitud del segmento suplementario de señal digital, para la muestra i.
  7. 7. Procedimiento según una de las reivindicaciones precedentes, en el que la etapa de generación por predicción de la trama de sustitución incluye además una actualización (313) de memorias internas del decodificador, y
    en el que la etapa de generación por predicción del segmento suplementario de señal digital incluye las subetapas siguientes:
    - copia (314) en una memoria temporal (107), de las memorias del decodificador actualizadas durante la etapa de generación por predicción de la trama de sustitución;
    - generación (316) del segmento suplementario de señal digital por medio de la memoria temporal.
  8. 8. Procedimiento según una de las reivindicaciones precedentes, en el que la etapa de generación por predicción de un segmento suplementario de señal digital incluye las subetapas siguientes:
    - generación por predicción de la trama suplementaria, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente;
    - extracción de un segmento de la trama suplementaria; y
    imagen1
    en la que:
    5
    10
    15
    20
    25
    30
    en el que el segmento suplementario de señal digital corresponde a la primera mitad de la trama suplementaria.
  9. 9. Programa informático que incluye unas instrucciones para la implementación del procedimiento según una cualquiera de las reivindicaciones precedentes, cuando estas instrucciones se ejecutan por un procesador.
  10. 10. Decodificador de una señal digital codificada según una codificación predictiva y según una codificación por transformada, que comprende:
    - una unidad de detección (108) de la pérdida de una trama actual de la señal digital;
    - un decodificador predictivo (103) que incluye un procesador dispuesto para efectuar las operaciones siguientes:
    * decodificación predictiva de una trama precedente de la señal digital, codificada mediante un conjunto de parámetros de codificación predictiva;
    * generación por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de una trama de sustitución de la trama actual;
    * generación por predicción, a partir de al menos un parámetro de codificación predictiva que codifica la trama precedente, de un segmento suplementario de señal digital;
    * almacenamiento temporal de dicho segmento suplementario de señal digital en una memoria temporal (107).
  11. 11. Decodificador según la reivindicación 10, que incluye además un decodificador por transformada (104) que incluye un procesador dispuesto para efectuar las operaciones siguientes:
    * recepción de una trama siguiente de señal digital codificada que comprende al menos un segmento codificado por transformada; y
    * decodificación de la trama siguiente por transformada;
    comprendiendo dicho decodificador además una unidad de decodificación (105) que comprende un procesador dispuesto para efectuar una suma con recubrimiento entre el segmento suplementario de señal digital y el segmento codificado por transformada.
ES15757533.3T 2014-07-29 2015-07-27 Gestión de la pérdida de trama en un contexto de transición FD/LPD Active ES2676834T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1457356 2014-07-29
FR1457356A FR3024582A1 (fr) 2014-07-29 2014-07-29 Gestion de la perte de trame dans un contexte de transition fd/lpd
PCT/FR2015/052075 WO2016016567A1 (fr) 2014-07-29 2015-07-27 Gestion de la perte de trame dans un contexte de transition fd/lpd

Publications (1)

Publication Number Publication Date
ES2676834T3 true ES2676834T3 (es) 2018-07-25

Family

ID=51894139

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15757533.3T Active ES2676834T3 (es) 2014-07-29 2015-07-27 Gestión de la pérdida de trama en un contexto de transición FD/LPD

Country Status (8)

Country Link
US (2) US10600424B2 (es)
EP (1) EP3175444B1 (es)
JP (2) JP6687599B2 (es)
KR (1) KR102386644B1 (es)
CN (2) CN106575505B (es)
ES (1) ES2676834T3 (es)
FR (1) FR3024582A1 (es)
WO (1) WO2016016567A1 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
KR102547480B1 (ko) * 2014-12-09 2023-06-26 돌비 인터네셔널 에이비 Mdct-도메인 에러 은닉
KR101754702B1 (ko) * 2015-09-03 2017-07-07 유신정밀공업 주식회사 밴드 스프링을 구비한 호스 클램프
US11647241B2 (en) * 2019-02-19 2023-05-09 Sony Interactive Entertainment LLC Error de-emphasis in live streaming
US20220172733A1 (en) * 2019-02-21 2022-06-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods for frequency domain packet loss concealment and related decoder

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969193A (en) * 1985-08-29 1990-11-06 Scott Instruments Corporation Method and apparatus for generating a signal transformation and the use thereof in signal processing
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
WO1999050828A1 (en) * 1998-03-30 1999-10-07 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
BR0009262A (pt) * 1999-03-05 2002-02-05 Toshiba Kk Toshiba Corp Aparelho de codificação de vìdeo e aparelho de decodificação de vìdeo
US6952668B1 (en) * 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
JP2001169281A (ja) * 1999-12-13 2001-06-22 Matsushita Electric Ind Co Ltd 動画像符号化装置、および動画像符号化方法
JP2003209845A (ja) * 2002-01-11 2003-07-25 Mitsubishi Electric Corp 画像符号化集積回路
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
JP4331928B2 (ja) * 2002-09-11 2009-09-16 パナソニック株式会社 音声符号化装置、音声復号化装置、及びそれらの方法
WO2004084182A1 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Decomposition of voiced speech for celp speech coding
US20040199276A1 (en) * 2003-04-03 2004-10-07 Wai-Leong Poon Method and apparatus for audio synchronization
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal
JP4445328B2 (ja) * 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
US20060088093A1 (en) * 2004-10-26 2006-04-27 Nokia Corporation Packet loss compensation
US8634413B2 (en) * 2004-12-30 2014-01-21 Microsoft Corporation Use of frame caching to improve packet loss recovery
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US20080215340A1 (en) * 2005-05-25 2008-09-04 Su Wen-Yu Compressing Method for Digital Audio Files
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
CN101310329A (zh) * 2005-10-18 2008-11-19 诺基亚公司 用于重新同步分组音频流的方法和装置
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US7805297B2 (en) * 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
CN101331539A (zh) * 2005-12-15 2008-12-24 汤姆逊许可公司 用于互联网协议语音的包丢失恢复方法和设备
US8024192B2 (en) * 2006-08-15 2011-09-20 Broadcom Corporation Time-warping of decoded audio signal after packet loss
CN101366080B (zh) * 2006-08-15 2011-10-19 美国博通公司 一种更新解码器的状态的方法和系统
JP2010503881A (ja) 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
PT2102619T (pt) * 2006-10-24 2017-05-25 Voiceage Corp Método e dispositivo para codificação de tramas de transição em sinais de voz
CN101833954B (zh) * 2007-06-14 2012-07-11 华为终端有限公司 一种实现丢包隐藏的方法和装置
CN101325537B (zh) * 2007-06-15 2012-04-04 华为技术有限公司 一种丢帧隐藏的方法和设备
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8607127B2 (en) 2007-09-21 2013-12-10 France Telecom Transmission error dissimulation in a digital signal with complexity distribution
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
CN101471073B (zh) * 2007-12-27 2011-09-14 华为技术有限公司 一种基于频域的丢包补偿方法、装置和系统
CN101588341B (zh) * 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
WO2010000303A1 (en) * 2008-06-30 2010-01-07 Nokia Corporation Speech decoder with error concealment
EP2311034B1 (en) * 2008-07-11 2015-11-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
KR101261677B1 (ko) * 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
US8463603B2 (en) * 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
JP2012516462A (ja) * 2009-01-28 2012-07-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報、オーディオ信号を符号化および復号化する方法およびコンピュータ・プログラム
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
US20110046761A1 (en) * 2009-08-19 2011-02-24 Paul Frederick Titchener Recorded Media Enhancement Method
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
US8442837B2 (en) * 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8321216B2 (en) * 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
ES2968927T3 (es) * 2010-07-08 2024-05-14 Fraunhofer Ges Forschung Decodificador que utiliza cancelación del efecto de solapamiento hacia delante
EP2619758B1 (en) * 2010-10-15 2015-08-19 Huawei Technologies Co., Ltd. Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
EP4243017A3 (en) * 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
DE102011088519A1 (de) * 2011-12-14 2013-06-20 Metabowerke Gmbh Stator für einen Elektromotor sowie Verfahren zur Herstellung eines Stators für einen Elektromotor
US9043201B2 (en) * 2012-01-03 2015-05-26 Google Technology Holdings LLC Method and apparatus for processing audio frames to transition between different codecs
US9053699B2 (en) * 2012-07-10 2015-06-09 Google Technology Holdings LLC Apparatus and method for audio frame loss recovery
US9123328B2 (en) 2012-09-26 2015-09-01 Google Technology Holdings LLC Apparatus and method for audio frame loss recovery
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
CN103714821A (zh) * 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
US9661340B2 (en) * 2012-10-22 2017-05-23 Microsoft Technology Licensing, Llc Band separation filtering / inverse filtering for frame packing / unpacking higher resolution chroma sampling formats
CN103854649B (zh) * 2012-11-29 2018-08-28 中兴通讯股份有限公司 一种变换域的丢帧补偿方法及装置
EP2951814B1 (en) * 2013-01-29 2017-05-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-frequency emphasis for lpc-based coding in frequency domain
CA2916150C (en) * 2013-06-21 2019-06-18 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method realizing improved concepts for tcx ltp
CN103456307B (zh) * 2013-09-18 2015-10-21 武汉大学 音频解码器中帧差错隐藏的谱代替方法及系统
US10390034B2 (en) * 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
WO2015131330A1 (en) * 2014-03-04 2015-09-11 Microsoft Technology Licensing, Llc Encoding strategies for adaptive switching of color spaces, color sampling rates and/or bit depths
US20150264357A1 (en) * 2014-03-11 2015-09-17 Stmicroelectronics S.R.L. Method and system for encoding digital images, corresponding apparatus and computer program product
CN105099949A (zh) * 2014-04-16 2015-11-25 杜比实验室特许公司 基于对延迟抖动和对话动态的监视的抖动缓冲器控制
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition

Also Published As

Publication number Publication date
CN106575505B (zh) 2021-06-01
JP2017523471A (ja) 2017-08-17
EP3175444B1 (fr) 2018-04-11
KR102386644B1 (ko) 2022-04-14
WO2016016567A1 (fr) 2016-02-04
JP2020091496A (ja) 2020-06-11
US10600424B2 (en) 2020-03-24
US11475901B2 (en) 2022-10-18
US20170213561A1 (en) 2017-07-27
FR3024582A1 (fr) 2016-02-05
JP6687599B2 (ja) 2020-04-22
CN113571070B (zh) 2023-09-29
JP7026711B2 (ja) 2022-02-28
KR20170037661A (ko) 2017-04-04
CN113571070A (zh) 2021-10-29
EP3175444A1 (fr) 2017-06-07
US20200175995A1 (en) 2020-06-04
CN106575505A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
ES2676834T3 (es) Gestión de la pérdida de trama en un contexto de transición FD/LPD
JP7488926B2 (ja) フォワードエイリアシング消去を用いた符号化器
ES2639127T3 (es) Aparato y procedimiento que realiza un desvanecimiento de un espectro MDCT a ruido blanco antes de la aplicación de FDNS
ES2657393T3 (es) Codificador y descodificador de audio para codificar y descodificar muestras de audio
ES2529221T3 (es) Codificación de sonido con bajo retardo que alterna codificación predictiva y codificación por transformada
ES2683077T3 (es) Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
ES2644967T3 (es) Extensión adaptativa del ancho de banda y aparato para la misma
ES2676832T3 (es) Determinación de un presupuesto de codificación de una trama de transición LPD/FD
PT2301023T (pt) Esquema de codificação/descodificação áudio de baixo débito com comutadores em cascata
ES2651988T3 (es) Transición desde una codificación/decodificación por transformada hacia una codificación/decodificación predictiva