ES2664968T3 - Encubrimiento de pérdida de trama de audio - Google Patents

Encubrimiento de pérdida de trama de audio Download PDF

Info

Publication number
ES2664968T3
ES2664968T3 ES16178186.9T ES16178186T ES2664968T3 ES 2664968 T3 ES2664968 T3 ES 2664968T3 ES 16178186 T ES16178186 T ES 16178186T ES 2664968 T3 ES2664968 T3 ES 2664968T3
Authority
ES
Spain
Prior art keywords
frame
prototype
sinusoidal
frequency
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16178186.9T
Other languages
English (en)
Inventor
Stefan Bruhn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2664968T3 publication Critical patent/ES2664968T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stringed Musical Instruments (AREA)
  • Packaging For Recording Disks (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Television Receiver Circuits (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un método de encubrimiento de pérdida de trama, en el que un segmento de una señal de audio previamente recibida o reconstruida se utiliza como una trama prototipo para crear una trama de sustitución para una trama de audio perdida, comprendiendo el método: - transformar la trama prototipo en un dominio de frecuencia; - aplicar un modelo sinusoidal a la trama prototipo para identificar frecuencias de componentes sinusoidales de la señal de audio; - calcular un cambio de fase qk para los componentes sinusoidales identificados; - cambiar qk las fases de los componentes sinusoidales identificados; - crear la trama de sustitución realizando una transformación de frecuencia inversa de un espectro de frecuencia de la trama prototipo; caracterizado porque: - cambiar las fases de los componentes sinusoidales identificados comprende cambiar qk una fase de todos los coeficientes espectrales en la trama prototipo incluida en un intervalo Mk alrededor de un sinusoide k; - las fases de coeficientes espectrales que no son cambiadas de fase son aleatorizadas; y - un espectro de magnitud de la trama prototipo se mantiene sin cambios.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
descripción
Encubrimiento de pérdida de trama de audio Campo técnico
La invención se refiere generalmente a un método para encubrir una trama de audio perdida de una señal de audio recibida. La invención también se refiere a un decodificador configurado para encubrir una trama de audio perdida de una señal de audio codificada recibida. La invención, adicionalmente, se refiere a un receptor que comprende un decodificador, y a un programa de ordenador y a un producto de programa de ordenador.
Antecedentes
Un sistema de comunicación de audio convencional transmite señales de audio y habla en tramas, que significa que el lado de envío primero dispone la señal de sonido en segmentos cortos, es decir, tramas de señal de sonido, de, por ejemplo, 20-40 ms, que después se codifican y se transmiten como una unidad lógica en, por ejemplo, un paquete de transmisión. Un decodificador en el lado de recepción decodifica cada una de esas unidades y reconstruye los correspondientes tramas de señal de audio, que a su vez son finalmente emitidas como una secuencia continua de muestras de señal de audio reconstruida.
Antes de la codificación, una conversión de analógico a digital (A/D) puede convertir la señal analógica de habla o audio procedente de un micrófono en una secuencia de muestras de señal digital de audio. A la inversa, en el extremo de recepción, un paso de conversión D/A final típicamente convierte la secuencia de muestras de señal digital de audio reconstruida en una señal analógica, continua en el tiempo, para reproducir en un altavoz.
Sin embargo, un sistema de transmisión convencional para señales de audio y habla puede sufrir errores de transmisión, que puede llevar a una situación en la que uno o varios de las tramas transmitidos no están disponibles en el lado receptor para la reconstrucción. En ese caso, el decodificador tiene que generar una señal sustituta para cada trama no disponible. Esto puede realizarse por una llamada unidad de encubrimiento de pérdida de trama de audio en el decodificador en el lado receptor. El objetivo del encubrimiento de pérdida de trama es hacer que la pérdida de trama sea lo más inaudible posible, y, por consiguiente, mitigar el impacto de la pérdida de trama en la calidad de la señal reconstruida.
Los métodos de encubrimiento de pérdida de trama convencionales pueden depender de la estructura o la arquitectura del códec, por ejemplo, repitiendo parámetros de códec recibidos anteriormente. Dichas técnicas de repetición de parámetros son claramente dependientes en los parámetros específicos del códec usado, y pueden no ser fácilmente aplicables a otros códecs con una estructura diferente. Los métodos de encubrimiento de pérdida de tramas actuales pueden, por ejemplo, congelar y extrapolar parámetros de una trama recibido anteriormente con el fin de generar una trama de sustitución para la trama perdida. Los códecs lineares predictivos estandarizados AMR y AMR-WB son códecs de habla paramétrica que congelan los parámetros recibidos anteriores o usan alguna extrapolación de los mismos para la decodificación. En esencia, el principio es tener un modelo dado para codificar /decodificar y aplicar el mismo modelo con parámetros congelados o extrapolados.
Muchos códecs de audio aplican una técnica de dominio de frecuencia codificada, que implica aplicar un modelo de codificación en un parámetro espectral después de una transformación de dominio de frecuencia. El decodificador reconstruye el espectro de señales desde los parámetros recibidos y transforma el espectro de vuelta a una señal de tiempo. Típicamente, la señal de tiempo se reconstruye trama por trama, y las tramas se combinan por técnicas de agregar y superponer y potenciar otros procesamientos adicionales para formar la señal final reconstruida. El encubrimiento de pérdida de trama de audio correspondiente aplica el mismo, o al menos un modelo de decodificación similar para tramas perdidos, donde los parámetros de dominio de frecuencia de una trama recibido anteriormente son congelados o adecuadamente extrapolados y entonces usados en la conversión de dominio de frecuencia a tiempo.
“Encubrimiento de borradura de trama usando síntesis de análisis sinusoidal y su aplicación a códecs basados en MDCT”, Parikh, et al., el documento ICASSP 2000, presenta un algoritmo de encubrimiento de borradura de trama basado en una síntesis de análisis sinusoidal y su aplicación a códecs basados en MDCT. Cuando una trama se pierde, se realiza un análisis sinusoidal de la señal anterior decodificada y amortiguada. El análisis da un conjunto de sinusoides, que se usan para sintetizar la forma de onda correspondiente a la trama perdida.
Sin embargo, los métodos de encubrimiento de pérdida de trama de audio convencionales pueden sufrir de perjuicios de calidad, por ejemplo, desde la congelación de parámetros y la técnica de extrapolación y replicación del mismo modelo de decodificador para las tramas perdidos no siempre puede garantizar una evolución suave y fiel de la señal desde las tramas de señales decodificadas con anterioridad a la trama perdida. Esto puede llevar a discontinuidades de señal audibles con un impacto de calidad correspondiente. De este modo, el encubrimiento de pérdida de trama de audio con perjuicio de calidad reducido es deseable y necesitado.
5
10
15
20
25
30
35
40
45
50
55
60
65
Sumario
El objeto de realizaciones de la presente invención es para dirigir al menos algunos de los problemas mencionados anteriormente, y este objeto y otros se consiguen por el método y los arreglos según las reivindicaciones adjuntadas independientes, y por las realizaciones según las reivindicaciones dependientes.
Según un primer aspecto, un método de encubrimiento de pérdida de trama se divulga según la reivindicación 1.
Según un segundo aspecto, un aparato se configura para implementar un método de encubrimiento de pérdida de trama tal como se describe en la reivindicación 3.
El aparato puede estar comprendido en un decodificador de audio.
El decodificador puede estar implementado en un dispositivo, tal como, por ejemplo, un teléfono móvil.
Según un tercer aspecto, las realizaciones proporcionan un programa de ordenador que se define para encubrir una trama de audio perdida, donde el programa de ordenador comprende instrucciones que cuando se ejecutan por un procesador hace que el procesador encubra una trama de audio perdida, de acuerdo con el primer aspecto.
Según un cuarto aspecto, las realizaciones proporcionan un producto de programa de ordenador que comprende un medio de ordenador legible que almacena un programa de ordenador según el tercer aspecto mencionado anteriormente.
Las ventajas de las realizaciones descritas aquí son proporcionar un método de encubrimiento de pérdida de trama que permite mitigar el impacto audible de pérdida de trama en la transmisión de señales de audio, por ejemplo, de habla codificada. Una ventaja general es proporcionar una evolución suave y fiel de la señal reconstruida para una trama perdida, donde el impacto audible de las pérdidas de trama es muy reducido en comparación a técnicas convencionales.
Características y ventajas adicionales de las enseñanzas en las realizaciones de la presente aplicación quedarán claras después de leer la siguiente descripción y los dibujos que acompañan.
Breve descripción de los dibujos
Las realizaciones serán descritas más detalladamente y en referencia a los dibujos que se acompañan, en los que: la figura 1 ilustra una función típica de ventana; la figura 2 ilustra una función específica de ventana;
la figura 3 exhibe un ejemplo de un espectro de magnitud de una función de ventana; la figura 4 ilustra un espectro de línea de una señal ejemplar sinusoidal con la frecuencia fk; la figura 5 muestra un espectro de una señal sinusoidal de ventana con la frecuencia fk;
la figura 6 ilustra unas barras correspondientes a la magnitud de los puntos de cuadrícula de un DFT, basado en una trama de análisis;
la figura 7 ilustra una parábola que encaja a través de los puntos de cuadrícula DFT; la figura 8 es un diagrama de flujo de un método según realizaciones; las figuras 9 y 10 ambas ilustran un decodificador según realizaciones; y
la figura 11 ilustra un programa de ordenador y un producto de programa de ordenador, según realizaciones. Descripción detallada
En lo siguiente, las realizaciones de la invención serán descritas más detalladamente. Para el objetivo de la explicación y no limitación, se divulgan detalles específicos, tal como escenarios y técnicas particulares, con el fin de proporcionar un pleno entendimiento.
Lo que, es más, es aparente que el método ejemplar y los dispositivos descritos más abajo pueden ser implementados, al menos en parte, por el uso de un funcionamiento de equipo lógico informático en conjunto con un microprocesador programado u ordenador de objetivo general, y/o usando un circuito integrado específico aplicado
5
10
15
20
25
30
35
40
45
50
55
(ASIC). Además, las realizaciones también pueden, al menos en parte, ser implementadas como un producto de programa de ordenador o en un sistema que comprende un procesador de ordenador y una memoria acoplada al procesador, donde la memoria está codificada con uno o más programas que pueden realizar las funciones divulgadas aquí.
Un concepto de las realizaciones descritas aquí en lo sucesivo comprende un encubrimiento de una trama de audio perdida mediante:
- la realización de un análisis sinusoidal de al menos parte de una señal de audio previamente recibida o reconstruida, donde el análisis sinusoidal implica identificar frecuencias de componentes sinusoidales de la señal de audio;
- la aplicación de un modelo sinusoidal en un segmento de la señal de audio previamente recibida o reconstruida, donde dicho segmento se usa como una trama prototipo con el fin de crear una trama de sustitución para una trama perdida, y
- la creación de la trama de sustitución que implica la evolución temporal de los componentes sinusoidales de la trama prototipo, hasta la instancia de tiempo de la trama de audio perdida, en respuesta a las frecuencias identificadas correspondientes.
Análisis sinusoidal
El encubrimiento de la pérdida de trama según las realizaciones implica un análisis sinusoidal de una parte de una señal de audio previamente recibida o reconstruida. El objetivo de este análisis sinusoidal es encontrar las frecuencias de los componentes sinusoidales principales, es decir, sinusoides, de esa señal. Por ello, la suposición subyacente es que la señal de audio fue generada por un modelo sinusoidal y que está compuesto por un número limitado de sinusoides individuales, es decir, que es una señal múltiple del siguiente tipo:
A' f
sin) = 2ak -cosí::- ; ■« <p )
*■=1 Js
(6.1)
En esta ecuación K es el número de sinusoides que se asume que consisten la señal. Para cada uno de los sinusoides con el índice k=1...K, ak es la amplitud, fk es la frecuencia, y ^k es la fase. La frecuencia de muestra se denomina por fs y el índice de tiempo de las muestras de señal de tiempo discreta s(n) por n.
Es importante encontrar tantas frecuencias exactas de los sinusoides como sea posible. Mientras una señal sinusoidal ideal tendría un espectro de línea con frecuencias de línea fk, encontrando que sus valores reales tendrían que requerir en principio medidas de tiempo infinitas. Entonces, en la práctica es difícil encontrar estas frecuencias, desde que solo pueden estimarse basadas en un periodo corto de medición, que corresponde al segmento de señal utilizado para el análisis sinusoidal según las realizaciones descritas aquí; este segmento de señal es referido después aquí como una trama de análisis. Otra dificultad es que la señal puede en la práctica variar en el tiempo, que significa que los parámetros de la ecuación anterior varían con el tiempo. Entonces, por un lado, es deseable utilizar una trama largo de análisis haciendo la medición más precisa; por otro lado, un periodo corto de medición tendría se necesitaría con el fin de enfrentarse mejor a las variaciones de señal posibles. Una buena compensación es utilizar una longitud de trama de análisis con el fin de, por ejemplo, 20-40 ms.
Según una realización preferida, las frecuencias de los sinusoides fk se identifican por un análisis de dominio de frecuencia de la trama de análisis. Con este fin, la trama de análisis se transforma en un dominio de frecuencia, por ejemplo, por medio de DFT (Transformación Fourier Discreta) o DCT (Transformación de Coseno Discreta), o una transformación de dominio de frecuencia similar. En el caso de que se use un DFT de la trama de análisis, el espectro es dado por:
L I ,2ír
(6.2)
n 0
En esta ecuación, w(n) denota la función de ventana con la que la longitud de la trama de análisis L se extrae y se pesa.
La figura 1 ilustra una función de ventana típica, es decir, una ventana rectangular que es igual a 1 para n e [0...L-1] y de otro modo 0. Se asume que los índices de tiempo de la señal de audio recibida anteriormente están establecidos de tal manera que la trama prototipo se referencia por los índices de tiempo n=0...L-1. Otras funciones de ventana que pueden ser más adecuadas para análisis espectrales son, por ejemplo, Hamming, Hanning, Kaiser o
5
10
15
20
25
30
35
40
45
50
Blackman.
La figura 2 ilustra una función de ventana más útil, que es una combinación de la ventana Hamming y la ventana rectangular. La ventana ilustrada en la figura 2 tiene una forma de borde ascendente como la mitad izquierda de una ventana Hamming de longitud L1 y una forma de borde descendente como la mitad derecha de una ventana Hamming de longitud L1 y entre los bordes ascendente y descendente la ventana es igual a 1 para la longitud de L- L1.
Los picos del espectro de magnitud de la trama de análisis de ventana | X(m) | constituyen una aproximación de las frecuencias sinusoidales requeridas fk. La precisión de esta aproximación es, sin embargo, limitada por el espaciado
L_
de frecuencia del DFT. Con el DFT con un bloqueo de longitud L la precisión está imitada a 2L. Sin embargo, este nivel de precisión puede ser muy bajo en el alcance del método según las realizaciones descritas aquí, y una precisión mejorada puede obtenerse basada en los resultados de la siguiente consideración:
El espectro de la trama de análisis de ventana es dado por la circunvolución del espectro de la función de ventana con el espectro de línea de una señal sinusoidal modelo S(Q), después muestreada en los puntos de cuadrícula del DFT:
X(m) = f Ó'(n-m - ^f) ■ (W(fí) * .SCO))■ ull
(6.3)
Utilizando la expresión del espectro de la señal modelo sinusoidal, esto puede escribirse como:
A ¡mi - . j.o.£) m- . i-Y.
2 7T *=1
Entonces, el espectro de muestra viene dado por:
(II iO • A.t\ )• í M ■ II iQ 2k- )-e
L
f,
■ dQ
(6.4)
x(m) = \Yjak
k=1
Vi2x(^ + &-))-e M +W(
(6.5)
con m=0...L-1.
Basándose en esto, los picos observados en el espectro de magnitud de la trama vástago de análisis desde una señal sinusoidal de ventana con K sinusoides, donde las frecuencias sinusoides reales se encuentran en la vecindad de los picos. Además, la identificación de frecuencias de componentes sinusoidales puede además implicar identificar frecuencias en la vecindad de los picos del espectro con relación a la transformación usada de dominio de frecuencia.
Si se asume que rrik es un índice DFT (punto de cuadrícula) del pico kesimo observado, entonces la frecuencia
fk = — ■ /
L ° que puede considerarse una aproximación de la verdadera frecuencia sinusoidal fk. que la verdadera frecuencia sinusoide fk se sitúa dentro del intervalo
correspondiente es Se puede asumir
■L
L
L
L
Por claridad, se aprecia que la circunvolución del espectro de la función de ventana con el espectro del espectro de línea de la señal modelo sinusoidal puede entenderse como una superposición de versiones de frecuencia cambiadas del espectro de función de ventana, en donde las frecuencias cambiadas son las frecuencias de los sinusoides. Esta superposición es entonces muestreada en los puntos de cuadrícula DFT. La circunvolución del espectro de la función de ventana con el espectro del espectro de línea de la señal modelo sinusoidal se ilustran en las figuras 3 - figura 7, de las que la figura 3 muestra un ejemplo del espectro de magnitud de la función de ventana, y la figura 4 el espectro de magnitud (espectro de línea) de una señal sinusoidal de ejemplo con un único sinusoide con una frecuencia fk. La figura 5 muestra el espectro de magnitud de la señal sinusoidal de ventana que replica y superpone el espectro de ventana de frecuencias cambiadas en las frecuencias del sinusoide, y las barras en la figura 6 corresponden a la magnitud de los puntos de cuadrícula del DFT de la sinusoide de ventana que se obtienen calculando el DFT de la trama de análisis. Aprecie que todos los espectros son periódicos con el parámetro de frecuencia normalizado Q donde fí=2n que corresponde a la frecuencia de muestreo fs.
5
10
15
20
25
30
35
40
45
50
55
Basado en la discusión anterior, y basado en la ilustración en la figura 6, se puede encontrar una mejor aproximación de las frecuencias sinusoidales reales incrementando la resolución de la búsqueda, de tal manera que es mayor que la resolución de frecuencia de la transformación de dominio de frecuencia usada.
Además, la identificación de frecuencias de componentes sinusoidales es preferiblemente realizada con una resolución más alta que la resolución de frecuencia de la transformación de dominio de frecuencia usada, y la identificación puede además implicar interpolación.
Una manera ejemplar preferida para encontrar una mejor aproximación de las frecuencias fk de los sinusoides es para aplicar interpolación parabólica. Un enfoque es ajustar parábolas a través de puntos de cuadrícula del espectro de magnitud DFT que rodea los picos y calcular las respectivas frecuencias que pertenecen a la máxima parábola, y una decisión adecuada ejemplar para el orden de las parábolas es 2. En más detalle, puede aplicarse el siguiente procedimiento:
1) Identificar los picos del DFT de la trama de análisis de ventana. La búsqueda de pico entregará el número de picos K y los correspondientes índices DFT de los picos. La búsqueda de pico puede estar hecha típicamente en el espectro de magnitud DFT o en el espectro de magnitud logarítmico DFT.
2) Para cada pico k (con k=1...K) con el correspondiente índice DFT mk, ajustar una parábola a través de los tres puntos {P1; P2; P3} = {(mk-1, log(| X(mk-1)|); (mk, log(| X(mk)|); (mk+1, log(| (X(mk+1)|}. Esto da como resultado unos coeficientes de parábola bk(0), bk(1), bk(2) de la parábola definidos por
2
/>.<:>/)
¡ 11
La figura 7 ilustra el ajuste de la parábola a través de puntos de cuadrícula DFT P1, P2 y P3.
3) Para cada una de las parábolas K, calcular el índice de frecuencia interpolada Amk correspondiente al valor de q para la cual la parábola tiene su máximo, donde se usa Afk =Amk . fs/L como una aproximación para la frecuencia sinusoide fk.
Aplicar un modelo sinusoidal
La aplicación de un modelo sinusoidal con el fin de realizar una operación de encubrimiento de pérdida de trama según las realizaciones puede describirse como sigue:
En el caso de que un segmento dado de la señal codificada no pueda ser reconstruida por el decodificador desde que la información codificada correspondiente no está disponible, es decir, desde que una trama se ha perdido, una parte disponible de la señal anterior a este segmento puede ser usada como una trama prototipo. Si y(n) con n=0...N-1 es el segmento no disponible para el cual una trama de sustitución z(n) tiene que ser generado, y y(n) con n-0 es la señal decodificada anteriormente disponible, una trama prototipo de la señal disponible de longitud L y primer índice n-1 se extrae con una función de ventana x(n) y transforma en un dominio de frecuencia, por ejemplo, por medio de DFT:
i.-™ 1
K-.iCm) — y y(n - ) ■ w(n) • e ”m
rc=0
La función de ventana puede ser una de las funciones de ventana descritas anteriormente en el análisis sinusoidal. Preferiblemente, con el fin de ahorrar complejidad numérica, la trama transformada de dominio de frecuencia debería ser idéntica a la usada durante el análisis sinusoidal.
En un siguiente paso, se aplica una suposición del modelo sinusoidal. Según la suposición del modelo sinusoidal, el DFT de la trama prototipo puede escribirse como sigue:
= \{W(2nPr + fy))-e M )
k \ \ L Js L Js
Esta expresión también fue utilizada en la parte de análisis y es descrita en detalle anteriormente.
Después, hay que darse cuenta de que el espectro de la función de ventana usada tiene solo una contribución significativa en un rango de frecuencia cerca de cero. Como se ilustra en la figura 3 el espectro de magnitud de la función de ventana es grande para frecuencias cerca de cero y pequeñas sin embargo (dentro del rango de
5
10
15
20
25
30
35
40
45
50
frecuencia normalizado desde -n a n, que corresponde a la mitad de la frecuencia muestreada. Entonces, como una aproximación, se asume que el espectro de ventana W(m) no es cero solo para un intervalo M = [-mmin, mmax], con mmin y mmax siendo números positivos pequeños. En particular, una aproximación del espectro de función de ventana se usa de tal forma que, para cada k, las contribuciones de los espectros de ventana cambiados en la expresión anterior estrictamente no se superponen. Entonces, en la ecuación anterior para cada índice de frecuencia siempre hay solo al máximo la contribución desde un sumando, es decir, desde un espectro de ventana cambiado. Esto significa que la expresión anterior se reduce a la siguiente expresión aproximada:
imagen1
para m no negativos e Mk y para cada k. Aquí, Mk denota el intervalo entero
Mk = [redondeo ■ l) -mmin<k , redondeo (j ■ L) + mmaXjk]
donde mmin,k y mmax,k llenan la restricción explicada anteriormente de tal forma que los intervalos no se superponen. Una decisión adecuada para mmin,k y mmax,k es establecerlos en un valor entero pequeño, por ejemplo § = 3. Si, sin embargo, los índices DFT en relación a dos frecuencias sinusoidales vecinas fk y fk+1 son menos que 28, entonces 8
imagen2
se establece en v ¿ / de tal forma que se asegura que los
intervalos no se superponen. La función suelo(.) es el entero más cercano al argumento de función que es menor o igual a él.
El siguiente paso según las realizaciones es aplicar el modelo sinusoidal según la expresión anterior y para evolucionar sus sinusoides K a tiempo. La suposición de que los índices de tiempo del segmento borrado comparado con los índices de tiempo de la trama prototipo difiere por n-1 muestras significa que las fases de los sinusoides avanzan por
2lt j
fs
ak
\
Pro consiguiente, el espectro DFT del modelo sinusoidal evolucionado viene dado por:
A a, ■ (W(2n( ,, , ,
L fs L fs
Aplicar otra vez la aproximación según la cual los espectros de función de ventana cambiados no se superponen da:
CW(2n{— + ^r)) ■ e 9* 1 + - ^)) ■ eKn 19k))
* i v
J
imagen3
para m no negativos e Mk y para cada k.
Comparando el DFT de trama prototipo Y-1 (m) con el DFT del modelo evolucionado sinusoidal Y0 (m) utilizando la aproximación, se encuentra que el espectro de magnitud permanece sin cambios mientras que la fase cambia por
, __ fk ^
, para cada m e Mk. Entonces, la trama de sustitución puede calcularse con la siguiente expresión: Z(n) = IDFT{Z(m)} con Z(m) = Y(m)-ej0k para m no negativos e Mk y para cada k.
Una realización específica se dirige a la aleatoriedad de fase para índices DFT que no pertenecen a ningún intervalo Mk. Como se describe anteriormente, los intervalos Mk, k=1...K tienen que estar establecidos de tal forma que no están estrictamente sin superponerse lo que se hace usando algún parámetro § que controla el tamaño de los intervalos. Puede ocurrir que § sea pequeño en relación a la distancia de frecuencia de dos sinusoides vecinos. Entonces, en ese caso ocurre que hay un espacio entre dos intervalos. Por consiguiente, para los correspondientes
5
10
15
20
25
30
35
40
45
50
55
60
65
índices DFT m, no hay cambio de fase correspondiente a la expresión anterior Z(m) = Y(m)-ei0k se defina. Una decisión adecuada según esta realización es aleatorizar la fase para estos índices, flexibilizar Z(m) = Y(m)-ei2nrand(), donde la función rand(.) devuelve algún número aleatorio.
Basado en lo anterior, la figura 8 es un diagrama de flujo que ilustra un método de encubrimiento de pérdida de trama de audio ejemplar según las realizaciones:
En el paso 81, se realiza un análisis sinusoidal de una parte de una señal de audio reconstruida o recibida anteriormente, donde el análisis sinusoidal implica identificar frecuencias de componentes sinusoidales, es decir, sinusoides, de la señal de audio. Después, en el paso 82, un modelo sinusoidal se aplica en un segmento de la señal de audio reconstruida o recibida anteriormente, donde dicho segmento se usa como una trama prototipo con el fin de crear una trama de sustitución para una trama de audio perdida, y en el paso 83 se crea la trama de sustitución para la trama de audio perdida, que implica la evolución del tiempo de componentes sinusoidales, es decir, sinusoides, de la trama prototipo, hasta la instancia de tiempo de la trama de audio perdida, en respuesta a las frecuencias identificadas correspondientes.
Según una realización más, se asume que la señal de audio se compone de un número limitado de componentes sinusoidales individuales, y que al análisis sinusoidal se realiza en el dominio de frecuencia. Además, la identificación de las frecuencias de componentes sinusoidales puede implicar identificar frecuencias en la vecindad de los picos de un espectro en relación a la transformación de dominio de frecuencia usada.
Según una realización ejemplar, la identificación de frecuencias de componentes sinusoidales se realiza con una resolución más alta que la resolución de la transformación de dominio de frecuencia usada, y la identificación puede además implicar interpolación, por ejemplo, de tipo parabólico.
Según una realización ejemplar, el método comprende extraer una trama prototipo de una señal previamente recibida o reconstruida disponible usando una función de ventana, y donde la trama prototipo extraído puede ser transformado en un dominio de frecuencia.
Una realización más implica una aproximación de un espectro de la función de ventana, de tal forma que el espectro de la trama de sustitución se compone estrictamente de porciones no superpuestas del espectro de función de ventana aproximada.
Según una realización ejemplar más, el método comprende componentes sinusoidales de evolución de tiempo de un espectro de frecuencia de una trama prototipo avanzando la fase de los componentes sinusoidales, en respuesta a la frecuencia de cada componente sinusoidal y en respuesta a la diferencia de tiempo entre la trama de audio perdida y la trama de prototipo, y cambiar un coeficiente espectral de la trama prototipo incluida en un intervalo Mk en la vecindad sinusoide k por un cambio proporcional en la fase a la frecuencia sinusoidal fk y a la diferencia de tiempo entre la trama de audio perdida y la trama prototipo.
Una realización más comprende cambiar la fase de un coeficiente espectral de la trama prototipo que no pertenece a un sinusoide identificado por una fase aleatoria, o cambiar la fase de un coeficiente espectral de la trama prototipo no incluido en ninguno de los intervalos relacionados con la vecindad del sinusoide identificado por un valor aleatorio.
Una realización más implica una transformación de dominio de frecuencia inversa del espectro de frecuencia de la trama prototipo.
Más específicamente, el método de encubrimiento de la pérdida de la trama de audio según a una realización más puede implicar los siguientes pasos:
1) Analizar un segmento de la señal disponible previamente sintetizada para obtener las frecuencias sinusoidales constituyentes fk de un modelo sinusoidal.
2) Extraer una trama prototipo y-1 desde la señal disponible previamente sintetizada y calcular el DFT de ese trama.
3) Calcular el cambio de fase 0k para cada sinusoide k en respuesta a la frecuencia sinusoidal fk y el avance de tiempo n-1 entre la trama prototipo y la trama de sustitución.
4) Para cada sinusoide k avanzar la fase de la trama prototipo DFT con 0k selectivamente para los índices DFT relacionados a una vecindad alrededor de la frecuencia sinusoide fk.
5) Calcular el DFT inverso del espectro obtenido 4).
Las realizaciones descritas anteriormente pueden ser mejor explicadas por las siguientes suposiciones:
5
10
15
20
25
30
35
40
45
50
55
60
65
a) La suposición de que la señal puede ser representada por un número limitado de sinusoides.
b) La suposición de que la trama de sustitución esta suficientemente bien representado por estos sinusoides evolucionados en el tiempo, en comparación a algún instante anterior en el tiempo.
c) La suposición de una aproximación del espectro de una función de ventana de tal forma que el espectro de la trama de sustitución puede ser construido por porciones no superpuestas de espectros de función de ventana de frecuencia cambiada, las frecuencias cambiadas siendo las frecuencias sinusoides.
La figura 9 es un diagrama esquemático de bloque que ilustra un decodificador ejemplar 1 configurado para realizar un método de encubrimiento de pérdida de trama de audio según las realizaciones. El decodificador ilustrado comprende uno o más procesadores 11 y equipo lógico informático adecuado con almacenamiento o memoria adecuada 12. La señal de audio codificada entrante se recibe por una entrada (IN), a la que el procesador 11 y la memoria 12 están conectados. La señal de audio decodificada y reconstruida obtenida del equipo lógico informático es emitida desde la salida (OUT). Un decodificador ejemplar se configura para encubrir una trama de audio perdida de una señal de audio recibida, y comprende un procesador 11 y memoria 12, donde la memoria contiene instrucciones ejecutables por el procesador 11, y donde el decodificador 1 se configura para:
- realizar un análisis sinusoidal de una parte de una señal de audio previamente recibida o reconstruida, donde el análisis sinusoidal implica identificar frecuencias de componentes sinusoidales de la señal de audio;
- aplicar un modelo sinusoidal en un segmento de la señal de audio previamente recibida o reconstruida, donde dicho segmento se utiliza como una trama prototipo con el fin de crear una trama de sustitución para una trama de audio perdida, y
- crear la trama de sustitución para la trama de audio perdida evolucionando en el tiempo componentes sinusoidales de la trama prototipo, hasta el instante en el tiempo de la trama de audio perdida, en respuesta a las frecuencias identificadas correspondientes.
Según una realización más del decodificador, el modelo sinusoidal aplicado asume que la señal de audio está compuesta de un número limitado de componentes sinusoidales individuales, y la identificación de frecuencias de componentes sinusoidales de la señal de audio pueden además comprender una interpolación parabólica.
Según una realización más, el decodificador está configurado para extraer una trama prototipo desde una señal disponible previamente recibida o reconstruida utilizando una función de ventana, y para transformar la trama prototipo extraído en un dominio de frecuencia.
Según otra realización más, el decodificador está configurado para evolucionar en el tiempo componentes sinusoidales de un espectro de frecuencia de una trama prototipo avanzando la fase de los componentes sinusoidales, en respuesta a la frecuencia de cada componente sinusoidal y en respuesta a la diferencia de tiempo entre la trama de audio perdida y la trama prototipo, y para crear la trama de sustitución realizando una transformación de frecuencia inversa del espectro de frecuencia.
Un decodificador según una realización alternativa se ilustra en la figura 10a, tal que comprende una unidad de salida configurada para recibir una señal de audio codificada. La figura ilustra el encubrimiento de pérdida de trama por una unidad de encubrimiento de pérdida de trama lógica 13, donde el decodificador 1 está configurado para implementar un encubrimiento de una trama de audio perdida según las realizaciones descritas anteriormente. La unidad de encubrimiento de pérdida de trama lógica 13 está mejor ilustrada en la figura 10b, y comprende medios adecuados para encubrir una trama de audio perdida, es decir, medios 14 para realizar un análisis sinusoidal de una parte de una señal de audio previamente recibida o reconstruida, donde el análisis sinusoidal implica identificar frecuencias de componentes sinusoidales de la señal de audio, medios 15 para aplicar un modelo sinusoidal en un segmento de la señal de audio previamente recibida o reconstruida, donde dicho segmento es utilizado como una trama prototipo con el fin de crear una trama de sustitución para una trama de audio perdida, y medios 16 para crear la trama de sustitución para la trama de audio perdida evolucionando en el tiempo componentes sinusoidales de la trama prototipo, hasta el instante en el tiempo de la trama de audio perdida, en respuesta a las frecuencias identificadas correspondientes.
Las unidades y medios incluidos en el decodificador ilustrado en las figuras pueden ser implementados al menos en parte en un equipo físico informático, y hay numerosas variantes de elementos de circuitos que pueden ser utilizados y combinados para lograr las funciones de las unidades del decodificador. Dichas variantes se abarcan en las realizaciones. Un ejemplo particular de implementación de equipo físico informático del decodificador es la implementación en un procesador de señal digital (DSP) en el equipo físico informático y un circuito tecnológico integrado, incluyendo ambos, el circuito electrónico de objetivo general y el circuito de aplicación específica.
Un programa de ordenador según las realizaciones de la presente invención comprende instrucciones que cuando se ejecutan por un procesador hace que el procesador realice un método según un método descrito en conexión con
la figura 8. La figura 11 ilustra un producto de programa de ordenador 9 según las realizaciones, en la forma de una memoria no volátil, por ejemplo, un EEPROM (Memoria Solo Legible Programable Borrable Eléctricamente), una memoria flash o un disco duro. El producto de programa de ordenador comprende un medio de ordenador legible almacenando un programa de ordenador 91, que comprende módulos de programa de ordenador 91 a, b, c, d que 5 cuando se ejecutan en un decodificador 1 hace que el procesador del decodificador realice los pasos según la figura 8.
Un decodificador según las realizaciones de esta invención puede ser utilizado, por ejemplo, en un receptor para un dispositivo móvil, por ejemplo, un teléfono móvil o un ordenador portátil, o en un receptor para un dispositivo 10 estático, por ejemplo, un ordenador personal.
Las ventajas de las realizaciones descritas aquí son para proporcionar un método de encubrimiento de pérdida de trama que permite mitigar el impacto audible de pérdida de trama en la transmisión de señales de audio, por ejemplo, de habla codificada. Una ventaja general es proporcionar una evolución suave y fiel de la señal 15 reconstruida para una trama perdida, donde el impacto audible de pérdidas de trama es muy reducido en comparación a técnicas convencionales.
Debe entenderse que la decisión de módulos y unidades que interaccionan, así como el nombramiento de las unidades solo son con objetivo ejemplar, y pueden ser configuradas en una pluralidad de maneras alternativas con 20 el fin de ser capaces de ejecutar las acciones del proceso divulgado. También debería observarse que las unidades o módulos descritos en esta divulgación deben ser consideradas como entidades lógicas y no con necesidades como entidades físicas separadas. Se apreciará que el alcance de la tecnología descrita aquí abarca totalmente otras realizaciones que pueden resultar obvias para aquellos expertos en la técnica.

Claims (8)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    reivindicaciones
    1. Un método de encubrimiento de pérdida de trama, en el que un segmento de una señal de audio previamente recibida o reconstruida se utiliza como una trama prototipo para crear una trama de sustitución para una trama de audio perdida, comprendiendo el método:
    - transformar la trama prototipo en un dominio de frecuencia;
    - aplicar un modelo sinusoidal a la trama prototipo para identificar frecuencias de componentes sinusoidales de la señal de audio;
    - calcular un cambio de fase 0k para los componentes sinusoidales identificados;
    - cambiar 0k las fases de los componentes sinusoidales identificados;
    - crear la trama de sustitución realizando una transformación de frecuencia inversa de un espectro de frecuencia de la trama prototipo;
    caracterizado porque:
    - cambiar las fases de los componentes sinusoidales identificados comprende cambiar 0k una fase de todos los coeficientes espectrales en la trama prototipo incluida en un intervalo Mk alrededor de un sinusoide k;
    - las fases de coeficientes espectrales que no son cambiadas de fase son aleatorizadas; y
    - un espectro de magnitud de la trama prototipo se mantiene sin cambios.
  2. 2. El método de encubrimiento de pérdida de trama según la reivindicación 1, en el que el cambio de fase 0k depende de la frecuencia sinusoidal fk y un cambio de tiempo entre la trama prototipo y la trama perdida.
  3. 3. Un aparato (13) para crear una trama de sustitución para una trama de audio perdida, comprendiendo el aparato:
    - medios para generar una trama prototipo desde un segmento de una señal de audio previamente recibida o reconstruida;
    - medios para transformar la trama prototipo en un dominio de frecuencia;
    - medios para aplicar un modelo sinusoidal a la trama prototipo para identificar frecuencias de componentes sinusoidales de la señal de audio;
    - medios para calcular un cambio de fase 0k para los componentes sinusoidales identificados;
    - medios para cambiar 0k las fases de los componentes sinusoidales identificados;
    - medios para crear la trama de sustitución realizando una transformación de frecuencia inversa de un espectro de frecuencia de la trama prototipo;
    caracterizado porque:
    - cambiar las fases de los componentes sinusoidales identificados comprende cambiar 0k una fase de todos los coeficientes espectrales en la trama prototipo incluida en un intervalo Mk alrededor de un sinusoide k,
    - las fases de los coeficientes espectrales que no son cambiadas de fase son aleatorizadas, y
    - un espectro de magnitud de la trama prototipo se mantiene sin cambios.
  4. 4. El aparato según la reivindicación 3, en el que el cambio de fase 0k depende de la frecuencia sinusoidal fk y un cambio de tiempo entre la trama prototipo y la trama perdida.
  5. 5. Un decodificador de audio (1) que comprende el aparato según la reivindicación 3 o 4.
  6. 6. Un dispositivo que comprende el decodificador de audio según la reivindicación 5.
  7. 7. Un programa de ordenador (91) que comprende instrucciones que, cuando se ejecutan en al menos un procesador, causa que al menos un procesador lleve a cabo el método según la reivindicación 1 o 2.
  8. 8. Un portador de datos legible informáticamente que almacena el programa de ordenador (91) según la reivindicación 7.
ES16178186.9T 2013-02-05 2014-01-22 Encubrimiento de pérdida de trama de audio Active ES2664968T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361760814P 2013-02-05 2013-02-05
US201361760814P 2013-02-05

Publications (1)

Publication Number Publication Date
ES2664968T3 true ES2664968T3 (es) 2018-04-24

Family

ID=50113007

Family Applications (5)

Application Number Title Priority Date Filing Date
ES17208127T Active ES2757907T3 (es) 2013-02-05 2014-01-22 Encubrimiento de pérdida de trama de audio
ES14704704.7T Active ES2597829T3 (es) 2013-02-05 2014-01-22 Ocultación de pérdida de trama de audio
ES16178186.9T Active ES2664968T3 (es) 2013-02-05 2014-01-22 Encubrimiento de pérdida de trama de audio
ES19185955T Active ES2877213T3 (es) 2013-02-05 2014-01-22 Ocultación de pérdida de trama de audio
ES21166868T Active ES2954240T3 (es) 2013-02-05 2014-01-22 Ocultación de pérdida de trama de audio

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES17208127T Active ES2757907T3 (es) 2013-02-05 2014-01-22 Encubrimiento de pérdida de trama de audio
ES14704704.7T Active ES2597829T3 (es) 2013-02-05 2014-01-22 Ocultación de pérdida de trama de audio

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES19185955T Active ES2877213T3 (es) 2013-02-05 2014-01-22 Ocultación de pérdida de trama de audio
ES21166868T Active ES2954240T3 (es) 2013-02-05 2014-01-22 Ocultación de pérdida de trama de audio

Country Status (13)

Country Link
US (4) US9847086B2 (es)
EP (6) EP3096314B1 (es)
JP (1) JP5978408B2 (es)
KR (3) KR20150108419A (es)
CN (3) CN108847247B (es)
BR (1) BR112015017222B1 (es)
DK (3) DK3576087T3 (es)
ES (5) ES2757907T3 (es)
HU (2) HUE045991T2 (es)
NZ (1) NZ709639A (es)
PL (4) PL3866164T3 (es)
PT (1) PT3333848T (es)
WO (1) WO2014123470A1 (es)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112015017222B1 (pt) * 2013-02-05 2021-04-06 Telefonaktiebolaget Lm Ericsson (Publ) Método e decodificador configurado para ocultar um quadro de áudio perdido de um sinal de áudio recebido, receptor, e, meio legível por computador
NO2780522T3 (es) * 2014-05-15 2018-06-09
EP3367380B1 (en) 2014-06-13 2020-01-22 Telefonaktiebolaget LM Ericsson (publ) Burst frame error handling
KR20190008663A (ko) * 2017-07-17 2019-01-25 삼성전자주식회사 음성 데이터 처리 방법 및 이를 지원하는 시스템
WO2020169754A1 (en) 2019-02-21 2020-08-27 Telefonaktiebolaget Lm Ericsson (Publ) Methods for phase ecu f0 interpolation split and related controller
SG11202110071XA (en) * 2019-03-25 2021-10-28 Razer Asia Pacific Pte Ltd Method and apparatus for using incremental search sequence in audio error concealment
EP4252227A1 (en) * 2020-11-26 2023-10-04 Telefonaktiebolaget LM Ericsson (publ) Noise suppression logic in error concealment unit using noise-to-signal ratio
CN113096685B (zh) * 2021-04-02 2024-05-07 北京猿力未来科技有限公司 音频处理方法及装置

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT362479B (de) * 1979-06-22 1981-05-25 Vianova Kunstharz Ag Verfahren zur herstellung von bindemitteln fuer die elektrotauchlackierung
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
WO1997019444A1 (en) * 1995-11-22 1997-05-29 Philips Electronics N.V. Method and device for resynthesizing a speech signal
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US6888844B2 (en) 2000-04-07 2005-05-03 Broadcom Corporation Method for selecting an operating mode for a frame-based communications network
WO2002009382A1 (en) * 2000-07-25 2002-01-31 Koninklijke Philips Electronics N.V. Decision directed frequency offset estimation
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
US20040002856A1 (en) 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US20040122680A1 (en) 2002-12-18 2004-06-24 Mcgowan James William Method and apparatus for providing coder independent packet replacement
US6985856B2 (en) 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
KR101058062B1 (ko) 2003-06-30 2011-08-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 잡음 부가에 의한 디코딩된 오디오의 품질 개선
US7337108B2 (en) * 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal
US20050091041A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
JP4744438B2 (ja) 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
US7734381B2 (en) 2004-12-13 2010-06-08 Innovive, Inc. Controller for regulating airflow in rodent containment system
BRPI0607251A2 (pt) 2005-01-31 2017-06-13 Sonorit Aps método para concatenar um primeiro quadro de amostras e um segundo quadro subseqüente de amostras, código de programa executável por computador, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
DE102006017280A1 (de) * 2006-04-12 2007-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals
CN101366079B (zh) * 2006-08-15 2012-02-15 美国博通公司 用于子带预测编码的基于全带音频波形外插的包丢失隐藏
FR2907586A1 (fr) 2006-10-20 2008-04-25 France Telecom Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
CN101261833B (zh) * 2008-01-24 2011-04-27 清华大学 一种使用正弦模型进行音频错误隐藏处理的方法
CN101308660B (zh) * 2008-07-07 2011-07-20 浙江大学 一种音频压缩流的解码端错误恢复方法
DE602008000303D1 (de) * 2008-09-03 2009-12-31 Svox Ag Sprachsynthese mit dynamischen Einschränkungen
ES2374008B1 (es) * 2009-12-21 2012-12-28 Telefónica, S.A. Codificación, modificación y síntesis de segmentos de voz.
US8538038B1 (en) * 2010-02-12 2013-09-17 Shure Acquisition Holdings, Inc. Audio mute concealment
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
DK2375782T3 (en) * 2010-04-09 2019-03-18 Oticon As Improvements in sound perception by using frequency transposing by moving the envelope
WO2012049659A2 (en) * 2010-10-14 2012-04-19 Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional High payload data-hiding method in audio signals based on a modified ofdm approach
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
RU2628144C2 (ru) 2013-02-05 2017-08-15 Телефонактиеболагет Л М Эрикссон (Пабл) Способ и устройство для управления маскировкой потери аудиокадров
BR112015017222B1 (pt) * 2013-02-05 2021-04-06 Telefonaktiebolaget Lm Ericsson (Publ) Método e decodificador configurado para ocultar um quadro de áudio perdido de um sinal de áudio recebido, receptor, e, meio legível por computador

Also Published As

Publication number Publication date
ES2597829T3 (es) 2017-01-23
EP4276820A3 (en) 2024-01-24
BR112015017222B1 (pt) 2021-04-06
US20190272832A1 (en) 2019-09-05
PL3333848T3 (pl) 2020-03-31
CN108564958A (zh) 2018-09-21
JP5978408B2 (ja) 2016-08-24
ES2877213T3 (es) 2021-11-16
DK3096314T3 (en) 2018-04-03
US20150371642A1 (en) 2015-12-24
CN104995675A (zh) 2015-10-21
EP3333848A1 (en) 2018-06-13
US9847086B2 (en) 2017-12-19
HUE045991T2 (hu) 2020-01-28
JP2016511433A (ja) 2016-04-14
KR101855021B1 (ko) 2018-05-04
KR20160075790A (ko) 2016-06-29
EP3576087B1 (en) 2021-04-07
EP3576087A1 (en) 2019-12-04
PL2954517T3 (pl) 2016-12-30
US11482232B2 (en) 2022-10-25
EP4276820A2 (en) 2023-11-15
US10339939B2 (en) 2019-07-02
ES2954240T3 (es) 2023-11-21
KR20180049145A (ko) 2018-05-10
CN108847247A (zh) 2018-11-20
KR102037691B1 (ko) 2019-10-29
ES2757907T3 (es) 2020-04-30
EP3333848B1 (en) 2019-08-21
CN108564958B (zh) 2022-11-15
CN104995675B (zh) 2018-06-29
PL3576087T3 (pl) 2021-10-25
EP3866164A1 (en) 2021-08-18
EP3096314B1 (en) 2018-01-03
DK2954517T3 (en) 2016-11-28
EP2954517B1 (en) 2016-07-27
DK3576087T3 (da) 2021-05-31
NZ709639A (en) 2016-06-24
US20180096691A1 (en) 2018-04-05
BR112015017222A2 (pt) 2017-07-11
WO2014123470A1 (en) 2014-08-14
EP2954517A1 (en) 2015-12-16
EP3866164B1 (en) 2023-07-19
US20230008547A1 (en) 2023-01-12
HUE036322T2 (hu) 2018-06-28
CN108847247B (zh) 2023-04-07
PL3866164T3 (pl) 2023-12-27
KR20150108419A (ko) 2015-09-25
EP3096314A1 (en) 2016-11-23
PT3333848T (pt) 2019-10-14

Similar Documents

Publication Publication Date Title
ES2664968T3 (es) Encubrimiento de pérdida de trama de audio
ES2881510T3 (es) Método y aparato para controlar la ocultación de pérdida de trama de audio
ES2769845T3 (es) Predicción basada en modelo en un banco de filtros
US9478221B2 (en) Enhanced audio frame loss concealment
BR122020009727B1 (pt) Método
CN111312261B (zh) 突发帧错误处理