MXPA04011751A - Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal. - Google Patents

Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal.

Info

Publication number
MXPA04011751A
MXPA04011751A MXPA04011751A MXPA04011751A MXPA04011751A MX PA04011751 A MXPA04011751 A MX PA04011751A MX PA04011751 A MXPA04011751 A MX PA04011751A MX PA04011751 A MXPA04011751 A MX PA04011751A MX PA04011751 A MXPA04011751 A MX PA04011751A
Authority
MX
Mexico
Prior art keywords
frame
voice
signal
parameter
concealment
Prior art date
Application number
MXPA04011751A
Other languages
English (en)
Inventor
Gournay Philippe
Original Assignee
Voiceage Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=29589088&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MXPA04011751(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Voiceage Corp filed Critical Voiceage Corp
Publication of MXPA04011751A publication Critical patent/MXPA04011751A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

La presente invencion se refiere a un metodo y dispositivo para mejorar ocultamiento de borrado de cuadro provocado por cuadros de una senal de sonido codificada borrada durante la transmision de un codificador (106) a un descodificador (110) y para acelerar la recuperacion del descodificador despues de que se han recibido cuadros no borrados de la senal de sonido codificada. Para este proposito se determinan parametros de ocultamiento/recuperacion en el codificador o el descodificador. Cuando se determinan en el codificador (106), los parametros de ocultamiento/recuperacion se transmiten al descodificador (110). En el descodificador, el ocultamiento de cuadro borrado y recuperacion de descodificador se conducen en respuesta a los parametros de ocultamiento/recuperacion. Los parametros de ocultamiento/recuperacion pueden seleccionarse del grupo que consiste de: un parametro de clasificacion de senal, un parametro de informacion de energia y un parametro de informacion de fase. La determinacion de los parametros de ocultamiento/recuperacion comprende clasificar los cuadros sucesivos de la senal de sonido codificada como sin voz, transicion sin voz, transicion con voz, de voz o principio, y esta clasificacion se determina en base a cuando menos una parte de los siguientes parametros: un parametro de correlacion normalizado, un parametro de inclinacion espectral, un parametro de proporcion de senal-a-ruido, u parametro de estabilidad de paso, un parametro de energia de cuadro relativa y un parametro de cruce a cero.

Description

MÉTODO Y DISPOSITIVO PARA OCULTAMIENTO DE BORRADO ADECUADO EFICIENTE EN CODECS DE HABLA DE BASE PREDICTIVA LINEAL CAMPO DE LA INVENCIÓN La presente invención se refiere a una técnica para codificar digitalmente una señal de sonido, en particular pero no exclusivamente una señal de habla, en vista de transmitir y/o sintetizar esta señal de sonido. Más específicamente, la presente invención se refiere a codificación y descodificación robustas de señales de sonido para mantener el buen desempeño en caso de uno o varios cuadros borrados, por ejemplo debido a errores de canal en sistemas inalámbricos o paquetes perdidos en aplicaciones de red de voz sobre paquete. ANTECEDENTES DE LA INVENCIÓN La demanda por eficientes técnicas de codificación de habla de banda estrecha y banda ancha digital con una buena compensación entre la calidad subjetiva y la velocidad de bits, está creciendo en diversas áreas de aplicaciones tales como teleconferencia, multimedia y comunicaciones inalámbricas. Hasta hace poco, un ancho de banda de telefonía restringido en un rango de 200-3400 Hz se ha utilizado primordialmente en aplicaciones de codificación de habla. Sin embargo, las aplicaciones en habla de banda ancha proporcionan incrementadas inteligibilidad y naturalidad en la comunicación, en comparación con el ancho de banda de la telefonía convencional . Se ha encontrado que un ancho de banda en el rango de 50-7000 Hz es suficiente para suministrar una buena calidad dando la impresión de una comunicación cara-a-cara. Para señales de audio en general, este ancho de banda da una calidad subjetiva aceptable, pero aún es menor que la calidad de radio FM o un CD que operan en rangos de 20-16000 Hz y de 20-20000 Hz, respectivamente. Un codificador de habla convierte una señal de habla en una corriente de bits digital que se transmite sobre un canal de comunicaciones o se guarda en un medio de almacenamiento. La señal de habla se digitaliza, esto es, se muestrea y cuantifica usualmente con 16-bits por muestra. El codificador de habla tiene el papel de representar estas muestras digitales con un número más pequeño de bits mientras que mantiene una buena calidad de habla subjetiva. El sintetizador o descodificador de habla opera en la corriente de bits transmitida y almacenada y la convierte de regreso en una señal de sonido . La Codificación por Predicción Lineal Excitada por Código (CELP = Code-Excited Linear Prediction) es una de las mejores técnicas disponibles para lograr un buen compromiso entre la calidad subjetiva y la velocidad de bits. Esta técnica de codificación es una base de varias normas de codificación de habla tanto en aplicaciones alámbricas como inalámbricas. En la codificación CELP, la señal de habla muestreada se procesa en bloques sucesivos de L muestras usualmente denominados cuadros, en donde L es un número predeterminado que corresponde típicamente a 10-30 ms. Un filtro de predicción lineal (LP = linear prediction) se calcula y se transmite cada cuadro. El cálculo del filtro LP típicamente requiere una revisión por adelantado o por anticipación, un segmento de habla de 5-15 minutos del cuadro subsecuente. El cuadro de muestra L se divide en bloques más pequeños denominados subcuadros . Usualmente, el número de subcuadros es tres o cuatro, resultando en subcuadros de 4-10 ms . En cada subcuadro, una señal de excitación usualmente se obtiene de dos componentes, la excitación pasada y la excitación de libro de códigos fija, innovadora. El componente formado de la última excitación a menudo se refiere como la excitación de paso o libro de códigos adaptativo. Los parámetros que caracterizan la señal de excitación se codifican y transmiten al descodificadór, en donde la señal de excitación reconstruida se utiliza como la alimentación del filtro LP.
Como las aplicaciones principales de codificación de habla de baja velocidad de bits son sistemas de comunicaciones móviles inalámbricos y redes de voz sobre paquete, entonces se vuelve de una importancia significante incrementar lo robusto de los codees de habla en caso de borrado de cuadro. En sistemas celulares inalámbricos, la energía de la señal recibida puede exhibir frecuentes desvanecimientos severos resultando en altas velocidades de error de bits y esto se vuelve más evidente en las fronteras de celda. En este caso, el descodificador de canal falla en corregir errores en el cuadro recibido y, como consecuencia, el detector de error usualmente empleado después del descodificador de canal declarará el cuadro como borrado. En aplicaciones de red de voz sobre paquete, la señal de habla se forma en paquete en donde usualmente un cuadro de 20 ms se coloca en cada paquete. En comunicaciones conmutadas por paquetes, puede ocurrir un retiro de paquete en un ruteador si el número de paquetes se vuelve muy grande, o el paquete puede alcanzar al receptor después de un prolongado retardo y deberá declararse como perdido si su retardo es mayor que la longitud de una memoria intermedia de retardo en el lado receptor. En estos sistemas, el codee se somete típicamente de 3 a 5% velocidades de borrado de cuadros.
Además, el uso de codificación de habla de banda ancha es un valor importante para estos sistemas a fin de permitir competir con la red de telefonía conmutada pública (PSTN Public switched Telephone Network) tradicional que utiliza las señales de habla de banda estrecha de legado. El libro de códigos adaptativo o pronosticador de paso, en CELP juega un papel importante para mantener calidad de alta velocidad a bajas velocidades de bits. Sin embargo, ya que el contenido del libro de códigos adaptativo se basa en la señal de cuadros pasados, esto hace al modelo de codee sensible a pérdida de cuadro. En el caso de cuadros borrados o perdidos, el contenido de libro de códigos adaptativo en el descodificador se vuelve diferente de su contenido en el codificador. De esta manera, después de que un cuadro perdido se oculta y se reciben consecuentes buenos cuadros, la señal sintetizada en los buenos cuadros recibidos es diferente de la señal de síntesis pretendida, ya que ha cambiado la contribución de libro de códigos adaptativo. El impacto de un cuadro perdido depende de la naturaleza del segmento de habla en donde ocurrió el borrado. Si el borrado ocurre en un segmento estacionario de la señal, entonces puede realizarse un ocultamiento de borrado de cuadro eficiente y puede minimizarse el impacto en consecuentes cuadros buenos. Por otra parte, si el borrado ocurre al comienzo del habla o en una transición, el efecto del borrado puede propagarse a través de varios cuadros. Por ejemplo, si el principio de un segmento de voz se pierde, entonces el primer periodo de paso estará faltante del contenido del libro de códigos adaptativo. Esto tendrá un efecto severo en el pronosticador de paso en consecuentes buenos cuadros, resultando en prolongado tiempo antes de que la señal de síntesis converja al pretendido en el codificador. COMPENDIO DE LA INVENCIÓN La presente invención se refiere a un método para mejorar ocultamiento de' borrado de cuadros provocado por cuadros de una señal de sonido codificada, borrados durantes transmisión de un codificador a un descodificador, y para acelerar la recuperación del descodificador después de que se han recibido los cuadros no borrados de la señal de sonido codificado, que comprende : determinar, en el codificador, parámetros de ocul amiento/recuperación; transmitir al descodificador los parámetros de ocultamiento/recuperación determinados en el codificador; Y en el descodificador, realizar ocultamiento de cuadro borrado y recuperación de descodificador en respuesta a los parámetros de ocultamiento/recuperación recibidos . La presente invención también se refiere a un método para el ocultamiento de borrado de cuadros provocado por cuadros borrados durante la transmisión de una señal de sonido codificada bajo la forma de parámetros de codificación de señal desde un codificador a un descodificador , y para acelerar la recuperación del descodif icador después de que se hayan recibido cuadros no borrados de la señal de sonido codificado, que comprende : determinar, en el descodificador , parámetros de ocultamiento/recuperación de los parámetros de codificación de señal; ' en el descodificador , realizar el ocultamiento de borrado de cuadros y recuperación de descodificador , en respuesta a parámetros de ocultamiento/recuperación determinados . De acuerdo con la presente invención, también se proporciona un dispositivo para mejorar el ocultamiento de borrado de cuadros provocado por cuadros de una señal de sonido codificada durante la transmisión de un codificador a un descodificador y para acelerar la recuperación del descodificador después de que se han recibido cuadros no borrados de la señal de sonido codificada, que comprende: medios para determinar, en el codificador, parámetros de ocultamiento/recuperación; medios para transmitir al descodificador, los parámetros de ocultamiento/recuperación determinados en el codificador; y en el descodificador, medios para realizar ocultamiento de borrado de cuadro y recuperación de descodificador en respuesta a los parámetros recibidos de ocultamiento/recuperación . De acuerdo con la invención, además se proporciona un dispositivo para ocultamiento de borrado de cuadro provocado por cuadros borrados durante la transmisión de una señal de sonido codificada bajo la forma de parámetros que codifican la señal de un codificador a un descodificador, y para acelerar la recuperación del descodificador después de que se han recibido cuadros no borrados de la señal de sonido codificada, que comprende: medios para determinar, en el descodificador, parámetros de ocultamiento/recuperación de los parámetros de codificación de señal; en el descodificador, medios para realizar el ocultamiento de borrado de cuadros y recuperación de descodificador en respuesta a los parámetros de ocultamiento/recuperación determinados . La presente invención también se refiere a un sistema para codificar y descodificar una señal de sonido, y un descodificador de señal de sonido utilizando los dispositivos anteriormente definidos para mejorar el ocultamiento de borrado cuadro provocado por cuadros de la señal de sonido codificada borrada durante transmisión del codificador al descodificador, y para acelerar la recuperación del descodificador después de que se han recibido cuadros no borrados de la señal de sonido codificada . Los anteriores y otros objetivos, ventajas y características de la presente invención serán más aparentes ante la lectura de la siguiente descripción no restrictiva de modalidades ilustrativas de la misma, dados a manera de ejemplos solo con referencia a los dibujos acompañantes. BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 es un diagrama de bloques esquemático de un sistema de comunicación de habla que ilustra una aplicación de dispositivos de codificación y descodificación de habla de acuerdo con la presente invención; La Figura 2 es un diagrama de bloques esquemática de un ejemplo de un dispositivo de codificación de banda ancha (codificador AMR-WB) ; La Figura 3 es un diagrama de bloques esquemáticos de un ejemplo de un dispositivo de descodificación de banda ancha (descodificador MR-WB) ; La Figura 4 es un diagrama de bloques simplificado del codificador AMR-WB de la Figura 2, en donde el módulo de muestreo descendente, el módulo de filtro de paso alto y el módulo de filtro de preacentuación se han agrupado en un solo módulo de pre-procesamiento, y en donde el módulo de búsqueda de paso de bucle cerrado, el módulo de calculador de respuesta de alimentación cero, el módulo generador de respuesta de impulso, el módulo de búsqueda de excitación innovadora y el módulo de actualización de memoria se han agrupado en un solo módulo de búsqueda de libro de códigos innovativo y de paso de bucle cerrado sencillo; La Figura 5 es una extensión del diagrama de bloques de la Figura 4, en donde se han agregado módulos relacionados a una modalidad ilustrativa de la presente invención; La Figura 6 es un diagrama de bloques que explica la situación cuando se construye un principio artificial; y La Figura 7 es un diagrama esquemático que muestra una modalidad ilustrativa de una máquina de estado de clasificación de cuadros para el ocultamiento de borrado . DESCRIPCIÓN DETALLADA DE LAS MODALIDADES ILUSTRATIVAS Aunque las modalidades ilustrativas de la presente invención se describirán en la siguiente descripción en relación a una señal de habla, habrá de mantenerse en mente que los conceptos de la presente invención se aplican igualmente a otros tipos de señal., en particular pero no forma exclusiva a otros tipos de señales de sonido. La Figura 1 ilustra un sistema de comunicación de habla 100 que muestra el uso de codificación y descodificación de habla en el contexto de la presente invención. El sistema de comunicación de habla 100 de la Figura 1 soporta la transmisión de una señal de habla a través de un canal de comunicación 101. Aunque puede comprender un ejemplo un cable, un enlace óptico o un enlace de fibras, el canal de comunicación 101 típicamente comprende cuando menos en parte un enlace de radio frecuencia. El enlace de radio frecuencia a menudo soporta múltiples comunicaciones de habla simultáneas que requieren recursos de ancho de banda compartidos tal como puede encontrarse con sistemas de telefonía celular.
Aunque no se ilustra, el canal de comunicación 101 puede reemplazarse por un dispositivo de almacenamiento en una modalidad de un solo dispositivo del sistema 100 que registra y almacena la señal de habla codificada para la reproducción posterior. En el sistema de comunicación de habla 100 de la Figura 1, un micrófono 102 produce una señal de habla analógica 103 que se suministra al convertidor analógico-a-digital (A/D = analog- o-digital) 104 para convertirla en una señal de habla digital 105. Un codificador de habla 106 codifica la señal de habla digital 105 para producir un conjunto de parámetros de codificación de señal 107 que se codifican en una forma binaria y suministran a un codificador de canal 108. El codificador de canal opcional 108 agregar redundancia a la representación binaria de los parámetros de la codificación de señal 107 antes de transmitirlos sobre el canal de comunicación 101. En el receptor, un descodificador de canal 109 utiliza la información redundante en la corriente de bits recibida 111 para detectar y corregir errores de canal que ocurren durante la transmisión. Un descodificador de habla 110 convierte la corriente de bits 112 recibida del descodificador de canal 109 de regreso a un conjunto de parámetros de codificación de señal y crea una señal de habla sintetizada digital 113 de los parámetros de codificación de señal recuperados. La señal de habla sintetizada digital 113 reconstruida en el descodificador de habla 110 se convierte en una forma analógica 114 por un convertidor digital-a-analógico (D/A) 115 y se reproduce a través de una unidad de bocinas 116. La modalidad ilustrativa del método para el ocultamiento con borrado de cuadro descrita en la presente especificación puede utilizarse ya sea con codees basados en predicción lineal de banda estrecha o de banda ancha. La presente modalidad ilustrativa se describe en relación a un codee de habla de banda ancha que se ha estandardizado por la Unión de Telecomunicaciones Internacional (ITU = International Telecommunications Union) como la Recomendación G. 722.2 y conocido como el codee AMR-WB (Codee de Ancho de Banda de Velocidad Múltiple Adaptativo) [Recomendación ITU-T G. 722.2 "Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)" (Codificación de Banda Ancha de Habla Alrededor de 16 kbit/s utilizando Banda Ancha de Velocidad Múltiple Adaptativa (AMR-WB) ) , Ginebra, 2002] . Este codee también se ha seleccionado por el proyecto de asociación de tercera generación (3GPP = third generation partnership project) para telefonía de banda ancha en sistemas inalámbricos de tercera generación [3GPP TS 26.190, "AMR ideband Speech Codee: Transcoding Functions" (Codee de Habla de Banda Ancha AMR: Funciones de Transdescodificación) Especificación Técnica 3GPP] . AMR-WB puede operar a velocidades de 9 bits en el rango de 6.6 a 23.85 kbits/s. La velocidad de bits de 12.65 kbits/s se utiliza para ilustrar la presente invención. Aquí, habrá de entenderse que la modalidad ilustrativa del método de ocultamiento de borrado de cuadro eficiente puede aplicarse a otros tipos de codees. En las siguientes secciones, se dará primero una revisión del codificador y descodificador AMR-WB. Luego será descrita la modalidad ilustrativa del enfoque novedoso para mejorar lo robusto del codee. Revisión del Codificador AMR-WB La señal de habla muestreada se codifica en una base bloque-por-bloque por el dispositivo de codificación 200 de la Figura 2, que se descompone en once módulos numerados del 201 al 211. Por lo tanto, la señal de habla de alimentación 212 se procesa en una base bloque-por-bloque, es decir, en los bloques de muestra L anteriormente mencionados denominados cuadros . Con referencia a la Figura 2, la señal de habla de alimentación muestreada 212 se muestrea en forma descendente en un módulo de muestreo descendente 201. La señal se muestrea descendente de 16 kHz hasta 12.8 kHz, utilizando las técnicas bien conocidas por aquellos con destreza ordinaria en la especialidad. El muestreo descendente incrementa la eficiencia de la codificación, ya que se codifica un ancho de banda de frecuencia más pequeño. Esto también reduce la complejidad algorítmica, ya que el número de muestras en un cuadro se disminuyen. Después de muestreo descendente, el cuadro de muestra 320 de 20 ms se reduce a un cuadro de 256-muestras (proporción de muestreo descendente 4/5) . El cuadro de alimentación luego se suministra al módulo de pre-procesamiento opcional 202. El módulo de pre-procesamiento 202 puede consistir de un filtro de paso alto con una frecuencia de corte a 50 Hz . El filtro de paso alto 202 retira los componentes de sonido indeseados por debajo de 50 Hz. La señal pre-procesada de muestreo descendente, se denota por sp(n) , n=0 , 1, 2,...,L-1, donde L es la longitud del cuadro (256 a la frecuencia de muestreo de 12.8 kHz). En una modalidad ilustrativa del filtro de preacentuación 203, la señal sp(n) se pre-enfatiza utilizando un filtro que tiene la siguiente función de transferencia : P(z) = 1 - µ?~? en donde es un factor de preacentuación con un valor ubicado entre 0 y 1 (un valor típico es = 0.7) . La función del filtro de preacentuación 203 es mejorar los contenidos de alta frecuencia en la señal de habla de alimentación. También reduce el rango dinámico de la señal de habla de alimentación, que lo hace más adecuado para la implementacion de punto fijo. La preacentuación, también juega un papel importante para lograr una ponderación perceptual total adecuada del error de cuantificación, que contribuye a la calidad del sonido mejorado. Esto se explicará con más detalle a continuación. La salida de filtro de preacentuación 203 se denota s (n) . Esta señal se utiliza para realizar análisis LP en el módulo 204. El análisis LP es una técnica bien conocida por aquellos con destreza ordinaria en la especialidad. En esta implementacion ilustrativa, se utiliza el enfoque de autocorrelacion. En el enfoque de autocorrelacion, la señal s (n) primero se forma en ventana utilizando, típicamente una ventana Hamming que tiene una longitud en el orden de 30-40 ms . Las autocorrelaciones se calculan desde la señal en ventana, y se utiliza una recursión Levinson-Durbin para calcular los coeficientes filtro LP, a±, donde i=l,¾¾,p, y donde p es el orden LP, que típicamente es 16 en la codificación de ancho de banda. Los parámetros a¿ son los coeficientes de la función de transferencia A(z) del filtro LP, que están dados por la siguiente relación: i=\ El análisis LP se realiza en el módulo 204, que también realiza la cuantificación e interpolación de los coeficientes del filtro LP. Los coeficientes del filtro LP primero se transforman en otro dominio equivalente más adecuado para propósitos de cuantif icación e interpolación. Los dominios de par espectral de línea (LSP = line spectral pair) y el par espectral de immitancia (ISP = immitance spectral pair) son dos dominios en donde pueden realizarse eficientemente la cuantificación y la interpolación. Los 16 coeficientes de filtro LP, ai# pueden cuantificarse en el orden de 30 a 50 bits utilizando la cuantificación de etapas múltiples o divididas, o una combinación de estas. El propósito de la interpolación es permitir la actualización de los coeficientes del filtro LP cada subcuadro mientras que se les transmiten una vez cada cuadro, que mejora el desempeño del codificador sin incrementar la velocidad de bits. Se considera que la cuantificación e interpolación de los coeficientes del filtro LP de otra forma es bien conocida por aquellos con destreza ordinaria en la especialidad y, de acuerdo con esto, no se describirá más en la presente especificación. Los siguientes parámetros describirán el resto de las operaciones de codificación realizadas en una base de sub-cuadro. En esta implementación ilustrativa, el cuadro de alimentación se divide en 4 subcuadros de 5 ms (64 muestras a la frecuencia de muestreo de 12.8 kHz) . En la siguiente descripción, el filtro A(z) denota el filtro LP interpolado no cuantificado del subcuadro y el filtro A(z) denota el filtro LP interpolado cuantificado del subcuadro. El filtro Á(z) se suministra cada subcuadro a un multiplexor 213 para transmisión a través de un canal de comunicación. En codificadores de análisis-por-síntesis , los parámetros óptimos de paso e innovación se buscan al minimizar el error cuadro medio entre la señal de habla de alimentación 212 y una señal de habla sintetizada en un dominio perceptualmente ponderado. La señal ponderada sw(n) se calcula en un sitio de ponderación perceptual 205 en respuesta a la señal ' sw(n) del filtro de preacentuación 203. Se utiliza un filtro de ponderación perceptual 205 con denominador fijo, adecuado para señales de banda ancha. Un ejemplo de función de transferencia para el filtro de ponderación perceptual 205 se da por la siguiente relación: en donde A fin de simplificar el análisis de paso, un retardo de paso de bucle abierto T0L primero se estima en un módulo de búsqueda de paso de bucle abierto 206 a partir de la señal de habla ponderada sw(n) . Luego, el análisis de paso de bucle cerrado, que se realiza en un módulo de búsqueda de paso de bucle cerrado 207 en una base de subcuadro, se restringe alrededor del retardo de paso de bucle abierto T0L que significativamente reduce la complejidad de búsqueda de los parámetros LTP T (retardo de paso) y b (ganancia de paso) . El análisis de paso de bucle abierto usualmente se realiza en el módulo 206 una vez cada 10 ms (dos subcuadros) utilizando técnicas bien conocidas por aquellos con destreza ordinaria en . la especialidad . Primero se calcula el vector objetivo x para el análisis de Predicción de Largo Plazo (LTP = Long Term Prediction) . Esto usualmente se realiza al substraer la * respuesta de alimentación cero s0 del filtro de síntesis ponderada W(z)/Á(z) de la señal de habla ponderada sw(n) . Esta respuesta de alimentación cero s0 se calcula por un calculador de respuesta de alimentación cero 208 en respuesta al filtro LP de interpolación cuantificada Á(z) del análisis LP, módulo de cuantificación e interpolación 204 y los estados iniciales del filtro de síntesis ponderado W(z)/Á(z) almacenado en el módulo de actualización de memoria 211, en respuesta a los filtros LP A(z) y A(z), y el vector de excitación u. Esta operación es bien conocida por aquellos con destreza ordinaria en la especialidad y de acuerdo con esto no se describirá más. Un vector de respuesta de impulso N-dimensional h del filtro de síntesis ponderado W(z)/Á(z) se calcula en el generador de respuesta de impulso 209 utilizando los coeficientes del filtro LP A(z) y A (z) del módulo 204. De nuevo, esta operación es bien conocida por aquellos con destreza ordinaria en la especialidad y, de acuerdo con esto, no se describirá más en la presente especificación . Los parámetros de paso de bucle cerrado (o libro de códigos de paso) b, T y j se calculan en el módulo de bucle de paso de bucle cerrado 207, que' utiliza el vector objetivo x, el vector de respuesta de impulso h y el retardo de paso de bucle abierto T0L como alimentaciones. La búsqueda de paso consiste en encontrar el mejor retardo de paso T y la ganancia b que minimice un error de predicción de paso ponderado de cuadrado medio, por ej emplo donde j= 1, 2, ¾, k entre el vector objetivo x y una versión filtrada a escala de excitación pasada. Más específicamente, en la implementación ilustrativa actual, la búsqueda de paso (libro de códigos de paso) está compuesta por tres etapas. En la primer etapa, un retardo de paso de bucle abierto TOL se estima en el módulo de bucle de paso 206 en respuesta a la señal de habla ponderada sw(n) . Como se indicó en la descripción anterior, esté análisis de paso de bucle abierto usualmente se realiza una vez cada 10 ms (dos subcuadros) utilizando técnicas bien conocidas por aquellos con destreza ordinaria en la especialidad. En la segunda etapa, un criterio de búsqueda C se busca en el módulo de búsqueda de paso de bucle cerrado 207 para retardos de paso enteros alrededor del retardo de paso de bucle abierto estimado T0L (usualmente ±5) , que simplifica significativamente el procedimiento de búsqueda. Un procedimiento simple se emplea para actualizar el vector de código filtrado yT (este vector se define en la siguiente descripción) sin necesidad por calcular la convolución por cada retardo de paso. Un ejemplo del criterio de búsqueda C está dado por: donde t denota una transposición de vector. Una vez que se encuentra un retardo de paso entero óptimo en la segunda etapa, una tercera etapa de las pruebas de búsqueda (módulo 207) , mediante el criterio de búsqueda C, las fracciones alrededor de retardo de paso entero óptimo. Por ejemplo, la norma AMR-WB utiliza la resolución de submuestra ¼ y ½. En las señales de banda ancha, la estructura armónica existe sólo hasta una cierta frecuencia, dependiendo del segmento de habla. De esta manera, a fin de lograr una representación eficiente de la contribución de paso en segmentos de voz de una señal de habla de banda ancha, se requiere flexibilidad para variar la cantidad de periodicidad sobre el espectro de banda ancha. Esto se logra al procesar el vector de código de paso a través de una pluralidad de filtros de conformado de frecuencia (por ejemplo filtros de paso bajo o paso de banda) . Y se elige el filtro de conformado de frecuencia que minimiza el error ponderado cuadrado medio e ) . El filtro de conformado de frecuencia seleccionado se identifica por un índice j. El índice de libro de códigos de paso T se codifica y transmite al multiplexor 213 para la transmisión a través de un canal de comunicación. La ganancia de paso b se cuantifica y transmite al multiplexor 213. Un bit extra se utiliza para codificar el índice j, este bit extra también se suministra al multiplexor 213. Una vez que se determinan el paso, o los parámetros de Predicción de Largo Plazo (LTP = Long Term Predicción) b, T, y j, la siguiente etapa es buscar la excitación innovadora óptima mediante el módulo de búsqueda de excitación innovativo 210 de la Figura 2. Primero, el vector objetivo x se actualiza al substraer la contribución LTP: x1=x-byT en donde b es la ganancia de paso y yT es el vector de libro de códigos de paso filtrado (la última excitación al retardo T filtrado con el filtro de conformado de frecuencia selecto (índice j) y se enrollaron con la respuesta de impulso h) . El procedimiento de búsqueda de excitación innovativo en CELP se realiza en un libro de códigos innovativo para encontrar el vector de código de excitación óptimo ck y la ganancia g que minimiza error cuadrado medio E entre el vector objetivo x' 5 una versión filtrada a escala del vector de código < por ejemplo; en donde H es una matriz de convolución triangular inferior derivada del vector de respuesta de impulso . El índice k del libro de códigos de innovación correspondiente al vector de código óptimo encontrado ck y la ganancia g se suministran al multiplexor 213 para la transmisión a través de un canal de comunicación. Habrá de notarse que el libro de códigos de innovación empleado es un libro de códigos dinámico que consiste de un libro de códigos algebraico seguido por un pre-filtro adaptativo F(z) que mejora los componentes espectrales especiales a fin de mejorar la calidad del habla de síntesis, de acuerdo con la patente de los E.U.A. No. 5,444,816 otorgada a Adoul y colaboradores, en agosto 22 de 1995. En esta implementación ilustrativa, la búsqueda de libro de códigos innovativo se realizó en el módulo 210 mediante un libro de códigos algebraico como se describe en las patentes de los E.U.A. Nos: 5,444,816 (Adoul y colaboradores) otorgada en agosto 22 de 1995; 5,699,482 otorgada a Adoul y colaboradores, en Diciembre 17 de 1997; 5,754,976 otorgada a Adoul y colaboradores, en Mayo 19 de 1998; y 5,701,392 (Adoul y colaboradores) fechada en Diciembre 23 de 1997. Información General de descodificador AMR-WB El descodificador de habla 300 de la Figura 3 ilustra las diversas etapas llevadas a cabo entre la alimentación digital 322 (corriente de bits de alimentación al desmultiplexor 317) y la señal de habla de muestreo de salida 323 (salida del sumador 321) .
El desmultiplexor 317 extrae los parámetros del modelo de síntesis de la información binaria (corriente de bits de alimentación 322) recibida de un canal de alimentación digital. De cada cuadro binario recibido, los parámetros extraídos son: ¦ los coeficientes LP interpolados, cuantificados Á(z) también denominados parámetros de predicción de corto plazo (STP) producidos una vez por cuadro; ¦ los parámetros de predicción de largo plazo (LTP) T, b, y j (por cada subcuadro) ; y ¦ el índice de libro de códigos de innovación k y ganancia g (por cada subcuadro) . La señal de habla actual se sintetiza con base en estos parámetros, como se explicará a continuación. El libro de códigos de innovación 318 responde al índice k para producir el vector de código de innovación ck, que se ajusta en escala por el factor de ganancia descodificado g a través de un amplificador 324. En la implementación ilustrativa, se utiliza un libro de códigos de innovación como se describe en las patentes de los E.U.A. anteriormente mencionados 5,444,816; 5,699,482; 5,754,976; y 5,701,392 para producir el vector de código innovativo ck. El vector de código ajustado en escala generado a la salida del amplificador 324 se procesa a través de un mejorador de paso dependiente de frecuencia 305. Mejorando la periodicidad de la señal de excitación se mejora la calidad de los segmentos de sonoros. La mejora en periodicidad se logra al filtrar el vector de código innovativo del libro de códigos de innovación (fijo) a través de un filtro de innovación F(z) (mejorador de paso 305) cuya respuesta de frecuencia enfatiza las frecuencias superiores más que las frecuencias inferiores. Los coeficientes del filtro de innovación F(z) se relacionan a la cantidad de periodicidad en la señal de excitación u. üna forma eficiente e ilustrativa para derivar los coeficientes del filtro de innovación F(z) es relacionarlos a la cantidad de contribución de paso en la señal de excitación total u. Estos resulta en una respuesta de frecuencia que depende de la periodicidad del subcuadro, en donde las frecuencias superiores se enfatizan más fuertemente (pendiente total más fuerte) para ganancias superiores de paso. El filtro de innovación 305 tiene el efecto de reducir la energía del vector de código de innovación c¿ a frecuencias menores cuando la señal de excitación u es más periódica, lo que mejora la periodicidad de la señal de excitación u a frecuencias menores más que a frecuencias superiores. Una forma sugerida para el filtro de innovación 305 es la siguiente: F(z) = -OZ+ 1 - az~l en donde alfa es un factor de periodicidad derivado del nivel de periodicidad de la señal de excitación u. El factor de periodicidad alfa se calcula en el generador de factor sonoro o de habla 304. Primero se calcula un factor sonoro rv se calcula en el generador de factor sonoro 304 por: rv = {Ev-Ec)l{E, + Ec) donde Ev es la energía del vector de código de paso ajustado en escala bvT y Ec es la energía del vector de código innovativo ajustado en escala gck. Esto es: y Hay que notar que el valor de rv se encuentra entre -1 y 1 (1 corresponde a señales puramente de voz y -1 corresponde a señales puramente sin voz) . El vector de código de paso ajustado en escala anteriormente mencionado bvT se produce al aplicar el retardo de paso a un libro de códigos de paso 301 para producir un vector de código de paso. El vector de código de paso luego se procesa a través de un filtro de paso bajo 302 cuya frecuencia de corte se elige en relación al índice j desde el desmultiplexor 317 para producir el vector de código de paso filtrado vr. Luego se amplifica el vector de código de paso filtrado vT por la ganancia de paso b por un amplificador 326 para producir el vector de código de paso ajustado en escala bvT. En esta implementación ilustrativa, el factor alfa luego se calcula en el generador de factor sonoro 304 por: a = 0.125(1+ rv) que corresponde a un valor de 0 para señales puramente sin voz y 0.25 para señales puramente de voz. Por lo tanto, la señal mejorada cf se calcula al filtrar el vector de código innovativo ajustado en escala ge* a través del filtro de innovación 305 (F(z)). La señal de excitación mejorada u' se calcula por el sumador 320 como: wf= cf + bvT Habrá de anotarse que este proceso no se realiza en el codificador 200. De esta manera, es esencial actualizar el contenido del libro de códigos de paso 301 utilizando el valor pasado de la señal de excitación u sin mejora almacenada en la memoria 303 para mantener la sincronía entre el codificador 200 y el descodificador 300. Por lo tanto, la señal de excitación u se utiliza para actualizar la memoria 303 del libro de códigos de paso 301 y la señal de excitación mejorada u' se utiliza en la alimentación del filtro de síntesis LP 306. La señal sintetizada s' se calcula al filtrar la señal de excitación mejorada u' a través del filtro de síntesis LP 306 que tiene la forma 1/Á(z), en donde Á(z) es el filtro LP interpolado, cuantificado en el subcuadro actual. Como puede verse en la Figura 3, los coeficientes LP interpolados cuantificados Á(z) en la línea 325 del desmultiplexor 317 se suministran al filtro de síntesis LP 306 para ajustar los parámetros del filtro de síntesis LP 306 de conformidad. El filtro de desacentuación 307 es la inversa del filtro del pre-acentuación 203 de la Figura 2. La función de transferencia del filtro de desacentuación 307 está dada por en donde µ es el factor de preacentuación con un valor ubicado entre 0 y 1 (un valor típico es µ = 0.7) . También puede emplearse un filtro de orden superior. El vector s' se filtra a través del filtro de desacentuación D(z) 307 para obtener el vector sd, que se procesa a través del filtro de paso alto 308 para retirar las frecuencias indeseadas por debajo de 50 Hz y además obtener s¡,. El sobre muestreador 309 conduce el proceso inverso del muestreo descendente 201 de la Figura 2. En esta modalidad ilustrativa, el sobre muestreo convierte la velocidad de muestreo de 12.8 kHz a la velocidad de muestreo 16 kHz original, utilizando técnicas bien conocidas por aquellos con destreza ordinaria en la especialidad. La señal de síntesis sobre muestreada se denota s. La señal s también se refiere como la señal intermedia de banda ancha sintetizada. La señal de síntesis sobre muestreada s no contiene los componentes de frecuencia superior que se perdieron durante el proceso de muestreo descendente (módulo 201 de la Figura 2) en el codificador 200. Esto da una percepción de paso bajo a la señal de habla sintetizada. Para restaurar la banda completa de la señal original, se realiza un procedimiento de generación de alta frecuencia en el módulo 310 y requiere alimentación del generador de factor sonoro 304 (Figura 3). La secuencia de interferencia filtrada de paso de banda resultante z del módulo de generación de alta frecuencia 310 se agrega por el sumador 321 a la señal de habla sintetizada sobre muestreada s para obtener la señal de habla de salida reconstruida final sout en la salida 323. Un ejemplo del proceso de regeneración de alta frecuencia se describe en la solicitud de patente PCT Internacional bajo el No. O 00/25305 de mayo 4 del 2000.. La asignación de bits del codee AMR-WB a 12.65 kbit/s se da en la Tabla 1. Tabla 1 Asignación de bit en el modo 12.65-kbits/s Ocultamlento de horrado de cuadro robusto El borrado de cuadros tiene un efecto principal en la calidad de habla sintetizada en sistemas digitales de comunicación de habla, especialmente cuando se opera en ambientes inalámbricos y redes conmutadas por paquete. En sistemas celulares inalámbricos, la energía de la señal recibida puede exhibir frecuentes caídas severas que resultan en altas velocidades de error de bits y esto se vuelve más evidente en las fronteras de las celdas. En ' este caso, el descodificador de canal falla al corregir los errores en el cuadro recibido y, como consecuencia, el detector de error usualmente empleado después del descodificador de canal declarará el cuadro como borrado. En aplicaciones de red de voz sobre-paquetes, tales como protocolos de Voz sobre Internet (VoIP = Voice over Internet Protocol) , la señal de habla se forma en paquetes donde usualmente un cuadro de 20 ms se coloca en cada paquete. En comunicaciones conmutadas por paquetes puede ocurrir el retiro de un paquete en un ruteador si el número de paquetes se vuelve muy grande, o el paquete puede llegar al receptor después de un prolongado retardo, y deberá ser declarado como perdido si su retardo es mayor que la longitud de una memoria intermedia de retardo en el lado del receptor. En estos sistemas, el codee se somete típicamente 3 a 5% de las velocidades de borrado del cuadro. El problema de procesamiento de borrado de" cuadro (FER = frame erasure) básicamente es doble. Primero, cuando llega un indicador de cuadro borrado, el cuadro faltante debe generarse al utilizar la información enviada en el cuadro previo y. al estimar la evolución de señal en el cuadro faltante. El éxito de la estimación depende no sólo de la estrategia de ocultamiento, sino también del sitio de la señal de habla en donde sucede el borrado. Segundo, una transición uniforme debe asegurarse cuando se recupera la operación normal, es decir, cuando llega el primer buen cuadro después de un bloque de cuadros borrados (uno o más) . Esta no es una tarea trivial, ya que la verdadera síntesis y la síntesis estimada pueden evolucionar en forma diferente. Cuando llega el primer cuadro bueno, el descodificador , por lo tanto, se desincroniza del codificador. La razón principal es que los codificadores de baja velocidad de bits se basan en la predicción de paso, y durante los cuadros borrados la memoria del pronosticador de paso ya no es más la misma que aquella del codificador. El problema se amplía cuando se borran muchos cuadros consecutivos. En cuanto al ocultamiento, la dificultad de la recuperación del procesamiento normal depende del tipo de señal de habla donde ocurrió el borrado. El efecto negativo de borrado de cuadro puede reducirse significativamente al adaptar el ocultamiento y la recuperación de procesamiento normal (mayor recuperación) al tipo de señal de habla en donde ocurre el borrado. Para este propósito, es necesario clasificar cada cuadro de habla. Esta clasificación puede realizarse en el codificador y transmitirse. En forma alterna, puede estimarse en el descodificador . Para mejor ocultamiento y recuperación, hay pocas características críticas de la señal de habla que deben ser controladas cuidadosamente. Estas características críticas son la energía de señal o la amplitud, la cantidad de periodicidad, el envolvente espectral y el periodo de paso. En caso de una recuperación de habla con voz, puede lograrse mejora adicional por un control de fase. Con un ligero incremento en la velocidad de bits, pocos parámetros suplementarios pueden cuantificarse y transmitirse para mejor control. Si no hay un ancho de banda disponible adicional, los parámetros pueden estimarse en el descodificador . Con estos parámetros controlados, el ocultamiento de borrado de cuadro y recuperación pueden mejorarse significativamente, en especial al mejorar la convergencia de la señal descodificada en la señal actual en el codificador y aliviar el efecto de desajuste entre el codificador y descodificador cuando se recupera el procesamiento normal. En la presente modalidad ilustrativa de la presente invención, se describen métodos para ocultamiento de borrado de cuadro eficiente y método para extraer y transmitir parámetros que mejoran el desempeño y convergencia en el descodificador en los cuadros después de un cuadro borrado. Estos parámetros incluyen dos o más de los siguientes: clasificación de cuadro, energía, información de habla e información de fase. Además, se describen métodos para extraer estos parámetros en el descodificador si no es posible transmisión de bits extra. Finalmente, también se describen métodos para mejorar la convergencia de descodificador en buenos cuadros después de un cuadro borrado . Las técnicas de ocultamiento de borrado de cuadro de acuerdo con la presente modalidad ilustrativa se han aplicado al codee A R-WB descrito anteriormente. Este codee servirá como un marco ejemplar para la implementación de los métodos de ocultamiento FER en la siguiente descripción. Como se explicó anteriormente, la señal de habla de alimentación 212 al codee tiene una frecuencia de muestreo de 16 kHz, pero se muestrea descendente a una frecuencia de muestreo de 12.8 kHz antes de mayor procesamiento. En la modalidad ilustrativa actual, el procesamiento FER se realiza en la señal de muestreo descendente. La Figura 4 da un diagrama de bloques simplificado del codificador AMR-WB 400. En este diagrama de bloques simplificado, el muestreador descendente 201, el filtro de paso alto 202 y el filtro de preacentuacion 203 se agrupan en conjunto en el módulo de preprocesamiento 401. También, el módulo de búsqueda de bucle cerrado 207, el calculador de respuesta de alimentación cero 208, el calculador de respuesta de impulso 209, el módulo de búsqueda de excitación innovadora 210, y el módulo de actualización de memoria 211 se agrupan en un paso de bucle cerrado y en módulos de búsqueda de libro de códigos de innovación 402. Este agrupamiento se realiza para simplificar la introducción de los nuevos módulos relacionados con la modalidad ilustrativa de la presente invención. La Figura 5 es una extensión del diagrama de bloques de la Figura 4 en donde se agregan los módulos relacionados a la modalidad ilustrativa de la presente invención. En estos módulos agregados 500 a 507, se calculan, cuantifican y transmiten parámetros adicionales con el objeto de mejorar el ocultamiento FER y la convergencia y recuperación del descodificador después de los cuadros borrados. En la presente modalidad ilustrativa, estos parámetros incluyen la clasificación de señal, energía e información de fase (la posición estimada del primer pulso glotal en un cuadro) . En las siguientes secciones se darán en detalle los cálculos y la cuantificación de estos parámetros adicionales, y serán más aparentes con referencia a la Figura 5. Entre estos parámetros, se tratará la clasificación de señal con más detalle. En las secciones subsecuentes se explicará el ocultamiento FER eficiente utilizando estos parámetros adicionales para mejorar la convergencia .
Clasificación de Señal para Ocultami ento y Recuperación FER La idea básica tras utilizar una clasificación de habla para una reconstrucción de señal en la presencia de cuadros borrados consiste en el hecho de que la estrategia de ocultamiento ideal es diferente para segmentos de habla cuasi estacionarios y para segmentos de habla con características rápidamente cambiantes. Mientras que el mejor procesamiento de cuadros borrados en segmentos de habla no estacionarios puede resumirse como una convergencia rápida de parámetros de codificación de habla, a las características de ruido o interferencia ambiente, en el caso de la señal cuasi-estacionaria los parámetros de codificación de habla no varían dramáticamente, y pueden mantenerse prácticamente sin cambio durante varios cuadros borrados adyacentes antes de ser almacenados en memoria intermedia. También, el método óptimo para una recuperación de señal después de un bloque de borrado de cuadros varía con la clasificación de la señal de habla. La señal de habla puede clasificarse burdamente como con voz o sonora, sin voz y pausa. El habla con voz contiene una cantidad importante de componentes periódicos y además puede dividirse en las siguientes categorías: inicios con voz, segmentos de voz, transiciones de voz y equivalentes de voz. Un inicio con voz se define como el inicio de un segmento de habla con voz después de una pausa o un segmento sin voz. Durante los segmentos con voz, los parámetros de señal de habla (envolvente espectral, periodo de paso, proporción de componentes periódicos y no periódicos, energía) varían lentamente de cuadro en cuadro. Una transición con voz se caracteriza por rápidas variaciones de habla con voz, tal como una transición entre vocales. Los desplazamientos con voz se caracterizan por un decremento gradual de energía y sonorización al final de los segmentos con voz. Las partes sin voz de la señal se caracterizan porque falta el componente periódico y además pueden dividirse en cuadros inestables, en donde la energía y el espectro cambian rápidamente, y cuadros estables en donde estas características permanecen en forma relativamente estable. Los cuadros restantes se clasifican como de silencio. Los cuadros de silencio comprenden todos los cuadros sin habla activa, es decir, también cuadros de solo interferencia si hay presente una interferencia de fondo . No todas las clases anteriormente mencionadas requieren procesamiento separado. Por lo tanto, para los propósitos de técnicas de ocultamiento de error, algunas de las clases de señal se agrupan en conjunto. Clasificación en el codificador Cuando hay un ancho de banda disponible en la corriente de bits para incluir la información de clasificación, la clasificación puede realizarse en el codificador. Esto tiene varias ventajas. La más importante es que a menudo hay una revisión por adelantado en codificadores de habla. La revisión por adelantado permite estimar la evolución de la señal en el siguiente cuadro y, consecuentemente, la clasificación puede realizarse al tomar en cuenta el comportamiento de señal futuro. En general, entre más larga sea revisión por adelantado mejor puede ser la clasificación. Una ventaja adicional es una reducción en complejidad, ya que la mayoría del procesamiento de señal necesario para el ocultamiento de borrado de cuadro se requiere de cualquier forma para codificación de habla. Finalmente, también hay la ventaja de trabajar con la señal original en lugar de la señal sintetizada. La clasificación del cuadro se realiza con la consideración de la estrategia de ocultamiento y recuperación en mente. En otras palabras, cualquier cuadro se clasifica de manera tal que el ocultamiento puede ser óptimo si el siguiente cuadro falta, o que la recuperación pueda ser óptima si el cuadro previo ' se pierde. Algunas de las clases empleadas para procesamiento FER no requieren ser transmitidas, ya que pueden deducirse sin ambigüedad en el descodificador . En la presente modalidad ilustrativa, se utilizan cinco (5) clases distintas y se definen como sigue: ¦ Clase SIN VOZ (UNVOICED) , que comprende todos los cuadros de habla sin voz y todos los cuadros sin habla activa. Un cuadro equivalente con voz también puede clasificarse como SIN VOZ si su final tiende a ser sin voz y el ocultamiento designado para cuadros sin voz puede utilizarse para el siguiente cuadro en caso de que se pierda. ¦ Clase de TRANSICIÓN SIN VOZ (UNVOICED TRANSITION) , que comprende cuadros sin voz con un inicio de voz posible al final. Sin embargo, el inicio es todavía muy corto o no es bien construido lo suficiente para utilizar el ocultamiento designado para cuadros de voz. La clase de TRANSICIÓN SIN VOZ puede seguir sólo a un cuadro clasificado como SIN VOZ o TRANSICIÓN SIN VOZ. ¦ La clase de TRANSICIÓN CON VOZ (VOICED TRANSITION) , comprende cuadros con características de voz relativamente débiles. Estos típicamente son cuadros con voz con características rápidamente cambiantes (transición entre vocales) o equivalentes con voz que duran todo el cuadro. La clase de TRANSICIÓN CON VOZ puede seguir sólo un cuadro clasificado como TRANSICIÓN CON VOZ , CON VOZ o de INICIO. ¦ La clase CON VOZ (VOICED) , comprende cuadros con voz con características estables. Esta clase puede seguir sólo un cuadro clasificado como TRANSICIÓN DE VOZ, CON VOZ o de INICIO. ¦ La clase de INICIO (ONSET) comprende todos los cuadros con voz con características estables después de un cuadro clasificado como SIN VOZ o TRANSICIÓN SIN VOZ. Los cuadros clasificados como de INICIO corresponden a cuadros de inicio con voz en donde el inicio ya está suficientemente bien construido para utilizar en el ocultamiento designado para cuadros de voz perdido. Las técnicas de ocultamiento utilizadas para un borrado de. cuadro siguiendo la clase de INICIO son las mismas que las siguientes a la clase con VOZ. La diferencia está en la estrategia de recuperación. Si un cuadro de clase de INICIO se pierde (es decir, un buen cuadro CON VOZ llega después de un borrado, pero el último cuadro bueno antes del borrado era SIN VOZ ) , puede utilizarse una técnica especial para reconstruir artificialmente el inicio perdido. Este escenario puede verse en la Figura 6. Las técnicas de reconstrucción de inicio artificial se describirán con mayor detalle en la siguiente descripción. Por una parte, si un buen cuadro de INICIO llega después de uno borrado y el último cuadro bueno antes de borrado era SIN VOZ, no se requiere este procesamiento especial, ya que el inicio no se ha perdido (no ha estado en el cuadro perdido) . El diagrama de estado de clasificación se perfila en la Figura 7. Si el ancho de banda disponible es suficiente, la clasificación se realiza en el codificador y se transmite utilizando 2 bits. Como puede verse en la Figura 7, la clase de TRANSICIÓN SIN VOZ y la clase de TRANSICIÓN CON VOZ pueden agruparse juntas ya que pueden diferenciarse en forma no ambigua en el descodificador (TRANSICIÓN SIN VOZ puede seguir sólo a cuadros SIN VOZ o de TRANSICIÓN SIN VOZ, TRANSICIÓN CON VOZ puede seguir sólo cuadros de INICIO, CON VOZ o TRANSICIÓN DE VOZ ) . Los siguientes parámetros se utilizan para la clasificación: una correlación normalizada rx, una medida de inclinación espectral et, una proporción de señal para interferencia snr, un contador de estabilidad de paso pe, una energía de cuadro relativa de la señal al final del cuadro corriente Es y un contador de cruce a cero zc. Como puede verse en el siguiente análisis detallado, el cálculo de estos parámetros utiliza revisión por adelantado disponible lo más posible para tomar en cuenta el comportamiento de la señal de habla también en el siguiente cuadro.
La correlación normalizada rx se calcula como parte del módulo de búsqueda de paso de bucle abierto 206 de la Figura 5. Este módulo 206 usualmente envía de salida el estimado de paso de bucle abierto cada 10 ms (dos veces por cuadro) . Aquí, también utiliza enviar de salida las medidas de correlación normalizadas. Estas correlaciones normalizadas se calculan en la señal de habla ponderada actual s„(n) y la señal de habla ponderada pasada en el retardo de paso de bucle abierto. A fin de reducir la complejidad, la señal de habla ponderada sw(n) se muestrea en forma descendente por un factor de 2 antes del análisis de paso de bucle abierto bajando a la frecuencia de muestreo de 6400 Hz [3GPP TS 26.190, "AMR Wideband Speech Codee: Transcoding Functions (Codee de habla de banda ancha AMR: Funciones de Transcodificación) Especificación de Técnicas 3GPP] . La correlación promedio rx se define como rx = 05(^(1)+^(2)) (a) en donde rx(l), rx(2) , respectivamente, son la correlación normalizada de la segunda mitad del cuadro actual y de revisión por adelantado. En esta modalidad ilustrativa, una revisión por adelantado de 13 ms se utiliza a diferencia de la norma AMR-WB que utiliza 5 ms . La correlación normalizada rK (k) se calcula como sigue: en donde z=0 Las correlaciones rx(k) se calculan utilizando la señal de habla ponderada su(n). Los instantes t¾ se relacionan al inicio de cuadro actual y son iguales a muestras 64 y 128 respectivamente a la velocidad de muestreo de la frecuencia de 6.4 kHz (10 y 20 ras) . Los valores pk= oL son los estimados de paso de bucle abierto selecto. La longitud del cálculo de autocorrelación Lk depende del periodo de paso. Los valores de Lk se resumen a continuación (para la velocidad de muestreo de 6.4 kHz): Lk = 40 muestras para Pk < 31 muestras Lk = 62 muestras para Pk < 61 muestras Lk = 115 muestras para Pk > 61 muestras Estas longitudes aseguran que la longitud de vector correlacionada comprende al menos un periodo de paso que ayuda a una detección de paso de bucle abierto robusta. Para periodos de paso largo ( i > 61 muestras), rx(l) y rx(2) son idénticos, es decir sólo se calcula una correlación ya que los vectores correlacionados son suficientemente largos de manera tal que ya no es más necesario el análisis en revisión por adelantado. El parámetro de inclinación espectral et contiene la información respecto a la distribución de frecuencia de energía. En la presente modalidad ilustrativa, la inclinación espectral se estima como una proporción entre la energía concentrada en bajas frecuencias y la energía concentrada en altas frecuencias. Sin embargo, también puede estimarse en formas diferentes como una proporción entre los dos primeros coeficientes de autocorrelación de la señal de habla . La Transformada Fourier discreta se utiliza para realizar el análisis espectral en el módulo de estimado de análisis espectral y energía de espectro 500 de la Figura 5. El análisis de frecuencia y el cálculo de inclinación se realizan dos veces por cuadro. Se utiliza Transformado Fourier Rápida de 256 puntos (FFT) con una super posición de 50 por ciento. Las ventanas de análisis se colocan de manera tal que se explota toda la revisión por adelantado. En esta modalidad ilustrativa, el inicio de la primera ventana se coloca 24 muestras después del inicio del cuadro actual. La segunda ventana se coloca 128 muestras más. Pueden emplearse diferentes ventanas para ponderar la señal de alimentación para el análisis de frecuencia. Se ha utilizado en la presente modalidad ilustrativa una raíz cuadrada de ventana Hamming (que es igual a una ventana de seno) . Esta ventana es particularmente bien adecuada para métodos de adición de superposición. Por lo tanto, este análisis espectral particular puede utilizarse en un algoritmo de supresión de interferencia opcional con base en la substracción espectral y el análisis/síntesis de adición de superposición. La energía en altas y bajas frecuencias se calcula en el módulo 500 de la Figura 5 siguiendo a las bandas críticas perceptuales . En la presente modalidad ilustrativa, cada banda crítica se considera hasta el siguiente número [J. D. Johnston/ "Transform Coding of Audio Signáis üsing Perceptual Noise Criteria" (Codificación de Transformación de Señales de Audio Utilizando Criterios de Interferencia Perceptual) IEEE Jour. on Selected Areas in Communications, vol . 6, no. 2, pp. 314-323] : Bandas críticas = {100.0, 200.0, 300.0, 400.0, 510.0, 630.0, 770.0, 920.0, 1080.0, 1270.0, 1480.0, 1720.0, 2000.0, 2320.0, 2700.0, 3150.0, 3700.0, 4400.0, 5300.0, 6350.0} Hz . energía en frecuencias superiores se calcula en el módulo 500 como el promedio de las energías de las últimas dos bandas críticas: donde las energías de bandas críticas e(i) se calculan como una suma de las energías de acumulación dentro de la banda crítica, promediadas por el número de acumuladores. La energía en frecuencias inferiores se calcula como el promedio de las energías en las primeras 10 bandas críticas. Las bandas críticas medias se han excluido del cálculo para mejorar la discriminación entre cuadros con concentración de alta energía en bajas frecuencias (generalmente con voz) y con concentración de alta energía en altas frecuencias (generalmente sin voz) . Intermedio, el contenido de energía no es característica para cualquiera de las clases e incrementará la confusión en la decisión. En el módulo 500, la energía en bajas frecuencias se calcula diferente para periodos de largo paso y periodos de corto paso. Para segmentos de habla femenina con voz, la estructura armónica del espectro puede ser explotada para incrementar la discriminación de voz-sin voz. De esta manera, para periodos de paso corto, ?? se calcula a manera de depósito y solo se toman en cuenta depósitos de frecuencia suficientemente cercanos a los armónicos de habla en la suma, es decir, donde et(i) son las energías de acumulación en los primeros 25 depósitos o acumuladores de frecuencia (el componente DC no se considera) . Hay que notar que estos 25 depósitos corresponden a las primeras 10 bandas críticas. En la suma anterior, sólo los términos relacionados a los depósitos más cerca del armónico más cercano que un cierto umbral de frecuencia son no cero. El contador cnt igual al número de estos términos no cero. El umbral para un depósito a incluirse en la suma se ha fijado en 50 Hz, es decir sólo se toman en cuenta los depósitos más cercanos a 50 Hz a los armónicos más cercanos. Por lo tanto, si la estructura es armónica en bajas frecuencias, se incluirá en la suma sólo un término de alta energía. Por otra parte, si la estructura no es armónica, la selección de los términos será aleatoria y la suma será pequeña. De esta manera, se podrán detectar incluso sonidos sin voz con alto contenido de energía en bajas frecuencias. Este procesamiento no puede realizarse para periodos de paso más largo, ya que la resolución de frecuencia no es suficiente. El valor de paso umbral es 128 muestras correspondientes a 100 Hz. Significa que para periodos de paso más largos que 128 muestras, y también para sonidos sin voz a priori (es decir en donde r rx+re <0.6), la estimación de energía de baja frecuencia se realiza por banda crítica y se calcula como El valor re, calculado en un módulo de estimación de ruido y corrección de correlación normalizada 501, es una corrección agregada a la correlación normalizada en presencia de una interferencia o ruido de fondo por la siguiente razón. En la presencia de interferencia de fondo, disminuye la correlación normalizada promedio. Sin embargo, con el propósito de clasificación de señal, este decremento no deberá afectar la decisión con voz-sin voz. Se ha encontrado que la dependencia entre este decremento re y la energía de ruido de fondo total en dB es aproximadamente exponencial y puede expresarse utilizando la siguiente relación re = 2.4492 · 1(T4 · e0 l596 NdB - 0.022 donde NdB se representa por Aquí, n(i) son los estimados de energía de interferencia por cada banda crítica normalizada en la misma forma que e(i) y gdB es el nivel de supresión de interferencia máximo en dB permitido para la rutina de reducción de interferencia. El valor re no se permite que sea negativo. Habrá de notarse que cuando se utiliza un buen algoritmo para reducción de interferencia y gdB es su icientemente alto, re prácticamente es igual a cero. Sólo es relevante cuando la reducción de interferencia se desactiva o si el nivel de interferencia de fondo es significativamente superior a la reducción permitida máxima. La influencia de re puede ajustarse al multiplicar este término con una constante. Finalmente, las energías de frecuencia inferior y superior resultantes se obtienen al substraer una energía de interferencia estimada de los valores Ei y Ei calculados anteriormente. Esto es donde 2\¾ y Ni son las energías de interferencia promediadas en las últimas dos (2) bandas críticas y primeras diez (10) bandas críticas, respectivamente, calculadas utilizando ecuaciones similares a las Ecuaciones (3) y (5), y fc es un factor de corrección ajustado de manera tal que estas medidas permanecen cercanas a constante al variar el nivel de interferencia de fondo. En esta modalidad ilustrativa, el valor fc se ha fijado en 3. La inclinación espectral et se calcula en el módulo de estimado de inclinación espectral 503 utilizando la relación: et - Eh (B) y se promedia en el dominio dB para los dos (2) análisis de frecuencia realizados por cuadros: <¾=10-IogI0(e,(0)-e((l)) La medición de la proporción de señal a interferencia (SNR = signal to noise ratio) explota el hecho de que para un codificador de correspondencia en forma de onda general, la SNR es muy superior para sonidos con voz. El estimado de parámetro snr puede realizarse al final del bucle de sub-cuadro de codificador y se calcula en el módulo de cálculo SNR 504 utilizando la relación: E donde Esw es la energía de la señal de habla ponderada sw(n) del cuadro actual del filtro de ponderación perceptual 205 y Ee es la energía del error entre esta señal de habla ponderada y la señal de síntesis ponderada del cuadro corriente a partir del filtro de ponderación perceptual 205'.. El contador de estabilidad de paso pe estima la variación del periodo de paso. Se calcula módulo de clasificación de señal 505 en estimado de paso de bucle abierto como sigue Los valores po, pi, p? corresponden a los estimados de paso de bucle abierto calculados por el módulo de búsqueda de paso de bucle abierto 206 a partir de la primer mitad del cuadro actual, la segunda mitad del cuadro actual y revisión por adelantado, respectivamente. La energía de cuadro relativo Es se calcula por el módulo 500 como una diferencia entre la energía de cuadro actual en ¦· dB y su promedio a largo plazo en donde la energía de cuadro Ef se obtiene como una suma de las energías de bandas críticas, promediadas para ambos análisis espectrales realizados a cada cuadro: 19 EfU)? z=0 La energía promediada de largo plazo se actualiza en cuadros de habla activa utilizando la relación : Elt = 0.99Elt + 0.0lEf El último parámetro es el parámetro de cruce a cero zc calculado en un cuadro de la señal de habla por el módulo de cálculo de cruce a cero 508. El cuadro se inicia en la mitad del cuadro actual y utiliza dos (2) sub-cuadros de revisión por adelantado. En esta modalidad ilustrativa, el contador de cruce a cero zc cuenta el número de veces que el signo de señal cambia de positivo a negativo durante ese intervalo. Para hacer más robusta la clasificación, los parámetros de clasificación se consideran juntos formando una función de mérito fm. Para este propósito, los parámetros de clasificación primero se ajustan en escala entre 0 y 1, de manera tal que cada valor de parámetro típico para señal sin voz se traduce en 0 y cada valor de parámetro típico para señal de voz se traduce en 1. Una función lineal se utiliza entre ellos. Consideremos un parámetro px, su versión en escala se obtiene utilizando: Ps = kp-px + cp y recortado entre 0 y 1. Los coeficientes de función kp y cp se han encontrado experimentalmente para cada uno de los parámetros, de manera tal que la distorsión de señal debida a las técnicas de ocultamiento y recuperación empleadas en la presencia de FERs es mínima. Los valores empleados en esta implementación ilustrativa se resumen en la Tabla 2: Tabla 2 Parámetros de Clasificación de Señal y los Coeficientes de sus Funciones de Escala Respectivos La función de mérito se ha definido como: fm = ~ (2 - rx+ et + snrs + pcs + Ess + zcs) en donde el sub-indice s indica la versión de escala d los parámetros. La clasificación luego se realiza utilizando 1 función de mérito fm y siguiendo las reglas resumidas e la Tabla 3: Tabla 3 Reglas de Clasificación de Señal en el Codificador Clase de Cuadro Regla Clase de Cuadro Previo Actual PRINCIPIO fm = 0.66 CON VOZ CON VOZ TRANSICIÓN CON VOZ 0.66 > fm - 0.49 TRANSICIÓN CON VOZ TRANSICIÓN SIN fm < 0.49 SIN VOZ VOZ SIN VOZ fm >0.63 PRINCIPIO 0.63 = fm > 0.585 TRANSICIÓN SIN OZ fm = 0.585 SIN VOZ En el caso de codificador de velocidad de bits variable controlado por fuente (VBR = variable bit rate) , una clasificación de señal es inherente a la operación de codee. El codee opera a varias velocidades de bits, y se utiliza un módulo de selección de velocidad para determinar la velocidad de bits empleada para codificar cada cuadro de habla con base en la naturaleza del cuadro de habla (por ejemplo cuadros de voz, sin voz, transitorios, ruido de fondo cada uno se codifica con un algoritmo de codificación especial) . La información respecto al modo de codificación y de esta manera respecto a la clase de habla ya es una parte implícita de la corriente de bits y no requiere ser transmitida explícitamente para procesamiento FER. Esta información de clase luego puede utilizarse para sobre-escribir la decisión de clasificación descrita anteriormente. En la aplicación ejemplar al codee AMR WB, la única selección de velocidad controlada fuente representa la detección de actividad de voz (VAD = voice activity detection) . Esta bandera VAD es igual a 1 para habla activa, 0 para silencio. Este parámetro es útil para la clasificación, ya que directamente indica que no se requiere mayor clasificación si su valor es 0 (es decir, el cuadro se clasifica directamente como SIN VOZ) . Este parámetro es la salida de módulo de detección de actividad de voz (VAD) 402. Existen diferentes algoritmos de VAD en la literatura, y puede utilizarse cualquier algoritmo con el propósito de la presente invención. Por ejemplo, el algoritmo VAD que es parte de la norma G. 722.2 puede emplearse [Recomendación ITU-T G. 722.2 "Wideband Coding of Speech at Around 16 kbit/s Using Adaptive Multi-Rate ideband (AMR-WB) " (Codificación de Banda Ancha de Habla Alrededor de 16 kbit/s utilizando Banda Ancha de Velocidad Múltiple Adaptativa (AMR-WB) ) , Ginebra, 2002]. Aqui, el algoritmo VAD se basa en la salida del análisis espectral del módulo 500 (con base en la proporción de señal-a-interferencia por banda critica) . El VAD empleado para propósitos de clasificación difiere de aquel empleado para propósitos de codificación con respecto al sobrante. En los codificadores de habla se utiliza una generación de interferencia cómoda (CNG = comfort noise generation) para segmentos sin habla activa (silencio o sólo ruido) , un sobrante a menudo se agrega después de aumentos de habla (CNG en la norma AMR-WB es un ejemplo [3GPP TS 26.192, "AMR Wideband Speech Codee: Comfort Noise Aspects" (Codee de Habla de Banda Ancha AMR: Aspectos de Interferencia de Comodidad) Especificación Técnica 3GPP] ) . Durante el sobrante, el codificador de habla continúa siendo utilizado y el sistema conmuta al CNG sólo después de que se termina el periodo sobrante. Con propósitos de clasificación para ocultamiento FER, no se requiere esa alta seguridad. Consecuentemente, la bandera de VAD para la clasificación será igual a 0 también durante el periodo del sobrante. En esta modalidad ilustrativa, se realiza la clasificación en el módulo 505 con base en los parámetros anteriormente descritos; es decir, las correlaciones normalizadas (o información de habla) rx, la inclinación espectral et, snr, el contador de estabilidad de paso pe, la energía de cuadro relativo Es, la velocidad de cruce a cero zc, y la bandera VAD. Clasificación en el descodificador Si la aplicación no permite la transmisión de la información de clase (no pueden transportarse bits extra) , la clasificación aún puede realizarse en el descodificador . Como ya se anotó, la desventaja principal aquí es que generalmente no hay revisión por adelántado disponible en descodificadores de habla. También, a menudo hay necesidad por mantener limitada la complejidad del descodificador . Una clasificación simple puede realizarse al estimar la sonorización de la señal sintetizada. Si consideramos el caso de un codificador tipo CELP, el estimado de habla rv calculado como la Ecuación (1) puede utilizarse. Esto es: rv = (Ev - Ec) / (Ev + Ec) en donde Ev es la energía del estado de código de paso en escala bv? y Ec es la energía del vector de código innovativo en escala gck. Teóricamente, para una señal de voz pura rv=l y para una señal sin voz pura r„=-l. La clasificación actual se realiza al promediar valores rv cada 4 sub-cuadros. El factor resultante frv (promedio de valores rv de cada cuatro sub-cuadros) se utiliza como sigue : Tabla 4 Reglas de Clasificación de Señal en el descodif cador Clase de Cuadro Regla Clase de Cuadro Previo Actual PRINCIPIO frv > -0.1 CON VOZ CON VOZ TRANSICIÓN CON VOZ -0.1 = frv = -0.5 TRANSICIÓN CON VOZ TRANSICIÓN SIN frv < -0.5 SIN VOZ VOZ frv > -0.1 PRINCIPIO -0.1 = frv = -0.5 TRANSICIÓN SIN VOZ Símilármente a la clasificación en el codificador, pueden emplearse otros parámetros en el descodificador para ayudar a la clasificación, como los parámetros del filtro LP o la estabilidad de paso. En el caso del codificador de velocidad de bits variable controlado por fuente, la información respecto al modo de codificación ya es una parte de la corriente de bits. Aquí, si por ejemplo, se utiliza un modo de codificación sin voz puramente, el cuadro puede clasificarse automáticamente como SIN VOZ. Similarmente, si se utiliza un modo de codificación es puramente con voz, el cuadro se clasifica como CON VOZ. Parámetros de Habla para Procesamiento FER Hay pocos parámetros críticos que deben controlarse cuidadosamente para evitar artefactos molestos cuando ocurren FERs . Si pueden transmitirse pocos extra bits, entonces estos parámetros pueden estimarse en el codificador, cuantificarse y transmitirse. De otra forma, algunos de ellos pueden estimarse en el descodificador . Estos parámetros incluyen clasificación de señal, información de energía, información de fase e información de habla. El más importante es un control preciso de la energía de habla.
La fase y la periodicidad de habla pueden controlarse también para mejorar adicionalmente el ocultamiento y la recuperación de FER. La importancia del control de energía se manifiesta primordialmente cuando una operación normal se recupera después de un bloque de cuadros borrados. Ya que la mayoría de los codificadores de habla utilizan una predicción, la energía correcta puede no ser estimada adecuadamente en el descodificador . En segmentos de habla con voz, la energía incorrecta puede persistir para varios cuadros consecutivos, lo que es muy molesto especialmente cuando se incrementa esta energía incorrecta . Incluso si el control de energía es más importante para habla con voz debido a la predicción de largo plazo (predicción de paso) , es importante también para habla sin voz. La razón aquí es la predicción del cuantificador de ganancia de innovación a menudo empleado en codificadores de tipo CELP . La energía errónea durante segmentos sin voz puede provocar una fluctuación de alta energía molesta. El control de fase puede realizarse en varias formas, primordialmente dependiendo del ancho de banda disponible. En nuestra implementación, se logra un simple control de fase durante inicios principio de voz perdidos al buscar la información aproximada respecto a la posición de pulso glotal. Por lo tanto, aparte de la información de clasificación de señal discutida en la sección previa, la información más importante para enviar es la información respecto a la energía de señal y la posición del primer pulso glotal en un cuadro (información de fase) . Si está disponible suficiente ancho de banda, también puede enviarse una información de habla. Información de Energía La información de energía puede estimarse y enviarse ya sea en el dominio residual LP o en el dominio de señal de habla. Enviar la información en el dominio residual tiene la desventaja de no tomar en cuenta la influencia del filtro de síntesis LP. Esto puede ser particularmente engañoso en el caso de recuperación con voz después de varios cuadros con voz perdidos (cuando sucede FER durante un segmento de habla con voz) . Cuando un FER llega después de un cuadro con voz, la excitación del último buen cuadro típicamente se utiliza durante el ocultamiento con algo de estrategia de atenuación. Cuando un nuevo filtro de síntesis LP llega con el primer cuadro bueno después de borrado, puede haber un desacoplamiento entre la energía de excitación y la ganancia del filtro de síntesis LP. El nuevo filtro de síntesis puede producir una señal de síntesis con una energía altamente diferente de la energía del último cuadro borrado sintetizado y también de la energía de señal original. Por esta razón, la energía se calcula y cuantifica en el dominio de señal. La energía Eq se calcula y cuantifica en el módulo de estimado de energía y cuantificación 506. Se ha encontrado que 6 bits son suficientes para transmitir la energía. Sin embargo, el número de bits puede reducirse sin un efecto significante si no hay disponibles suficientes bits. En esta modalidad preferida, un cuantificador uniforme de 6 bits se utiliza en el rango de -15 dB a 83 dB con una etapa de 1.58 dB. El índice de cuantificación se da por la parte entera de: 101og10(£ + 0.001) + 15 en donde E es la cantidad de la energía de señal para cuadros clasificados como CON VOZ o PRINCIPIO, o la energía promedio por muestra para otros cuadros. Para cuadros CON VOZ o PRINCIPIO, el máximo de la energía de señal es el paso calculado síncronamente al final del cuadro como sigue: en donde L es la longitud de cuadro y la señal s(i) representa la señal de habla (o la señal de habla sin ruido si se utiliza supresión de ruido) . En esta modalidad ilustrativa s(i) representa la señal de alimentación después del muestreo descendente a 12.8 kHz y del pre-procesamiento . Si el retardo de paso es mayor que 63 muestras, tE iguala el retardo de paso de bucle cerrado redondeado del último sub-cuadro. Si el retardo de paso es más corto que 64 muestras, entonces ÜE se ajusta al doble del retardo de paso de bucle cerrado redondeado del último sub-cuadro. Para otras clases, E es la energía promedio por muestra de la segunda mitad del cuadro actual, es decir, se ajusta a L/2 y E se calcula como: 1 i_1 E = —f ?*-* s2(i)7 (17) Información de Control de Fase El control de fase es particularmente importante mientras que se recupera después de un segmento perdido de habla con voz por razones similares como se describe en la sección previa. Después de un bloque de cuadros borrados, las memorias del descodificador se desincronizan con las memorias del codificador. Para resincronizar al descodificador , puede enviarse algo de información de fase dependiendo del ancho de banda disponible. En la implementación ilustrativa descrita, se envía una posición aproximada del primer pulso glotal en el cuadro. Esta información luego se emplea para la recuperación después de principios con voz perdidos como se describirá posteriormente . Sea To el retardo de paso de bucle cerrado redondeado para el primer sub-cuadro. El módulo de cuantificación y búsqueda del primer pulso glotal 507 busca la posición del primer pulso glotal t entre las primeras muestras To del cuadro al buscar la muestra con la máxima amplitud. Se obtienen mejores resultados cuando la posición del primer pulso glotal se mide en la señal residual filtrada de paso bajo. La posición del primer pulso glotal se codifica utilizando 6 bits de la siguiente manera. La precisión empleada para codificar la posición del primer pulso glotal depende del valor de paso de bucle cerrado para el primer sub-cuadro T0. Esto es posible debido a que este valor se conoce tanto por el codificador como el descodificador, y no está sujeto a propagación de error después de una o varias pérdidas de cuadro. Cuando T0 es menos que 64, la posición del primer pulso glotal respecto al inicio del cuadro se codifica directamente con una precisión de una muestra. Cuando 64 = T0 < 128, la posición del primer pulso glotal respecto al inicio del cuadro se codifica con una precisión de dos muestras al utilizar una división de entero simple, es decir t/2. Cuando T0 = 128, la posición del primer pulso glotal respecto al inicio del cuadro se codifica con una precisión de cuatro muestras al dividir ulteriores r por 2. El procedimiento inverso se realiza en el descodificador . Si To < 64, la posición cuantificada recibida se emplea como tal. Si 64 = T0 < 128, la posición cuantificada recibida se multiplica por 2 e incrementa por 1. Si T0 = 128, la posición cuantificada recibida se multiplica por 4 e incrementa por 2 (incrementando por 2 resulta en error de cuantificación distribuido uniformemente) . De acuerdo con otra modalidad de la invención en donde se codifica la forma del primer pulso glotal, la posición del primer pulso glotal se determina por un análisis de correlación entre la señal residual y las formas de pulso posibles, signos (positivo o negativo) y posiciones. La forma de pulso puede tomarse de un libro de códigos en formas de pulso conocido tanto en el codificador como en el descodificador, este método se conoce como cuantificación de vector por aquellos con destreza ordinaria en la especialidad. Luego se codifican y transmiten al descodificador la forma, el signo y amplitud del primer pulso glotal. Información de Periodicidad En el caso de que haya suficiente ancho de banda, puede calcularse y transmitirse una información de periodicidad, o información de habla, y utilizarse en el descodificador para mejorar el ocultamiento de borrado de cuadro. La información de habla se estima con base en la correlación normalizada. Puede codificarse en forma bastante precisa con 4 bits, sin embargo, de ser necesario, 3 o incluso 2 bits serán suficientes. La información de habla es necesaria en general sólo para cuadros con algunos componentes periódicos y se requiere mejor resolución de habla para cuadros altamente sonorizados. La correlación normalizada se da en la Ecuación (2) y se utiliza como un indicador a la información de habla. Se cuantifica en el módulo de cuantificación y búsqueda del primer pulso glotal 507. En esta modalidad ilustrativa, un cuantificador lineal a manera de pieza se ha empleado para codificar la información de habla como sigue: 0.03 para r (2)< 0.92 (18) n (2) -0.92 ne + O01 * para rA =0.92 (19) De nuevo, la parte entero de i se codifica y se transmite. La correlación rx{2) tiene el mismo significado que en la Ecuación (1) . En la Ecuación (18) sonorización se cuantifica linealmente entre 0.65 y 0.89 con la etapa de 0.03. En la Ecuación (19) la sonorización se cuantifica linealmente entre 0.92 y 0.98 con la etapa de 0.01. Si se requiere un rango de cuantificación más grande, puede emplearse la siguiente cuantificación lineal : Esta ecuación cuantifica habla en el rango de 0.4 a 1 con la etapa de 0.04. La correlación r x se define en la Ecuación (2a) .
Las ecuaciones (18) y (19) o la ecuación (20) luego se utilizan en el descodificador para calcular rx(2) o rK. Llamemos a esta correlación normalizada cuantificada rq. Si no puede transmitirse habla, puede estimarse utilizando el factor de habla de la Ecuación (2a) al mapearlo o representarlo en el rango de 0 a 1. r, = 0.5·(/+.) Procesamiento de Cuadros Borrados Las técnicas de ocultamiento FER en la modalidad ilustrativa se demuestran en codificadores de tipo ACELP. Sin embargo, pueden aplicarse fácilmente a cualquier codee de habla en donde la señal de síntesis se genera al filtrar una señal de excitación a través de un filtro de síntesis LP. La estrategia de ocultamiento puede resumirse como una convergencia de la energía de señal y la envolvente espectral a los parámetros estimados de la interferencia de fondo. La periodicidad de la señal es convergente a cero. La velocidad de la convergencia depende de los parámetros de la clase del último cuadro bueno recibido y el números de cuadros de borrado consecutivos y se controla por un factor de atenuación a. El factor a además depende de la estabilidad del filtro LP para cuadros SIN VOZ. En general, la convergencia es lenta si el último cuadro bueno recibido está en un segmento estable y es rápida si el cuadro está en un segmento de transición. Los valores de a se resumen en la Tabla 5. Tabla 5 Valores a del factor de atenuación de ocultamiento FER Un factor de estabilidad T se calcula con base en una medición de distancia entre filtros LP adyacentes. Aquí, el factor T se relaciona a la medición de distancia de Frecuencias Espectrales de Imitancia (ISF = Immittance Spectral Frequencies) y está limitado por 0=?=1, con valores más grandes de T correspondientes a señales más estables. Esto resulta en el decremento de energía y en fluctuaciones de envolvente espectral cuando ocurre un borrado de cuadro dentro de un segmento sin voz estable. La clase de señal permanece sin cambio durante el procesamiento de cuadros borrados, es decir la clase permanece igual como en el último cuadro bueno recibido. Construcción de la parte periódica de la excitación Para un ocultamiento de cuadros borrados siguiendo un cuadro SIN VOZ recibido correctamente, no se genera parte periódica de la señal de excitación. Para un ocultamiento de cuadros borrados siguiendo un cuadro recibido correctamente diferente a SIN VOZ, la parte periódica de la señal de excitación se construye al repetir el último periodo de paso del cuadro previo. Si este es el caso del primer cuadro borrado después de un buen cuadro, este pulso de paso primero se filtra de paso bajo. El filtro utilizado es un filtro FIR de fase lineal de 3-caminos simple con coeficientes de filtro iguales a 0.18, 0.64 y 0.18. Si está disponible una información de habla, el filtro también puede seleccionarse dinámicamente con una frecuencia de corte dependiente de habla. El periodo de paso Tc empleado para seleccionar el último pulso de paso y por lo tanto utilizado durante el ocultamiento, se define de manera tal que puedan evitarse o reducirse múltiplos o sub-múlt iplos de paso. La siguiente lógica se emplea para determinar el periodo de paso Tc. si ( (T3 < 1.8 Ts) Y (T3 > 0.6 Ts) ) 0 (Tcnt = 30), entonces Tc = T3, además Tc = Ts. Aquí, T3 es el periodo de paso redondeado del 4o sub-cuadro del último cuadro bueno recibido y Ts es el periodo de paso redondeado del 4o sub-cuadro del último cuadro con voz bueno estable con estimado de paso coherente. Un cuadro de voz estable se define aquí como un cuadro CON VOZ precedido por un cuadro de tipo CON VOZ (TRANSICIÓN CON VOZ, CON VOZ, PRINCIPIO) . La coherencia de pasos se verifica en esta implementación al examinar si los estimados de paso de bucle cerrado están razonablemente cerca, es decir, si las proporciones entre el último paso de sub-cuadro, el segundo paso de sub-cuadro y el último paso de sub-cuadro del cuadro previo están dentro del intervalo (0.7, 1.4) . Esta determinación del periodo de paso Tc significa que el paso del último cuadro bueno se emplea si el paso al final del último cuadro bueno y el paso del último cuadro estable están cerca entre si. De otra forma, este paso se considera no confiable y el paso del último cuadro estable se utiliza en lugar de evitar el impacto de estimados de paso erróneos en principios con voz. Sin embargo, esta lógica tiene sentido sólo si el último segmento estable no está muy lejano en el pasado. Por lo tanto, un contador Tcnt se define que limite el alcance de la influencia del último segmento estable. Si Tcnt es mayor o igual a 30, es decir, si hay al menos 30 cuadros desde la última actualización Ts, el último paso de cuadro bueno se utiliza sistemáticamente. Tcnt se reajusta a 0 cada vez que un segmento estable se detecta y se actualiza Ts. Luego el periodo Tc se mantiene constante durante el ocultamiento para todo el bloque borrado . Como el último pulso de la excitación del cuadro previo se utiliza para la construcción de la parte periódica, su ganancia es aproximadamente correcta al comienzo del cuadro ocultado y puede ajustarse a l. La ganancia luego se atenúa linealmente a través del cuadro en una base muestra por muestra para lograr el valor de a al final del cuadro. Los valores de a corresponden a la · Tabla 5 excepto que están modificados por borrados siguiendo a cuadro CON VOZ y PRINCIPIO para tomar en consideración la evolución de energía de los segmentos con voz . Esta evolución puede extrapolarse en cierta proporción al utilizarse los valores de ganancia de excitación de paso de cada sub-cuadro del último cuadro bueno. En general, si estas ganancias son mayores a 1, se incrementa la energía de señal, si son menores a 1, la energía se disminuye, a de esta manera se multiplica por un factor de corrección fb calculado como sigue: fb = 0.1¿>(0)+ 0.2A(1)+ 0.36(2)+ 0.4¿(3) (23) en donde b{0) , £>(1) , £>(2) y £>(3) son las ganancias de paso de los cuatro sub-cuadros del último cuadro recibido correctamente. El valor de fb se recorta entre 0.98 y 0.85 antes de utilizarse para ajusfar en escala la parte periódica de la excitación. De esta manera se evitan fuertes incrementos y decrementos de energía. Para cuadros borrados después de un cuadro correctamente · recibido diferente a SIN VOZ, el amortiguador de excitación se actualiza con esta parte periódica de la excitación solamente. Esta actualización se utilizará para construir la excitación del libro de códigos de paso en el siguiente cuadro. Construcción de la parte aleatoria, de la excitación La parte de innovación (no-periódica) de la señal de excitación se genera aleatoriamente. Puede generarse como una interferencia aleatoria o al utilizar el libró de código de innovación CELP con índices de vector generados en forma aleatoria. En la presente modalidad ilustrativa se ha empleado un generador aleatorio simple con distribución aproximadamente uniforme. Antes de ajustar la ganancia de innovación, la innovación generada aleatoriamente se ajusta en escala a cierto valor de referencia, fijado aquí a la energía unitaria por muestra. Al comienzo de un bloque borrado, la ganancia de innovación gs se inicializa al utilizar las ganancias de excitación por innovación de cada sub-cuadro del último buen cuadro: gs=0.1g(0) +0.2g(l) +0.3g(2) +0.4g(3) (23a) en donde gr(0), g(l), g(2) y g(3) son el libro de códigos fijo, o innovación, ganancias de los cuatro (4) sub-cuadros del último cuadro correctamente recibido. La estrategia de atenuación de la parte aleatoria de la excitación es algo diferente de la atenuación de la excitación de paso. La razón es que la excitación de paso (y de esta manera la periodicidad de excitación) converge a 0 mientras que la excitación aleatoria converge a la energía de excitación para generación de ruido de comodidad (CNG - comfort noise generation) . La atenuación de ganancia de innovación se realiza como: ¿í = a'gs°+(l- a>g„ (24) en donde g° g es la ganancia de innovación al inicio del siguiente cuadro, g° es la ganancia de innovación al inicio del cuadro actual, gn es la ganancia de excitación empleada durante la generación de ruido de comodidad y a es como se define en la Tabla 5. Similarmente a la atenuación de excitación periódica, la ganancia de esta manera se atenúa linealmente a través del cuadro en una base muestra por muestra partiendo con g° y pasando al valor de g] , que se lograría al inicio del siguiente cuadro . Finalmente, si el último buen cuadro recibido (correctamente recibido o no borrado) es diferente de SIN VOZ, la excitación de innovación se filtra a través de un filtro de paso alto FIR de fase lineal con coeficientes -0.0125, -0.109, 0.7813, -0.109, -0.0125. Para disminuir la cantidad de componentes con ruido durante los segmentos con voz, estos coeficientes de fil.tro se multiplican por un factor adaptativo igual a (0.75-0.25 rv) , rv es el factor de habla como se definió en la Ecuación (1) . La parte aleatoria de la excitación luego se agrega a la excitación adaptativa para formar la señal de excitación total. Si el último buen cuadro es SIN VOZ, sólo se utiliza la excitación de innovación y, además, se atenúa por un factor de 0.8. En este caso, el amortiguador de excitación pasada se actualiza con la excitación de innovación ya que no hay parte periódica de la excitación disponible. Ocultamiento de Envolvente Espectral, Síntesis y Actualizaciones Para sintetizar el habla descodificada deben obtenerse los parámetros de filtro LP. La envolvente espectral es mueve gradualmente a la envolvente estimada del ruido ambiente. Aquí se utiliza la representación ISF de los parámetros LP: /10,)=a/°?) + (1-a ') - j = 09...,p - l (25) En la ecuación (25), l1 (j) es el valor del ISF jésimo del cuadro actual, Io (j) es el valor del ISF jésímo del cuadro previo, ln(j) es el valor del ISF jésimo del envolvente de ruido de comodidad estimada y p es el orden del filtro LP. El habla sintetizada se obtiene al filtrar la señal de excitación a través del filtro de síntesis LP. Los coeficientes de filtro se calculan a partir de la representación ISF y se interpolan por cada sub-cuadro (cuatro (4) veces por cuadro) como durante la operación de codificador normal. Un cuantificador de ganancia de innovación y cuantificador ISF ambos usan una predicción, su memoria no será actualizada después de que se reanude la operación normal. Para reducir este efecto, las memorias dé los cuantificadores se estiman y actualizan al final de cada cuadro borrado. Recuperación de la operación normal después de borrado El problema de la recuperación después de un bloque borrado de cuadros, básicamente se debe a la fuerte predicción empleada prácticamente en todos los codificadores de habla modernos. En particular, los codificadores de habla tipo CELP logran su alta proporción de señal a interferencia para habla con voz debido al hecho de que están utilizando la señal de excitación pasada para codificar la excitación de cuadro actual (predicción de largo plazo o paso) . También, la mayoría de los cuantificadores (cuantificadores LP, cuantificadores de ganancia) utilizan una predicción. Construcción de Principio Artificial La situación más complicada referente al uso de predicción a largo plazo en codificadores CELP es cuando se pierde un principio con voz. El principio perdido significa que el principio de habla con voz sucedió en algún punto durante el bloque borrado. En este caso, el último cuadro bien recibido fue sin voz y, de esta manera, no se encuentra excitación periódica en el amortiguador de excitación. Sin embargo, el primer cuadro bueno después del bloque borrado que tiene voz, el amortiguador de excitación en el codificador es altamente periódico y la excitación adaptativa se ha codificando utilizando esta excitación pasada periódica. Como esta parte periódica de excitación está completamente perdida en el descodificador , puede tardar hasta varios cuadros para recuperarse de esta pérdida. Si se pierde un cuadro de PRINCIPIO (es decir, un cuadro bueno CON VOZ llega después de un borrado, pero el último cuadro bueno antes del borrado estaban SIN VOZ como se ilustra en la Figura 6), se utiliza una técnica especial para reconstruir artificialmente el principio perdido sin activar la síntesis de voz. Al inicio del primer cuadro bueno, después de un principio perdido, la parte periódica de la excitación se construye artificialmente como un tren de pulsos periódico filtrado de paso bajo separados por un periodo de paso. En la presente modalidad ilustrativa, el filtro de paso bajo es un filtro FIR de paso lineal simple con la respuesta de impulso hlow = {-0.0125, 0.109, 0.7813, 0.109, -0.0125}. Sin embargo, el filtro también podría seleccionarse dinámicamente con una frecuencia de corte correspondiente a la información de habla si esta información está disponible. La parte innovadora de la excitación se construye utilizando descodificación CELP normal. Las entradas del libro de códigos de innovación también puede seleccionarse aleatoriamente (o la propia innovación puede generarse aleatoriamente) , ya que la sincronía con la señal original se ha perdido de cualquier forma. En la práctica, la longitud del principio artificial se limita de manera tal que al menos un periodo de paso completo se construye por este método y el método se continúa al final del sub-cuadro actual. Después de eso se reanuda un procesamiento ACELP regular. El periodo de paso considerado es el promedio redondeado de los periodos de paso descodificados de todos los subcuadros en donde se utiliza la reconstrucción de principio artificial. El tren de impulsos filtrados de paso bajo se logra al colocar las respuestas de impulso del filtro de paso bajo en un amortiguador o memoria intermedia de excitación adaptativa (previamente inicializado a cero) . La primera respuesta de impulso estará centrada en la posición cuantificada (transmitida dentro de la corriente de bits) con respecto al cuadro que empieza y los impulsos restantes se colocarán con la distancia del paso promedio hasta el final del último sub-cuadro afectado por la construcción principio artificial. Si el ancho de banda disponible no es suficiente para transmitir la primera posición de pulso glotal, la primera respuesta de impulso puede colocarse arbitrariamente alrededor de la mitad del periodo de paso después del comienzo de cuadro actual. Como un ejemplo, para la longitud del sub-cuadro de 64 muestras, consideremos que los periodos de paso en el primero y segundo sub-cuadros son p(0)=70.75 y p(l)=71. Ya que esto es más grande que el tamaño del sub-cuadro de tamaño 64, entonces el principio artificial se construirá durante los primeros dos sub-cuadros y el periodo de paso será igual al promedio de paso de los dos sub-cuadros redondeados al entero más cercano, es decir 71. Los últimos dos sub-cuadros se procesarán por el descodificador CELP normal. La energía de la parte periódica de la excitación de principio artificial luego se ajusta en escala por la ganancia que corresponde a la energía cuantificada y transmitida para ocultamiento FER (como se define en las Ecuaciones 16 y 17) y dividir por una ganancia del filtro sintetizador LP. La ganancia de filtro de síntesis LP se calcula como: en donde h (i) es la respuesta de impulso del filtro de síntesis LP. Finalmente, la ganancia principio artificial se reduce al multiplicar la parte periódica con 0.96. En forma alterna, este valor puede corresponder al sonorizar si hubiera ancho de banda disponible para transmitir también la información de habla. En forma alterna, sin desviar de la esencia de esta invención, el principio artificial puede ser también construido en el amortiguador de excitación pasado antes de entrar al bucle de sub-cuadro del descodificador . Esto tendría la ventaja de evitar el procesamiento especial para construir la parte periódica del principio artificial y podría emplearse en su lugar la descodificación CELP regular. El filtro LP para la síntesis de habla de salida no se interpola en el caso de una construcción principio artificial. Por el contrario, los parámetros ' LP recibidos se utilizan para la síntesis de todo el cuadro . Control de Energía La tarea más importante en la recuperación después de un bloque de cuadros borrados es controlar adecuadamente la energía de la señal de habla sintetizada. El control de energía de síntesis se requiere debido a la fuerte predicción usualmente empleada en los codificadores de habla modernos. El control de energía es más importante cuando un bloque de cuadros borrados sucede durante un segmento con voz. Cuando un borrado de cuadro llega después de un cuadro con voz, la excitación del último cuadro bueno típicamente se utiliza durante el ocultamiento con alguna estrategia de atenuación. Cuando un nuevo filtro LP llega con el primer cuadro bueno después de borrado, entonces puede haber un desajuste entre la energía de excitación y la ganancia del nuevo filtro de síntesis LP. El nuevo filtro de síntesis puede producir una señal de síntesis con una energía altamente diferente de la energía del último cuadro borrado sintetizado y también de la energía de señal original. El control de energía durante el primer cuadro bueno después de un cuadro borrado puede resumirse como sigue. La señal sintetizada se ajusta en escala, de manera tal que su energía es similar a la energía de la señal de habla sintetizada al final del último cuadro borrado al comienzo del primer cuadro bueno y converge con la energía transmitida hacia el final del cuadro evitando un incremento de energía muy importante. El control de energía se realiza en el dominio de señal de habla sintetizada. Incluso si la energía se controla en el dominio de habla, la señal de excitación debe ajustarse en escala ya que sirve como memoria de pronóstico a largo plazo para los siguientes cuadros. La síntesis se vuelve a realizar para alisar las transiciones. Sea go que denote la ganancia empleada para ajustar en escala la primera muestra en el cuadro actual y gi la ganancia empleada al final del cuadro. La señal de excitación luego se ajusta en escala como sigue: gAGc(})'u(j) . ¿ = ,...,L- I (32 ) en donde us(i) es la excitación ajustada en escala, us(i) es la excitación antes de ajuste en escala, L es la longitud de cuadro y gAGC(i) es el inicio de ganancia de g0 y que converge exponencialmente en gi SAG = /AGCSAGCÍÍ- 1) + (1 - ÍAGC)SX i = 0,..., ¿ - 1 con la inicialización de gAcc (-1) =7o, en donde fAGC es el factor de atenuación ajustado en esta implementación al valor de 0.98. Este valor se ha encontrado experimentalmente como un compromiso de tener una transición uniforme desde el cuadro previo (borrado) en un lado y ajustado en escala el último periodo de paso del cuadro actual lo más posible al valor correcto (transmitido) en el otro lado. Esto es importante debido a que el valor de energía transmitida se estima síncronamente en paso al final del cuadro. Las ganancias gO y gl se definen como: en donde £-2 es la energía calculada al final del cuadro previo (borrado) , E0 es la energía de inicio del cuadro actual (recuperado) , ¾ es la energía al final del cuadro actual y Eq es la información de energía transmitida cuantificada al final del cuadro actual, calculadas en el codificador a partir de las Ecuaciones (16, 17). ?-? y ? se calcula similarmente excepto porque se calculan en la señal de habla sintetizada s'. E-i se calcula síncronamente en paso utilizando el periodo de paso de ocultamiento Tc y Ei utiliza el último paso redondeado de sub-cuadro T3. Eo se calcula similarmente utilizando el valor de paso redondeado T0 del primer sub-cuadro, las ecuaciones (16,17) se modifican para: para cuadros CON VOZ y PRINCIPIO. tE es igual al retardo de paso redondeado o dos veces esa longitud y el paso es más corto que 64 muestras. Para otros cuadros, con tE igual a la mitad de la longitud de cuadro. Las ganancias g0 y gi además se limitan a un valor máximo permitido para evitar fuerte energía. Este valor se ha ajustado a 1.2 en la presente implementación ilustrativa. El conducir el ocultamiento con borrado de cuadro y recuperación de descodificador comprende, cuando una ganancia de un filtro LP de un primer cuadro no borrado recibido después de borrado de cuadro, es superior que una ganancia de un filtro LP del último cuadro borrado durante borrado de cuadro, es ajustar la energía de una señal de excitación de filtro LP producida en el descodificador durante el primer cuadro no borrado recibido, a una ganancia del filtro LP del primer cuadro no borrado recibido utilizando la siguiente relación: Si Eq no puede transmitirse, Eq se ajusta a Ei.
Sin embargo, el borrado sucede durante un segmento de habla con voz (es decir, el último cuadro bueno antes del borrado y el primer cuadro bueno después del borrado se clasifican como TRANSICIÓN CON VOZ, CON VOZ o PRINCIPIO), deben tomarse adicionales precauciones debido al desajuste posible entre la energía de señal de excitación y la ganancia de filtro LP, mencionadas previamente. Una situación particularmente peligrosa surge cuando la ganancia de filtro LP de un primer cuadro no borrado recibido después de borrado de cuadro es superior que la ganancia del filtro LP de un último cuadro borrado durante ese borrado de cuadro. En este caso particular, la energía de la señal de excitación de filtro LP producida en el descodificador durante el primer cuadro no borrado recibido se ajusta a una ganancia del filtro LP del primer cuadro no borrado recibido utilizando la siguiente relación: donde ELpo es la energía de la respuesta de impulso de filtro LP del último cuadro bueno antes del borrado y ELpl es la energía del filtro LP del primer cuadro bueno después del borrado. En esta implementación se utilizan los filtros LP de los últimos sub-cuadros en un cuadro. Finalmente, en este caso el valor de Eq se limita al valor de E-i (borrado de segmento con voz sin información Eq transmitida) . Las siguientes excepciones, todas se relacionan a transiciones en señal de habla, además sobre escriben el cálculo de g0. Si se utiliza principio artificial en el cuadro actual, go se ajusta a Q. gi, para hacer incremento gradual de la energía de principio. En el caso de un primer cuadro bueno después de un borrado clasificado como PRINCIPIO, la ganancia g0 se evita que sea superior a gi . Esta precaución se toma para evitar un ajuste de ganancia positivo al comienzo del cuadro (que probablemente todavía está cuando menos parcialmente sin voz) que amplifique el principio con voz (al final del cuadro) . Finalmente, durante una transición con voz a una sin voz (es decir, el último cuadro bueno se clasificó como TRANSICIÓN CON VOZ, CON VOZ o PRINCIPIO y el cuadro actual se clasificó como SIN VOZ) o durante una transición de un periodo de habla no activa a un periodo de habla activa (el último cuadro recibido bueno se codifica como ruido de comodidad y el cuadro actual se codifica como habla activa), go se ajusta a gi . En el caso de un borrado de segmento con voz, el problema de energía errónea puede manifestarse también en cuadros después del primer cuadro después de borrado. Esto puede suceder incluso si la energía del primer cuadro bueno se ha ajustado como se describió anteriormente. Para atenuar este problema, el control de energía puede continuarse hasta el final del segmento con oz . Aunque la presente invención se ha descrito en la descripción anterior, en relación a una modalidad ilustrativa de la misma, esta modalidad ilustrativa puede modificarse a voluntad, dentro del alcance de las reivindicaciones anexas sin apartarse del alcance y espíritu de la presente invención.

Claims (1)

  1. REIVINDICACIONES 1. Método para ocultar borrado de cuadro, provocado por cuadros de una señal de sonido codificada borrada durante transmisión de un codificador a un descodificador, caracterizado porque comprende determinar, en el codificador, parámetros de ocultamiento/recuperación; transmitir al descodificador parámetros de ocultamiento/recuperación determinados en el codificador; y en el descodificador, realizar ocultamiento de borrado de cuadro y recuperación del descodificador, en respuesta a parámetros de ocultamiento/recuperación recibidos . 2. Método de conformidad con la reivindicación 1, .caracterizado además porque comprende cuantificar en el codificador, los parámetros de ocultamiento/recuperación antes de transmitir los parámetros de ocultamiento/recuperación al descodificador . 3. Método de conformidad con la reivindicación 1, caracterizado porque los parámetros de ocultamiento/recuperación se eligen del grupo que consiste de: un parámetro de clasificación de señal, un parámetro de información de energía y un parámetro de información de fase. 4. Método de conformidad con la reivindicación 3, caracterizado porque la determinación del parámetro de información de fase comprende determinar una posición de un primer pulso glotal en un cuadro de la señal de sonido codificada. 5. Método de conformidad con la reivindicación 1, caracterizado porque conducir del ocultamiento con borrado de cuadro y la recuperación de descodificador comprende conducir la recuperación del descodificador en respuesta a una posición determinada de un primer pulso glotal después de al menos un principio de voz perdido. 6. Método de conformidad con la reivindicación 1, caracterizado porque conducir el ocultamiento con borrado de cuadro y recuperación dé descodificador comprende, cuando se pierde cuando menos un cuadro de principio, construir una parte de excitación periódica artificialmente como un tren de impulsos periódicos filtrados de paso bajo separados por un periodo de paso. 7. Método de conformidad con la reivindicación 6, caracterizado porque: el método comprende cuantificar la posición del primer pulso glotal antes de la transmisión de la posición del primer pulso glotal al descodificador; y construir una parte de excitación periódica que comprende realizar el tren de pulsos periódicos filtrados de paso bajo por: centrar una primera respuesta de impulso de un filtro de paso bajo en la posición cuantificada del primer pulso glotal con respecto al inicio de un cuadro; y colocar respuestas de impulso restantes del filtro de paso bajo, cada una con una distancia correspondiente a un valor de paso promedio de la respuesta de impulso precedente hasta el final de un último sub-cuadro afectado por la construcción artificial . 8. Método de conformidad con la reivindicación 4, caracterizado porque la determinación del parámetro de información de fase además comprende codificar, en el codificador, la forma, el signo y la amplitud del primer pulso glotal y transmitir la forma codificada, el signo y la amplitud desde el codificador al descodificador . 9. Método de conformidad con la reivindicación 4, caracterizado porque determinar la posición del primer pulso glotal comprende: medir el primer pulso glotal como una muestra de máxima amplitud dentro de un periodo de paso; y cuantificar la posición de la muestra de máxima amplitud dentro del periodo de paso. 10. Método de conformidad con la reivindicación 1, caracterizado porque la señal de sonido es una señal de habla; y determinar, en el codificador los parámetros de ocultamiento/recuperación que comprenden clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz o de principio. 11. Método de conformidad con la reivindicación 10, caracterizado porque la clasificación de los cuadros sucesivos comprende clasificar como sin voz a cada cuadro que esté en un cuadro sin voz, cada cuadro sin habla activa y cada cuadro de desplazamiento con voz que tiene un final tendiente a sin voz. 12. Método de conformidad con la reivindicación 10, caracterizado porque clasificar los cuadros sucesivos, comprende clasificar como transición sin voz cada cuadro sin voz que tiene un extremo con un principio de voz posible que es demasiado corto o no está suficientemente bien construido para procesarse como un cuadro con voz. 13. Método de conformidad con la reivindicación 10, caracterizado porque clasificar los cuadros sucesivos comprende clasificar como transición con voz cada cuadro con voz con características de voz relativamente débiles, incluyendo cuadros con voz con características rápidamente cambiantes y desplazamientos con voz que duran todo el cuadro, en donde un cuadro clasificado como transición con voz sigue sólo cuadros clasificados como transición con voz, con voz o principio. 14. Método de conformidad con la "reivindicación 10, caracterizado porque la clasificación de los cuadros sucesivos comprende clasificar como con voz a cada uno de los cuadros con voz con características estables, en donde un cuadro clasificado como con voz sigue sólo a cuadros clasificados como transición con voz, con voz o principio. 15. Método de conformidad con la reivindicación 10, caracterizado porque clasificar los cuadros sucesivos comprende clasificar como de principio a cada cuadro con voz con características estables siguiendo a un cuadro clasificado como sin voz o transición sin voz. 16. Método de conformidad con la reivindicación 10, caracterizado porque comprende determinar la clasificación de cuadros sucesivos de la señal de sonido codificada en base a cuando menos una parte de los siguientes parámetros: un parámetro de correlación normalizado, un parámetro de inclinación espectral, un parámetro de proporción de señal-a- interferencia, un parámetro de estabilidad de paso, un parámetro de energía de cuadro relativa, y un parámetro de cruce a cero. 17. Método de conformidad con la reivindicación 16, caracterizado porque determinar la clasificación de los cuadros sucesivos comprende: calcular una figura de mérito en base al parámetro de correlación normalizado, parámetro de inclinación espectral, parámetro de proporción señal-a-interferencia, parámetro de estabilidad de paso, parámetro de energía de cuadro relativa, parámetro de cruce a cero; y comparar la figura de mérito con umbrales para determinar la clasificación . 18. Método de conformidad con la reivindicación 16, caracterizado porque comprende calcular el parámetro de correlación normalizado en base a la versión ponderada actual de la señal de habla y una-versión ponderada pasada de la señal de habla. 19. Método de conformidad con la reivindicación 16, caracterizado porque comprende estimar el parámetro de inclinación espectral como una proporción entre una energía concentrada con bajas frecuencias y una energía concentrada con altas frecuencias. 20. Método de conformidad con la reivindicación 16, caracterizado porque comprende estimar el parámetro de proporción de señal-a-interferencia como una proporción entre una energía de una versión ponderada de la señal de habla de un cuadro actual y un energía de un error entre la señal ponderada de la señal de habla, del cuadro actual y una versión ponderada de una señal de habla sintetizada del cuadro actual. 21. Método de conformidad con la reivindicación 16, caracterizado porque comprende calcular el parámetro de estabilidad de paso en respuesta a estimar un paso de bucle abierto para una primera mitad de un cuadro actual, una segunda mitad del cuadro actual y una revisión por adelantado. 22. Método de conformidad con la reivindicación 16, caracterizado porque comprende calcular el parámetro de energía de cuadro relativo como una diferencia entre una energía de un cuadro actual y un promedio a largo plazo de una energía de largo plazo de una energía de cuadros de habla activa. 23. Método de conformidad con la reivindicación 16, caracterizado porque comprende determinar el parámetro de cruce a cero como una cantidad de veces que cambia un signo de la señal de habla de una primera polaridad a una segunda polaridad. 24. Método de conformidad con la reivindicación 16, caracterizado porque comprende calcular cuando menos uno de un parámetro de correlación normalizado, parámetro de inclinación espectral, parámetro de la proporción de señal-a-interferencia, parámetro de estabilidad de paso, parámetro de energía de cuadro relativa, . y parámetro de cruce a cero utilizando una revisión por adelantado disponible, para tomar en consideración el comportamiento de la señal de habla en el siguiente cuadro. 25. Método de conformidad con la reivindicación 16 , caracterizado porque además comprende determinar la clasificación de los cuadros sucesivos de la señal de habla codificada en base a una bandera para detección de actividad de voz. 26. Método de conformidad con la reivindicación 3, caracterizado porque la señal de sonido es una señal de habla; la determinación en el codificador de los parámetros de ocultamiento/recuperación comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin' voz, transición con voz, con voz o de principio; y determinar los parámetros de ocultamiento/recuperación comprende calcular el parámetro de información de energía en relación a un máximo de una energía de señal para cuadros •clasificados como con voz o principio, y calcular el parámetro de información de energía en relación a una energía promedio por muestra para otros cuadros. 27. Método de conformidad con la reivindicación 1, caracterizado porque determinar en el codificador, parámetros de ocultamiento/recuperación, comprende calcular un parámetro de información de voz. 28. Método de conformidad con la reivindicación 27, caracterizado porque la señal de sonido es una señal de habla; la determinación en el codificador de los parámetros de ocultamiento/recuperación comprende clasificar sucesivos cuadros de la señal de sonido codificada; el método comprende determinar la clasificación de los cuadros sucesivos de la señal de sonido codificada, en base a un parámetro de correlación normalizado; y calcular el parámetro de información de habla comprende estimar el parámetro de información de habla en base a la correlación normalizada. 29. Método de conformidad con la reivindicación 1, caracterizado porque el conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprende: después de recibir un cuadro sin voz no borrado después de borrado de cuadro, generar parte no periódica de una señal de excitación de filtro LP; después de recibir tras borrado de cuadro, un cuadro no borrado diferente a sin voz, construir una parte periódica de la señal de excitación de filtro LP al repetir el último periodo de paso de un cuadro previo. 30. Método de conformidad con la reivindicación 29, caracterizado porque construir la parte periódica de la señal de excitación de filtro LP, comprende filtrar el ¦periodo de último paso repetido del cuadro previo a través de un filtro de paso bajo. 31. Método de conformidad con la reivindicación 30, caracterizado porque determinar los parámetros de ocultamiento/recuperación comprende calcular un parámetro de información de habla; el filtro de paso bajo tiene una frecuencia de corte; y construir la parte periódica de la señal de excitación comprende ajustar dinámicamente la frecuencia de corte en relación al parámetro de información de habla . 32. Método de conformidad con la reivindicación 1, caracterizado porque el conducir el ocultamiento de borrado de cuadro y recuperación de descodificador comprende generar aleatoriamente una parte de innovación, no periódica, de una señal de excitación de filtro LP. 33. Método de conformidad con la reivindicación 32, caracterizado porque generar aleatoriamente la parte de innovación, no periódica de la señal de excitación de filtro LP comprende generar un ruido aleatorio. 34. Método de conformidad con la reivindicación 32, caracterizado porque generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP comprende generar aleatoriamente índices de vector de un libro de códigos de innovación. 35. Método de conformidad con la reivindicación 32, caracterizado porque la señal de sonido es una señal de habla; la determinación de los parámetros de ocultamiento/recuperación comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz o de principio; y generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP además comprende: . si el último cuadro recibido correctamente es diferente de sin voz, filtrar la parte de innovación de la señal de excitación a través de un filtro de paso alto; y . si el último cuadro correctamente recibido es sin voz, utilizar sólo la parte de innovación de la señal de excitación. 36. Método de conformidad con la reivindicación 1, caracterizado porque la señal de sonido es una señal de habla; la determinación en el codificador, de los parámetros de ocultamiento/recuperación comprende clasificar cuadros sucesivos de la señal de sonido codificado como sin voz, transición sin voz, transición con voz, con voz, o de principio; conducir el ocultamiento de borrado de cuadro y recuperación de descodificador comprende, cuando se pierde un cuadro de principio que se indica por la presencia de un cuadro con voz después de borrado de cuadro y un cuadro sin voz antes de borrado de cuadro, reconstruir artificialmente el principio perdido al construir una parte periódica de una señal de excitación como un tren de pulsos periódicos filtrado de paso bajo separado por un periodo de paso. 37. Método de conformidad con la reivindicación 36, caracterizado porque el conducir ocultamiento de borrado de cuadro y recuperación de descodificador además comprende construir una parte de innovación de la señal de excitación mediante descodificación normal. 38. Método de conformidad con la reivindicación 37, caracterizado porque construir una parte de innovación de una señal de excitación comprende seleccionar aleatoriamente las entradas de un libro de códigos de innovación. 39. Método de conformidad con, la reivindicación 36, caracterizado porque reconstruir artificialmente el cuadro o principio perdido, comprende limitar una longitud o un tramo del principio reconstruido artificialmente, de manera tal que al menos un periodo completo de paso se construye por la reconstrucción artificial de . principio, la reconstrucción se continúa hasta el final de un sub-cuadro actual. 40. Método de conformidad con la reivindicación 39, caracterizado porque conducir ocultamiento de borrado de cuadro y recuperación de descodificador además comprende, después de la reconstrucción artificial del principio perdido, reanudar un procesamiento CELP regular en donde el periodo de paso es un promedio redondeado de periodos de paso descodificados de todos los sub-cuadros, en donde se utiliza la reconstrucción de principio artificial . 41. Método de conformidad con la reivindicación 3, caracterizado porque el conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprende: controlar una energía de una señal de sonido sintetizada producida por el descodificador, controlar energía de la señal de sonido sintetizada que comprende ajustar en escala la señal de sonido sintetizada para producir una energía de la señal de sonido sintetizada al inicio de un primer cuadro no borrado recibido siguiendo un borrado de cuadro similar a una energía de la señal sintetizada al final de un último cuadro borrado durante el borrado de cuadro; y converger la energía de la señal de sonido sintetizada en el primer cuadro no borrado recibido a una energía correspondiente al parámetro de información de energía recibido hacia el final del primer cuadro no borrado recibido mientras que limita un incremento en energía. 42. Método de conformidad con la reivindicación 3, caracterizado porque el parámetro de información de energía no se transmite del codificador al descodificador; y conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprende, cuando una ganancia de filtro LP de un primer cuadro no borrado recibido después de borrado de cuadro, es superior que una ganancia de un filtro LP de un último cuadro borrado durante el borrado de cuadro, ajustar la energía de una señal de excitación de filtro LP producida en el descodificador durante el primer cuadro no borrado recibido a una ganancia del filtro LP del primer cuadro no borrado. 43. Método de conformidad con la reivindicación 42, caracterizado porque ajustar la energía de una señal de excitación de filtro LP producida en el descodificador durante el primer cuadro no borrado recibido a una ganancia del filtro LP del primer cuadro no borrado recibido, comprende utilizar la siguiente relación: en donde E1 es la energía al final del cuadro actual , ELP0 es la energía de una respuesta de impulso del filtro LP al último cuadro no borrado recibido antes del borrado de cuadro y ELP1 es la energía de respuesta de impulso del filtro LP al primer cuadro no borrado recibido después de borrado de cuadro . 44. Método de conformidad con la reivindicación 41, caracterizado porque la señal de sonido es una señal de habla; la determinación en el codificador de parámetros de ocultamiento/recuperación comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz, o principio; y cuando el primer cuadro no borrado recibido después de un borrado de cuadro se clasifica como principio, conducir ocultamiento con borrado de cuadro y recuperación de descodificador, que comprende limitar a un valor determinado una ganancia empleada para ajustar en escala la señal de sonido sintetizada. 45. Método de conformidad con la reivindicación 41, caracterizado porque la señal de sonido es una señal de habla; determinación en el codificador de los parámetros de ocultamiento/recuperación comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz, o principio; y el método comprende hacer una ganancia utilizada para ajustar en escala la señal de sonido sintetizada al inicio del primer cuadro no borrado recibido después de borrado de cuadro igual a una ganancia empleada al final del primer cuadro no borrado recibido; . durante una transición de un cuadro con voz a un cuadro sin voz, en el caso de un último cuadro no borrado recibido antes de borrado de cuadro, clasificado como transición con voz, con voz o principio y un primer cuadro no borrado recibido después de borrado de cuadro clasificado como sin voz; y . durante una transición de un periodo de habla no activo a un periodo de habla activo, en donde el último cuadro no borrado recibido antes de borrado de cuadro, se codifica como un ruido de comodidad y el primer cuadro no borrado recibido después de borrado de cuadro se codifica como habla activa. 46. Método para ocultamiento de borrado de cuadro provocado por cuadros de una señal de sonido codificada, borrados durante transmisión de un codificador a un descodificador, caracterizado porque comprende: determinar, en el codificador, parámetros de ocul amiento/recuperación; y transmitir al descodificador parámetros de ocultamiento/recuperación determinados en el codificador. 47. Método de conformidad con la reivindicación 46, caracterizado porque además comprende cuantificar en el codificador, los parámetros de ocultamiento/recuperación antes de transmitir los parámetros de ocultamiento/recuperación al descodificador . 48. Método de conformidad con la reivindicación 46, caracterizado porque los parámetros de ocultamiento/recuperación se eligen del grupo que consiste de: un parámetro de clasificación de señal, un parámetro de información de energía y un parámetro de información de fase. 49. Método de conformidad con la reivindicación 48, caracterizado porque la determinación del parámetro de información de fase comprende determinar una posición de un primer pulso glotal en un cuadro de la señal de sonido codificada. 50. Método de conformidad con la reivindicación 49, caracterizado porque la determinación del parámetro de información de fase además comprende codificar, en el codificador, la forma, signo y amplitud del primer pulso glotal y transmitir la forma codificada, pulso y amplitud del codificador al descodificador . 51. Método de conformidad con la reivindicación 49, caracterizado porque determinar la posición del primer pulso glotal comprende: medir el primer pulso glotal como una muestra de máxima amplitud dentro de un periodo de paso; y cuantificar la posición de la muestra de amplitud máxima dentro del periodo de paso. 52. Método de conformidad con la reivindicación 46, caracterizado porque la señal de sonido es una señal de habla; y la determinación en el codificador de los parámetros de ocultamiento/recuperación comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz, o principio. 53. Método de conformidad con la reivindicación 52, caracterizado porque clasificar los cuadros sucesivos comprende clasificar como sin voz a cada cuadro que es un cuadro sin voz, cada cuadro sin habla activa y cada cuadro de desplazamiento con voz que tiene un extremo o un final que tiende a estar sin voz. 54. Método de conformidad con la reivindicación 52, caracterizado porque clasificar los cuadros sucesivos comprende clasificar como transición sin voz cada cuadro sin voz que tiene un extremo o un fin con un principio con voz posible que es muy corto o no está bien construido lo suficiente para procesarse como un cuadro con voz . 55. Método de conformidad con la reivindicación 52, caracterizado porque clasificar los cuadros sucesivos comprende clasificar como transición con voz cada cuadro con voz, con características con voz relativamente débiles, incluyendo cuadros con voz con características rápidamente cambiantes y desplazamientos con voz que duran todo el cuadro, en donde un cuadro clasificado como transición con voz sigue sólo a cuadros clasificados como transición con voz, con voz o principio. 56. Método de conformidad con la reivindicación 52, caracterizado porque clasificar los cuadros sucesivos comprende clasificar como con voz a todos los cuadros con voz con características estables, en donde un cuadro clasificado con voz sigue sólo a cuadros clasificados como transición con voz, con voz o principio. 57. Método de conformidad con la reivindicación 52, caracterizado porque clasificar los cuadros sucesivos comprende clasificar como principio a cada cuadro con voz con características estables siguiendo a un cuadro clasificado como sin voz o transición sin voz. 58. Método de conformidad con la reivindicación 52, caracterizado porque comprende determinar la clasificación de cuadros sucesivos de la señal de sonido codificada, en base a cuando menos una parte de los siguientes parámetros: un parámetro de correlación normalizado, un parámetro de inclinación espectral, un parámetro de proporción de señal-a-interferencia, un parámetro de estabilidad de paso, un parámetro de energía de cuadro relativa y un parámetro de cruce a cero. 59. Método de conformidad con la reivindicación 58, caracterizado porque determinar la clasificación de los cuadros sucesivos comprende: calcular una figura de mérito en base a parámetro de correlación normalizado, parámetro de inclinación espectral, parámetro de proporción de señal-a-interferencia, parámetro de estabilidad de paso, parámetro de energía de cuadro relativo y parámetro de cruce a cero; y comparar la figura de mérito con umbrales para determinar la clasificación. 60. Método de conformidad con la reivindicación 58, caracterizado porque comprende calcular el parámetro de correlación normalizada en base a la versión ponderada actual de la señal de habla y una versión ponderada pasada de la señal de habla. 61. Método de conformidad con la reivindicación 58, caracterizado porque comprende estimar el parámetro de inclinación espectral como una proporción entre una energía concentrada en bajas frecuencias y una energía concentrada en altas frecuencias. 62. Método de conformidad con la reivindicación 58, caracterizado porque comprende estimar el parámetro de proporción de señal-a-interferencia como una proporción entre una energía de una versión ponderada de la señal de habla de un cuadro actual y una energía de un error entre la versión ponderada de la señal de habla del cuadro actual y una versión ponderada de una señal de habla sintetizada del cuadro actual. 63. Método de conformidad con la reivindicación 58, caracterizado porque comprende calcular el parámetro de estabilidad de paso en respuesta a estimados de paso de bucle abierto para una primer mitad de un cuadro actual, una segunda mitad de un cuadro actual y revisión por ade1antado . 64. Método de conformidad con la reivindicación 58, caracterizado porque comprende calcular el parámetro de energía de cuadro relativo como una diferencia entre una energía de un cuadro actual y un promedio a largo plazo de una energía de cuadros de habla activos. 65. Método de conformidad con la reivindicación 58, caracterizado porque comprende determinar el parámetro de cruce a cero como una cantidad de veces que cambia un signo de la señal de habla de una primera polaridad a una segunda polaridad. 66. Método de conformidad con la reivindicación 58, caracterizado porque comprende calcular al menos uno de parámetro de correlación normalizado, parámetro de inclinación espectral, parámetro de proporción de señala-interferencia, parámetro de estabilidad de paso, parámetro de energía de cuadro relativa, y parámetro de cruce a cero utilizando una revisión por adelantado disponible para tomar en consideración el comportamiento de la señal de habla en el siguiente cuadro. 67. Método de conformidad con la reivindicación 58, caracterizado porque además comprende determinar la clasificación de los cuadros sucesivos de la señal de sonido codificada también en base a la bandera de detección de actividad de voz. 68. Método de conformidad con la reivindicación 48, caracterizado porque: la señal de sonido es una señal de habla; la determinación, en el codificador de parámetros de ocultamiento/recupéración comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz o principio; y determinar los parámetros de ocultamiento/recupéración comprende calcular el parámetro de información de energía en relación a un máximo de una energía de señal para cuadros clasificados como con voz, principio y calcular el parámetro de información de energía en relación a una energía promedio por muestra para otros cuadros . 69. Método de conformidad con la reivindicación 46, caracterizado porque determinar, en el codificador, parámetros de ocultamiento/recupéración comprende calcular un parámetro de información de habla. 70. Método de conformidad con la reivindicación 68, caracterizado porque: la señal de sonido es una señal de habla; la determinación en el codificador de los parámetros de ocultamiento/recupéración comprende clasificar cuadros sucesivos de la señal de sonido codificada; el método comprende determinar la clasificación de cuadros sucesivos en la señal de sonido codificada en base al parámetro de correlación normalizado; y calcular el parámetro de información con habla que comprende estimar el parámetro de información con habla o sonorización en base a la correlación normalizada . 71. Método para ocultamiento de borrado de cuadro provocado por cuadros borrados durante transmisión de una señal de sonido codificada bajo la forma de parámetros de codificación de señal desde un codificador a un descodificador, caracterizado porque comprende: determinar, en el descodificador, parámetros de ocultamiento/recuperación de los parámetros de codificación de señal; en el descodificador, conducir el ocultamiento de borrado de cuadro y recuperación de descodificador en respuesta a parámetros de ocultamiento/recuperación determinados en el descodificador . 72. Método de conformidad con la reivindicación 71, caracterizado porque los parámetros de ocultamiento/recuperación se eligen del grupo que consiste de: un parámetro de clasificación de señal, un parámetro de información de energía y un parámetro de información de fase. 73. Método de conformidad con la reivindicación 71, caracterizado porque: la señal de sonido es una señal de habla; y la determinación en el descodificador de parámetros de ocultamiento/recuperación, comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz, o principio. 74. Método de conformidad con la reivindicación 71, caracterizado porque determinar, en el descodificador, parámetros de ocultamiento/recuperación, comprende calcular un parámetro de información de habla. 75. Método de conformidad con la reivindicación 71, caracterizado porque conducir el ocultamiento de borrado de cuadro y recuperación de descodificador comprende: después de recibir un cuadro sin voz no borrado después de borrado de cuadro, generar parte no periódica de una señal de excitación de filtro . LP; después de recibir tras borrado de cuadro, un cuadro no -borrado diferente a sin voz, construir una parte periódica de la señal de excitación de filtro LP al repetir un último periodo de paso de un cuadro previo. 76. Método de conformidad con la reivindicación 75, caracterizado porque construir la parte periódica de la señal de excitación comprende filtrar el periodo de último paso repetido del cuadro previo a través de un filtro de paso bajo. 77. Método de conformidad con la reivindicación 76, caracterizado porque: el determinar en el descodificador, parámetros de ocultamiento/recuperación, comprende calcular un parámetro de información de habla; el filtro de paso bajo tiene una frecuencia de corte; y construir la parte periódica de la señal de excitación de filtro LP comprende ajustar dinámicamente la frecuencia de corte en relación al parámetro de información de habla . 78. Método de conformidad con la reivindicación 71, caracterizado porque conducir el ocultamiento de borrado de cuadro y la recuperación de descodificador comprende generar aleatoriamente una parte de innovación, no periódica, de una señal de excitación de filtro LP. 79. Método de conformidad " con la reivindicación 78, caracterizado porque generar aleatoriamente la parte de innovación, no periódica, de la señal de excitación de filtro LP comprende generar un ruido aleatorio. 80. Método de conformidad con la reivindicación 78, caracterizado porque generar aleatoriamente la parte de innovación, no periódica, de la señal de excitación de filtro LP comprende generar aleatoriamente índices de vector de un libro de códigos de innovación. 81. Método de conformidad con la reivindicación 78, caracterizado porque la señal de sonido es una señal de habla; la determinación en el descodificador, de parámetros de ocultamiento/recuperación, comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz, o principio; y generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP además comprende: . si el último cuadro no borrado recibido es diferente de sin voz, filtrar la parte de innovación de la señal de excitación de filtro LP a través de un filtro de paso alto; y . si el último cuadro no borrado recibido está sin voz, utilizar sólo la parte de innovación de la señal de excitación de filtro LP. 82. Método de conformidad con la reivindicación 78, caracterizado porque: la señal de sonido es una señal de habla; determinación, en el descodificador de los parámetros de ocultamiento/recuperación comprende clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz, o principio; conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprende, cuando un cuadro de principio se pierde que se indica por la presencia de un cuadro con voz después de borrado de cuadro y un cuadro sin voz antes de borrado de cuadro, reconstruir artificialmente el principio perdido al construir una parte periódica de una señal de excitación como un tren de pulsos periódicos filtrado de paso bajo por un periodo de paso. 83. Método de conformidad con la reivindicación 82, caracterizado porque conducir ocultamiento de borrado de cuadro y recuperación de descodificador además comprende construir una parte de innovación de la señal de excitación de filtro LP mediante descodificación normal . 84. Método de conformidad con la reivindicación 83, caracterizado porque la construcción de una parte de la innovación de la señal de excitación del filtro LP, comprende seleccionar aleatoriamente la entrada de un libro de códigos de innovación. 85. Método de conformidad con la reivindicación 82, caracterizado porque reconstruir artificialmente el principio perdido comprende limitar una longitud del principio reconstruido artificialmente, de manera tal que al menos un periodo de paso completo se construye por la reconstrucción artificial de principio, la reconstrucción se continua hasta el final de un sub-cuadro actual. 86. Método de conformidad con la reivindicación 85, caracterizado porque conducir ocultamiento de borrado de cuadro y recuperación de descodificador además comprende', después de reconstrucción artificial del principio perdido, reanudar un procesamiento CELP regular en donde el periodo de paso es un promedio redondeado de periodos de paso descodificados de todos los sub-cuadros, en donde se utiliza la reconstrucción de principio artificial . 87. Método de conformidad con la reivindicación 72, caracterizado porque: el parámetro de información de energía no se transmite del codificador al descodificador ; y conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprende, cuando una ganancia de un filtro LP de un primer cuadro no borrado recibido después de borrado de cuadro, es superior que una ganancia de un filtro LP de un último cuadro borrado durante el borrado de cuadro, ajustar la energía de una señal de excitación de filtro LP producida en el descodif icador durante el primer cuadro no borrado cuadro recibido, a una ganancia del filtro LP del primer cuadro no borrado recibido utilizando la siguiente relación : en donde E1 es la energía al final del cuadro actual, ELP0 es la energía de una respuesta de impulso del filtro LP al último cuadro no borrado recibido antes de borrado de cuadro y ELP1 es la energía de la respuesta de impulso del filtro LP al primer cuadro no borrado recibido después de borrado de cuadro . 88. Dispositivo para conducir ocultamiento de borrado de cuadro provocado por cuadros de una señal de sonido codificada borrada durante la transmisión de un codificador a un descodif icador , que comprende: medios para determinar, en el codificador, parámetros de ocultamiento/recuperación medios para transmitir al descodificador parámetros de ocultamiento/recuperación determinados en el codificador; y en el descodificador , medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador , en respuesta a parámetros de ocultamiento/recuperación recibidos determinados por los medios de determinación. 89. ' Dispositivo de conformidad con la reivindicación 88, caracterizado porque además comprende medios para cuantificar, en el codificador, los parámetros de ocultamiento/recuperación antes de transmitir los parámetros de ocultamiento/recuperación al descodificador . 90. Dispositivo de conformidad con la reivindicación 88, caracterizado porque los parámetros de ocultamiento/recuperación se eligen del grupo que consiste de: un parámetro de clasificación de señal; un parámetro de información de energía y un parámetro de información de fase. 91. Dispositivo de conformidad con la reivindicación 90, caracterizado porque los medios para determinar el parámetro de información de fase comprenden medios para determinar la posición de un primer pulso glotal en un cuadro de la señal de sonido codificada. 92. Dispositivo de conformidad con la reivindicación 88, caracterizado porque los medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprenden medios para conducir recuperación de descodificador, en respuesta a una posición determinada de un primer pulso glotal después de al menos un principio de voz perdido. 93. Dispositivo de conformidad con la reivindicación 88, caracterizado porque los medios para conducir el ocultamiento de cuadro borrado y recuperación de descodificador, comprenden medios para construir, cuando se pierde al menos un cuadro de principio, una parte de excitación periódica artificialmente como un tren de pulsos periódicos filtrado de paso bajo separado por un periodo de paso . 94. Dispositivo de conformidad con la reivindicación 93, caracterizado porque: el dispositivo comprende medios para cuantificar la posición del primer pulso glotal antes de la transmisión de la posición del primer pulso glotal al descodificador; y los medios para construir una parte de excitación periódica comprenden medios para lograr el tren de pulsos periódicos filtrado de paso bajo por: - centrar una primer respuesta de impulso de un filtro de paso bajo en la posición cuantificada del primer pulso glotal con respecto al inicio de un cuadro y - colocar respuestas de impulso restantes del filtro de paso bajo, cada una con una distancia correspondiente a un valor de paso promedio de la respuesta de impulso precedente hasta el final de un último sub-cuadro afectado por la construcción artificial. 95. Dispositivo de , conformidad con la reivindicación 91, caracterizado porque los medios para determinar el parámetro de información de fase además comprenden medios para codificar, en el codificador, la forma, signo y amplitud del primer pulso glotal y medios para transmitir la forma codificada, signo y amplitud del codificador al descodificador . 96. Dispositivo de conformidad con la reivindicación 91, caracterizado porque los medios para determinar la posición del primer pulso glotal comprenden: medios para medir el primer pulso glotal como una muestra de amplitud máxima dentro de un periodo de paso; y medios para cuantificar la posición de la muestra de amplitud máxima dentro del periodo de paso. 97. Dispositivo de conformidad con la reivindicación 88, caracterizado porque: la señal de sonido es una señal de habla; y los medios para determinar, en el codificador, parámetros de ocultamiento/recuperación comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz, o principio. 98. Dispositivo de conformidad con la reivindicación 97, caracterizado porque los medios para clasificar los cuadros sucesivos, comprenden medios para clasificar como sin voz a cada cuadro que es un cuadro sin voz, cada cuadro sin habla activa y cada cuadro desplazado con voz que tiene un extremo o fin que tiende a estar sin voz. 99. Dispositivo de conformidad con la reivindicación 97, caracterizado porque los medios para clasificar los cuadros sucesivos comprenden medios para clasificar una transición sin voz a cada cuadro sin voz que tiene un extremo con un principio con voz posible que es muy corto o no está suficientemente bien construido para procesarse como un cuadro con voz . 100. Dispositivo de conformidad con la reivindicación 97, caracterizado porque los medios para clasificar los cuadros sucesivos comprenden medios para clasificar como transición con voz a cada cuadro con voz con características de voz relativamente débiles, incluyendo cuadros con voz con características rápidamente cambiantes y desplazamientos con voz que duran todo el cuadro, en donde un cuadro clasificado como transición con voz sigue sólo a cuadros clasificados como transición con voz, con voz o principio. 101. Dispositivo de conformidad con la reivindicación 97, caracterizado porque los medios para clasificar los cuadros sucesivos, comprenden medios para clasificar como con voz a cada cuadro con voz con características estables, en donde un cuadro clasificado como .con voz sigue sólo a cuadros clasificados como transición con voz, con voz o principio. 102. Dispositivo de conformidad con la reivindicación 97, caracterizado porque los medios para clasificar los cuadros sucesivos comprenden medios para clasificar como principio a cada cuadro con voz con características estables después de un cuadro clasificado como sin voz o transición sin voz. 103. Dispositivo de conformidad con la reivindicación 97, caracterizado porque comprende medios para determinar la clasificación de los cuadros sucesivos de la señal de sonido codificada, en base a cuando menos una parte de los siguientes parámetros: un parámetro de correlación normalizada, un parámetro de inclinación espectral, un parámetro de proporción de señal-a-interferencia, un parámetro de estabilidad de paso, un parámetro de energía de cuadro relativa y un parámetro de cruce a cero. 104. Dispositivo de conformidad con la reivindicación 103, caracterizado porque los medios para determinar la clasificación de cuadros sucesivos comprenden: medios para calcular una figura de mérito en base al parámetro de correlación normalizado, parámetro de inclinación espectral, parámetro de proporción de señal-a-interferencia, parámetro de estabilidad de paso, parámetro de energía de cuadro relativa, y parámetro de cruce a cero; y medios para comparar la figura de mérito con umbrales para determinar la clasificación.. 105. Dispositivo de conformidad con la reivindicación 103, caracterizado porque comprende medios para calcular el parámetro de correlación normalizada en base a una versión ponderada actual de la señal de habla y una versión ponderada pasada de la señal de habla. 106. Dispositivo de conformidad con la reivindicación 103, caracterizado porque comprende medios para estimar el parámetro de inclinación espectral como una proporción entre la energía concentrada en bajas frecuencias y una energía concentrada en altas frecuencias . 107. Dispositivo de conformidad con la reivindicación 103, caracterizado porque comprende medios para estimar el parámetro de proporción de señal-a-interferencia como una proporción entre una energía de una versión ponderada de la señal de habla de un cuadro actual y una energía de un error entre la versión ponderada de la señal de habla del cuadro actual y una versión ponderada de una señal de habla sintetizada del cuadro actual . 108. Dispositivo de conformidad con la reivindicación 103, caracterizado porque comprende medios para calcular el parámetro de estabilidad de paso en respuesta a estimados de paso de bucle abierto para una primer mitad de un cuadro actual, una segunda mitad de un cuadro actual y una revisión por adelantado. 109. Dispositivo de conformidad con la reivindicación 103, caracterizado porque comprende medios para calcular el parámetro de energía de cuadro relativo como una diferencia entre una energía de un cuadro actual y un promedio a largo plazo de una energía de cuadros de habla activos. 110. Dispositivo de conformidad con la reivindicación 103, caracterizado porque comprende medios para determinar el parámetro de cruce a cero como una cantidad de veces que un signo de la señal de habla cambia de una primera polaridad a una segunda polaridad. 111. Dispositivo de conformidad con la reivindicación 103, caracterizado porque comprende medios para calcular cuando menos uno del parámetro de correlación normalizada, parámetro de inclinación espectral, parámetro de proporción de señal-a-interferencia, parámetro de estabilidad de paso, parámetro de energía de cuadro relativa y parámetro de cruce a cero utilizando una revisión por adelantado disponible para tomar en consideración el comportamiento de la señal de habla en el siguiente cuadro. 112. Dispositivo de conformidad con la reivindicación 103, caracterizado además porque comprende medios para determinar la clasificación de los cuadros sucesivos de la señal de sonido codificada también en base a la bandera de detección de actividad de voz. 113. Dispositivo de conformidad con la reivindicación 90, caracterizado porque la señal de sonido es una señal de habla; los medios para determinar, en el codificador, parámetros de ocultamiento/recuperación, comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio; y los medios para determinar los parámetros de ocultamiento/recuperación comprenden medios para calcular el parámetro de información de energía en relación a un máximo de una energía de señal para cuadros clasificados como con voz o principio, y medios para calcular el parámetro de información de energía en relación a una energía promedio por muestra para otros cuadros. 11 . Dispositivo de conformidad con la reivindicación 88, caracterizado porque los medios para determinar en el codificador, parámetros de ocultamiento/recuperación, comprenden medios para calcular un parámetro de información de habla. 115. Dispositivo de conformidad con la reivindicación 114, caracterizado porque la señal de sonido es una señal de habla; los medios para determinar parámetros de ocultamiento/recuperación en el codificador, comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada; el dispositivo comprende medios para determinar la clasificación de los cuadros sucesivos de la señal de sonido codificada en base a un parámetro de correlación normalizado; y los medios para calcular el parámetro de información de habla comprenden medios para estimar el parámetro de información de habla en base a la correlación normalizada. 116. Dispositivo de conformidad con la reivindicación 88, caracterizado porque los medios para conducir el ocultamiento de borrado de cuadro y recuperación de descodificador comprenden: siguiendo la recepción de un cuadro sin voz no borrado después de borrado de cuadro, medios para generar parte no periódica de una señal de excitación de filtro LP; después de recibir, tras borrado de cuadro, un cuadro no borrado diferente a sin voz, medios para construir una parte periódica de la señal de excitación de filtro LP al repetir un periodo de último paso de un cuadro previo. 117. Dispositivo de conformidad con la reivindicación 116, caracterizado porque los medios para construir la parte periódica de la señal de excitación de filtro LP comprenden un filtro de paso bajo, para filtrar el periodo de último paso repetido del cuadro previo. 118. Dispositivo de conformidad con la reivindicación 117, caracterizado porque: los medios para determinar los parámetros de ocultamiento/recuperación comprenden medios para calcular un parámetro de información de habla; el filtro de paso bajo tiene una frecuencia de corte; los medios para construir la parte periódica de la señal de excitación comprenden medios para ajustar dinámicamente la frecuencia de corte en relación al parámetro de información de habla. 119. Dispositivo de conformidad con la reivindicación 88, caracterizado porque los medios para conducir el ocultamiento de borrado de cuadro y recuperación de descodificador comprenden medios para generar aleatoriamente una parte de innovación no periódica de una señal de excitación de filtro LP. 120. Dispositivo de conformidad con la reivindicación 119, caracterizado porque los medios para generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP comprenden medios para generar un ruido aleatorio. 121. Dispositivo de conformidad con la reivindicación 119, caracterizado porque los medios para generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP comprenden medios para generar aleatoriamente índices de vector de un libro de códigos de innovación. 122. Dispositivo de conformidad con la reivindicación 119, caracterizado porque: la señal de sonido es una señal de habla; los medios para determinar los parámetros de ocultamiento/recuperación comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificados como sin voz, transición sin voz, transición con voz, de voz o principio; y los medios para generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP además comprenden: . el último cuadro correctamente recibido es diferente de sin voz, un filtro de paso alto para filtrar la parte de innovación de la señal de excitación; y . el último cuadro correctamente recibido está sin voz, medios para utilizar sólo la parte de innovación de la señal de excitación. 123. Dispositivo de conformidad con la reivindicación 88, caracterizado porque: la señal de sonido es una señal de habla; los medios para determinar, en el codificador, los parámetros de ocultamiento/recuperación comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio; los medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprenden, cuando se pierde un cuadro de principio que es indicado por la presencia de un cuadro con voz siguiendo borrado de cuadro y un cuadro sin voz antes de borrar el cuadro, medios para reconstruir artificialmente el principio perdido al construir una parte periódica de una señal de excitación como un tren de pulsos periódicos filtrado de paso bajo separado por un periodo de paso. 124. Dispositivo de conformidad con la reivindicación 123, caracterizado porque los medios para conducir el ocultamiento de borrado de cuadro y recuperación de descodificador además comprenden medios para construir una parte de innovación de la señal de excitación mediante descodificación normal. 125. Dispositivo de conformidad con la reivindicación 124, caracterizado porque los medios para construir una parte de la innovación de la señal de excitación comprenden medios para seleccionar aleatoriamente entradas de un libro de códigos de innovación. 126. Dispositivo de conformidad con la reivindicación 123, caracterizado porque los medios para reconstruir artificialmente el principio perdido comprenden medios para limitar una longitud del principio reconstruido artificialmente de manera tal que al menos un periodo de paso completo se construye por la reconstrucción artificial de principio, la reconstrucción se continúa hasta el final de un sub-cuadro actual. 127. Dispositivo de conformidad con la reivindicación 126, caracterizado porque los medios para conducir * el ocultamiento de borrado de cuadro y recuperación de descodificador además comprenden, tras de reconstrucción artificial del principio perdido, medios para reanudar un procesamiento CELP regular en donde el periodo de paso es un promedio redondeado dé los periodos de paso descodificados de todos los sub-cuadros en donde se utiliza la reconstrucción de principio artificial. 128. Dispositivo de conformidad con la reivindicación 124, caracterizado porque los medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprenden: medios para controlar' una energía de una señal de sonido sintetizada, producida por el descodificador, los medios para controlar energía de la señal de sonido sintetizada comprenden medios para ajustar en escala la señal de sonido sintetizada para hacer o presentar una energía de la señal de sonido sintetizada al inicio de un primer cuadro ' no borrado recibido después de borrado de cuadro similar a una energía de la señal sintetizada al final del último cuadro borrado durante el borrado de cuadro; y medios para converger la energía de la señal de sonido sintetizada en el primer cuadro no borrado recibido a una energía correspondiente al parámetro de información de energía recibido al final del primer cuadro no borrado recibido mientras que se limita un incremento de energía. 129. Dispositivo de conformidad con la reivindicación 90, caracterizado porque el parámetro de información de energía no se transmite del codificador al descodificador; y los medios para conducir el ocultamiento de borrado de cuadro y recuperación de descodificador comprenden, cuando una ganancia de un filtro LP de un primer cuadro no borrado recibido después de borrado de cuadro es superior a una ganancia de un filtro LP de un último cuadro borrado durante el borrado de cuadro, medios para ajustar la energía de una señal de excitación de filtro LP producida en el descodificador durante el primer cuadro no borrado recibido a una ganancia del filtro LP del primer cuadro no borrado recibido. 130. Dispositivo de conformidad con reivindicación 129, caracterizado porque los medios para ajustar la energía de una señal de excitación de filtro LP producida en el descodificador durante el primer cuadro no borrado recibido a una ganancia de filtro LP del primer cuadro no borrado recibido, comprende medios para utilizar las siguiente relación: en donde 1 E1 es la energía al final de cuadro actual, E¡ es la energía de una respuesta de impulso del filtro LP al último cuadro no borrado recibido antes del borrado de cuadro, y ELP1, es la energía de la respuesta de impulso del filtro LP al primer cuadro no borrado recibido después de borrado de cuadro. 131. Dispositivo de conformidad con la reivindicación 128, caracterizado porque la señal de sonido es una señal de habla; los medios para determinar en el codificador, parámetros de ocultamiento/recuperación comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, voz o principio; y cuando el primer cuadro no borrado recibido después de un borrado de cuadros se clasifica como PRINCIPIO, los medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprenden medios para limitar a un valor determinado una ganancia utilizada para ajustar en escala la señal de sonido sintetizada. 132. Dispositivo de conformidad con la reivindicación 128, caracterizado porque: la señal de sonido es una señal de habla; los medios para determinar, en el codificador, los parámetros de ocultamiento/recuperación comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio; y el dispositivo comprende medios para hacer una ganancia empleada para ajustar en escala la señal de sonido sintetizada al inicio del primer cuadro no borrado recibida tras borrado de cuadro igual a una ganancia utilizada al final del primer cuadro no borrado recibido: . durante una transición de un cuadro con voz a un cuadro sin voz, en el caso de un último cuadro no borrado recibido antes de borrado de cuadro clasificado como transición con voz, voz o principio de un primer cuadro no borrado recibido tras borrado de cuadro clasificado como sin voz; y . durante una transición de un periodo de habla no activo a un periodo de habla activo, cuando el último cuadro no borrado recibido antes del borrado de cuadros se codifica como ruido de comodidad y el primer cuadro no borrado recibido después del borrado de cuadro se codifica como habla activa. 133. Dispositivo para conducir el ocultamiento de borrado de cuadros provocado por cuadros de una señal de sonido codificada, borrada durante transición de un codificador a un descodificador, caracterizado porque comprende: medios para determinar en el codificador, parámetros de ocultamiento/recuperación; y medios para transmitir al descodificador parámetros de ocultamiento/recuperación determinados en el codificador. 134. Dispositivo de conformidad con la reivindicación 133, caracterizado porque además comprende medios para cuantificar en el codificador, los parámetros de ocultamiento/recuperación antes de transmitir los parámetros de ocultamiento/recuperación al descodificador. 135. Dispositivo de conformidad con la reivindicación 133, caracterizado porque los parámetros de ocultamiento/recuperación se eligen del grupo que consiste de: un parámetro de clasificación de señal, un parámetro de información de energía y un parámetro de información de fase. 136. Dispositivo de conformidad con la reivindicación 135, caracterizado porque los medios para determinar el parámetro de información de fase comprenden medios para determinar la posición de un primer pulso glotal en un cuadro de la señal de sonido codificada. 137. Dispositivo de conformidad con la reivindicación 136, caracterizado porque los medios para determinar el parámetro de información de fase además comprenden medios para codificar, en el codificador, la forma, signo y amplitud del primer pulso glotal y medios para transmitir la forma codificada, signo y amplitud de este codificador al descodificador . 138. Dispositivo de conformidad con la reivindicación 136, caracterizado porque los medios para determinar la posición del primer pulso glotal comprenden: medios para medir el primer pulso glotal como una muestra de máxima amplitud dentro de un periodo de fase; y medios para cuantificar la posición de la mezcla de amplitud máxima dentro del periodo de paso. 139. Dispositivo de conformidad con la reivindicación 133, caracterizado porque la señal de sonido es una señal de habla; y los medios para determinar, en el codificador, parámetros de ocultamiento/ ecuperación, comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio. 140. Dispositivo de conformidad ' con la reivindicación 139, caracterizado porque los medios para clasificar los cuadros sucesivos comprenden medios para clasificar como sin voz a todos los cuadros que sean cuadros sin voz, todos los cuadros sin habla activa y todos los cuadros de desplazamiento con voz que tienen un extremo tendiente a estar sin voz. 141. Dispositivo de conformidad con la reivindicación 139, caracterizado porque los medios para clasificar los cuadros sucesivos comprenden medios para clasificar como transición sin voz a todo cuadro sin voz que tenga un extremo con un principio de voz posible que es muy corto o no bien construido lo suficiente para ser procesado como un cuadro con voz. 142. Dispositivo de conformidad con la reivindicación 139, caracterizado porque los medios para clasificar los cuadros sucesivos comprenden medios para clasificar como transición de voz a todo cuadro de voz con características de voz relativamente débiles, incluyendo cuadros de voz con características de cambio rápido y desplazamientos de voz que duran todo el cuadro, en donde un cuadro clasificado como transición de voz sigue sólo cuadros clasificados como transición de voz, voz o principio. 143. Dispositivo de conformidad con la reivindicación 139, caracterizado porque los medios para clasificar los cuadros sucesivos comprenden medios para clasificar como de voz a cada cuadro de voz con características estables en donde un cuadro clasificado como de voz sigue sólo cuadros clasificados como transición de voz, de voz o de principio. 144. Dispositivo de conformidad con la reivindicación 139, caracterizado porque los medios para clasificar los cuadros sucesivos comprenden medios para clasificar como principio todo cuadro de voz con características estables siguiendo un cuadro clasificado como sin voz o transición sin voz. 145. Dispositivo de conformidad con la reivindicación 139, caracterizado porque comprende medios para determinar la clasificación de los cuadros sucesivos de la señal de sonido codificada en base a cuando menos una parte de los siguientes parámetros: un parámetro de correlación normalizada como un parámetro de inclinación espectral, un parámetro de proporción o relación de señal-ruido, un parámetro de estabilidad de paso, un parámetro de energía de cuadro relativa y un parámetro de cruce a cero. 146. Dispositivo de conformidad con la reivindicación 145, caracterizado porque comprende los medios para determinar la clasificación de los cuadros sucesivos comprenden: medios para calcular una figura de mérito en base al parámetro de correlación normalizado, parámetro de inclinación espectral, parámetro de proporción de señal -a- interferencia , parámetro de estabilidad de paso, parámetro de energía de cuadro relativa y parámetro de cruce a cero; y medios para comparar la figura de mérito a umbrales para determinar la clasificación. " 147. Dispositivo de conformidad con la reivindicación 145, caracterizado porque comprende medios para calcular el parámetro de correlación normalizada en base a una versión ponderada actual de la señal de habla y una versión ponderada pasada de la señal de habla. 148. Dispositivo de conformidad con la reivindicación 145, caracterizado porque comprende medios para estimar el parámetro de inclinación espectral como una proporción entre una energía concentrada en bajas frecuencias y una energía concentrada en altas frecuencias. 149. Dispositivo de conformidad con la reivindicación 145, caracterizado porque comprende medios para estimar el parámetro de proporción de señal -a-interferencia como una relación entre una energía de una versión ponderada de la señal de habla de un cuadro actual y una energía de un error entre la versión ponderada de la señal de habla del cuadro actual y una versión ponderada de una señal de habla sintetizada del cuadro actual . 150. Dispositivo de conformidad con la reivindicación 145, caracterizado porque comprende medios para calcular el parámetro de estabilidad de paso, en respuesta a estimados de paso de bucle abierto para una primera mitad de un cuadro actual, una segunda mitad del cuadro actual y una revisión por adelantado. 151. Dispositivo de conformidad con la reivindicación 145, caracterizado porque comprende medios para calcular el parámetro de energía de cuadro relativa como una diferencia entre una energía de un cuadro actual y un promedio a largo plazo de una energía de cuadros de habla activos. 152. Dispositivo de conformidad con la reivindicación 145, caracterizado porque comprende medios para determinar el parámetro de cruce a cero como un número de veces que cambia un signo entre la señal de habla de una primera polaridad a una segunda polaridad. 153. Dispositivo de conformidad con la reivindicación 145, caracterizado porque comprende medios para calcular cuando menos uno del parámetro de correlación normalizado, parámetro de inclinación espectral, parámetro de proporción de señal -a-ruido, parámetro de estabilidad de paso, parámetro de energía de cuadro relativo y parámetro de cruce a cero utilizando el revisión por adelantado disponible para tomar en consideración el comportamiento de la señal de habla en el siguiente cuadro. 154. Dispositivo de conformidad con la reivindicación 145, caracterizado porque además comprende medios para determinar la clasificación de los cuadros sucesivos de la señal de sonido codificada también en base a la bandera para detección de actividad de voz. 155. Dispositivo de conformidad con la reivindicación 135, caracterizado porque la señal de sonido es una señal de habla; los medios para determinar, en el codificador, los parámetros de ocultamiento/recuperación comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio; y los medios para determinar los parámetros de ocultamiento/recuperación comprenden medios para calcular el parámetro de información de energía en relación a un máximo de una energía de señal para cuadros clasificados como con voz o principio, y medios para calcular el parámetro de información de energía en relación a una energía promedio por muestra para otros pasos. 156. Dispositivo de conformidad con la reivindicación 133, caracterizado porque los medios para determinar en el codificador, parámetros de ocultamiento/recuperación, comprenden medios para calcular un parámetro de información de habla. 157. Dispositivo de conformidad con la reivindicación 156, caracterizado porque la señal de sonido es una señal de habla; los medios para determinar, en el codificador, parámetros de ocultamiento/recuperación, comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada; el dispositivo comprende medios para determinar la clasificación de los cuadros sucesivos de la señal de sonido codificada, en base a un parámetro de correlación normalizado; y los medios para calcular el parámetro de información de habla comprenden medios para estimar el parámetro de información de habla en base a la correlación normalizada. 158. Un dispositivo para ocultamiento de borrado de cuadro provocado por cuadros borrados durante la transmisión de una señal de sonido codificada bajo la forma de parámetros de codificación de señal desde un codificador a un descodificador, caracterizado porque comprende: medios para determinar, en el descodificador, los parámetros de ocultamiento/recuperación a partir de los parámetros de codificación de señal; en el descodificador, medios para conducir ocultamiento de cuadro borrado y recuperación de descodificador, en respuesta a los parámetros de ocultamiento/recuperación determinados por los medios de determinación. 159. Dispositivo de conformidad con la reivindicación 158, caracterizado porque los parámetros de ocultamiento/recuperación se eligen del grupo que consiste de: un parámetro de clasificación de señal, un parámetro de información de energía y un parámetro de información de fase. 160. Dispositivo de conformidad con la reivindicación 158, caracterizado porque la señal de sonido es una señal de habla; y los medios para determinar, en el descodificador, los parámetros de ocultamiento/recuperación, que comprenden medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio. 161. Dispositivo de conformidad con la reivindicación 158, caracterizado porque los medios para determinar, en el descodificado , parámetros de ocultamiento/recuperación, comprenden los medios para calcular un parámetro de información de habla. 162. Dispositivo de conformidad con la reivindicación 158, caracterizado porque los medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprenden: después de recibir un cuadro sin voz no borrado después de borrado de cuadro, medios para generar parte no periódica de una señal de excitación de filtro LP; después de recibir, tras borrado de cuadro, un cuadro no borrado diferente a sin voz, medios para construir una parte periódica de la señal de excitación de filtro LP al repetir un último periodo de paso de un cuadro previo. 163. Dispositivo de conformidad con la reivindicación 162, caracterizado porque los medios para construir la parte periódica de la señal de excitación comprenden un filtro de paso bajo, para filtrar el periodo de último paso repetido del cuadro previo. 16 . Dispositivo de conformidad con la reivindicación 163, caracterizado porque los medios para determinar, en el descodificador, los parámetros de ocultamiento/recuperación, comprenden medios para calcular un parámetro de información de habla; el filtro de paso bajo tiene una frecuencia de corte; y los medios para construir la parte periódica de la señal de excitación de filtro LP comprenden medios para ajustar dinámicamente la frecuencia de corte en relación al parámetro de información de habla. 165. Dispositivo de conformidad con la reivindicación 158, caracterizado porque los medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprenden los medios para generar aleatoriamente una parte de innovación no periódica y una señal de excitación de filtro LP. 166. Dispositivo de conformidad con la reivindicación 165, caracterizado porque los medios para generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP comprenden medios para generar un ruido aleatorio. 167. Dispositivo de conformidad con la reivindicación 165, caracterizado porque los medios para generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP comprenden medios para generar aleatoriamente índices de vector de un libro de códigos de innovación. 168. Dispositivo de conformidad con la reivindicación 165, caracterizado porque la señal de sonido es una señal de habla; y los medios para determinar, en el descodificado , parámetros de ocultamiento/recuperación comprenden los medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio; y los medios para generar aleatoriamente la parte de innovación no periódica de la señal de excitación de filtro LP además comprenden: . si el último cuadro no borrado recibido es diferente de un filtro de paso alto sin voz para filtrar la parte de innovación de la señal de excitación de filtro LP; y . si el último cuadro no borrado recibido es sin voz, medios para utilizar solo la parte de innovación de la señal de innovación de filtro LP. 169. Dispositivo de conformidad con la reivindicación 165, caracterizado porque la señal de sonido es una señal de habla; y los medios para determinar, en el descodificador, parámetros de ocultamiento/recuperación comprenden los medios para clasificar cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio; los medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador comprenden, cuando se pierde un cuadro o principio, que se indica por la presencia de un cuadro de voz siguiendo a borrado de cuadro y un cuadro sin voz antes de borrado de cuadro, los medios para reconstruir artificialmente el principio perdido o para construir una parte periódica de una señal de excitación como un tren de pulsos periódico filtrado de paso bajo separado por un periodo de paso . 170. Dispositivo de conformidad con la reivindicación 169, caracterizado porque los medios para conducir ocultamiento de borrado de cuadro y recuperación de descodificador además comprende los medios para construir una parte de innovación de la señal de excitación de filtro LP mediante descodificación normal. 171. Dispositivo de conformidad con la reivindicación 170, caracterizado porque los medios para construir una parte de innovación de la señal de excitación de filtro LP comprenden los medios para seleccionar aleatoriamente las entradas de un libro de códigos de innovación. 172. Dispositivo de conformidad con la reivindicación 169, caracterizado porque los medios para reconstruir artificialmente el principio perdido comprenden los medios para limitar una longitud del principio reconstruido artificialmente, de manera tal que al menos un periodo de paso completo se construye por la reconstrucción artificial del principio, la reconstrucción se continúa hasta el final de un sub-cuadro presente . 173. Dispositivo de conformidad con la reivindicación 172, caracterizado porque los medios para conducir el ocultamiento de borrado de cuadro y recuperación de descodificador además comprenden, tras reconstrucción artificial del principio perdido, los medios para reanudar un procesamiento CELP regular en donde el periodo de paso es un promedio redondeado de los periodos de paso descodificados de todos los sub-cuadros en donde se utiliza la reconstrucción de principio artificial. 174. Dispositivo de conformidad con la reivindicación 159, caracterizado porque el parámetro de información de energía no se transmite del codificador al descodificador; y los medios para conducir el ocultamiento de borrado de cuadro y recuperación de descodificador comprenden, cuando una ganancia de un filtro LP de un primer cuadro no borrado recibido después de borrado de cuadro es superior que una ganancia de un filtro LP de un último cuadro borrado durante el borrado de cuadro, medios para ajustar la energía de una señal de excitación de filtro LP producida en el descodificador durante el primer cuadro no borrado recibido a una ganancia del filtro LP del primer cuadro no borrado recibido, utilizando la siguiente relación: en donde E es la energía al final del cuadro actual, ELP0 es la energía de una respuesta de impulso del filtro LP al último cuadro no borrado recibido antes del borrado de cuadro, y ELP1, es la energía de la respuesta de impulso del filtro LP al primer cuadro no borrado recibido después de borrado de cuadro. 175. Sistema para codificar y descodificar una señal de sonido, caracterizado porque comprende: un codificador de señal de sonido en respuesta a la señal de sonido para producir un conjunto de parámetros de codificación de señal; medios para transmitir los parámetros de codificación de señal a un descodificador; el descodificador para sintetizar la señal de sonido en respuesta a los parámetros de codificación de señal; y un dispositivo como se describe en cualquiera de las reivindicaciones 88 a 132, para ocultar borrado de cuadros provocado por cuadros de la señal de sonido codificada borrada durante transmisión del codificador al descodificador . 176. Un descodificador para descodificar una señal de sonido codificada, caracterizado porque comprende: medios que responden a la señal de sonido codificada para recuperar de la señal de sonido codificada un conjunto de parámetros de codificación de señal; medios para sintetizar las señales de sonido en respuesta a los parámetros de codificación de señal; y un dispositivo de conformidad con cualquiera de las reivindicaciones 158 a 174, para ocultar el borrado de cuadro provocado por cuadros de la señal de sonido codificada borrada durante transmisión desde un codificador al descodificador . 177. Un codificador para codificar una señal de sonido, caracterizado porque comprende: medios que responden a la señal de sonido para producir un conjunto de parámetros de codificación de señal; medios para transmitir conjunto de parámetros de codificación de señal a un descodificador en respuesta a los parámetros de codificación de señal, para recuperar la señal de sonido; y un dispositivo de conformidad con cualquiera de las reivindicaciones 133 a 157, para conducir el ocultamiento de borrado de cuadro provocado por cuadros borrados durante la transmisión de los parámetros de codificación de señal desde el codificador al descodificador. RESUMEN DE LA INVENCIÓN La presente invención se refiere a un método y dispositivo para mejorar ocultamiento de borrado de cuadro provocado por cuadros de una señal de sonido codificada borrada durante la transmisión de un codificador (106) a un descodificador (110) y para acelerar la recuperación del descodificador después de que se' han recibido cuadros no borrados de la señal de sonido codificada. Para este propósito se determinan parámetros de ocultamiento/recuperación en el codificador o el descodificador . Cuando se determinan en el codificador (106) , los parámetros de ocultamiento/recuperación se transmiten al descodificador (110) . En el descodificador , el ocultamiento de cuadro borrado y recuperación de descodificador se conducen en respuesta a los parámetros de ocultamiento/recuperación. Los parámetros de ocultamiento/recuperación pueden seleccionarse del grupo que consiste de: un parámetro de clasificación de señal, un parámetro de información de energía y un parámetro de información de fase. La determinación de los parámetros de ocultamiento/recuperación comprende clasificar los cuadros sucesivos de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, de voz o principio, y esta clasificación se determina en base a cuando menos una parte de los siguientes parámetros: un parámetro de correlación normalizada, un parámetro de inclinación espectral, un parámetro de proporción de señal -a-ruido, un parámetro de estabilidad de paso, un parámetro de energía de cuadro relativa y un parámetro de cruce a cero. B-74 08241-169-Final
MXPA04011751A 2002-05-31 2003-05-30 Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal. MXPA04011751A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA002388439A CA2388439A1 (en) 2002-05-31 2002-05-31 A method and device for efficient frame erasure concealment in linear predictive based speech codecs
PCT/CA2003/000830 WO2003102921A1 (en) 2002-05-31 2003-05-30 Method and device for efficient frame erasure concealment in linear predictive based speech codecs

Publications (1)

Publication Number Publication Date
MXPA04011751A true MXPA04011751A (es) 2005-06-08

Family

ID=29589088

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA04011751A MXPA04011751A (es) 2002-05-31 2003-05-30 Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal.

Country Status (18)

Country Link
US (1) US7693710B2 (es)
EP (1) EP1509903B1 (es)
JP (1) JP4658596B2 (es)
KR (1) KR101032119B1 (es)
CN (1) CN100338648C (es)
AU (1) AU2003233724B2 (es)
BR (3) BR0311523A (es)
CA (2) CA2388439A1 (es)
DK (1) DK1509903T3 (es)
ES (1) ES2625895T3 (es)
MX (1) MXPA04011751A (es)
MY (1) MY141649A (es)
NO (1) NO20045578L (es)
NZ (1) NZ536238A (es)
PT (1) PT1509903T (es)
RU (1) RU2325707C2 (es)
WO (1) WO2003102921A1 (es)
ZA (1) ZA200409643B (es)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107851441A (zh) * 2015-08-17 2018-03-27 高通股份有限公司 高频带目标信号控制

Families Citing this family (150)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7558295B1 (en) * 2003-06-05 2009-07-07 Mindspeed Technologies, Inc. Voice access model using modem and speech compression technologies
JP4135621B2 (ja) * 2003-11-05 2008-08-20 沖電気工業株式会社 受信装置および方法
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7668712B2 (en) 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
JP4698593B2 (ja) * 2004-07-20 2011-06-08 パナソニック株式会社 音声復号化装置および音声復号化方法
FR2880724A1 (fr) * 2005-01-11 2006-07-14 France Telecom Procede et dispositif de codage optimise entre deux modeles de prediction a long terme
AU2006208529B2 (en) 2005-01-31 2010-10-28 Microsoft Technology Licensing, Llc Method for weighted overlap-add
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8160868B2 (en) * 2005-03-14 2012-04-17 Panasonic Corporation Scalable decoder and scalable decoding method
US7930176B2 (en) * 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
CN101263554B (zh) * 2005-07-22 2011-12-28 法国电信公司 在比特率分级和带宽分级的音频解码中的比特率切换方法
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US7805297B2 (en) * 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
KR101151746B1 (ko) 2006-01-02 2012-06-15 삼성전자주식회사 오디오 신호용 잡음제거 방법 및 장치
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US8370138B2 (en) * 2006-03-17 2013-02-05 Panasonic Corporation Scalable encoding device and scalable encoding method including quality improvement of a decoded signal
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
CN1983909B (zh) * 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
CN101101753B (zh) * 2006-07-07 2011-04-20 乐金电子(昆山)电脑有限公司 音频帧识别方法
US8218529B2 (en) * 2006-07-07 2012-07-10 Avaya Canada Corp. Device for and method of terminating a VoIP call
WO2008007699A1 (en) * 2006-07-12 2008-01-17 Panasonic Corporation Audio decoding device and audio encoding device
WO2008007700A1 (fr) * 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8280728B2 (en) * 2006-08-11 2012-10-02 Broadcom Corporation Packet loss concealment for a sub-band predictive coder based on extrapolation of excitation waveform
KR101041895B1 (ko) * 2006-08-15 2011-06-16 브로드콤 코포레이션 패킷 손실 후 디코딩된 오디오 신호의 시간 워핑
CN101366079B (zh) * 2006-08-15 2012-02-15 美国博通公司 用于子带预测编码的基于全带音频波形外插的包丢失隐藏
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
CN101155140A (zh) * 2006-10-01 2008-04-02 华为技术有限公司 音频流错误隐藏的方法、装置和系统
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
RU2462769C2 (ru) * 2006-10-24 2012-09-27 Войсэйдж Корпорейшн Способ и устройство кодирования кадров перехода в речевых сигналах
JP5123516B2 (ja) * 2006-10-30 2013-01-23 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法及び符号化方法
DE602006015328D1 (de) * 2006-11-03 2010-08-19 Psytechnics Ltd Abtastfehlerkompensation
EP1921608A1 (en) * 2006-11-13 2008-05-14 Electronics And Telecommunications Research Institute Method of inserting vector information for estimating voice data in key re-synchronization period, method of transmitting vector information, and method of estimating voice data in key re-synchronization using vector information
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
KR101291193B1 (ko) 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
WO2008072671A1 (ja) * 2006-12-13 2008-06-19 Panasonic Corporation 音声復号化装置およびパワ調整方法
EP2128855A1 (en) 2007-03-02 2009-12-02 Panasonic Corporation Voice encoding device and voice encoding method
EP2115742B1 (en) * 2007-03-02 2012-09-12 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements in a telecommunications network
WO2008108080A1 (ja) 2007-03-02 2008-09-12 Panasonic Corporation 音声符号化装置及び音声復号装置
SG179433A1 (en) * 2007-03-02 2012-04-27 Panasonic Corp Encoding device and encoding method
US20080249767A1 (en) * 2007-04-05 2008-10-09 Ali Erdem Ertan Method and system for reducing frame erasure related error propagation in predictive speech parameter coding
US8160872B2 (en) * 2007-04-05 2012-04-17 Texas Instruments Incorporated Method and apparatus for layered code-excited linear prediction speech utilizing linear prediction excitation corresponding to optimal gains
EP2112653A4 (en) * 2007-05-24 2013-09-11 Panasonic Corp AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT
WO2008151408A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
CN101325631B (zh) * 2007-06-14 2010-10-20 华为技术有限公司 一种估计基音周期的方法和装置
KR100906766B1 (ko) * 2007-06-18 2009-07-09 한국전자통신연구원 키 재동기 구간의 음성 데이터 예측을 위한 음성 데이터송수신 장치 및 방법
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR101449431B1 (ko) 2007-10-09 2014-10-14 삼성전자주식회사 계층형 광대역 오디오 신호의 부호화 방법 및 장치
US8326610B2 (en) * 2007-10-24 2012-12-04 Red Shift Company, Llc Producing phonitos based on feature vectors
CN101207665B (zh) * 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
CN100550712C (zh) * 2007-11-05 2009-10-14 华为技术有限公司 一种信号处理方法和处理装置
KR100998396B1 (ko) * 2008-03-20 2010-12-03 광주과학기술원 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치
FR2929466A1 (fr) * 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
EP2144171B1 (en) * 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
DE102008042579B4 (de) * 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
US8706479B2 (en) * 2008-11-14 2014-04-22 Broadcom Corporation Packet loss concealment for sub-band codecs
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101958119B (zh) * 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
EP4358082A1 (en) * 2009-10-20 2024-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
JP5812998B2 (ja) * 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
KR101761629B1 (ko) * 2009-11-24 2017-07-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2011074233A1 (ja) * 2009-12-14 2011-06-23 パナソニック株式会社 ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
CN105374362B (zh) 2010-01-08 2019-05-10 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及记录介质
US20110196673A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
US8660195B2 (en) 2010-08-10 2014-02-25 Qualcomm Incorporated Using quantized prediction memory during fast recovery coding
ES2727748T3 (es) * 2010-11-22 2019-10-18 Ntt Docomo Inc Dispositivo y método de codificación de audio
EP4239635A3 (en) * 2010-11-22 2023-11-15 Ntt Docomo, Inc. Audio encoding device and method
JP5724338B2 (ja) * 2010-12-03 2015-05-27 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
WO2012110478A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
KR101551046B1 (ko) * 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
BR112013020587B1 (pt) 2011-02-14 2021-03-09 Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
EP2676265B1 (en) 2011-02-14 2019-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using an aligned look-ahead portion
EP2676270B1 (en) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
WO2012110415A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
JP2012203351A (ja) * 2011-03-28 2012-10-22 Yamaha Corp 子音識別装置、およびプログラム
US9026434B2 (en) 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
SI2774145T1 (sl) * 2011-11-03 2020-10-30 Voiceage Evs Llc Izboljšane negovorne vsebine v celp dekoderju z nizko frekvenco
JP6012203B2 (ja) 2012-03-05 2016-10-25 キヤノン株式会社 画像処理装置、及び制御方法
US20130282372A1 (en) 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
US9589570B2 (en) * 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
US9123328B2 (en) 2012-09-26 2015-09-01 Google Technology Holdings LLC Apparatus and method for audio frame loss recovery
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
CN102984122A (zh) * 2012-10-09 2013-03-20 中国科学技术大学苏州研究院 基于amr-wb码率伪装的ip语音隐蔽通信方法
JP6180544B2 (ja) 2012-12-21 2017-08-16 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成
BR112015014217B1 (pt) * 2012-12-21 2021-11-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V Adição de ruído de conforto para modelagem do ruído de fundo em baixas taxas de bits
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
ES2816014T3 (es) * 2013-02-13 2021-03-31 Ericsson Telefon Ab L M Ocultación de error de trama
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
KR102148407B1 (ko) * 2013-02-27 2020-08-27 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
SI3537437T1 (sl) 2013-03-04 2021-08-31 Voiceage Evs Llc Naprava in postopek za zmanjšanje kvantizacijskega šuma v časovnem dekoderju
CN106169297B (zh) 2013-05-30 2019-04-19 华为技术有限公司 信号编码方法及设备
PT3011555T (pt) 2013-06-21 2018-07-04 Fraunhofer Ges Forschung Reconstrução de uma estrutura de discurso
SG11201510463WA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
EP3011556B1 (en) 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
MX358362B (es) * 2013-06-21 2018-08-15 Fraunhofer Ges Forschung Decodificador de audio que tiene un modulo de extension de ancho de banda con un modulo de ajuste de energia.
PT3011561T (pt) 2013-06-21 2017-07-25 Fraunhofer Ges Forschung Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros
CN104299614B (zh) * 2013-07-16 2017-12-29 华为技术有限公司 解码方法和解码装置
CN108364657B (zh) * 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
PL3285256T3 (pl) 2013-10-31 2020-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału pobudzenia w dziedzinie czasu
SG10201609146YA (en) 2013-10-31 2016-12-29 Fraunhofer Ges Forschung Audio Decoder And Method For Providing A Decoded Audio Information Using An Error Concealment Modifying A Time Domain Excitation Signal
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
CN104751849B (zh) 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
KR102457290B1 (ko) * 2014-02-24 2022-10-20 삼성전자주식회사 신호 분류 방법 및 장치, 및 이를 이용한 오디오 부호화방법 및 장치
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922055A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
CN107369454B (zh) * 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
ES2689120T3 (es) * 2014-03-24 2018-11-08 Nippon Telegraph And Telephone Corporation Método de codificación, codificador, programa y soporte de registro
BR112016022466B1 (pt) * 2014-04-17 2020-12-08 Voiceage Evs Llc método para codificar um sinal sonoro, método para decodificar um sinal sonoro, dispositivo para codificar um sinal sonoro e dispositivo para decodificar um sinal sonoro
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
NO2780522T3 (es) * 2014-05-15 2018-06-09
US9666210B2 (en) * 2014-05-15 2017-05-30 Telefonaktiebolaget Lm Ericsson (Publ) Audio signal classification and coding
CN106683681B (zh) * 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
PL3163571T3 (pl) 2014-07-28 2020-05-18 Nippon Telegraph And Telephone Corporation Kodowanie sygnału dźwiękowego
EP2980797A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
CN105590629B (zh) * 2014-11-18 2018-09-21 华为终端(东莞)有限公司 一种语音处理的方法及装置
US10424305B2 (en) 2014-12-09 2019-09-24 Dolby International Ab MDCT-domain error concealment
CN105810214B (zh) * 2014-12-31 2019-11-05 展讯通信(上海)有限公司 语音激活检测方法及装置
DE102016101023A1 (de) * 2015-01-22 2016-07-28 Sennheiser Electronic Gmbh & Co. Kg Digitales Drahtlos-Audioübertragungssystem
US20170365255A1 (en) * 2016-06-15 2017-12-21 Adam Kupryjanow Far field automatic speech recognition pre-processing
US9679578B1 (en) 2016-08-31 2017-06-13 Sorenson Ip Holdings, Llc Signal clipping compensation
CN108011686B (zh) * 2016-10-31 2020-07-14 腾讯科技(深圳)有限公司 信息编码帧丢失恢复方法和装置
WO2019000178A1 (zh) * 2017-06-26 2019-01-03 华为技术有限公司 一种丢帧补偿方法及设备
CN107564533A (zh) * 2017-07-12 2018-01-09 同济大学 基于信源先验信息的语音帧修复方法和装置
MX2020002972A (es) * 2017-09-20 2020-07-22 Voiceage Corp Metodo y dispositivo para asignar un presupuesto de bits entre subtramas en un codec celp.
EP3913626A1 (en) * 2018-04-05 2021-11-24 Telefonaktiebolaget LM Ericsson (publ) Support for generation of comfort noise
US10763885B2 (en) 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
US10784988B2 (en) 2018-12-21 2020-09-22 Microsoft Technology Licensing, Llc Conditional forward error correction for network data
US10803876B2 (en) * 2018-12-21 2020-10-13 Microsoft Technology Licensing, Llc Combined forward and backward extrapolation of lost network data
CN111063362B (zh) * 2019-12-11 2022-03-22 中国电子科技集团公司第三十研究所 一种数字语音通信噪音消除和语音恢复方法及装置
CN113766239A (zh) * 2020-06-05 2021-12-07 于江鸿 数据处理的方法和系统
US11388721B1 (en) * 2020-06-08 2022-07-12 Sprint Spectrum L.P. Use of voice muting as a basis to limit application of resource-intensive service
CN113113030B (zh) * 2021-03-22 2022-03-22 浙江大学 一种基于降噪自编码器的高维受损数据无线传输方法
KR20220159071A (ko) * 2021-05-25 2022-12-02 삼성전자주식회사 신경망 자기 정정 최소합 복호기 및 이를 포함하는 전자 장치
EP4329202A1 (en) 2021-05-25 2024-02-28 Samsung Electronics Co., Ltd. Neural network-based self-correcting min-sum decoder and electronic device comprising same

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4707857A (en) * 1984-08-27 1987-11-17 John Marley Voice command recognition system having compact significant feature data
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5226084A (en) 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
US5122875A (en) 1991-02-27 1992-06-16 General Electric Company An HDTV compression system
EP0533257B1 (en) * 1991-09-20 1995-06-28 Koninklijke Philips Electronics N.V. Human speech processing apparatus for detecting instants of glottal closure
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5732389A (en) 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
EP0938781A2 (en) * 1997-09-12 1999-09-01 Cellon France SAS Transmission system with improved reconstruction of missing parts
FR2774827B1 (fr) * 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
FR2784218B1 (fr) * 1998-10-06 2000-12-08 Thomson Csf Procede de codage de la parole a bas debit
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6493664B1 (en) * 1999-04-05 2002-12-10 Hughes Electronics Corporation Spectral magnitude modeling and quantization in a frequency domain interpolative speech codec system
US6324503B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions
RU2000102555A (ru) 2000-02-02 2002-01-10 Войсковая часть 45185 Способ маскирования видеосигнала
SE0001727L (sv) * 2000-05-10 2001-11-11 Global Ip Sound Ab Överföring över paketförmedlade nät
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
FR2815457B1 (fr) * 2000-10-18 2003-02-14 Thomson Csf Procede de codage de la prosodie pour un codeur de parole a tres bas debit
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US7016833B2 (en) * 2000-11-21 2006-03-21 The Regents Of The University Of California Speaker verification system using acoustic data and non-acoustic data
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6614370B2 (en) * 2001-01-26 2003-09-02 Oded Gottesman Redundant compression techniques for transmitting data over degraded communication links and/or storing data on media subject to degradation
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
ATE439666T1 (de) * 2001-02-27 2009-08-15 Texas Instruments Inc Verschleierungsverfahren bei verlust von sprachrahmen und dekoder dafer
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US7047187B2 (en) * 2002-02-27 2006-05-16 Matsushita Electric Industrial Co., Ltd. Method and apparatus for audio error concealment using data hiding
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20070174047A1 (en) * 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107851441A (zh) * 2015-08-17 2018-03-27 高通股份有限公司 高频带目标信号控制
CN107851441B (zh) * 2015-08-17 2021-09-14 高通股份有限公司 用于对输入音频信号进行编码的方法和设备

Also Published As

Publication number Publication date
US20050154584A1 (en) 2005-07-14
RU2325707C2 (ru) 2008-05-27
ZA200409643B (en) 2006-06-28
ES2625895T3 (es) 2017-07-20
JP4658596B2 (ja) 2011-03-23
DK1509903T3 (en) 2017-06-06
BR0311523A (pt) 2005-03-08
CN1659625A (zh) 2005-08-24
RU2004138286A (ru) 2005-06-10
EP1509903A1 (en) 2005-03-02
JP2005534950A (ja) 2005-11-17
KR101032119B1 (ko) 2011-05-09
CA2388439A1 (en) 2003-11-30
KR20050005517A (ko) 2005-01-13
MY141649A (en) 2010-05-31
CN100338648C (zh) 2007-09-19
BRPI0311523B1 (pt) 2018-06-26
WO2003102921A1 (en) 2003-12-11
AU2003233724A1 (en) 2003-12-19
PT1509903T (pt) 2017-06-07
US7693710B2 (en) 2010-04-06
CA2483791A1 (en) 2003-12-11
NO20045578L (no) 2005-02-22
NZ536238A (en) 2006-06-30
CA2483791C (en) 2013-09-03
EP1509903B1 (en) 2017-04-12
BR122017019860B1 (pt) 2019-01-29
AU2003233724B2 (en) 2009-07-16

Similar Documents

Publication Publication Date Title
AU2003233724B2 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP5149198B2 (ja) 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス
CN105359209B (zh) 在错误隐藏过程中在不同域中改善信号衰落的装置及方法
KR100711280B1 (ko) 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
JP5173939B2 (ja) Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置
KR20050061615A (ko) 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법
Jelinek et al. On the architecture of the cdma2000/spl reg/variable-rate multimode wideband (VMR-WB) speech coding standard
WO2003001172A1 (en) Method and device for coding speech in analysis-by-synthesis speech coders
MX2008008477A (es) Metodo y dispositivo para ocultamiento eficiente de borrado de cuadros en codec de voz

Legal Events

Date Code Title Description
FG Grant or registration