MXPA04011845A - Metodo y dispositivo para aumentar el espaciamiento selectivo de la frecuencia de la voz sintetizada. - Google Patents

Metodo y dispositivo para aumentar el espaciamiento selectivo de la frecuencia de la voz sintetizada.

Info

Publication number
MXPA04011845A
MXPA04011845A MXPA04011845A MXPA04011845A MXPA04011845A MX PA04011845 A MXPA04011845 A MX PA04011845A MX PA04011845 A MXPA04011845 A MX PA04011845A MX PA04011845 A MXPA04011845 A MX PA04011845A MX PA04011845 A MXPA04011845 A MX PA04011845A
Authority
MX
Mexico
Prior art keywords
sound signal
decoded sound
signal
decoded
spacing
Prior art date
Application number
MXPA04011845A
Other languages
English (en)
Inventor
Lefebvre Roch
Original Assignee
Voiceage Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=29589086&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MXPA04011845(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Voiceage Corp filed Critical Voiceage Corp
Publication of MXPA04011845A publication Critical patent/MXPA04011845A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Executing Machine-Instructions (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Working-Up Tar And Pitch (AREA)
  • Inorganic Fibers (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)

Abstract

Se da a conocer un metodo y un dispositivo para el proceso posterior de una senal de sonido descodificada, con el fin de aumentar la calidad percibida de dicha senal de sonido descodificada, esta senal de sonido descodificada se divide en una pluralidad de senales de sub-bandas de frecuencia, y el proceso posterior se aplica a cuando menos una de las senales de sub-banda de frecuencia. Despues de este proceso posterior de esta al menos una senal de sub-banda de frecuencia, dichas senales de sub-banda de frecuencia pueden ser agregadas para producir una senal de sonido descodificada de salida, procesada posteriormente. De esta manera, el proceso posterior puede estar localizado en una o mas sub-bandas deseadas, dejando a las otras sub-bandas virtualmente sin alterar.

Description

UN MÉTODO Y DISPOSITIVO PARA AUMENTAR EL ESPACIAMIENTO SELECTIVO DE LA FRECUENCIA DE LA VOZ SINTETIZADA ANTECEDENTES DE LA INVENCIÓN 1. Campo de la Invención La presente invención se refiere a un método y dispositivo para el proceso posterior de una señal de sonido descodificada, con el fin de aumentar la calidad percibida de la señal de sonido descodificada. Estos método y dispositivo de proceso posterior se puede aplicar, en particular, pero no exclusivamente, a la codificación digital de señales de sonidos (que incluyen la voz) . Por ejemplo, este método, después del proceso, y dispositivo pueden también ser aplicados al caso más general de mejorar de señal, donde una fuente de ruido pueda ser desde cualquier medio o sistema, y no necesariamente se relaciona con la codificación o con la cuantificación del ruido. 2. Breve Descripción de la Tecnología Actual 2.1 Codificadores de Voz ¡Los codificadores de -voz son usados ampliamente en sistemas ', de comunicaciones ,; digitales, para transmitir eficientemente y/o almacenar señales de voz. En los sistemas digitales, la señal de voz de entrada analógica se muestrea primero con un régimen de muestreo apropiado, y las muestras de voz sucesivas son después procesadas en el dominio digital. En particular, un codificador de voz recibe las muestras de voz como una entrada y genera una corriente de bits de salida comprimidos, a través de un canal o almacenados en un medio de almacenamiento apropiado. En el receptor, un descodificador de voz recibe la corriente de bits como una entrada y produce una señal de voz reconstruida de salida. Para ser útil, el codificador de voz debe producir una corriente de bits comprimida con un régimen de bits menor que el régimen de bits de la señal digital de voz de entrada muestreada. Los codificadores de voz del estado actual de la técnica logran una relación de compresión al menos de 16 a 1, y aún es posible descodificar la voz de alta calidad. Muchos de estos codificadores de voz del estado actual de la técnica se basan en el modelo de la Predicción Lineal Excitada del Código ("CELP"), con diferentes variantes que dependen del algoritmo. En la codificación CELP, la señal de voz digital se procesa en bloques sucesivos de muestras de velocidad denominados marcos. Para cada marco, el codificador extrae de las muestras de voz digital un número de parámetros, que se codifican digitalmente, y luego son transmitidas y/o almacenadas. El descodificador se diseña para procesar los parámetros recibidos para reconstruir o sintetizar el marco dado de la señal de voz. Típicamente, se extraen los siguientes parámetros de las muestras de voz digitales por el codificador de CELP: los .Coeficientes de Predicción Lineales (Coeficientes de LP) , transmitidos en un dominio transformado, tal como las Frecuencias Espectrales de Línea (LSF) o Immitance Spectral Frequencies (ISF) ; los parámetros de espaciamiento o paso, que incluyen el retardo de espaciamiento (o retardo) y una ganancia de espaciamiento; y - los parámetros de excitación innovadores (índice y ganancia fijo del libro de códigos) . Los parámetros de espaciamiento y los parámetros de excitación innovadores describen juntos lo que se denomina la señal de excitación. Esta señal de excitación es suministrada como una entrada a un filtro de Predicción Lineal (LP) , descrito por los coeficientes de LP. Este filtro de LP puede ser visto como un modelo del tracto vocal, en tanto la señal de excitación puede ser vista como la salidá de la glotis. Los coeficientes LP o LSF son calculados típicamente y transmitidos cada marco, en tanto los parámetros de espaciamiento y excitación innovadora se calculan y transmiten varias veces por marco. Más específicamente, cada marco se divide en varios bloques de señales denominados submarcos, y los parámetros de espaciamiento y los parámetros de excitación innovadora se calculan , y transmiten cada submarco. Un marco tiene típicamente una duración de 10 a 30 milisegundos, en tanto un submarco tiene típicamente una duración de 5 milisegundos . Varios estándares de codificación de la voz se basan en el modelo CELP Algebraico (ACELP) y, más particularmente, en el algoritmo ACELP. Una de las características principales del modelo ACELP es el uso de libros de códigos algebraicos para codificar la excitación innovadora en cada submarco. Un libro de códigos algebraicos divide un submarco en un conjunto de pistas de posiciones de pulso intercaladas. Solamente se permiten unos cuantos pulsos de amplitud no de cero por pista, y cada pulso de f amplitud no de cero se restringe a las posiciones de la pista correspondiente. El codificador usa algoritmos de búsqueda rápida para encontrar las posiciones óptimas de pulsos y amplitudes para los pulsos de cada submarco. Una descripción del algoritmo ACELP puede ser encontrada en el articulo de R. SALAMI et al., "Diseño y Descripción de CS-AC P: un codificador de voz de 8 kb/s de calidad de tarifa", IEEE Trans . on Speech and Audio Proc. Vol . 6, No. 2, pp. 116-130, marzo de 1998, incorporado aqui como referencia y el cual describe el algoritmo codificador de voz de banda estrecha ITU-T G-729 CS-ACELP, a 8 kbits/segundo . Se debe notar que hay algunas variaciones en la búsqueda del libro de códigos innovadora de ACELP, que dependen del estándar de interés. La presente invención no depende de estas variaciones, , puesto que solamente se aplica al proceso posterior de la señal de voz descodificada (sintetizada). Un estándar reciente basado en el algoritmo ACELP es el algoritmo de codificación de voz ETS/3GPP AMR-WB, el cual es< también adoptado por ITU-T (International Telecommunication Union)) como la recomendación G.722.2 [ITU-T Recommendation G.722.2 "Código de banda ancha de voz de alrededor de 16 kbit/s, que usa la Banda Ancha de Múltiple Régimen Adaptable (AMR-WB) " , Ginebra, 2002], [3GPP TS 26-190. "AMR Wideband Speech Codee: Transcodin Functions," Especificación Técnica 3GPP] . El AMR-WB es un algoritmo de múltiple régimen diseñado para operar con nueve diferentes regímenes de bits entre 6.6 y 23.85 kbits/segundo. Los expertos ordinarios en la materia saben que la calidad de la voz descodificada aumenta generalmente con el régimen de bits. El AMR-WB se ha diseñado para permitir que los sistemas de comunicación celular reduzcan el régimen de bits del codificador de voz en el caso de condiciones malas del canal; los bits se convierten a los bits de codificación del canal para aumentar la protección de los bits transmitidos. En esta forma, la calidad general de los bits transmitidos se puede mantener mayor que en el caso donde el codificador de voz opera en un solo régimen fijo de bits. La Figura 7 es un diagrama de bloques esquemático, que muestra el principio del descodificador AMR-WB. Más específicamente, la Figura 7 es una representación de alto nivel del descodificador, que enfatiza el hecho que la corriente de bits recibida codifica la señal de voz únicamente a 6.4 kHz (12.8 kHz de frecuencia de muestreo), y las frecuencias mayores de 6.4 kHz se sintetizan en el descodificador desde los parámetros de banda menor. Esto implica que, en el codificador, la banda ancha original, la señal de voz muestreada de 16 kHz fue primero muestreada. en forma descendente, a la frecuencia de muestreo de 12.8 kHz, que usa las técnicas de conversión de múltiple régimen, bien conocida , por los expertos ordinarios en la materia. El descodificador 701 de parámetros y el descodificador 702 de voz de la Figura 7 son análogos al descodificador 106 de parámetros y el descodificador 107 de fuente de la Figura 1. La corriente de bits recibida 709, es primero descodificada por el descodi icador 701 de parámetros para recuperar los parámetros 710 suministrados al descodificador 702 de voz, para volver a sintetizar la señal de voz. En el caso y especifico del descodificador AMR-WB, estos parámetros son: los coeficientes ISF para cada marco de 20 milisegundos ; un retardo del espaciamiento de enteros, T0, un valor del espaciamiento fraccional, T0_frac alrededor de T0, y una ganancia de espaciamiento para cada submarco de 5 milisegundos; y una configuración del libro de códigos algebraico (posiciones y signos de pulsos) y ganancia para cada submarco de 5 milisegundos. Desde los parámetros 710, el descodificador 702 de voz se diseña para sintetizar un marco dado de la señal de voz para las frecuencias iguales a y menores de 6.4 kHz, y producir asi una señal 712 de voz sintetizada de banda baja en la frecuencia de muestreo de 12.8 kHz. Para recibir la señal de banda completa, que corresponde a la frecuencia de muestreo de 16 kHz, el descodificador AMR-WB comprende el procesador 707 de re-sintesis de banda alta, responsivo a los parámetros descodificados 710 del descodificador 701 de parámetros, para volver a sintetizar una señal 711 de banda alta a la frecuencia de muestreo de 16 kHz . Los detalles del procesador 707 de re-sintesis de la señal de banda alta pueden ser encontrados en las siguientes publicaciones, que se incorporan aquí como referencia: - Recomendación G.7222.2 de ITU-T "Codificación de banda ancha de voz en alrededor de 16 kbit/s, usando la banda ancha de múltiple régimen adaptadora (AMR-WB) ", Ginebra, 2002 y - 3GPP TS 26-190, "AMR Wideband Speech Codee: Transcoding Functions," 3GPP Technical Specification .
La salida del procesador 707 de re-sintesis de banda alta, referida como la señal 711 de banda alta de la Figura 7, es una señal-, de la frecuencia de muestreo de 16 kHz, que tiene una energía concentrada arriba de 6.4 kHz. El procesador 708 suma la señal 711 de banda alta a una señal de voz de banda baja muestreada por completo de 16 kHz, para formar la señal de voz descodificada completa 714 del descodificador AMR-WB en la frecuencia de muestreo de 16 kHz. 2.2 Necesidad para el proceso posterior Cuando se usa un codificador de voz en un sistema de comunicaciones, la señal de voz sintetizada o descodificada nunca es idéntica a la señal de voz original, aún en la anuencia de errores de transmisión. Cuanto mayor sea la relación de compresión, más alta será la distorsión introducida por el codificador. Esta distorsión puede ser hecha subjetivamente pequeña usando diferentes acercamientos. Un primer acercamiento es acondicionar la señal en el codificador para describir mejor, o codificar, subjetivamente la información relevante en la señal de voz. El uso de un filtro de peso de ondas de sonido, a menudo representada por W(z), es un ejemplo ampliamente usado de este primer acercamiento [B. Kleijn y K. Paliwal, editores, "Speech Coding and Synthesis," Elsevier 1995]. Este filtro W(z) es hecho típicamente adaptable, y se calcula de tal manea que reduzca la energía de señal cerca de los formatos espectrales, aumentando así la energía relativa de las bandas de energía menores. El codificador puede luego cuantificar mejor las bandas de energía menores, que de otra manera estarían enmascaradas por el ruido de la codificación, aumentando la distorsión percibida. Otro ejemplo de acondicionamiento digital en el codificador es el denominado filtro de exactitud de espaciamiento, el cual aumenta la estructura armónica de la señal de excitación en el codificador. La precisión de espaciamiento ayuda en asegurar 'que el nivel del ruido ínter-armónico se mantenga suficientemente bajo en el sentido de percepción.
'Un segundo acercamiento para minimi2ar la distorsión percibida, introducida por un codificador de voz, es aplicar el denominado algoritmo de proceso posterior. Este proceso posterior se aplica al descodificador, como se muestra en la Figura 1. En la Figura, el codificador 101 de voz y el descodificador 105 de voz, son divididos en dos módulos. En el caso del codificador 101 de voz, un codificador 102 de fuente produce una serie de parámetros codificadores de voz, 109, para ser transmitidos o almacenados. Estos parámetros 109 son luego codificados en forma binaria por el codificador 103 de parámetros usando un método de' codificación especifico, dependiendo del algoritmo que codifica la voz y en los parámetros por codificar. La señal de , voz codificada (parámetros codificados binarios) 110 es luego transmitida al descodificador a través de un canal 104 de comunicaciones. En el descodificador, la corriente 111 de bits recibidos se analiza primero por un descodificador 106 de parámetros, para descodificar los parámetros que codifican la señal de sonido codificada recibida, que son luego usados por el descodificador 107 de fuente, para generar la señal 11 de voz sintetizada. El objeto del proceso posterior (véase el procesador posterior 108 de la Figura 1) es mejorar la información relevante perceptiva en la señal de voz sintetizada, o equivalentemente para reducir o remover la información importuna perceptiva. Dos formas usadas comúnmente del proceso posterior son el post-proceso de las ondas de sonido y el post-proceso de espaciamiento. En el primer caso, la estructura de las ondas de sonido de la señal de voz sintetizada se amplifican por el uso de un filtro adaptador con una respuesta de frecuencia correlacionada a las ondas de sonido de la voz. Las crestas espectrales de la señal de voz sintetizada son luego acentuadas a expensas de los valles espectrales, cuya energía relativa llega a ser más pequeña. En el caso del proceso posterior del espaciamiento, un filtro adaptable es también aplicado a las señal de voz sintetizada. Sin embargo, en este caso, la respuesta de frecuencia del filtro se correlaciona a la estructura espectral fina, es decir, la armónica. Un filtro posterior del espaciamiento luego acentúa las armónicas a expensas de la energía inter-armónica, que llega a ser relativamente pequeña. Nótese que la respuesta de frecuencia de un filtro posterior de espaciamiento cubre típicamente todo el intervalo de frecuencia. El impacto es que una estructura armónica se impone en la voz procesada posteriormente, aún en bandas de frecuencia que no exhiben una estructura armónica en la voz descodi.ficada . Esto no es un acercamiento óptimo perceptivo para la voz de banda ancha (voz muestreada a 16 kHz) , que exhibe raramente una estructura periódica en todo el intervalo de frecuencia.
COMPENDIO DE LA INVENCIÓN La presente invención se refiere a un método para el proceso posterior de una señal de sonido descodificada, con el fin de aumentar la calidad percibida de esta señal de sonido descodificada, que comprende dividir dicha señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia y aplica el proceso posterior a cuando menos una de las señales de sub-banda de frecuencia, pero no a todas las señales de sub-banda de frecuencia. La presente invención también se refiere a un dispositivo para el proceso posterior de una señal de sonido decodificada, con el fin de aumentar la calidad percibida de esta señal de sonido descodificada, que comprende un elemento para dividir la señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia y elementos para el proceso posterior al menos de una de las señales de sub-banda de frecuencia, pero no todas las señales de sub-banda de frecuencia. De acuerdo con una modalidad alternativa, después del proceso posterior de al menos una señal de sub-banda de frecuencia, antes mencionada, "las señales de sub-banda de frecuencia se suman para producir una señal de sonido descodificada de proceso posterior de salida. Por lo tanto, el método de proceso posterior y el dispositivo hacen posible localizar el proceso posterior en las sub-bandas deseadas, y dejar otras sub-bandas virtualmente sin alterar. La presente invención además se refiere a un descodificador de señal de sonido, que comprende una entrada para recibir una señal de sonido codificada, un descodificador de parámetros suministrado con la señal de sonido codificada, para descodificar los parámetros que codifican la señal de sonido descodificada, un descodificador de la señal de sonido suministrado con los parámetros de codificación de la señal de sonido descodificada para producir una señal de sonido descodificada y un dispositivo de proceso posterior, como se describió anteriormente, para llevar a cabo el proceso posterior de la señal de sonido descodificada, con el fin de mejorar la calidad percibida de esta señal de sonido descodificada . Los objetos anteriores y otros, ventajas y características de la presente invención, llegarán a ser más evidentes de la lectura de la siguiente descripción no restrictiva de sus modalidades ilustrativas, dadas en forma de ejemplo únicamente, con ¦ referencia a los dibujos acompañantes.
BREVE DESCRIPCIÓN DE LOS DIBUJOS En los dibujos adjuntos: la Figura 1 es un diagrama de bloque esquemático de la estructura de alto nivel de un ejemplo del sistema codificador / descodificador de voz, que usa el proceso posterior en el descodificador; la Figura 2 es un diagrama de bloques esquemático, que muestra el principio general de una modalidad ilustrativa de la presente invención, que usa un banco de filtros adaptables y filtros de sub-banda, en los cuales la entrada de los filtros adaptables es la señal de voz (linea sólida) descodificada (sintetizada) y los parámetros descodificados (linea de puntos); la Figura 3 es un diagrama de bloques esquemático de un aumentador de espaciamiento de dos bandas, el cual constituye un caso especial de la modalidad ilustrativa de la Figura 2; la Figura 4 es un diagrama de bloques esquemático de una modalidad ilustrativa de la presente invención, según se aplica al caso especial del descodificador de voz de banda ancha, AMR-WB; la Figura 5 es un diagrama de bloques esquemático de una forma de realización alternativa de la modalidad ilustrativa de la Figura 4; la Figura 6a es una gráfica que ilustra un ejemplo de un espectro de una señal procesada previamente; la Figura 6b es una gráfica que ilustra un ejemplo del espectro de la señal procesada posteriormente, obtenida cuando se usa el método descrito en la Figura 3; la Figura 7 es un diagrama de bloques esquemático, que muestra el principio de operación del descodificador 3GPP de A R-WB; las Figuras 8a y 8b son gráficas que muestran un ejemplo de la respuesta de frecuencia de un filtro que aumenta el espaciamiento, como se describe por la Ecuación (19, con el caso especial de un periodo de espaciamiento T = 10 muestras; la Figura 9a es una gráfica que muestra un ejemplo de respuesta de frecuencia para el filtro 404 de paso bajo de la Figura 4; la Figura 9b es una gráfica que muestra un ejemplo de la respuesta de frecuencia para el filtro 407 de paso de banda de la Figura 4; ·; la Figura 9c es una gráfica que muestra un ejemplo de la respuesta de frecuencia combinada para el filtro 404 de paso bajo y los filtros 407 de paso de banda de la Figura 4; y la Figura 10 es una gráfica que muestra un ejemplo de la respuesta de frecuencia de un filtro inter-armónico, como se describe por la Ecuación (2), y usado en el filtro inter-armónico, 503, de la Figura 5, para el caso especifico de T = 10 muestras.
DESCRIPCIÓN DETALLADA DE LAS MODALIDADES ILUSTRATIVAS La Figura 2 es un diagrama de bloques esquemático, que ilustra el principio general de una modalidad ilustrativa de la presente invención. En la Figura 1, la señal de entrada (señal en la cual se aplica el proceso posterior) es la señal 112 de voz descodificada (sintetizada) , producida por el descodificador 105 de voz (Figura 1) en el receptor de un sistema de comunicaciones (salida del descodificador 107 de fuente de la Figura 1) . El objeto es producir una señal de voz descodificada, procesada posteriormente, en la salida 113 del post-procesador 108 de la Figura 1 (la cual es también la salida del procesador 203 de la Figura 2) con calidad percibida aumentada. Esto se logra aplicando primero al menos una, y posiblemente más de una, operación de filtración adaptable a la señal 112 de entrada (véase los filtros adaptables 201a, 201b, ... 201N) . Estos filtros adaptables serán descritos en la siguiente descripción. Cuando se', señale aquí que algunos de los filtros adaptables 210a hasta 201N pueden ser de funciones triviales, cuando sea requerido, por ejemplo, con la salida igual a la entrada. La salida 204a, 204b, ... 204N de cada filtro adaptable 204a, 204b, ... 204N es luego filtrada por paso de banda a través de los filtros de sub-banda 202a, 202b, 202N, respectivamente, y la señal de voz descodificada 113, procesada posteriormente, se obtiene agregando a través de un procesador 203 las salidas resultantes respectivas 205a, 205b,... 205N de los filtros de sub-banda 202a, 202b, ... 202N. En una modalidad ilustrativa, una descomposición de dos bandas se usa y la filtración adaptable se aplica solamente a la banda inferior. Esto resulta en un proceso posterior total que es el objetivo en la mayoría de las frecuencias, cerca de la primera armónica de la señal de voz sintetizada . La Figura 3 es un diagrama de bloques esquemático de un aumentador de espaciamiento de dos bandas, que constituye un caso especial de modalidad ilustrativa de la Figura 2. Más específicamente, la Figura 3 muestra las funciones- básicas del post-procesador de dos bandas (véase el post-procesador 108 de la Figura 1). De acuerdo con esta modalidad ilustrativa, sólo el aumento de espaciamiento se considera como el proceso posterior, aunque otros tipos de procesos posteriores pueden ser considerados. En la Figura 3, la señal de voz descodificada (que se supone será la salida 11;2 del descodificado 107 de fuente de la Figura 1) se suministra a través de una pareja de sub-ramales 308 y 309. En el ramal mayor 308, la señal de voz descodificada 112 se filtra por un filtro 301 de paso alto, para producir una señal 310 de banda mayor (SH) . En este ejemplo especifico, ningún filtro adaptable se usa en el ramal mayor. En el ramal inferior 309, la señal de voz descodificada 11 se procesa primero a través de un filtro adaptable 307, que comprende un filtro 302 de paso bajo opcional, un módulo 303 de pista de espaciamiento y un aumentador 304 de espaciamiento, y luego se filtra a través de un filtro 305 de paso bajo, para obtener la banda inferior, la señal 311 procesada posteriormente (SLEF) · La señal 113 de voz descodificada, procesada posteriormente, se obtiene agregando a través de un sumador 306 las señales procesadas posteriormente de banda inferior 311 y mayor 312 desde la salida del filtro 305 de paso bajo y el filtro 301 de paso alto, respectivamente. Se debe señalar que los filtros de paso bajo 305 y paso alto 301 pueden ser de muchos diferentes tipos, por ejemplo la Respuesta de Impulso Infinito (UR) o la Respuesta de Impulso Finito ( FIR) . En esta modalidad ilustrativa, se usan los filtros de fase lineal FIR. Por lo tanto, el filtro 307 adaptable de la Figura 3 se compone de dos y posiblemente tres procesadores, el filtro de paso bajo opcional 302, similar al filtro 305 de paso bajo, el módulo 303 de pista de espaciamiento y el aumentador 304 de espaciamiento. El filtro 302 de paso bajo puede ser omitido, pero se incluye para permitir ver el proceso posterior de la Figura 3, como una descomposición de dos bandas, seguido por la filtración especifica en cada sub-banda. Después de la filtración de paso bajo, opcional, (filtro 302) de la señal 112 de voz descodificada en la banda inferior, la señal resultante SL se procesa a través del aumentador 304 de espaciamiento. El objeto de este aumentador 304 de espaciamiento es reducir el ruido inter-armónico en la señal de voz descodificada en la presente modalidad ilustrativa, el aumentador 304 de espaciamiento es logrado por un filtro lineal que varia en el tiempo, descrito por la siguiente ecuación: donde a es un coeficiente que controla la atenuación interarmónica, T es el periodo de espaciamiento de la señal x[n] de entrada de y[n] es la señal de salida del aumentador de espaciamiento. Una ecuación más general puede también ser usada cuando el filtro se deriva en n-T y en n+T puede estar en diferentes retardos (por ejemplo n-Tl y n+T2) . Los parámetros T y a varían con el tiempo y se dan por el módulo 303 de pista de espaciamiento. Con un valor de a = 1, la ganancia del filtro descrito por la Ecuación (1) es exactamente 0 en frecuencias 1/2T, 3/2T, 5/2T, etc., es decir, el punto medio entre las frecuencias armónicas 1/T, 3/T, 5/T, etc. Cuando a se acerca a 0, la atenuación entre las armónicas producidas por el filtro de la Ecuación (1) se reduce. Con un valor de a = 0, la salida del filtro es igual a la entrada. La Figura 9 muestra la respuesta de la frecuencia ) en dB del filtro descrito por la Ecuación (1) para los valores a = 0.8 y 1, cuando el retardo de espaciamientos (arbitrariamente) establecido en un valor T = 10 muestras. El valor de a puede ser calculado usando varios acercamientos.. Por ejemplo, la correlación de espaciamiento normalizada, la cual es bien conocida por los experto ordinarios en la materia, puede ser usada para controlar el coeficiente a : cuanto mayor sea la correlación de espaciamiento normalizada (más cercana a 1 es) , mayor será el valor de a. Una señal periódica . x [n] con un periodo de T = 10 muestras, tendrá armónicas máximas de las respuestas de frecuencia de la Figura 8, es decir frecuencias normalizadas 0.2, 0.4 etc. Es fácil entender de la Figura 8, que el aumentador de espaciamiento de la Ecuación (1) atenuará la energía de señal sólo entre sus armónicas, y que los componentes armónicos no serán alterados por el filtro. La Figura 8 también muestra que variando el parámetro , se habilita el control de la cantidad de la atenuación interarmónica, provista por el filtro de la Ecuación (1) . Nótese que la respuesta de frecuencia del filtro de la Ecuación (1), mostrado en la Figura 8, se extiende a todas las frecuencias del espectro. 'Puesto que el período de espaciamiento de una señal de voz varia con el tiempo, el valor de espaciamiento Y del aumentador 304 de espaciamiento tiene que variar correspondientemente. El módulo 303 de pista de espaciamiento es responsable para proporcionar el valor T de espaciamiento apropiado al aumentador 304 de espaciamiento, para cada marco de la señal de voz descodificada que tiene que ser procesada. Para ese propósito, el módulo 303 de pista de espaciamiento recibe como entrada no sólo las muestras de voz descodificadas, sino también los parámetros 114 descodificados, desde el descodificador de parámetros 106 de la Figura 1. Puesto que un codificador típico de voz extrae, para cada sub-marco de voz, un retardo de espaciamiento, podemos nombrar a To y posiblemente un valor fraccional To frac usado para interpolar la contribución del libro de códigos adaptable a la resolución de muestra fraccional, el módulo 303 de pista de espaciamiento pede luego usar este retardo de espaciamiento descodificado para enfocar la pista de espaciamiento en el descodificador . Una posibilidad es usar T0 y T0frac directamente en el aumentador 304 de espaciamiento, explotando el hecho que el codificador ya ha realizado la pista de espaciamiento . Otra posibilidad, usada en esta modalidad ilustrativa, es recalcular la pista de espaciamiento del descodificador que se enfoca en valores alrededor, y los múltiplos o submúltiplos del valor de espaciamiento descodificado TQ. El módulo 303 de pista de espaciamiento luego proporciona un retardo de espaciamiento T al aumentador 304 de espaciamiento, el cual usa este valor de T en la Ecuación (1) para el presente marco de la señal de voz descodificada. La salida es la señal SLE.
La señal aumentada SLE de espaciamiento es luego filtrada por paso bajo a través del filtro 305, para aislar las frecuencias bajas de la señal aumentada de espaciamiento SLE/ y remover los componentes de alta frecuencia que surgen cuando el; filtro aumentador de espaciamiento de la Ecuación (1) varia en el tiempo, de acuerdo con el retardo T de espaciamiento, en los limites del marco de la voz codificada Esto produce la señal SLEF post-procesada de banda menor, que puede ahora ser agregada a la señal SH de banda mayor en el sumador 306. El resultado es la señal 113 de voz descodificada post-procesada, con ruido inter-armónico reducido en la banda menor, la banda de frecuencia, conde el aumento de espaciamiento será aplicado, depende de la frecuencia recortada del filtro 305 de paso bajo (y, opcionalmente, en el filtro 302 de paso bajo) . Las Figuras 6a y 6b muestran un espectro de la señal de ejemplo que ilustra el efecto del proceso posterior descrito en la Figura 3. La Figura 6 a es el espectro de la señal 112 de entrada del post-procesador 108 de la Figura 1 ( señal de voz descodificada 112 en la Figura 3) . En este ejemplo ilustrativa, la señal de entrada se compone de 20 armónicas, con frecuencia fundamental fo = 373 Hz, seleccionados arbitrariamente, con los componentes "ruidosos" en las frecuencias f0/2, 3f0/2 y 5f0/2. Estos tres componentes ruidosos pueden ser vistos entre las armónicas de frecuencia baja en la Figura 6 a. La frecuencia de muestreo se supone será de 16 kHz en este ejemplo. El aumentador de espaciamiento de dos bandas, mostrado en la Figura 3 y descrito anteriormente, es luego aplicado a la señal de la Figura 6a. Con una frecuencia de muestreo de 16 kHz y una señal periódica de la frecuencia fundamental igual a 373 Hz, como en la Figura 6a, el módulo 303 de pista de espaciamiento debe encontrar un periodo de T = 16000/373 ~43 muestras. Este es el valor que se usó para el filtro aumentador de espaciamiento de la Ecuación (1) aplicado al aumentador 304 de espaciamiento de la Figura 3. Un valor de a = 0.5 también se usó. Los filtros de paso bajo 305 y paso alto 302 ..son simétricos, los filtros de fase lineal FIR con 31 derivaciones. La frecuencia recortada para este ejemplo es escogida como de 2000 Hz. Estos valores específicos son dados solamente como un ejemplo ilustrativo. La señal de voz descodificada post-procesada, 113, en la salida del sumador 306 tiene el espectro mostrado en la Figura' 6b. Se puede ver que las tres ondas sinusoidales inter-armónicas en la Figura 6 a, se han removido completamente, mientras las armónicas de la señal prácticamente no se alteran. Igualmente, se notará que el efecto del aumentador de espaciamiento disminuye conforme la frecuencia se acerca a la frecuencia de recorte del filtro de paso bajo (2000 Hz en este ejemplo) . Asi, solamente la banda inferior se afecta por el post-proceso . Esta es una característica clave de la modalidad ilustrativa de la presente invención. Variando las frecuencias de recorte del filtro de paso bajo opcional, 302, el filtro de paso bajo 305 y el filtro de paso alto 301, es posible controlar hasta cuál aumento de espaciamiento de frecuencia se aplica.
Aplicación al descodificador de voz de AM-WB La presente invención puede ser aplicada a cualquier señal de voz sintetizada por un descodificador de voz, o aún a cualquier señal de voz que se ha corrompido por el ruido ' armónico que necesita ser reducido. Esta sección mostrará una realización ejemplar específica de la presente invención, a una señal de voz descodificada de AMR-WB. El post-proceso se aplica a las señal 712 de voz sintetizada de banda baja de la Figura 7, es decir, a la salida del descodificador 702 de voz, que produce una voz sintetizada en una frecuencia de muestreo de 12.8 kHz. La Figura 4 muestra el diagrama de bloques de un post-proc'esador de espaciamiento, cuando la señal de entrada es la señal de voz sintetizada de banda baja de AMR-WB en la frecuencia de muestreo de 12.8 kHz.' Más precisamente, el post-procesador presentado en la Figura 4 reemplaza la unidad 703 de muestreo ascendente, que comprende los procesadores 704, 805 y 706. Este post-procesador de espaciamiento de la Figura 4 también estaré aplicado a la señal de voz sintetizada muestra más completamente de 16 kHz, pero; se aplica antes que el muestreo ascendente reduzca el número de operaciones de filtración en el codificador, y reduzca asi su complejidad. La señal de entrada (voz sintetizada de banda baja de AMR-WB (12.8 kHz)) de la Figura 4 es diseñada como la señal s. En este ejemplo especifico, la señal s es la señal de voz sintetizada de banda baja de 7AMR-WB en la frecuencia de muestreo de 12.8 kHz (salida del procesador 702) . El post-procesador de espaciamiento de la Figura 4 comprende un módulo de pista de espaciamiento 401, para determinar para cada marco de 5 milisegundos, el retardo T de espaciamiento que usa los parámetros descodificados recibidos 114 (Figura 1) y la' señal s de voz sintetizada. Los parámetros descodificados usados por el módulo de pista de espaciamiento son T0, el valor de espaciamiento entero para el sub-marco y To_frac el valor de espaciamiento fraccionar para la resolución de la sub-muestra. El retardo T de espaciamiento, calculado en el módulo 401 de pista de espaciamiento, será usado en las siguientes etapas para el aumento de espaciamiento . Sería posible usar directamente los parámetros de espaciamiento descodificados, recibidos, To y 0 frac para formar el retardo T usado por el aumentador de espaciamiento en el filtro 402 de espaciamiento. Sin embargo, el módulo 401 de pista de espaciamiento es capaz de corregir múltiplos o submúltiplos del espaciamiento, lo cual puede tener un efecto perjudicial en el aumento dele espaciamiento . Una modalidad ilustrativa del algoritmo de pista de espaciamiento para el módulo 401 es el siguiente (el umbral específico y los valores de pista del espaciamiento sondados solamente en forma de e emplo) .
Primero, la información de espaciamiento descodificada i (retardo T0 de espaciamiento) se compara a un valor almacenado del retardo T_prev del espaciamiento descodificado del marco previo. El T_prev puede haber sido modificado por algunas de las siguientes etapas, de acuerdo con el algoritmo de pista del espaciamiento. Por ejemplo, si T0 < 1.15*T_prev, entonces va al caso 1 siguiente, también si T0 > 1.16*T prev, entonces se ajusta a T temp = T0 y va al siguiente caso 2.
Caso 1 : Primero, calcular la correlación cruzada C2 (producto cruzado entre el submarco sintetizado y la señal de síntesis que parte de las muestras T0/2, antes del inicio del último sub-marco (libro de correlación en la mitad del valor de espaciamiento descodificado) .
Luego, calcular la correlación cruzada C3 (producto cruzado) entre el último sub-marco sintetizado y la señal de síntesis que comienza en las muestras T0/3 antes de comenzar el último sub-marco (observar en correlación a un tercio del valor de espaciamiento descodificado) .
Luego, seleccionar el valor máximo entre C2 y C3 y calcular la correlación normalizada Cn (versión normalizada de C2 y C3) en el sub-múltipio correspondiente de T0 (en T0/2 si C2 > C3 y en T0/3 si C3 > C2) . Llamar T_new el sub-múltiplo de espaciamiento que corresponde a la correlación normalizada más alta.
Si Cn > 0.95 (correlación normalizada fuerte) , el nuevo período de espaciamiento es Tnew (en lugar de T0) . La salida del valor T = T_new desde el módulo 401 de pista de espaciamiento. Conservar T_prev = T para la siguiente pista de espaciamiento de submarco y salir el módulo 401 de pista de espaciamiento.
Si 0.7 < Cn < 0.95, entonces conservar T_temp = T0 ¡i o t0/3 (de acuerdo con C2 o C3 anterior) para comparaciones en el caso 2 siguiente. De otra manera, si Cn < 0.7, conservar T_temp = T0.
Calcular todos los valores posibles de la relación Tn = [T_temp/n] , donde [x] significa la parte entera de x y n = 1, 2, 3, etc. es un entero.
Calcular todas las correlaciones cruzadas Cn en los submúltiplos de retardo de espaciamiento Tn. Retener Cn_max como la correlación cruzada máxima entre todos los Cn. Si n > 1 y Cn > 0.8, la salida Tn como la salida T del periodo de espaciamiento de la unidad de pista de espaciamiento 401. De otra manera, la salida TI = 5 T_temp. Aquí, el valor de T_temp dependerá de los cálculos en el Caso 1 anterior.
Se debe notar que el ejemplo anterior del módulo 401 de pista de espaciamiento se a para el propósito de ilustración solamente. Cualquier otro método de pista de espaciamiento o dispositivo puede ser realizado en el módulo ti 401 (o ,303 y 502) para asegurar una mejor pista de espaciamiento en el descodificador . Por lo tanto, la salida del módulo de pista de espaciamiento es el período T que se va a usar en el filtro de espaciamiento 402, el cual, en esta modalidad preferida, se describe por el filtro de la Ecuación (1) . De nuevo, un valor de ;o = 0 implica que no hay filtración (la salida del filtro 402 de espaciamiento es igual a su entrada) y un valor de a = 1 corresponde a la cantidad más alta del aumento del espaciamiento. Una vez que la señal aumentada SE (Figura 4) se determina^ se combina con la señal s de entrada, de modo que, como- en la Figura 3, sólo la banda inferior se someta a la mejora' de espaciamiento. En la Figura 4, un acercamiento modificado se usa, comparado con la Figura 3. Puesto que el post-procesador de espaciamiento de la Figura 4 reemplaza la unidad 703 de muestreo ascendente en la Figura 7 , los filtros de sub-banda, , 301 y 305 , de la Figura 3 se combinan i).. con el fjiltro 705 de interpolación de la Figura 7 para minimizar'.; el número de operaciones de filtración, y el retardo de filtración. Más específicamente, los filtros 404 y 407 de la Figura 4 actúan ambos como filtros de paso de banda (para separar las bandas de frecuencia) y como filtros de interpolación para el muestreo ascendente de 12 . 8 a 16 kHz) . Estos filtros, 404 y 407 , pueden ser designados además de modo ; que el filtro 407 de paso de banda tenga restricci Iones reducidas en su banda de detención de baja frecuencia (es decir, no tiene que atenuar completamente la señal en las frecuencias bajas) Esto pudiera lograrse usando restricciones de diseño similares a aquéllas mostradas en la Figura 9 . La Figura 9 a es un ejemplo de la respuesta de frecuencia para el filtro 404 de paso bajo. Se debe notar que la ganancia de Corriente Continua (DC) de este filtro es de 5 (en i lugar de 1 ) , puesto que este filtro también actúa como filtro de interpolación, con una relación de interpolación de 5/ 4 , que implica que la ganancia de filtro deba ser de 5 a 0 Hz . Luego, la Figura 9b muestra la respuesta; de frecuencia del filtro 407 de paso de banda, que %¦'- 'í'* hace al 'filtro 407 complementario en la banda baja, al filtro 404 de paso bajo. En este ejemplo, el filtro 407 es un filtro! de paso de banda, no un filtro de paso alto, tal como el filtro 301, puesto que debe actuar tanto como un filtro de paso alto (tal como el filtro 301) y un filtro de paso bajo (tal como el filtro de interpolación 705) . Haciendo de nuevo referencia a la Figura 9, vemos que los filtros de paso bajo y de paso de banda, 404 y 407, son complementarios, cuando se consideran en paralelo, como en la Figura 4. Sus respuestas de frecuencia combinadas (cuando se usan en paralelo) se muestran en la Figura 9c. Para la forma complementaria, , las tablas de los coeficientes de filtro usados en esta modalidad ilustrativa de los filtros 404 y 407, se proporcionan en seguida. Por supuesto,^ estas tablas de coeficientes de filtros se proporcionan en forma de ejemplo únicamente. Se debe entender que estos filtros pueden ser reemplazados sin modificar el ámbito, espíritu y naturaleza de la presente invención. j 'fi Tabla 1 - Coeficientes de paso baio del filtro 404 hlp[0] 0.04375000000000 hlp[30] 0.01998000000000 hlp[ 1] 0.04371500000000 h!p[3l] 0.01882400000000 hlp[2] 0.04361200000000 hlp[32] 0.01768200000000 h!p[3] 0.04344000000000 - h¡p[33] 0.01655700000000 tabla 2 - Coeficientes de paso de banda del filtro 407 • bp[60] -0.00001800000000 La salida del filtro 402 de espaciamiento de la Figura 4 se llama SE. Será recombinada con la señal del ramal superior, Ella es primero muestreada más completamente por el procesador 403, el filtro 404 de paso bajo y el procesador 405, y agregado a través de un sumador 409 a la señal 410 del ramal superior muestreado más completamente. La operación de muestreo ascendente en el ramal superior se realiza por el procesador 406, el filtro de paso de banda 407 y el procesador 408.
Forma de realización alternativa del aumentador de espaciamiento propuesto La Figura 5 muestra una forma de realización alternativa de un aumentador de espaciamiento de dos bandas, de acuerdo con una modalidad ilustrativa de la presente invención. Se debe notar que el ramal superior de la Figura 5 no procesa la señal de entrada del todo. Esto significa que, en este caso particular, los filtros en el ramal superior de la Figura 2 (filtros adaptadores 201a y 201b) tienen características triviales de entrada-salida (la salida es igual a la entrada) . En el ramal inferior, la señal de entrada (señal que se va a aumentar) se procesa primero a través de un filtro 501 de paso bajo opcional, luego a través de un filtro lineal denominado filtro interarmónico -503, definido por la siguiente ecuación: y[n x[n]-^{x[n-T]+x[n^ Se debe notar el signo negativo enfrente del segundo término en el costado derecho, comparado con la Ecuación (1). Debe también notarse que el factor a de aumento no se incluye en la Ecuación (2), sino más bien se introduce por medio de una ganancia adaptadora por el procesador 504 de la Figura 5. El filtro 503 inter-armónico, descrito en la Ecuación (2) tiene una respuesta de frecuencia tal que remueve completamente las amónicas de una señal periódica que tiene un periodo de T muestras, y tal que una onda sinusoide en una frecuencia exactamente entre las armónicas pasa a través del filtro sin cambiar en amplitud, pero con una fase inversa de exactamente 180 grados (los mismos como una inversión de signo) Por ejemplo, la Figura 10 muestra la respuesta de frecuencia del filtro, descrita por la Ecuación (2) cuando el periodo es (arbitrariamente) escogido en T = 10 muestras. Una señal periódica con un periodo de T = 10 muestras, presentará amónicas en frecuencias normalizadas de 0.2, 0.4, 0.6, etc. y la Figura 10 muestra que el filtro de la ? Ecuación (2), con T = 10 muestras, moverá completamente estas armónicas. Por otra parte, las frecuencias en el punto medio exacto, entre las armónicas, aparecerán en la salida del filtro con la misma amplitud pero con un desplazamiento de fase de 180 grados. Esta es la razón del por qué el filtro descrito por la Ecuación (2) y usado como el filtro 603 se denomina el filtro inter-armónico . El valor T de espaciamiento para uso en el filtro 503 inter-armónico se obtiene en forma adaptable por el módulo 502 de pista de espaciamiento. El módulo 502 de pista de espaciamiento opera en la señal de voz descodificada y los parámetros descodificados, similarmente a los métodos previamente descritos, como se muestran en las Figuras 3 y 4. Luego, la salida 507 el filtro 503 inter-armónico es una señal formada esencialmente de la porción inter-armónica de la señal 112 descodificada de entada, con un desplazamiento de fase de 180 gados en el punto medio entre las armónicas de la señal. Luego, la salida 507 del filtro 503 inter-armónico se multiplica por una ganancia oc (procesador 504) y subsiguientemente filtrado de paso bajo (filtro 505) para obtener la modificación de la banda de frecuencia baja, que se aplica a la señal 112 de voz descodificada de entrada de la Figura 5, para obtener la señal descodificada post-procesada (señal aumentada) 509. El coeficiente a en el procesador 504 controla la cantidad del 36 espaciamiento o aumento inter-armónico . Cuanto más cercano a 1 sea, mayor será el aumento. Cuando a es igual a 0, ningún aumento se obtiene, es decir, la salida del sumador 506 es exactamente igual a la señal de entrada (voz descodificada en la Figura 5) . El valor de puede ser calculado usando varios acercamientos. Por ejemplo, la correlación de espaciamiento normalizada, la cual es bien conocida por los expertos ordinarios en la materia, puede ser usada para controlar el coeficiente a: cuanto mayor sea la correlación de espaciamiento normalizada (más cercano a 1) mayor será el valor de a. La señal de voz descodificada final, , procesada posteriormente, 509, se obtiene agregando a través de un sumador 508 la salida del filtro 505 de paso bajo a la señal de entrada (señal 112 de voz descodificada de la Figura 5)., Dependiendo de la frecuencia de recorte del filtro 505 de paso bajo, el impacto de este procesamiento posterior será limitado a las frecuencias bajas de la señal 112 de entrada, hasta una frecuencia dada. Las frecuencias mayores serán efectivamente no afectadas por el proceso posterior. Alternativa de una banda, que usa un filtro de paso alto adaptable Al menos una alternativa para llevar a cabo el proceso posterior de sub-banda, para aumentar la señal de síntesis a frecuencias bajas, es usar un filtro de paso alto, adaptable, cuya frecuencia recortada es variada, de acuerdo con el valor de espaciamiento de la señal de entrada. Específicamente, y sin referirse a cualquier dibujo, la mejora de la frecuencia baja, que usa esta modalidad ilustrativa, será realizada, en cada marco de señal de entrada, de acuerdo con las siguientes etapas: 1 Determinar el valor de la señal de entrada (período de señal) usando la señal de entrada y posiblemente los parámetros descodificados (salida del descodificador 105 de voz) si se procesa posteriormente una señal de voz descodificada; esto es una operación similar como la operación de pista de espaciamiento de los módulos 303, 401 y 502. 2 Calcular los coeficientes de un filtro de paso alto, de modo que la frecuencia de recorte sea baja, pero cercana a, la frecuencia fundamental de la señal de entrada; alternativamente, interpolar entre los filtros de paso alto, almacenados, calculados previamente, de las frecuencias de recorte conocidas (la interpolación puede ser hecha en el dominio de derivaciones del filtro, o en el dominio del polo, cero, o en algún otro dominio transformado, tal como de Frecuencias Espectrales de Línea (LSF) del dominio de Frecuencias Espectrales de Imitancia (ISF) ) . 3 Filtrar el marco de señal de entrada con el filtro de paso alto calculado, para obtener la señal procesada posteriormente para ese marco. Se debe señalar que la presente modalidad ilustrativa de la invención es equivalente a usar sólo un ramal de proceso en la Figura 2, y para definir el filtro adaptable de ese ramal como un filtro de paso alto controlado en espaciamiento . El proceso posterior logrado con este acercamiento sólo afectará el intervalo de frecuencia debajo de la primera armónica y no la energía inter-armónica arriba de la primera armónica. Aunque la invención se describió anteriormente con referencia a sus modalidades ilustrativas, estas modalidades se pueden modificar, dentro del ámbito de las cláusulas anexas, sin apartarse del espíritu y naturaleza de la invención. Por ejemplo, aunque se describieron modalidades ilustrativas en relación a una señal de voz descodificada, los expertos apreciarán que los conceptos de la invención se pueden aplicar a otros tipos de señales descodificadas, en particular, aunque no exclusivamente, a otros tipos de señales de sonidos descodificadas.

Claims (63)

REIVINDICACIONES
1. Un método para el proceso posterior de una señal de sonido descodificada, con el fin de aumentar la calidad percibida de dicha señal de sonido descodificada, este método comprende: 1 dividir la señal de sonido descodificada en una pluralidad de señales de sub-bahda de frecuencia; y aplicar el proceso posterior a cuando menos una de las señales de sub-banda de frecuencia, pero no a todas las señales de sub-banda de frecuencia.
2. Un método de proceso posterior, según se define en la reivindicación 1, que " además comprende sumar las señales de sub-banda de frecuencia, después del proceso posterior de dicha al menos una señal de sub-banda de frecuencia, para producir una señal de sonido descodificada de salida, procesada posteriormente.
3. Un método de proc-eso posterior, según se define en la reivindicación 1, en que la aplicación del proceso posterior a cuando menos una de las señales de sub-banda de frecuencia comprende filtrar, en forma adaptable, al menos una señal' de sub-banda de frecuencia.
4. Un método de proceso posterior, según se define en la reivindicación 1, en que la división de la señal de sonido descodificada en una pluralidad de señales de sub-bandas de frecuencia, comprende filtrar en la sub-banda la señal de sonido descodificada, para producir la pluralidad de señales de sub-banda de frecuencia.
5. Un método de proceso posterior, según se define en la reivindicación 1, en que para dicha al menos una de las señales de sub-banda de frecuencia: la aplicación del proceso posterior comprende filtrar, en forma adaptable, la señal de sonido descodificada; y la división de la señal de sonido descodificada comprende filtrar en la sub-banda la señal de sonido descodificada, filtrada en forma adaptable.
6. Un método de proceso posterior, según se define en la reivindicación 1, en que: la división de la señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia comprende: la filtración . de paso alto de la señal de sonido descodificada, para producir una señal de banda alta de frecuencia; y la filtración de paso bajo de la señal de sonido descodificada, para producir una señal de anda baja de frecuencia; y la aplicación del proceso posterior a cuando menos una de las señales de sub-banda de frecuencia comprende: aplicar el proceso posterior a la señal de sonido descodificada, antes de la filtración de paso bajo de la señal de sonido descodificada, para producir la señal de banda baja de frecuencia.
7. Un método de proceso posterior, según se define en la reivindicación 6, en que la aplicación del proceso posterior a la señal de sonido descodificada comprende aumentar el espaciamiento o paso de dicha señal de sonido descodificada, para reducir el ruido inter-armónico en la señal de sonido descodificada.
8. Un método de proceso posterior, según se define en la reivindicación 7, que además comprende la filtración de paso bajo de la señal de sonido descodificada, antes de aumentar el espaciamiento de dicha señal de sonido descodificada .
[9. Un método de proceso posterior, según se define en la reivindicación 6, que además comprende sumar las señales de banda alta y de banda baja de la frecuencia, para producir una señal de sonido descodificada de salida, procesada posteriormente.
.10. Un método de proceso posterior, según se define en, la reivindicación 1, en que: la división de la señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia comprende : la filtración de paso de banda de la señal de sonido descodificada, para producir una señal de banda superior de frecuencia; y -la filtración de paso bajo de la señal de sonido descodificada, para producir una señal de banda inferior de frecuencia; y la aplicación del proceso posterior a cuando menos una de las señales de las sub-bandas de frecuencia comprende : la aplicación del proceso posterior a la señal de banda inferior de frecuencia.
11. Un método de proceso posterior, según se define en la reivindicación 10, en que la aplicación del proceso posterior a la señal de banda inferior de frecuencia comprende aumentar el espaciamientp de dicha señal de banda inferior de frecuencia, antes de la filtración de paso bajo de la señal de sonido descodificada.
12. Un método de proceso posterior, según se define en la reivindicación 10, que además comprende sumar las señales de la banda superior y de la banda inferior de frecuencia, para producir una señal de sonido descodificada de salida, procesada posteriormente.
13. Un método de proceso posterior, según se define en la reivindicación 1, en que: la división de la señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia comprende : la filtración de paso bajo de la señal de sonido descodificada, para producir una señal de banda baja de frecuencia; y la aplicación del proceso posterior a cuando menos una de las señales de sub-banda de frecuencia comprende: la aplicación del proceso posterior a la señal de banda baja' de frecuencia.
14. Un método de proceso posterior, según se define en la reivindicación 13, en que la aplicación del proceso posterior a la señal de banda baja de frecuencia comprende procesar la señal de .'sonido descodificada a través de un filtro inter-armónico, para la atenuación interarmónica de la señal de sonido descodificada.
15. Un método de proceso posterior, según se define en la reivindicación 14, en que la aplicación del proceso posterior a la señal de banda baja de frecuencia comprende multiplicar la señal de sonido descodificada filtrada, inter-armónica por una ganancia de aumento del espaciamiento .
16. Un método de proceso posterior, según se define en la reivindicación 14, que comprende la filtración de paso bajo de la señal de sonido descodificada, antes de procesar esta señal de sonido descodificada a través del filtro inter-armónico.
17. Un método de proceso posterior, según se define en la reivindicación 13, que además comprende sumar la señal 'de sonido descodificada y la señal de banda baja de frecuencia, para producir una señal de sonido descodificada de salida, procesada posteriormente.
"18. Un método de proceso posterior, según se define en la reivindicación 13, en que la aplicación del proceso posterior a la señal de banda baja de frecuencia comprende procesar la señal de sonido descodificada a través de un filtro inter-armónico, que tiene la siguiente función de transferencia: y[n lx[n]- {x[n-T}+x[n+T} para la atenuación inter-armónica de la señal de sonido descodificada, donde x[n] es la señal de sonido descodificada, y[n] es la señal de sonido descodificada filtrada, inter-armónica, en una sub-banda dada, y T es el retardo del espaciamiento de la señal de sonido descodificada .
19. Un método de proceso posterior, según se define en la reivindicación 18, que además comprende suma la señal de sonido descodificada sin procesar y la señal de banda baja de frecuencia filtrada, inter-armónica, para producir una señal de sonido descodificada de salida, procesada posteriormente.
20. Un método de proceso posterior, según se define en la reivindicación 1, en que la aplicación del proceso posterior a cuando menos una de las señales de sub.-bandas de frecuencia comprende aumentar el espaciamiento de la señal de sonido descodificada, usando la siguiente ecuación: donde x[n] es la señal de sonido descodificada, y[n] es la señal de sonido descodificada filtrada, inter-armónica, en una sub-banda dada, y T es el retardo del espaciamiento de la señal de sonido descodificada, y a es un coeficiente que varia entre 0 y 1, para controlar la cantidad de atenuación inter-armónica de la señal de sonido descodificada.
21. Un método de proceso posterior, según se define en la reivindicación 20, que comprende recibir el retardo T de espaciamiento a través de una corriente de bits.
22. Un método de proceso posterior, según se define en la reivindicación 20, que comprende descodificar el retardo T de espaciamiento desde una corriente de bits codificada, recibida.
¦ 23. Un método de proceso posterior, según se define en la reivindicación 20, que comprende calcular el retardo T de espaciamiento, en respuesta a la señal de sonido descodificada para una pista mejorada de espaciamiento.
;24. Un método de proceso posterior, según se define en la reivindicación 1, en que, durante la codificación, la señal de sonido es muestreada en forma descendente desde una frecuencia de muestreo mayor a una 5 frecuencia de muestreo menor, y en que la división de la señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia comprende el muestreo ascendente de la señal de sonido descodificada desde la frecuencia de muestreo menor a la frecuencia de muestreo mayor.
·T 25. Un método de proceso posterior, según se define en la reivindicación 24, en que la división de la señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia, comprende la filtración de sub- banda de. la señal de sonido descodificada y en que el 5 muestreo ascendente de la señal de sonido descodificada desde la frecuencia de muestreo menor a la frecuencia de muestreo mayor, son combinados medio de la filtración de sub-banda .
26. Un método de proceso posterior, según se 0 define en la reivindicación 24, este método comprende: la filtración de paso de banda de la señal de sonido descodificada, para producir una señal de banda superior de frecuencia, dicha filtración de paso de banda de la señal de sonido descodificada se combina con el muestro más completo de la señal de sonido descodificada desde la frecuencia de muestreo menor a la frecuencia de muestreo mayor; y el proceso posterior de la señal de sonido descodificada y la filtración de paso bajo de la señal de sonido descodificada procesada posteriormente, para producir una señal de banda inferior de frecuencia, dicha filtración de paso bajo de la señal de sonido descodificada procesada posteriormente se combina con el muestreo ascendente de la señal de sonido descodificada procesada posteriormente desde la frecuencia de muestreo menor a la frecuencia de muestreo mayor.
27. Un método de proceso posterior, según se define en la reivindicación 26, que además comprende agregar la señal de banda superior de frecuencia con la señal de banda inferior de frecuencia, para formar una señal de sonido descodificada de salida procesada posteriormente y muestreada en forma completa.
28. Un método de proceso posterior, según se define en la reivindicación 26, en que el proceso posterior de la señal de sonido descodificada comprende aumentar el espaciamiento de la señal de sonido descodificada, para reducir el ruido inter-armónico en la señal de sonido descodificada.
29. método de proceso posterior, según se define en la reivindicación 28, en que el aumento de espaciamiento de la señal de sonido descodificada comprende el proceso de la señal de sonido descodificada por medio de la siguiente ecuación: donde x[n] es la señal de sonido descodificada, y[n] es la señal de sonido descodificada aumentada en el espaciamiento, T es el retardo del espaciamiento de la señal de sonido descodificada, y a es un coeficiente que varia entre 0 y 1, para controlar la cantidad de atenuación inter-armónica de la señal de sonido descodificada.
30. Un método de proceso posterior, según se define en la reivindicación 1, en que: la división de la señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia, comprende dividir la señal de sonido descodificada en una señal de banda superior de frecuencia y una señal de banda inferior de frecuencia; y la aplicación del proceso posterior a cuando menos una de las señales de sub-bandas de frecuencia, comprende el proceso posterior de dicha señal de ' banda menor de frecuencia .
31. Un método de proceso posterior, según se define en la reivindicación 1, en que la aplicación del proceso posterior a dcha. al menos una de las señales de sub-banda de frecuencia comprende: determinar un valor de espaciamiento de la señal de sonido descodificada; calcular, en relación con el valor de espaciamiento determinado, un filtro de paso alto con una frecuencia de recorte debajo de una frecuencia fundamental de la señal de sonido descodificada; y procesar la señal de sonido descodificada a través del filtro de paso alto calculado.
32. Un dispositivo para el proceso posterior de una señal de sonido descodificada, con el fin de aumentar la calidad percibida de dicha señal de sonido descodificada, este dispositivo comprende: un elemento para dividir la señal de sonido descodificada en una pluralidad de señales de sub-banda de frecuencia; y un elemento para el proceso posterior de al menos una de las señales de sub-banda de frecuencia, pero no todas las señales de sub-banda de frecuencia.
,33. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, que además comprende un elemento sumador, para sumar las señales de sub-banda de frecuencia, después del proceso posterior de dicha al menos una señal de sub-banda de frecuencia, para producir una señal de sonido descodificada de salida, procesada posteriormente.
¦34. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que el elemento de proceso posterior comprende elementos de filtro adaptables, suministrados a la señal de sonido descodi ficada .
35. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que el elemento de división comprende un elemento de filtro de sub-banda, suministrado con la señal de sonido descodificada.
36. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que para dicha al menos una de las señales de sub-banda de frecuencia: ¦el elemento de proceso posterior comprende un filtro adaptable, suministrado con la señal de sonido descodificada, para producir una señal de sonido descodificada filtrada adaptablemente; y el elemento de división comprende un filtro de sub-banda, suministrado con la señal de sonido descodificada filtrada adaptablemente.
.37. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que: el elemento de división comprende: un filtro de paso alto, suministrado con la señal de sonido descodificada, para producir una señal de banda alta; de frecuencia; y - un filtro de paso bajo, suministrado con la señal de sonido descodificada, para producir una señal de banda baja de frecuencia; y el elemento de proceso posterior comprende: un procesador posterior, para el proceso posterior de la señal de sonido descodificada antes que el paso bajo filtre la señal de sonido descodificada a través del filtro de paso bajo.
38. Un dispositivo para el proceso posterior, según se define en la reivindicación 37, en que el procesador posterior comprende un aumentador de espaciamiento, suministrado con la señal de sonido descodificada, para producir una señal de sonido descodificada aumentada en espaciamiento.
39. Un dispositivo para el proceso posterior, según se define en la reivindicación 38, que además comprende un filtro de paso bajo, suministrado con la señal de sonido descodificada, para producir una señal de sonido descodifipada filtrada de paso bajo, suministrada al aumentador de espaciamiento.
40. Un dispositivo para el proceso posterior, según se define en la reivindicación 37, que además comprende un sumador para sumar las señales de banda alta y de banda baja de frecuencia, y producir una señal de sonido descodificada de salida, procesada posteriormente.
41. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que: el elemento de división comprende: un filtro de paso de banda, suministrado con la señal de sonido descodificada, para producir una señal de banda superior de frecuencia; y un filtro de paso bajo, suministrado con la señal de sonido descodificada, para producir una señal de banda inferior de frecuencia; y el elemento de proceso posterior comprende: un procesador posterior para el proceso posterior de la señal de banda inferior de frecuencia.
42. Un dispositivo para el proceso posterior, según se define en la reivindicación 41, en que el procesador posterior comprende un filtro de espaciamiento, suministrado con la señal de sonido descodificada, para producir una señal de sonido descodificada aumentada en espaciamiento, suministrada al filtro de paso bajo.
43. Un dispositivo para el proceso posterior, según se define en la reivindicación 41, que además comprende un sumador, para sumar las señales de banda superior y de banda inferior de frecuencia, para producir una señal de sonido descodificada de salida, procesada posteriormente.
44. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que: el elemento de división comprende: un filtro de paso bajo, suministrado con la señal de sonido descodificada, , para producir una señal de banda baja de frecuencia; y el elemento de proceso posterior comprende: - un procesador posterior, para el proceso posterior de la señal de sonido descodificada, para producir una señal de sonido descodificada procesada posteriormente, suministrada al filtro de paso bajo.
45. Un dispositivo para el proceso posterior, según se define en la reivindicación 44, en que el procesador posterior comprende un filtro inter-armónico, suministrado con la señal de sonido descodificada, para producir una señal de sonido descodificada atenuada, inter-armónica.
46. Un dispositivo para el proceso posterior, según se define en la reivindicación 45, en que el procesador posterior comprende un multiplicador, para multiplicar la señal de sonido descodificada atenuada, inter-armónica, por una ganancia de aumento de espaciamiento adaptable.
47. Un dispositivo para el proceso posterior, según se define en la reivindicación 45, que además comprende un filtro de paso bajo, suministrado con la señal de sonido descodificada la señal de sonido descodificada, para producir una señal de sonido descodificada filtrada de paso bajo, suministrada al filtro inter-armónico .
48. Un dispositivo para el proceso posterior, según se define en la reivindicación 44, que además comprende un sumador, para sumar la señal de sonido descodificada y la señal de banda ba a de frecuencia, y producir una señal de sonido descodificada de salida, procesada posteriormente.
49. Un dispositivo para el proceso posterior, según se define en la reivindicación 44, en que el procesador posterior comprende un filtro inter-armónico, que tiene la siguiente función de transferencia: y[n lx[n]-±{x[n-T)4-X[n+Ti para la atenuación inter-armónica de la señal de sonido descodificada, donde x[n] es la señal de sonido descodificada, y[n] es la señal de sonido descodificada filtrada, inter-armónica, en una sub-banda dada, y T es el retardo del espaciamiento de la señal de sonido descodificada.
50. Un dispositivo para el proceso posterior, según se define en la reivindicación 49, que además comprende un sumador, para sumar la señal de sonido descodificada no procesada y la señal de banda baja de frecuencia, filtrada, inter-armónica, para producir una señal de sonido descodificada de salida, procesada posteriormente.
51. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que el elemento de proceso posterior comprende un aumentador de espaciamiento de la señal de sonido descodificada, que usa la siguiente ecuación: donde x[n] es la señal de sonido descodificada, y[n] es la señal de sonido descodificada aumentada en espaciamiento en una sub-banda dada, T es el retardo del espaciamiento de la señal de sonido descodificada, y a es un coeficiente que varia entre 0 y 1, para controlar la cantidad de atenuación inter-armónica de la señal de sonido descodificada.
52. Un dispositivo para el proceso posterior, según se define en la reivindicación 51, que comprende un elemento para recibir el retardo T de espaciamiento a través de una corriente de bits.
53. Un dispositivo para el proceso posterior, según se define en la reivindicación 51, que comprende un elemento para descodificar el retardo T de espaciamiento desde una corriente de bits codificada, recibida.
54. Un dispositivo para el proceso posterior, según se define en la reivindicación 51, que comprende un elemento para calcular el retardo T de espaciamiento, en respuesta a la señal de sonido descodificada para una pista de espaciamiento mejorada.
55. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que, durante la codificación, la señal de sonido es muestreada en forma descendente desde una frecuencia de muestreo mayor a una frecuencia de muestreo menor, y en que el elemento de división comprende elementos para el muestreo ascendente de la señal de sonido descodificada desde la frecuencia de muestreo menor a la frecuencia de muestreo mayor.
56. Un dispositivo .para el proceso posterior, según se define en la reivindicación 55, en que el elemento de división comprende un elemento de filtro de sub-banda, con la señal de sonido descodificada y en que el elemento de muestreo ascendente se combina con el elemento de filtro de sub-banda.
57. Un dispositivo para el proceso posterior, según se define en la reivindicación 55, en que: el elemento de proceso posterior comprende; .elementos para el proceso posterior de la señal de sonido descodificada; y el elemento de división comprende: un filtro de paso de banda, suministrado con la señal de sonido descodificada, para producir una señal de banda superior de frecuencia, dicho filtro de paso de banda se combina con el elemento de muestreo ascendente; y un filtro de paso bajo, suministrado con la señal de sonido descodificada procesada posteriormente, para producir una señal de banda inferior de frecuencia, dicho filtro de paso bajo se combina con el elemento de muestreo ascendente.
;58. Un dispositivo ¡para el proceso posterior, según se define en la reivindicación 57, que además comprende un sumador, para sumar la señal de banda superior de frecuencia con la señal de banda inferior de frecuencia y formar una señal de sonido descodificada de salida procesada posteriormente y muestreada en forma ascendente.
59. Un dispositivo para el proceso posterior, según se define en la reivindicación 57, en que el elemento para el proceso posterior de la señal de sonido descodificada comprende elementos para aumentar el espaciamiento de la señal de sonido descodificada para reducir un ruido inter-armónico en la señal de sonido descodificada.
60. Un dispositivo para el proceso posterior, según se define en la reivindicación 59, en que el elemento que aumenta el espaciamiento comprende elementos para el proceso de la señal de sonido .descodificada por medio de la siguiente ecuación: donde x[n] es la señal de sonido descodificada, y[n] es la señal de sonido descodificada aumentada en espaciamiento, en una sub-banda dada, y T es el 'retardo del espaciamiento de la señal de sonido descodificada, y oc es un coeficiente que varia entre 0 y 1, para controlar la cantidad de atenuación inter-armónica de la señal de sonido descodificada.
61. Un dispositivo para el proceso posterior, según se define en la reivindicación 32, en que: el elemento de división comprende elementos para dividir la señal de sonido descodificada en una señal de banda superior de frecuencia y una señal de banda inferior de frecuencia; y ' el elemento del proceso posterior comprende elementos para el proceso posterior de la señal de banda inferior de frecuencia.
62. Un dispositivo .para el proceso posterior, según se define en la reivindicación 32, el elemento del proceso posterior comprende: elementos para determinar un valor de espaciamiento de la señal de sonido descodificada; elementos para calcular, en relación al valor de espaciamiento determinado, un filtro de paso alto con una frecuencia de recorte debajo de una frecuencia fundamental de la señal de sonido descodificada; y elementos para procesar la señal de sonido descodificada a través del filtro de paso alto calculado.
63. Un descodificador de señales de sonido, el cual comprende : una entrada, para recibir una señal de sonido codificada; un descodificador de parámetros, suministrado con la señal de sonido descodificada, para decodificar los parámetros que codifican la señal de sonido; un descodificador de la señal de sonido, suministrada con los parámetros que codifican la señal de sonido descodificada, para producir una señal de sonido descodificada; y un dispositivo de proceso posterior, según se especifica en cualquiera de las reivindicaciones 32 a 62, para el proceso posterior de la señal de sonido descodificada, con el fin de aumentar la calidad percibida de dicha la señal de sonido descodificada.
MXPA04011845A 2002-05-31 2003-05-30 Metodo y dispositivo para aumentar el espaciamiento selectivo de la frecuencia de la voz sintetizada. MXPA04011845A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA002388352A CA2388352A1 (en) 2002-05-31 2002-05-31 A method and device for frequency-selective pitch enhancement of synthesized speed
PCT/CA2003/000828 WO2003102923A2 (en) 2002-05-31 2003-05-30 Methode and device for pitch enhancement of decoded speech

Publications (1)

Publication Number Publication Date
MXPA04011845A true MXPA04011845A (es) 2005-07-26

Family

ID=29589086

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA04011845A MXPA04011845A (es) 2002-05-31 2003-05-30 Metodo y dispositivo para aumentar el espaciamiento selectivo de la frecuencia de la voz sintetizada.

Country Status (22)

Country Link
US (1) US7529660B2 (es)
EP (1) EP1509906B1 (es)
JP (1) JP4842538B2 (es)
KR (1) KR101039343B1 (es)
CN (1) CN100365706C (es)
AT (1) ATE399361T1 (es)
AU (1) AU2003233722B2 (es)
BR (2) BRPI0311314B1 (es)
CA (2) CA2388352A1 (es)
CY (1) CY1110439T1 (es)
DE (1) DE60321786D1 (es)
DK (1) DK1509906T3 (es)
ES (1) ES2309315T3 (es)
HK (1) HK1078978A1 (es)
MX (1) MXPA04011845A (es)
MY (1) MY140905A (es)
NO (1) NO332045B1 (es)
NZ (1) NZ536237A (es)
PT (1) PT1509906E (es)
RU (1) RU2327230C2 (es)
WO (1) WO2003102923A2 (es)
ZA (1) ZA200409647B (es)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6315985B1 (en) * 1999-06-18 2001-11-13 3M Innovative Properties Company C-17/21 OH 20-ketosteroid solution aerosol products with enhanced chemical stability
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
FR2861491B1 (fr) * 2003-10-24 2006-01-06 Thales Sa Procede de selection d'unites de synthese
DE102004007184B3 (de) * 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007191B3 (de) * 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US8417515B2 (en) * 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
ATE394774T1 (de) * 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
WO2006025313A1 (ja) * 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
JP4407538B2 (ja) * 2005-03-03 2010-02-03 ヤマハ株式会社 マイクロフォンアレー用信号処理装置およびマイクロフォンアレーシステム
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US8346546B2 (en) * 2006-08-15 2013-01-01 Broadcom Corporation Packet loss concealment based on forced waveform alignment after packet loss
WO2008072733A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 符号化装置および符号化方法
US8036886B2 (en) * 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
WO2008081920A1 (ja) * 2007-01-05 2008-07-10 Kyushu University, National University Corporation 音声強調処理装置
JP5046233B2 (ja) * 2007-01-05 2012-10-10 国立大学法人九州大学 音声強調処理装置
CN101622668B (zh) * 2007-03-02 2012-05-30 艾利森电话股份有限公司 电信网络中的方法和装置
ATE548727T1 (de) * 2007-03-02 2012-03-15 Ericsson Telefon Ab L M Nachfilter für geschichtete codecs
CN101622666B (zh) * 2007-03-02 2012-08-15 艾利森电话股份有限公司 非因果后置滤波器
CN101266797B (zh) * 2007-03-16 2011-06-01 展讯通信(上海)有限公司 语音信号后处理滤波方法
WO2009002245A1 (en) 2007-06-27 2008-12-31 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for enhancing spatial audio signals
JPWO2009004718A1 (ja) * 2007-07-03 2010-08-26 パイオニア株式会社 楽音強調装置、楽音強調方法、楽音強調プログラムおよび記録媒体
JP2009044268A (ja) * 2007-08-06 2009-02-26 Sharp Corp 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
GB2466668A (en) * 2009-01-06 2010-07-07 Skype Ltd Speech filtering
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
GB2473266A (en) 2009-09-07 2011-03-09 Nokia Corp An improved filter bank
JP5519230B2 (ja) * 2009-09-30 2014-06-11 パナソニック株式会社 オーディオエンコーダ及び音信号処理システム
ES2906085T3 (es) * 2009-10-21 2022-04-13 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
US9031835B2 (en) 2009-11-19 2015-05-12 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
PL2515299T3 (pl) * 2009-12-14 2018-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do kwantyzacji wektorowej, urządzenie do kodowania głosu, sposób kwantyzacji wektorowej i sposób kodowania głosu
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
WO2011127832A1 (en) * 2010-04-14 2011-10-20 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US8423357B2 (en) * 2010-06-18 2013-04-16 Alon Konchitsky System and method for biometric acoustic noise reduction
MY176192A (en) * 2010-07-02 2020-07-24 Dolby Int Ab Selective bass post filter
PL2550653T3 (pl) 2011-02-14 2014-09-30 Fraunhofer Ges Forschung Reprezentacja sygnału informacyjnego z użyciem transformacji zakładkowej
MX2013009301A (es) 2011-02-14 2013-12-06 Fraunhofer Ges Forschung Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio.
WO2012110448A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
KR101617816B1 (ko) 2011-02-14 2016-05-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식
TWI469136B (zh) * 2011-02-14 2015-01-11 Fraunhofer Ges Forschung 在一頻譜域中用以處理已解碼音訊信號之裝置及方法
ES2715191T3 (es) 2011-02-14 2019-06-03 Fraunhofer Ges Forschung Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
CN108962270B (zh) * 2012-05-23 2023-03-17 日本电信电话株式会社 解码方法、解码装置以及记录介质
FR3000328A1 (fr) * 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
US8927847B2 (en) * 2013-06-11 2015-01-06 The Board Of Trustees Of The Leland Stanford Junior University Glitch-free frequency modulation synthesis of sounds
US9418671B2 (en) 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
JP6220610B2 (ja) * 2013-09-12 2017-10-25 日本電信電話株式会社 信号処理装置、信号処理方法、プログラム、記録媒体
EP3058567B1 (en) * 2013-10-18 2017-06-07 Telefonaktiebolaget LM Ericsson (publ) Coding of spectral peak positions
EP3511935B1 (en) 2014-04-17 2020-10-07 VoiceAge EVS LLC Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
WO2016081814A2 (en) * 2014-11-20 2016-05-26 Tymphany Hk Limited Method and apparatus to equalize acoustic response of a speaker system using multi-rate fir and all-pass iir filters
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
CA3019506C (en) 2016-04-12 2021-01-19 Markus Multrus Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
RU2676022C1 (ru) * 2016-07-13 2018-12-25 Общество с ограниченной ответственностью "Речевая аппаратура "Унитон" Способ повышения разборчивости речи
CN111128230B (zh) * 2019-12-31 2022-03-04 广州市百果园信息技术有限公司 语音信号重建方法、装置、设备和存储介质
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
CN113053353B (zh) * 2021-03-10 2022-10-04 度小满科技(北京)有限公司 一种语音合成模型的训练方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU447857A1 (ru) 1971-09-07 1974-10-25 Предприятие П/Я А-3103 Устройство дл записи информации на термопластический носитель
SU447853A1 (ru) 1972-12-01 1974-10-25 Предприятие П/Я А-7306 Устройство передачи и приема речевых сигналов
JPS6041077B2 (ja) * 1976-09-06 1985-09-13 喜徳 喜谷 1,2‐ジアミノシクロヘキサン異性体のシス白金(2)錯体
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
JP3062392B2 (ja) * 1994-04-22 2000-07-10 株式会社河合楽器製作所 波形形成装置およびこの出力波形を用いた電子楽器
BR9508554A (pt) * 1994-08-08 1997-11-25 Debiopharm Sa Preparação farmaceuticamente estável de oxaliplatina
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
GB9512284D0 (en) 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US5864798A (en) * 1995-09-18 1999-01-26 Kabushiki Kaisha Toshiba Method and apparatus for adjusting a spectrum shape of a speech signal
US5806025A (en) 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
GB9804013D0 (en) * 1998-02-25 1998-04-22 Sanofi Sa Formulations
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US7167828B2 (en) * 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
JP3612260B2 (ja) * 2000-02-29 2005-01-19 株式会社東芝 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US6476068B1 (en) * 2001-12-06 2002-11-05 Pharmacia Italia, S.P.A. Platinum derivative pharmaceutical formulations
EP2243480A1 (en) * 2003-08-28 2010-10-27 Mayne Pharma Pty Ltd Pharmaceutical formulations comprising oxaliplatin and an acid.

Also Published As

Publication number Publication date
KR20050004897A (ko) 2005-01-12
ZA200409647B (en) 2006-06-28
CA2483790A1 (en) 2003-12-11
WO2003102923A3 (en) 2004-09-30
MY140905A (en) 2010-01-29
EP1509906A2 (en) 2005-03-02
NZ536237A (en) 2007-05-31
JP4842538B2 (ja) 2011-12-21
HK1078978A1 (en) 2006-03-24
KR101039343B1 (ko) 2011-06-08
RU2004138291A (ru) 2005-05-27
ES2309315T3 (es) 2008-12-16
EP1509906B1 (en) 2008-06-25
CY1110439T1 (el) 2015-04-29
BRPI0311314B1 (pt) 2018-02-14
ATE399361T1 (de) 2008-07-15
CN1659626A (zh) 2005-08-24
DE60321786D1 (de) 2008-08-07
AU2003233722B2 (en) 2009-06-04
CA2483790C (en) 2011-12-20
WO2003102923A2 (en) 2003-12-11
NO332045B1 (no) 2012-06-11
JP2005528647A (ja) 2005-09-22
US7529660B2 (en) 2009-05-05
CA2388352A1 (en) 2003-11-30
DK1509906T3 (da) 2008-10-20
PT1509906E (pt) 2008-11-13
RU2327230C2 (ru) 2008-06-20
US20050165603A1 (en) 2005-07-28
BR0311314A (pt) 2005-02-15
CN100365706C (zh) 2008-01-30
NO20045717L (no) 2004-12-30
AU2003233722A1 (en) 2003-12-19

Similar Documents

Publication Publication Date Title
MXPA04011845A (es) Metodo y dispositivo para aumentar el espaciamiento selectivo de la frecuencia de la voz sintetizada.
KR100421226B1 (ko) 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용
EP1141946B1 (en) Coded enhancement feature for improved performance in coding communication signals
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
EP0763818B1 (en) Formant emphasis method and formant emphasis filter device
US8612216B2 (en) Method and arrangements for audio signal encoding
US7260523B2 (en) Sub-band speech coding system
EP1313091B1 (en) Methods and computer system for analysis, synthesis and quantization of speech
JP2007525707A (ja) Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
MX2013004673A (es) Codificación de señales de audio genéricas a baja tasa de bits y a retardo bajo.
EP1264303B1 (en) Speech processing
CA2244008A1 (en) Nonlinear filter for noise suppression in linear prediction speech pr0cessing devices
McElroy et al. Wideband speech coding in 7.2 kbit/s
WO2005045808A1 (en) Harmonic noise weighting in digital speech coders
Indumathi et al. Performance Evaluation of Variable Bitrate Data Hiding Techniques on GSM AMR coder
MXPA06009342A (es) Metodos y dispositivos para enfasis a baja frecuencia durante compresion de audio basado en prediccion lineal con excitacion por codigo algebraico/excitacion codificada por transformada (acelp/tcx)
AU2757602A (en) Multimode speech encoder
AU2003262451A1 (en) Multimode speech encoder

Legal Events

Date Code Title Description
FG Grant or registration