ES2207968T3 - Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha. - Google Patents

Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha.

Info

Publication number
ES2207968T3
ES2207968T3 ES99952183T ES99952183T ES2207968T3 ES 2207968 T3 ES2207968 T3 ES 2207968T3 ES 99952183 T ES99952183 T ES 99952183T ES 99952183 T ES99952183 T ES 99952183T ES 2207968 T3 ES2207968 T3 ES 2207968T3
Authority
ES
Spain
Prior art keywords
signal
white noise
produce
noise sequence
synthesized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES99952183T
Other languages
English (en)
Inventor
Bruno Bessette
Redwan Salami
Roch Lefebvre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VoiceAge Corp
Original Assignee
VoiceAge Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4162966&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2207968(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by VoiceAge Corp filed Critical VoiceAge Corp
Application granted granted Critical
Publication of ES2207968T3 publication Critical patent/ES2207968T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Error Detection And Correction (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Dc Digital Transmission (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)
  • Networks Using Active Elements (AREA)
  • Television Systems (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Optical Communication System (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Preliminary Treatment Of Fibers (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Image Processing (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Package Frames And Binding Bands (AREA)
  • Installation Of Indoor Wiring (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Inorganic Insulating Materials (AREA)
  • Parts Printed On Printed Circuit Boards (AREA)
  • Coils Or Transformers For Communication (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

Dispositivo para recuperar un contenido de alta frecuencia de una señal de banda ancha, previamente diezmada, y para inyectar dicho contenido de alta frecuencia en una versión sintetizada, sobremuestreada, de dicha señal de banda ancha para producir una señal sintetizada de banda ancha de espectro completo, comprendiendo dicho dispositivo de recuperación del contenido de alta frecuencia: a) un generador (213) de ruido aleatorio para producir una secuencia de ruido que tiene un espectro determinado; b) una unidad (215) de conformación espectral para conformar el espectro de la secuencia de ruido en relación con los coeficientes de filtro de predicción lineal relacionados con dicha señal diezmada de banda ancha; y c) un circuito (221) de inyección de señales para inyectar dicha secuencia de ruido conformada espectralmente en dicha versión sintetizada, sobremuestreada, de la señal para producir así dicha señal (223) sintetizada de banda ancha, de espectro completo.

Description

Método de recuperación de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha.
Antecedentes de la invención 1. Campo de la invención
La presente invención se refiere a un método y a un dispositivo para recuperar un contenido de alta frecuencia de una señal de banda ancha, previamente diezmada, y para inyectar este contenido de alta frecuencia en una versión sintetizada, sobremuestreada, de la señal diezmada de banda ancha con el fin de producir una señal sintetizada de banda ancha, de espectro completo.
2. Breve descripción de la técnica anterior
La demanda de técnicas digitales eficaces de codificación de voz/audio de banda ancha, con una buena relación subjetiva calidad/velocidad binaria, para numerosas aplicaciones, tales como las aplicaciones de teleconferencias de audio/vídeo, las aplicaciones multimedia y las aplicaciones inalámbricas, así como las aplicaciones de Internet y de redes de paquetes, está aumentando. Hasta hace poco, los anchos de banda telefónicos, filtrados en el intervalo de 200-3400 Hz, se empleaban principalmente en aplicaciones para la codificación de voz. Sin embargo, existe una demanda creciente de aplicaciones de voz de banda ancha con el fin de incrementar la inteligibilidad y la naturalidad de las señales de voz. Se consideró que un ancho de banda en el intervalo de 50-7000 Hz era suficiente para suministrar una calidad del habla cara a cara. Para las señales de audio, este intervalo proporciona una calidad aceptable de audio, pero aún inferior a la calidad de CD, que funciona en el intervalo 20-20000 Hz.
Un codificador de voz convierte una señal de voz en un flujo de bits que se transmite por un canal de comunicación (o se almacena en un medio de almacenamiento). La señal de voz se digitaliza (se muestrea y cuantifica, normalmente con 16 bits por muestra) y el codificador de voz tiene el papel de representar estas muestras digitales con un número menor de bits, mientras conserva una buena calidad subjetiva de voz. El decodificador o sintetizador de voz trabaja sobre el flujo de bits transmitido o almacenado y lo convierte de nuevo en una señal sonora.
En la técnica anterior, el documento US-A-5 455 888 describe un esquema de ampliación del ancho de banda de voz que emplea el análisis LPC.
Una de las mejores técnicas de la técnica anterior que es capaz de conseguir una buena relación calidad/velocidad binaria es la llamada técnica de Predicción Lineal Excitada por Código (CELP). Según esta técnica, la señal muestreada de voz se trata en bloques sucesivos de L muestras normalmente llamados tramas, donde L es un número predeterminado (que corresponde a 10-30 ms de habla). En la CELP, un filtro de síntesis de predicción lineal (LP) se calcula y transmite a cada trama. Luego se divide la trama de L muestras en bloques más pequeños, llamados subtramas, de un tamaño de N muestras, donde L = kN y k es el número de subtramas en una trama (N normalmente corresponde a 4-10 ms de habla). En cada subtrama se determina una señal de excitación, que normalmente se compone de dos componentes: uno de la excitación pasada (también llamada contribución de tono o libro de códigos adaptativo) y el otro, de un libro de códigos innovador (también llamado libro de códigos fijo). Esta señal de excitación se transmite y emplea en el decodificador como la entrada del filtro LP de síntesis con el fin de obtener el habla sintetizada.
Un libro de códigos innovador en el contexto CELP es un conjunto de secuencias indexado de N tramas de largo, que se denominarán vectores códigos N-dimensionales. Cada secuencia de libro de códigos está indexada por un entero k que va desde 1 a M, donde M representa el tamaño del libro de códigos, habitualmente expresado como un número b de bits, donde M = 2^{b}.
Para sintetizar el habla según la técnica CELP, cada bloque de N muestras se sintetiza filtrando un vector código apropiado de un libro de códigos a través de filtros que varían el tiempo, que modelan las características espectrales de la señal de voz. En el extremo del codificador, la salida de síntesis se calcula para todos, o para un subconjunto de, los vectores código del libro de códigos (búsqueda en el libro de códigos). El vector código conservado es el que produce la salida de síntesis más parecida a la señal original de voz según una medida de la distorsión ponderada perceptualmente. Esta ponderación perceptual se realiza empleando un llamado filtro de ponderación perceptual, que se obtiene normalmente del filtro LP de síntesis.
El modelo CELP ha sido muy exitoso en la codificación de señales telefónicas de banda de sonido, y existen varios estándares basados en la CELP en una amplia gama de aplicaciones, especialmente en aplicaciones celulares digitales. En la banda telefónica, la señal sonora se encuentra limitada en banda a 200-3400 Hz y se muestrea a 8000 muestras/s. En aplicaciones de voz/audio de banda ancha, la señal sonora está limitada en banda a 50-7000 Hz y se muestrea a 16000 muestras/s.
Cuando se aplica el modelo CELP optimizado en banda telefónica a señales de banda ancha, aparecen algunas dificultades, y necesitan añadirse prestaciones adicionales al modelo con el fin de obtener señales de banda ancha de alta calidad. Las señales de banda ancha presentan un intervalo dinámico mucho más amplio en comparación con las señales de banda telefónica, lo que da como resultado problemas de precisión cuando se requiere una ejecución de punto fijo del algoritmo (lo que es esencial en aplicaciones inalámbricas). Además, frecuentemente el modelo CELP utilizará la mayoría de sus bits codificadores en la región de baja frecuencia, que tiene normalmente un contenido más alto de energía, lo que da como resultado una señal de salida de paso bajo. Para solucionar este problema, el filtro de ponderación perceptual debe modificarse con el fin de acomodar las señales de banda ancha, y las técnicas de preénfasis que mejoran las regiones de alta frecuencia se vuelven importantes para reducir el intervalo dinámico, procurando una implementación de punto fijo más sencilla, y para garantizar una mejor codificación de los contenidos de más alta frecuencia de la señal. Además, el contenido de tono en el espectro de los segmentos hablados en las señales de banda ancha no se extiende por todo el intervalo del espectro, y la cantidad de habla muestra más variación en comparación con las señales de banda estrecha. Por tanto, es importante mejorar el análisis de tono del bucle cerrado para acomodar mejor las variaciones del nivel de voz.
Cuando se aplica el modelo CELP optimizado de banda telefónica a señales de banda ancha, surgen algunas dificultades y deben añadirse prestaciones adicionales al modelo con el fin de obtener señales de banda ancha de alta calidad.
Como ejemplo, con el fin de mejorar la eficacia en la codificación y de reducir la complejidad algorítmica del algoritmo de codificación de banda ancha, la señal de banda ancha de entrada se diezma desde 16 kHz hasta aproximadamente 12,8 kHz. Esto reduce el número de muestras en una trama, el tiempo de tratamiento y el ancho de banda de la señal por debajo de 7000 Hz para permitir así la reducción de la velocidad binaria hasta 12 kbit/s mientras se mantiene una señal decodificada de sonido de calidad muy alta. También se reduce la complejidad debido al número menor de muestras por trama de habla. En el decodificador, es necesario reintroducir los contenidos de alta frecuencia de la señal para eliminar el efecto de filtrado de paso bajo de la señal sintetizada decodificada y recuperar la calidad de sonido natural de las señales de banda ancha. Con este propósito, se necesita una técnica eficaz para recuperar el contenido de alta frecuencia de la señal de banda ancha para producir así una señal sintetizada de banda ancha, de espectro completo, al tiempo que se mantiene una calidad cercana a la señal original.
Objeto de la invención
Un objeto de la presente invención es, por tanto, proporcionar una técnica eficaz de este tipo para la recuperación del contenido de alta frecuencia.
Sumario de la invención
Más concretamente, según la presente invención, se proporciona un método para recuperar un contenido de alta frecuencia de una señal de banda ancha, previamente diezmada, y para inyectar el contenido de alta frecuencia en una versión sintetizada, sobremuestreada, de la señal de banda ancha con el fin de producir una señal sintetizada de banda ancha de espectro completo. Este método de recuperación del contenido de alta frecuencia comprende: la generación de una secuencia de ruido; la conformación espectral de la secuencia de ruido en relación con unos parámetros de conformación representativos de la señal diezmada de banda ancha; y la inyección de la secuencia de ruido conformada espectralmente en la versión sintetizada, sobremuestreada, de la señal para producir así la señal sintetizada de banda ancha, de espectro completo.
Además, la presente invención trata de un dispositivo para recuperar un contenido de alta frecuencia de una señal de banda ancha, previamente diezmada, y para inyectar este contenido de alta frecuencia en una versión sintetizada, sobremuestreada, de la señal de banda ancha con el fin de producir una señal sintetizada de banda ancha de espectro completo. Este dispositivo de recuperación del contenido de alta frecuencia comprende un generador de ruido para producir una secuencia de ruido, una unidad de conformación espectral para conformar la secuencia de ruido en relación con unos parámetros de conformación representativos de la señal diezmada de banda ancha, y un circuito de inyección de señales para inyectar la secuencia de ruido conformada espectralmente en la versión sintetizada, sobremuestreada, de la señal, para producir así la señal sintetizada de banda ancha, de espectro completo.
Según una realización preferida, la secuencia de ruido es una secuencia de ruido blanco.
Preferiblemente, la conformación espectral de la secuencia de ruido comprende:
la producción de una secuencia de ruido blanco escalada en respuesta a la secuencia de ruido blanco y a un primer subconjunto de los parámetros de conformación; el filtrado de la secuencia de ruido blanco escalada en relación con un segundo subconjunto de los parámetros de conformación, que comprende unos coeficientes de filtro de síntesis expandidos en ancho de banda para producir una secuencia de ruido blanco escalada, filtrada, caracterizada por una ancho de banda de frecuencias mayor, en general, que un ancho de banda de frecuencias de la versión sintetizada, sobremuestreada, de la señal; y el filtrado de paso banda de la secuencia de ruido blanco filtrada, escalada, para producir una secuencia de ruido blanco escalada, filtrada paso banda, a inyectar posteriormente en la versión sintetizada, sobremuestreada, de la señal como la secuencia de ruido blanco conformada espectralmente.
Aún según la presente invención, se proporciona un decodificador para producir una señal sintetizada de banda ancha, que comprende:
a) un dispositivo de fragmentación de señales para recibir una versión codificada de una señal de banda ancha, previamente diezmada durante la codificación, y para extraer de la versión codificada de la señal de banda ancha al menos unos parámetros de tono de libro de códigos, unos parámetros innovadores de libro de códigos y unos coeficientes de filtro de síntesis;
b) un libro de códigos de tono, sensible a los parámetros del libro de códigos de tono para producir un vector código de tono;
c) un libro de códigos innovador, sensible a los parámetros innovadores de libro de códigos para producir un vector código innovador;
d) un circuito combinador para combinar el vector código de tono y el vector código innovador para producir así una señal de excitación;
e) un dispositivo de síntesis de señales que incluye un filtro de síntesis para filtrar la señal de excitación en relación con los coeficientes de filtrado de síntesis, para producir así una señal sintetizada de banda ancha, y un sobremuestreador sensible a la señal sintetizada de banda ancha para producir una versión sobremuestreada de la señal de la señal sintetizada de banda ancha; y
f) un dispositivo de recuperación de contenidos de alta frecuencia tal como se ha descrito anteriormente en el presente documento, para recuperar un contenido de alta frecuencia de la señal de banda ancha y para inyectar el contenido de alta frecuencia en la versión sobremuestreada de la señal, para producir la señal sintetizada de banda ancha, de espectro completo.
Según una realización preferida, el decodificador comprende adicionalmente:
a) un generador de factores de voz, sensible a los vectores código adaptativos e innovadores, para calcular un factor de voz para enviar al módulo de ajuste de la ganancia;
b) un módulo de cálculo de energía, sensible a la señal de excitación, para calcular una energía de excitación para enviar al módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales, sensible a la señal sintetizada, para calcular un factor de escalamiento de inclinación para enviar al módulo de ajuste de la ganancia. El primer subconjunto de parámetros de conformación comprende el factor de voz, el factor de escalamiento de energía y el factor de escalamiento de inclinación, y el segundo subconjunto de los parámetros de conformación incluye coeficientes de predicción lineal.
Según otras realizaciones preferidas del decodificador:
- el generador de factores de voz calcula el factor r_{v} de voz empleando la relación:
r_{v} = (E_{v} - E_{c}) / (E_{v} + E_{c})
donde E_{v} es la energía del vector código de tono escalado por ganancia y E_{c} es la energía del vector código innovador escalado por ganancia;
- la unidad de ajuste de la ganancia calcula un factor de escalamiento de la energía empleando la relación:
Factor \ de \ escalamiento \ de \ la \ \text{energía} = \sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cm
n=0, ..., N'-1
donde w' es la secuencia de ruido blanco y u' es una señal mejorada de excitación obtenida a partir de la señal de excitación;
- el calculador de inclinaciones espectrales calcula el factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 1 - inclinación
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v},
o la relación:
g_{t} = 10^{-0,6inclinación}
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
Preferiblemente, el filtro de paso de banda tiene un ancho de banda de frecuencias situado entre 5,6 kHz y 7,2 kHz.
También según la presente invención, en un decodificador para producir una señal sintetizada de banda ancha, que comprende:
a) un dispositivo de fragmentación de señales para recibir una versión codificada de una señal de banda ancha, previamente diezmada durante la codificación, y para extraer de la versión codificada de la señal de banda ancha al menos unos parámetros de libro de códigos de tono, unos parámetros innovadores de libro de códigos y unos coeficientes de filtro de síntesis;
b) un libro de códigos de tono, sensible a los parámetros del libro de códigos de tono, para producir un vector código de tono;
c) un libro de códigos innovador, sensible a los parámetros innovadores del libro de códigos, para producir un vector código innovador;
d) un circuito combinador para combinar el vector código de tono y el vector código innovador, para producir así una señal de excitación; y
e) un dispositivo de síntesis de señales que incluye un filtro de síntesis para filtrar la señal de excitación en relación con los coeficientes del filtro de síntesis para producir así una señal sintetizada de banda ancha, y un sobremuestreador sensible a la señal sintetizada de banda ancha, para producir una versión sobremuestreada de la señal de la señal sintetizada de banda ancha;
comprendiendo la mejora un dispositivo de recuperación de contenidos de alta frecuencia, tal como se ha descrito anteriormente en el presente documento, para recuperar un contenido de alta frecuencia de la señal de banda ancha y para inyectar el contenido de alta frecuencia en la versión sobremuestreada de la señal para producir la señal sintetizada de banda ancha, de espectro completo.
Por último, la presente invención comprende un sistema de comunicación celular, una unidad transmisora/receptora móvil celular, un elemento de red celular y un subsistema de comunicación inalámbrica, bidireccional, que comprende el decodificador anteriormente descrito.
Los objetos, ventajas y otras características de la presente invención serán más evidentes con la lectura de la siguiente descripción no restrictiva de una realización preferida de la misma, facilitada únicamente a título de ejemplo con referencia a los dibujos adjuntos.
\newpage
Breve descripción de los dibujos
En los dibujos adjuntos:
la figura 1 es un diagrama de bloques esquemático de una realización preferida del dispositivo codificador de banda ancha;
la figura 2 es un diagrama de bloques esquemático de una realización preferida del dispositivo decodificador de banda ancha;
la figura 3 es un diagrama de bloques esquemático de una realización preferida del dispositivo de análisis de tono; y
la figura 4 es un diagrama de bloques esquemático, simplificado de un sistema de comunicación celular en el que pueden emplearse el dispositivo codificador de banda ancha de la figura 1 y el dispositivo decodificador de banda ancha de la figura 2.
Descripción detallada de la realización preferida
Como saben bien aquellos individuos con una habilidad normal en la técnica, un sistema de comunicación celular, tal como el 401 (véase la figura 4), proporciona un servicio de telecomunicaciones en una gran zona geográfica al dividir esa gran zona geográfica en un número C de células más pequeñas. Unas estaciones 402_{1}, 402_{2} ... 402_{C} base celulares correspondientes dan servicio a las C células más pequeñas para dotar a cada célula de canales de señalización de radio, de audio y de datos.
Los canales de señalización de radio se emplean para buscar por radio radioteléfonos móviles (unidades transmisoras/receptoras móviles), tales como la 403, dentro de los límites de la zona de cobertura (la célula) de la estación 402 base celular, y para establecer llamadas con otros radioteléfonos 403 situados dentro o fuera de la célula de la estación base o con otra red, tal como la Red Telefónica Pública Conmutada (RTPC) 404.
Una vez que un radioteléfono 403 ha establecido o recibido con éxito una llamada, se establece un canal de audio o de datos entre este radioteléfono 403 y la estación 402 base celular que corresponde a la célula en la que está situado el radioteléfono 403, y la comunicación entre la estación 402 base y el radioteléfono 403 se realiza por ese canal de audio o de datos. El radioteléfono 403 también puede recibir información de control o de sincronización por un canal de señalización mientras una llamada está en curso.
Si un radioteléfono 403 deja una célula y entra en otra célula adyacente mientras una llamada está en curso, el radioteléfono 403 traspasa la llamada a un canal disponible de audio o de datos de la nueva estación 402 base celular. Si un radioteléfono 403 deja una célula y entra en otra célula adyacente cuando no hay llamada alguna en curso, el radioteléfono 403 envía un mensaje de control por el canal de señalización para entrar en la estación 402 base de la nueva célula. De esta manera es posible la comunicación móvil en una amplia zona geográfica.
El sistema 401 de comunicación celular comprende adicionalmente un terminal 405 de control para controlar la comunicación entre las estaciones 402 base celulares y la RTPC 404, por ejemplo, durante una comunicación entre un radioteléfono 403 y la RTPC 404, o entre un radioteléfono 403 situado en una primera célula y un radioteléfono 403 situado en una segunda célula.
Por supuesto, se requiere un subsistema de radiocomunicaciones inalámbrico, bidireccional para establecer un canal de audio o de datos entre una estación 402 base de una célula y un radioteléfono 403 situado en esa célula. Tal como se ha ilustrado de manera muy simplificada en la figura 4, este tipo de subsistema inalámbrico, bidireccional, de radiocomunicaciones comprende típicamente en el radioteléfono 403:
- un transmisor 406 que incluye:
-
un codificador 407 para codificar la señal de voz; y
-
un circuito 408 transmisor para transmitir la señal codificada de voz procedente del codificador 407 por una antena, tal como la 409; y
- un receptor 410 que incluye:
-
un circuito 411 receptor para recibir una señal codificada, transmitida, de voz, normalmente por la misma antena 409; y
-
un decodificador 412 para decodificar la señal codificada, recibida, de voz procedente del circuito 411 receptor.
El radioteléfono comprende adicionalmente otros circuitos 413 radiotelefónicos convencionales a los que están conectados el codificador 407 y el decodificador 412, y para tratar las señales procedentes de los mismos, circuitos 413 que son bien conocidos por aquellos individuos de habilidad normal en la técnica y, por consiguiente, no se describirán más en la presente memoria descriptiva.
Asimismo, este tipo de subsistema inalámbrico, bidireccional, de radiocomunicaciones comprende típicamente en la estación 402 base celular:
- un transmisor 414 que incluye:
-
un codificador 415 para codificar la señal de voz; y
-
un circuito 416 transmisor para transmitir la señal codificada de voz procedente del codificador 415 por una antena, tal como la 417; y
- un receptor 418 que incluye:
-
un circuito 419 receptor para recibir una señal codificada, transmitida, de voz por la misma antena 417 o por otra antena (no mostrada); y
-
un decodificador 420 para decodificar la señal codificada, recibida, de voz procedente del circuito 419 receptor.
Típicamente, la estación 402 base celular comprende adicionalmente un controlador 421 de estación base, junto con su base 422 de datos asociada, para controlar las comunicaciones entre el terminal 405 de control y el transmisor 414 y el receptor 418.
Tal como es bien sabido por aquellos individuos con una habilidad normal en la técnica, la codificación de voz se requiere con el fin de reducir el ancho de banda necesario para transmitir una señal de sonido, por ejemplo, una señal de voz tal como el habla, a través del subsistema de radiocomunicaciones, inalámbricas bidireccionales es decir, entre un radioteléfono 403 y una estación 402 base.
Los codificadores LP de voz (tales como el 415 y el 407), que funcionan típicamente a 13 kbits/segundo y menos, tales como los codificadores de Predicción Lineal Excitada por Código (CELP), típicamente emplean un filtro LP de síntesis para modelar la envolvente espectral a corto plazo de la señal de voz. Típicamente, la información LP se transmite cada 10 o 20 ms al decodificador (tal como el 420 y el 412) y se extrae en el extremo del decodificador.
Las técnicas novedosas descritas en la presente memoria descriptiva pueden aplicarse a diferentes sistemas de codificación basados en la LP. Sin embargo, en la realización preferida se emplea un sistema de codificación de tipo CELP con el propósito de presentar un ejemplo no limitativo de estas técnicas. De la misma manera, tales técnicas pueden emplearse con señales sonoras distintas de la voz y el habla, así como con otros tipos de señales de banda ancha.
La figura 1 muestra un diagrama de bloques general de un dispositivo 100 de codificación de voz de tipo CELP, modificado para acomodar mejor las señales de banda ancha.
La señal 114 muestreada de voz, de entrada, se divide en bloques sucesivos de L muestras llamados "tramas". En cada trama, se calculan, codifican y transmiten diferentes parámetros que representan la señal de voz en la trama. Unos parámetros LP que representan el filtro LP de síntesis, se calculan normalmente una vez por trama. Adicionalmente, la trama se divide en bloques más pequeños de N muestras (bloques de longitud N), en los que se determinan los parámetros de excitación (tono e innovación). En la literatura CELP, estos bloques de longitud N se llaman "subtramas", y las señales de N muestras en las subtramas se denominan vectores N-dimensionales. En esta realización preferida, la longitud N corresponde a 5 ms, mientras que la longitud L corresponde a 20 ms, lo que significa que una trama contiene cuatro subtramas (N = 80 a la velocidad de muestreo de 16 kHz, y 64 tras un diezmado a 12,8 kHz). Durante el procedimiento de codificación se producen varios vectores N-dimensionales. A continuación, en el presente documento, se presenta una lista con los vectores que aparecen en las figuras 1 y 2, así como una lista de los parámetros transmitidos:
Lista de los principales vectores N-dimensionales
s Vector de voz de entrada de la señal de banda ancha (tras el diezmado, el
pretratamiento y el preénfasis);
s_{w} Vector de voz ponderado;
s_{0} Respuesta de entrada nula del filtro de síntesis ponderado;
s_{p} Señal pretratada diezmada;
Señal sintetizada, sobremuestreada, de voz;
s' Señal de síntesis antes del deénfasis;
s_{d} Señal deenfatizada de síntesis;
s_{h} Señal de síntesis tras el deénfasis y el postratamiento;
x Vector objetivo para la búsqueda de tono;
x' Vector objetivo para la búsqueda de la innovación;
h Respuesta ponderada de impulso del filtro de síntesis;
v_{T} Vector del libro de códigos adaptativo (tono) para el retardo T;
y_{T} Vector filtrado del libro de códigos de tono (v_{T} convolucionado con h);
c_{k} Vector código innovador en el índice k (k-ésima entrada del libro de códigos de innovación);
c_{f} Vector código de innovación mejorado, escalado;
u Señal de excitación (vectores código de innovación y de tono escalados);
u' Excitación mejorada;
z Secuencia de ruido de paso de banda;
w' Secuencia de ruido blanco; y
w Secuencia de ruido escalada.
Lista de los parámetros transmitidos
STP Parámetros de predicción a corto plazo (definen A(z));
T Retardo de tono (o índice del libro de códigos de tono);
b Ganancia de tono (o ganancia del libro de códigos de tono);
j Índice del filtro de paso bajo empleado con el vector código de tono;
k Índice del vector código (entrada del libro de códigos de innovación); y
g Ganancia del libro de códigos de innovación.
En esta realización preferida, los parámetros STP se transmiten una vez por trama y el resto de los parámetros se transmite cuatro veces por trama (cada subtrama).
Lado del codificador
La señal muestreada de voz es codificada bloque a bloque por el dispositivo 100 codificador de la figura 1, que está dividido en once módulos numerados de 101 a 111.
El habla de entrada se trata en los bloques de L muestras, llamados tramas, mencionados anteriormente.
Haciendo referencia a la figura 1, la señal 114 muestreada de voz, de entrada, se diezma en un módulo 101 diezmador. Por ejemplo, la señal se diezma desde 16 kHz hasta 12,8 kHz, empleando técnicas bien conocidas por aquellos individuos con una habilidad normal en la técnica. Por supuesto, puede preverse el diezmado hasta otra frecuencia. El diezmado aumenta la eficacia de la codificación, puesto que se codifica un ancho de banda de frecuencias más pequeño. Esto también reduce la complejidad algorítmica dado que se reduce el número de muestras en una trama. El empleo del diezmado adquiere importancia cuando la velocidad binaria se reduce a menos de 16 kbit/s, aunque el diezmado no es esencial por encima de 16 kbit/s.
Tras el diezmado, la trama de 320 muestras, de 20 ms, se reduce a una trama de 256 muestras (una proporción de diezmado de 4/5).
La trama de entrada se suministra entonces al bloque 102 opcional de pretratamiento. El bloque 102 de pretratamiento puede componerse de un filtro de paso alto con una frecuencia de corte de 50 Hz. El filtro 102 de paso alto elimina los componentes de ruido no deseados por debajo de 50 Hz.
La señal pretratada, diezmada, viene indicada por s_{p}(n), n = 0, 1, 2, ..., L - 1, donde L es la longitud de la trama (256 con una frecuencia de muestreo de 12,8 kHz). En una realización preferida del filtro 103 de preénfasis, la señal s_{p}(n) se preenfatiza empleando un filtro que tiene la siguiente función de transferencia:
P(z) = 1 - \mu z^{-1}
donde \mu es un factor de preénfasis con un valor situado entre 0 y 1 (un valor típico es \mu = 0,7). También podría emplearse un filtro de mayor orden. Debe indicarse que el filtro 102 de paso alto y el filtro 103 de preénfasis pueden intercambiarse para obtener ejecuciones de punto fijo más eficaces.
La función de filtro 103 de preénfasis es mejorar el contenido de alta frecuencia de la señal de entrada. También reduce el intervalo dinámico de la señal de voz de entrada, lo que la hace más adecuada para la ejecución de punto fijo. Sin el preénfasis, el análisis LP en punto fijo utilizando una aritmética de precisión finita es difícil de ejecutar.
El preénfasis también desempeña un papel importante para conseguir una ponderación perceptual global adecuada del error de cuantificación, lo que contribuye a una calidad sonora mejorada. Esto se explicará con más detalle a continuación en el presente documento.
La salida del filtro 103 de preénfasis se denota como s(n). Esta señal se emplea para realizar el análisis LP en el módulo 104 calculador. El análisis LP es una técnica que conocen bien aquellos individuos de habilidad normal en la técnica. En esta realización preferida, se utiliza el enfoque de autocorrelación. Desde el punto de vista de la autocorrelación, primero se aplica una ventana a la señal s(n) empleando una ventana de Hamming (que normalmente tiene una longitud del orden de 30-40 ms). Las autocorrelaciones se calculan a partir de la señal a la que se ha aplicado la ventana, y se emplea la recursión de Levison-Durbin para calcular los coeficientes del filtro LP, a_{j}, donde i = 1, ..., p, y donde p es el orden LP, que normalmente es 16 en la codificación de banda ancha. Los parámetros a_{i} son los coeficientes de la función de transferencia del filtro LP, que viene dada por la siguiente relación:
A(z) = 1\sum\limits^{p}_{j=1}a_{j}z^{-1}
El análisis LP se realiza en el módulo 104 calculador, que también realiza la cuantificación y la interpolación de los coeficientes del filtro LP. Los coeficientes del filtro LP se transforman primero en otro dominio equivalente más adecuado para los propósitos de cuantificación e interpolación. Los dominios del par espectral de línea (LSP) y del par espectral de inmitancia (ISP) son dos dominios en los que puede realizarse eficazmente la cuantificación y la interpolación. Los 16 coeficientes del filtro LP, a_{i}, pueden cuantificarse en el orden de 30 a 50 bits utilizando la cuantificación dividida o la multietapa, o una combinación de las mismas. El fin de la interpolación es permitir la actualización de los coeficientes del filtro LP cada subtrama mientras se transmiten una vez por trama, lo que mejora el rendimiento del codificador sin incrementar la velocidad binaria. Se supone que la cuantificación e interpolación de los coeficientes del filtro LP son bien conocidas por aquellos individuos con una habilidad normal en la técnica y, por consiguiente, no se describirá adicionalmente en la presente memoria descriptiva.
Los siguientes párrafos describirán el resto de las operaciones de codificación realizadas en base a las subtramas. En la siguiente descripción, el filtro A(z) denota el filtro LP interpolado, no cuantificado, de la subtrama, y el filtro Â(z) denota el filtro LP interpolado, cuantificado, de la subtrama.
Ponderación perceptual
En los codificadores de análisis por síntesis, los parámetros óptimos de tono e innovación se buscan minimizando el error cuadrático medio entre el habla de entrada y el habla sintetizada en un dominio ponderado perceptualmente. Esto es equivalente a minimizar el error entre el habla ponderada de entrada y el habla ponderada de síntesis.
La señal s_{w}(n) ponderada se calcula en un filtro 105 de ponderación perceptual. Tradicionalmente, la señal s_{w}(n) ponderada es calculada por un filtro ponderador que tiene una función W(z) de transferencia de la forma:
W(z) = A(z/\gamma_{1}) / A(z/\gamma_{2})
donde 0 < \gamma_{2} < \gamma_{1} \leq 1.Como es bien sabido por aquellos individuos de habilidad normal en la técnica, en los codificadores de análisis por síntesis (AbS) de la técnica anterior, el análisis muestra que el error de cuantificación está ponderado por una función W^{-1}(z) de transferencia, que es la inversa de la función de transferencia del filtro 105 de ponderación perceptual. Este resultado lo describen bien B.S. Atal y M.R. Schroeder en "Predictive coding of speech and subjective error criteria", IEEE Transaction ASSP, vol. 27, nº 3, págs. 247-254, Junio 1979. La función W^{-1}(z) de transferencia exhibe algo de la estructura formante de la señal de voz de entrada. Por tanto, se aprovecha la propiedad de enmascaramiento del oído humano al conformar el error de cuantificación, de manera que ésta tiene más energía en las regiones formantes, donde estará enmascarada por la fuerte energía de señal presente en estas regiones. La cantidad de ponderación está controlada por los factores \gamma_{1}y \gamma_{2}.
El anterior filtro 105 de ponderación perceptual tradicional funciona bien con señales de banda telefónica. Sin embargo, se encontró que este filtro 105 de ponderación perceptual tradicional no es adecuado para la eficiente ponderación perceptual de las señales de banda ancha. También se encontró que el filtro 105 de ponderación perceptual tradicional tiene limitaciones inherentes al modelar simultáneamente la estructura formante y la inclinación espectral requerida. La inclinación espectral es más pronunciada en las señales de banda ancha debido al amplio intervalo dinámico entre las frecuencias bajas y altas. La técnica anterior ha sugerido añadir un filtro de inclinación en W(z) con el fin de controlar por separado la ponderación de la inclinación y de la formante de la señal de entrada de banda ancha.
Una solución novedosa a este problema es, según la presente invención, introducir el filtro 103 de preénfasis en la entrada, calcular el filtro LP A(z) basándose en el habla s(n) preenfatizada, y utilizar un filtro W(z) modificado fijando su denominador.
\newpage
El análisis LP se realiza en el módulo 104, sobre la señal s(n) preenfatizada para obtener el filtro LP A(z). Asimismo, se emplea un nuevo filtro 105 de ponderación perceptual con denominador fijo. Un ejemplo de función de transferencia para el filtro 104 de ponderación perceptual viene dado por la siguiente relación:
W(z) = A(z/\gamma_{1}) / (1 - \gamma_{2}z^{-1})
donde 0 < \gamma_{2} < \gamma_{1} \leq 1.
En el denominador puede emplearse un orden mayor. Esta estructura desacopla sustancialmente la ponderación de la formante de la inclinación.
Obsérvese que dado que A(z) se calcula basándose en la señal s(n) preenfatizada de voz, la inclinación del filtro 1/A(z/\gamma_{1}) es menos pronunciada en comparación con el caso en el que A(z) se calcula sobre la base del habla original. Puesto que el deénfasis se realiza en el extremo del decodificador empleando un filtro que tiene la función de transferencia:
P^{-1}(z) = 1/(1 - \mu z^{-1}),
el espectro del error de cuantificación está conformado por un filtro que tiene una función W^{-1}(z)P^{-1}(z) de transferencia. Cuando \gamma_{2} se hace igual a \mu, lo que típicamente es el caso, el espectro del error de cuantificación está conformado por un filtro cuya función de transferencia es 1/A(z/\gamma_{1}), con A(z) calculada sobre la base de la señal preenfatizada de voz. La escucha subjetiva mostró que esta estructura para conseguir la conformación del error mediante una combinación del preénfasis y el filtrado ponderado, modificado, es muy eficaz para codificar señales de banda ancha, además de las ventajas de la facilidad de la ejecución algorítmica de punto fijo.
Análisis del tono
Con el fin de simplificar el análisis del tono, primero se estima un retardo T_{OL} de tono, de bucle abierto, en el módulo 106 de búsqueda de tono, de bucle abierto, empleando la señal s_{w}(n) ponderada de voz. A continuación, el análisis del tono, de bucle cerrado, que se realiza en el módulo 107 de búsqueda de tono, de bucle cerrado, basado en subtramas, está limitado en torno al retardo T_{OL} de tono, de bucle abierto, que reduce significativamente la complejidad de búsqueda de los parámetros T y b LTP (retardo de tono y ganancia de tono). El análisis de tono, de bucle abierto, se realiza normalmente en el módulo 106 una vez cada 10 ms (dos subtramas), empleando técnicas bien conocidas por aquellos individuos de habilidad normal en la técnica.
El vector x objetivo para el análisis LTP (Predicción a Largo Plazo) se calcula primero. Habitualmente, esto se realiza restando la respuesta s_{0} de entrada nula del filtro W(z)/Â(z) de síntesis ponderado de la señal s_{w}(n) ponderada de voz. Esta respuesta s_{0} de entrada nula es calculada por un calculador 108 de respuesta de entrada nula. Más concretamente, el vector x objetivo se calcula empleando la siguiente relación:
x = s_{w} - s_{0}
donde x es el vector objetivo N-dimensional, s_{w} es el vector ponderado de voz en la subtrama, y s_{0} es la respuesta de entrada nula del filtro W(z)/Â(z), que es la salida del filtro W(z)/Â(z) combinado debido a sus estados iniciales. El calculador 108 de respuesta de entrada nula es sensible al filtro Â(z) LP interpolado, cuantificado, del análisis LP, al calculador 104 de cuantificación e interpolación y a los estados iniciales del filtro W(z)/Â(z) ponderado de síntesis almacenado en el módulo 111 de memoria, para calcular la respuesta s_{0} de entrada nula (esa parte de la respuesta debida a los estados iniciales, tal como se determina al hacer las entradas iguales a cero) del filtro W(z)/Â(z). Esta operación es bien conocida por aquellos individuos de habilidad normal en la técnica y, por consiguiente, no se describirá adicionalmente.
Por supuesto, pueden emplearse enfoques alternativos pero matemáticamente equivalentes para calcular el vector x objetivo.
Un vector h N-dimensional de respuesta de impulso del filtro W(z)/Â(z) ponderado de síntesis se calcula en el generador 109 de respuesta de impulsos empleando los coeficientes A(z) y Â(z) del filtro LP procedentes del módulo 104. De nuevo, esta operación es bien conocida por aquellos individuos de habilidad normal en la técnica y, por consiguiente, no se describirá adicionalmente en la presente memoria descriptiva.
Los parámetros b, T y j de tono, de bucle cerrado, (o de libro de códigos de tono), se calculan en el módulo 107 de búsqueda de tono, de bucle cerrado, que emplea como entradas el vector x objetivo, el vector h de respuesta de impulsos y el retardo T_{OL} de tono, de bucle abierto. Tradicionalmente, la predicción de tono ha estado representada por un filtro de tono que tiene la siguiente función de transferencia:
1 / (1 - bz^{-T})
donde b es la ganancia de tono y T es el retraso o retardo de tono. En este caso, la contribución de tono a la señal u(n) de excitación viene dada por bu (n - T), donde la excitación total viene dada por
u(n) = bu(n - T) + gc_{k}(n)
con g siendo la ganancia innovadora de libro de códigos y c_{k}(n) el vector código innovador en el índice k.
Esta representación tiene limitaciones si el retardo T de tono es más corto que la longitud N de subtrama. En otra representación, la contribución de tono puede verse como un libro de códigos de tono que contiene la señal anterior de excitación. En general, cada vector en el libro de códigos de tono es una versión desplazada una unidad del vector anterior (desechando una muestra y añadiendo una nueva muestra). Para retardos de tono T > N, el libro de códigos de tono es equivalente a la estructura (1/(1 - bz^{-T})) de filtro, y un vector v_{T}(n) de libro de códigos de tono, para el retardo T de tono, viene dado por
v_{T}(n) = u (n - T),
n = 0, ..., N - 1.
Para retardos T de tono más cortos que N, se construye un vector v_{T}(n) repitiendo las muestras disponibles a partir de la excitación pasada hasta que se completa el vector (esto no es equivalente a la estructura del filtro).
En codificadores recientes, se emplea una mayor resolución de tono que mejora significativamente la calidad de los segmentos de sonido hablados. Esto se consigue mediante el sobremuestreo de la señal anterior de excitación, empleando filtros polifásicos de interpolación. En este caso, el vector v_{T}(n) corresponde normalmente a una versión interpolada de la excitación pasada, con el retardo T de tono siendo un retraso no entero (por ejemplo, 50,25).
La búsqueda de tono consiste en encontrar el mejor retardo T y ganancia b de tono que minimizan el error E cuadrático medio ponderado entre el vector x objetivo y la excitación pasada, filtrada, escalada. Estando expresado el error E como:
E = ||x-by_{T}||^{2}
donde y_{T} es el vector filtrado de libro de códigos de tono para el retardo T de tono:
y_{T}(n) = v_{T}(n) * h(n) = \sum\limits^{n}_{i=0}v_{T}(i)h(n-i),
\hskip0,5cm
n=0,...N-1
Puede mostrarse que el error E se minimiza maximizando el criterio de búsqueda
C = \frac{x^{1}y_{T}}{\sqrt{y^{t}_{T}y_{T}}}
donde t denota la transpuesta del vector.
En la realización preferida de la presente invención, se emplea una resolución de tono de submuestra de 1/3, y la búsqueda de tono (libro de códigos de tono) se compone de tres etapas.
En la primera etapa se estima un retardo T_{OL} de tono, de bucle abierto, en el módulo 106 de búsqueda de tono, de bucle abierto, en respuesta a la señal s_{w}(n) ponderada de voz. Tal como se ha indicado en la descripción anterior, este análisis de tono, de bucle abierto, se realiza normalmente una vez cada 10 ms (dos subtramas) empleando técnicas bien conocidas por aquellos individuos de habilidad normal en la técnica.
En la segunda etapa, el criterio C de búsqueda se busca en el módulo 107 de búsqueda de tono, de bucle cerrado, para retardos de tono enteros alrededor del retardo T_{OL} de tono, de bucle abierto, estimado, (normalmente \pm 5), lo que simplifica significativamente el procedimiento de búsqueda. Se emplea un procedimiento sencillo para actualizar el vector código y_{T} filtrado sin necesidad de calcular la convolución para cada retardo de tono.
\newpage
Una vez que se encuentra un retardo de tono, entero, óptimo, en la segunda etapa, una tercera etapa de la búsqueda (módulo 107) evalúa las fracciones alrededor de ese retardo de tono, entero, óptimo.
Cuando el predictor de tono está representado por un filtro de la forma 1 / (1 - bz^{-T}), lo que es una suposición válida para retardos de tono T > N, el espectro del filtro de tono exhibe una estructura armónica en todo el intervalo de frecuencia, con una frecuencia armónica relacionada con 1/T. En caso de señales de banda ancha, esta estructura no es muy eficaz puesto que la estructura armónica en las señales de banda ancha no cubre la totalidad del espectro ampliado. La estructura armónica existe solamente hasta una cierta frecuencia, dependiendo del segmento de habla. Por tanto, con el fin de conseguir una representación eficaz de la contribución del tono en segmentos hablados de habla de banda ancha, el filtro de predicción de tono necesita tener la flexibilidad de variar la cantidad de periodicidad en el espectro de banda ancha.
Un nuevo método que logra una modelización eficaz de la estructura armónica del espectro de voz de señales de banda ancha se describe en la presente memoria descriptiva, por lo cual se aplican varias formas de filtros de paso bajo a la excitación pasada y se selecciona el filtro de paso bajo con la ganancia más alta de predicción.
Cuando se emplea una resolución de tono de subtrama, los filtros de paso bajo pueden incorporarse en los filtros de interpolación empleados para obtener la mayor resolución de tono. En este caso, la tercera etapa de la búsqueda de tono, en la que se evalúan las fracciones alrededor del retardo de tono, entero, elegido, se repite para los varios filtros de interpolación que tienen diferentes características de paso bajo, y se seleccionan la fracción y el índice de filtro que maximizan el criterio C de búsqueda.
Un enfoque más sencillo es completar la búsqueda en las tres etapas descritas anteriormente, para determinar el retardo de tono, fraccional, óptimo, empleando únicamente un filtro de interpolación con una cierta respuesta de frecuencia, y seleccionar al final la forma óptima de filtro de paso bajo aplicando los diferentes filtros de paso bajo predeterminados al vector v_{T} elegido de libro de códigos de tono, y seleccionar el filtro de paso bajo que minimiza el error de predicción de tono. Este enfoque se expone en detalle a continuación.
La figura 3 ilustra un diagrama de bloques esquemático de una realización preferida del enfoque propuesto.
En el módulo 303 de memoria se almacena la anterior señal u(n) de excitación, n < 0. El módulo 301 de búsqueda del libro de códigos de tono es sensible al vector x objetivo, al retardo T_{OL} de tono, de bucle abierto, y a la anterior señal u(n) de excitación, n < 0, procedente del módulo 303 de memoria, para realizar una búsqueda del libro de códigos de tono (libro de códigos de tono) que minimice el criterio C de búsqueda anteriormente definido. A partir del resultado de la búsqueda realizada en el módulo 301, el módulo 302 genera el vector v_{T} óptimo de libro de códigos de tono. Cabe observarse que, puesto que se emplea una resolución de tono de submuestra (tono fraccional), la anterior señal u(n) de excitación, n < 0, se interpola y el vector v_{T} de libro de códigos de tono corresponde a la anterior señal de excitación interpolada. En esta realización preferida, el filtro de interpolación (en el módulo 301, pero no mostrado) tiene una característica de filtro de paso bajo que elimina los contenidos de frecuencia por encima de 7000 Hz.
En una realización preferida, se emplean K características de filtro; estas características de filtro podrían ser características de filtro de paso bajo o de paso de banda. Una vez que el vector código v_{T} óptimo es determinado y suministrado por el generador 302 de vectores código de tono, se calculan K versiones filtradas de v_{T} empleando respectivamente K filtros de conformación de frecuencia diferentes, tales como los 305^{(j)}, donde j = 1, 2, ..., K. Estas versiones filtradas se denotan por v^{(j)}_{f}, donde j = 1, 2, ..., K. Los diferentes vectores v^{(j)}_{f} se convolucionan en unos módulos 304^{(j)} respectivos, donde j = 0, 1, 2, ..., K, con la respuesta h de impulso para obtener los vectores y^{(j)}, donde j = 0, 1, 2, ..., K. Para calcular el error cuadrático medio de predicción de tono para cada vector y^{(j)}, el valor y^{(j)} se multiplica por la ganancia b mediante un amplificador 307^{(j)} correspondiente, y el valor by^{(j)} se resta del vector x objetivo mediante un restador 308^{(j)} correspondiente. El selector 309 selecciona el filtro 305^{(j)} de conformación de frecuencia, que minimiza el error cuadrático medio de predicción de tono
e^{(j)} = ||x-b^{(j)}y^{(j)}||^{2},
j = 1,2, ..., K
Para calcular el error e^{(j)} cuadrático medio de predicción de tono para cada valor de y^{(j)}, el valor y^{(j)} se multiplica por la ganancia b mediante un amplificador 307^{(j)} correspondiente, y el valor b^{(j)}y^{(j)} se resta del vector x objetivo mediante los restadores 308^{(j)}. Cada ganancia b^{(j)} se calcula en un calculador 306^{(j)} de ganancia correspondiente, en asociación con el filtro de conformación de frecuencia en el índice j, empleando la siguiente relación:
b^{(j)} = x^{1}y^{(j)}/||y^{(j)}||^{2}
En el selector 309, los parámetros b, T y j se eligen basándose en v_{T} o v^{(j)}_{f}, lo que minimiza el error e cuadrático medio de predicción de tono.
Haciendo referencia de nuevo a la figura 1, el índice T de libro de códigos de tono se codifica y transmite al multiplexor 112. La ganancia b de tono se cuantifica y transmite al multiplexor 112. Con este nuevo enfoque, se necesita información adicional para codificar el índice j del filtro de conformación de frecuencia seleccionado en el multiplexor 112. Por ejemplo, si se emplean tres filtros (j = 0, 1, 2, 3), entonces se necesitan dos bits para representar esta información. La información del índice j de filtro también puede codificarse conjuntamente con la ganancia b de tono.
Búsqueda de libro de códigos innovador
Una vez que se determinan el tono o los parámetros LTP (Predicción a Largo Plazo) b, T y j, la siguiente etapa es buscar la excitación innovadora óptima mediante el módulo 110 de búsqueda de la figura 1. Primero, el vector x objetivo se actualiza restando la contribución LTP:
x' = x - by_{T}
donde b es la ganancia de tono e y_{T} es el vector filtrado de libro de códigos de tono (la excitación anterior en el retraso T, filtrada con el filtro seleccionado de paso bajo y convolucionada con la respuesta h de impulso, tal como se ha descrito con referencia a la figura 3).
El procedimiento de búsqueda en la CELP se realiza buscando el vector código c_{k} de excitación óptimo y la ganancia g que minimizan el error cuadrático medio entre el vector objetivo y el vector código filtrado, escalado
E = ||x' - gHc_{k}||^{2}
donde H es una matriz triangular inferior de convolución, obtenida a partir del vector h de respuesta de impulso.
En la realización preferida de la presente invención, la búsqueda de libro de códigos innovador se realiza en el módulo 110 mediante un libro de códigos algebraico, tal como se describe en las patentes estadounidenses 5.444.816 (Adoul et al), concedida el 22 de agosto de 1995; 5.699.482, concedida a Adoul et al el 17 de diciembre de 1997; 5.754.976, concedida a Adoul et al el 19 de mayo de 1998; y 5.701.392 (Adoul et al), fechada en el 23 de diciembre de 1997.
Una vez que el vector código c_{k} óptimo de excitación y su ganancia g son elegidos por el módulo 110, el índice k de libro de códigos y la ganancia g se codifican y transmiten al multiplexor 112.
Haciendo referencia a la figura 1, los parámetros b, T, Â(z), k y g se multiplexan a través del multiplexor 112 antes de transmitirse por un canal de comunicación.
Actualización de la memoria
En el módulo 111 de memoria (figura 1) se actualizan los estados del filtro W(z)/Â(z) ponderado de síntesis mediante el filtrado de la señal u = gc_{k} + bv_{T} de excitación a través del filtro ponderado de síntesis. Tras este filtrado, los estados del filtro se memorizan y emplean en la siguiente subtrama como estados iniciales para calcular la respuesta de entrada nula en el módulo 108 calculador.
Tal como en el caso del vector x objetivo, pueden emplearse otros enfoques alternativos, pero matemáticamente equivalentes, bien conocidos por aquellos individuos de habilidad normal en la técnica, para actualizar los estados de los filtros.
Lado del decodificador
El dispositivo 200 decodificador de voz de la figura 2 ilustra las varias etapas llevadas a cabo entre la entrada 222 digital (flujo de entrada al demultiplexor 217) y el habla 223 muestreada de salida (salida del sumador 221).
El demultiplexor 217 extrae los parámetros del modelo de síntesis a partir de la información binaria recibida de un canal digital de entrada. A partir de cada trama binaria recibida, los parámetros extraídos son:
- los parámetros Â(z) de predicción a corto plazo (STP) (una vez por trama);
- los parámetros T, b y j de predicción a largo plazo (LTP) (para cada subtrama); y
- el índice k del libro de códigos de innovación y la ganancia g (para cada subtrama).
La señal actual de voz se sintetiza basándose en estos parámetros, tal como se explicará a continuación en el presente documento.
El libro 218 de códigos innovador es sensible al índice k para producir el vector código c_{k} de innovación, que está escalado por el factor g decodificado de ganancia a través de un amplificador 224. En la realización preferida, un libro 218 de códigos innovador, tal como el descrito en las patentes estadounidenses 5.444.816; 5.669.482; 5.754.976; y 5.701.392, mencionadas anteriormente, se emplea para representar el vector código c_{k} innovador.
El vector código gc_{k} generado, escalado, en la salida del amplificador 224, se trata a través de un filtro 205 de innovación.
Mejora de la periodicidad
El vector código generado, escalado, en la salida del amplificador 224 se trata a través de un dispositivo 205 de mejora de tono, dependiente de la frecuencia.
La mejora de la periodicidad de la señal u de excitación mejora la calidad en caso de segmentos hablados. En el pasado, esto se hizo filtrando el vector de innovación del libro 218 de códigos innovador (libro de códigos fijo) a través de un filtro en forma de 1/(1 - \varepsilonbz^{-T}), donde e es un factor menor que 0,5 que controla la cantidad de periodicidad introducida. Este enfoque es menos eficaz en caso de señales de banda ancha ya que introduce periodicidad en todo el espectro. Se describe un nuevo enfoque alternativo, que es parte de la presente invención, por el cual la mejora de la periodicidad se consigue filtrando el vector código c_{k} innovador del libro de códigos innovador (fijo) a través de de un filtro 205 de innovación (F(z)), cuya respuesta en frecuencia enfatiza las frecuencias superiores más que las frecuencias inferiores. Los coeficientes de F(z) están relacionados con la cantidad de periodicidad en la señal u de excitación.
Muchos métodos conocidos por los expertos en la técnica están disponibles para obtener coeficientes de periodicidad válidos. Por ejemplo, el valor de la ganancia b proporciona una indicación de la periodicidad. Es decir, si la ganancia b es próxima a 1, la periodicidad de la señal u de excitación es alta, y si la ganancia b es menor que 0,5, entonces la periodicidad es baja.
Otra manera eficaz de obtener los coeficientes del filtro F(z) empleados en una realización preferida, es relacionarlos a la cantidad de contribución de tono en la señal u total de excitación. Esto tiene como resultado una respuesta en frecuencia que depende de la periodicidad de subtrama, donde las frecuencias más altas están más enfatizadas (pendiente total más pronunciada) para las ganancias de tono más elevadas. El filtro 205 de innovación tiene el efecto de reducir la energía del vector código c_{k} innovador en las frecuencias bajas cuando la señal u de excitación es más periódica, lo que mejora la periodicidad de la señal u de excitación para frecuencias más bajas más que para frecuencias altas. Formas sugeridas para el filtro 205 de innovación son
(1)F(z) = 1 - \sigma z^{-1},
(2)F(z) = \alpha z + 1 - \alpha z^{-1}
o
donde \sigma o \alpha son factores de periodicidad obtenidos del nivel de periodicidad de la señal u de excitación.
La segunda forma de tres términos de F(z) se emplea en una realización preferida. El factor \alpha de periodicidad se calcula en el generador 204 de factores de voz. Pueden emplearse varios métodos para obtener el factor
\alpha de periodicidad basándose en la periodicidad de la señal u de excitación. A continuación, se presentan dos métodos.
Método 1
La relación entre la contribución de tono y la señal u total de excitación se calcula primero en el generador 204 de factores de voz mediante
R_{p} = \frac{b^{2}v_{T}{}^{t} v_{T}}{u^{t}u} = \frac{b^{2}\sum\limits^{N-1}_{n=0}v_{T}{}^{2}(n)}{\sum\limits^{N-1}_{n=0}u^{2}(n)}
donde v_{T} es el vector del libro de códigos de tono, b es la ganancia de tono, y u es la señal u de excitación dada a la salida del sumador 219 por
u = gc_{k} + bv_{T}
Cabe observarse que el término bv_{T} tiene su origen en el libro 201 de códigos de tono (libro de códigos de tono) en respuesta al retardo T de tono y al valor anterior de u almacenado en la memoria 203. El vector código v_{T} de tono del libro 201 de códigos de tono se trata entonces a través de un filtro 202 de paso bajo cuya frecuencia de corte se ajusta mediante el índice j del demultiplexor 217. El vector código v_{T} resultante se multiplica entonces por la ganancia b procedente del demultiplexor 217 a través de un amplificador 226 para obtener la señal bv_{T}.
El factor a se calcula en el generador 204 de factores de voz mediante
\alpha = qR_{p}
limitado por \alpha < q
donde q es un factor que controla la cantidad de mejora (q se fija en 0,25 en esta realización preferida).
Método 2
Otro método empleado en una realización preferida de la invención para calcular el factor \alpha de periodicidad se expone a continuación.
Primero se calcula un factor r_{v} de voz en el generador 204 de factores de voz mediante
r_{v} = (Ev - Ec) / (Ev + Ec)
donde Ev es la energía del vector código bv_{T} escalado de tono y E_{c} es la energía del vector código gc_{k} innovador, escalado. Es decir
E_{v} = b^{2}v_{T}{}^{t}v_{T} = b^{2}\sum\limits^{N-1}_{n=0}v_{T}{}^{2}(n)
y
E_{c} = g^{2}c_{k}{}^{t}c_{k} = g^{2}\sum\limits^{N-1}_{n=0}c_{k}{}^{2}(n)
Obsérvese que el valor de r_{v} está entre -1 y 1 (1 corresponde a señales únicamente habladas y -1 corresponde a señales únicamente no habladas).
En esta realización preferida, el factor \alpha se calcula entonces en el generador 204 de factores de voz mediante
\alpha = 0,125(1 + r_{v})
que corresponde a un valor de 0 para señales únicamente no habladas y 0,25 para señales únicamente habladas.
En la primera forma de dos términos de F(z), puede aproximarse el factor \sigma de periodicidad empleando \sigma = 2\alpha en los métodos 1 y 2 anteriores. En tal caso, el factor \sigma de periodicidad se calcula como sigue en el método 1 anterior:
\sigma = 2qR_{p}
limitado por \sigma < 2q.
En el método 2, el factor \sigma de periodicidad se calcula como sigue:
\sigma = 0,25(1 + r_{v}).
Por tanto, la señal c_{f} mejorada se calcula filtrando el vector código gc_{k} innovador, escalado, a través del filtro 205 (F(z)) de innovación.
La señal u' mejorada de excitación es calculada por el sumador 220 como:
u' = c_{f} + bv_{T}
Obsérvese que este proceso no se realiza en el codificador 100. Por tanto, es esencial actualizar el contenido del libro 201 de códigos de tono empleando la señal u de excitación sin mejora para mantener el sincronismo entre el codificador 100 y el decodificador 200. Por tanto, la señal u de excitación se utiliza para actualizar la memoria 203 del libro 201 de códigos de tono, y la señal u' mejorada de excitación se emplea en la entrada del filtro 206 de síntesis LP.
Síntesis y deénfasis
La señal s' sintetizada se calcula filtrando la señal u' mejorada de excitación a través del filtro 206 de síntesis LP, que tiene la forma 1/Â(z), donde Â(z) es el filtro LP interpolado en la subtrama actual. Tal como puede observarse en la figura 2, los coeficientes Â(z) LP cuantificados en la línea 225 del demultiplexor 217, se suministran al filtro 206 de síntesis LP para ajustar los parámetros del filtro 206 de síntesis LP en consecuencia. El filtro 207 de deénfasis es el inverso del filtro 103 de preénfasis de la figura 1. La función de transferencia del filtro 207 de deénfasis viene dada por
D(z) = 1/(1 - \mu z^{-1})
donde \mu es un factor de preénfasis con un valor situado entre 0 y 1 (un valor típico es \mu = 0,7). También podría emplearse un filtro de un orden mayor.
El vector s' se filtra a través del filtro D(z) (módulo 207) de deénfasis para obtener el vector s_{d}, que se hace pasar a través del filtro 208 de paso alto para eliminar las frecuencias indeseadas por debajo de 50 Hz y obtener además s_{h}.
Sobremuestreo y regeneración de altas frecuencias
El módulo 209 de sobremuestreo realiza el proceso inverso al del módulo 101 de diezmado de la figura 1. En esta realización preferida, el sobremuestreo convierte desde la tasa de muestreo 12,8 kHz a la tasa original de muestreo de 16kHz, empleando técnicas bien conocidas para aquellos individuos de habilidad normal en la técnica. La señal sobremuestreada de síntesis se denota como S. A la señal S también se hace referencia como la señal intermedia, sintetizada, de banda ancha.
La señal S sobremuestreada de síntesis no contiene los componentes de frecuencia más alta que se perdieron en el proceso de diezmado (módulo 101 de la figura 1) en el codificador 100. Esto da una percepción de paso bajo a la señal sintetizada de voz. Para reestablecer la banda total de la señal original, se describe un procedimiento de generación de altas frecuencias. Este procedimiento se realiza en los módulos 210 y 216, y en el sumador 221, y requiere la entrada procedente del generador 204 de factores de voz (figura 2).
En este nuevo enfoque, los contenidos de alta frecuencia se generan llenando la parte superior del espectro con un ruido blanco adecuadamente escalado en el dominio de excitación, luego convertido al dominio de habla, preferiblemente al conformarlo con el mismo filtro de síntesis LP empleado para sintetizar la señal S diezmada.
A continuación se describe el procedimiento de generación de altas frecuencias según la presente invención.
El generador 213 de ruido aleatorio genera una secuencia w' de ruido blanco con un espectro plano en la totalidad del ancho de banda de las frecuencias, empleando técnicas bien conocidas por los expertos en la técnica. La secuencia generada tiene una longitud N' que es la longitud de subtrama en el dominio original. Cabe observarse que N es la longitud de subtrama en el dominio diezmado. En esta realización preferida, N = 64 u N' = 80, que corresponde a 5 ms.
La secuencia de ruido blanco se escala adecuadamente en el módulo 214 de ajuste de la ganancia. El ajuste de la ganancia comprende las siguientes etapas. Primero, la energía de la secuencia w' de ruido generada se ajusta igual a la energía de la señal u' mejorada de excitación calculada por un módulo 210 de cálculo de energía, y la secuencia de ruido escalada resultante viene dada por
w(n) = w'(n) \sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}w{'}^{2}(n)}},
\hskip0.5cm
n = 0, ..., N'-1.
La segunda etapa en el escalamiento de la ganancia es tener el cuenta los contenidos de alta frecuencia de la señal sintetizada en la salida del generador 204 de factores de voz con el fin de reducir la energía del ruido generado en caso de segmentos hablados (donde hay menos energía presente a frecuencias altas en comparación con los segmentos no hablados). En esta realización preferida, la medición del contenido de alta frecuencia se ejecuta midiendo la inclinación de la señal de síntesis a través de un calculador 212 de inclinación espectral y reduciendo la energía en consecuencia. Igualmente, pueden emplearse otras mediciones, tales como las mediciones de los pasos por el punto cero de una función. Cuando la inclinación es muy pronunciada, que corresponde con los segmentos hablados, la energía del ruido se reduce adicionalmente. El factor de inclinación se calcula en el módulo 212 como el primer coeficiente de correlación de la señal s_{h} de síntesis y viene dado por:
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}
donde el factor r_{v} de habla viene dado por
r_{v}= (E_{v} - E_{c}) / (E_{v} + E_{c})
donde E_{v} es la energía del vector código bv_{T} escalado de tono y E_{c} es la energía del vector código gc_{k} innovador, escalado, tal como se ha descrito anteriormente. El factor r_{v} de habla es muy frecuentemente menor que la inclinación pero esta condición se introdujo como una precaución contra los tonos de alta frecuencia en los que el valor de la inclinación es negativo y el valor de r_{v} es elevado. Por tanto, esta condición reduce la energía del ruido para tales señales tonales.
El valor de la inclinación es 0 en caso el de un espectro plano y 1, en el caso de señales considerablemente habladas, y es negativo en el caso de señales no habladas en las que hay más energía presente a frecuencias altas.
Pueden emplearse diferentes métodos para obtener el factor g_{t} de escalamiento a partir de la cantidad de contenidos de alta frecuencia. En esta invención, se proporcionan dos métodos basados en la inclinación de la señal descrita anteriormente.
Método 1
El factor g_{t} de escalamiento se obtiene a partir de la inclinación por
g_{t} = 1 - inclinación
limitada por 0,2 \leq g_{t} \leq 1,0
Para una señal considerablemente hablada en la que la inclinación se aproxima a 1, g_{t} es 0,2, y para señales considerablemente no habladas, g_{t} se vuelve 1,0.
Método 2
Primero, el factor g_{t} de inclinación está limitado en primer lugar para ser mayor o igual que cero, luego el factor de escalamiento se obtiene a partir de la inclinación por
g_{t} = 10^{-0,6inclinación}
La secuencia w_{g} de ruido escalada producida en el módulo 214 de ajuste de la ganancia viene dada, por tanto, por:
w_{g} = g_{t} w.
Cuando la inclinación es cercana a cero, el factor g_{t} de escalamiento es próximo a 1, lo que no tiene como resultado una reducción de la energía. Cuando el valor de la inclinación es 1, el factor g_{t} de escalamiento da como resultado una reducción de 12 dB en la energía del ruido generado.
Una vez que el ruido está escalado adecuadamente (w_{g}), se lleva al dominio del habla empleando el conformador 215 espectral. En la realización preferida, esto se consigue filtrando el ruido w_{g} a través de de una versión de ancho de banda expandido del mismo filtro de síntesis LP empleado en el dominio (1/Â(z/0,8)) diezmado. Los correspondientes coeficientes de filtro LP ampliados en ancho de banda se calculan en el conformador 215 espectral.
Entonces, la secuencia w_{f} filtrada, escalada, de ruido se filtra paso banda al intervalo de frecuencia requerido a restaurar, empleando el filtro 216 de paso de banda. En la realización preferida, el filtro 216 de paso de banda limita la secuencia de ruido al intervalo de frecuencia 5,6-7,2 kHz. La secuencia z de ruido resultante, filtrada paso banda, se suma en el sumador 221 a la señal ^s sintetizada, sobremuestreada, de voz para obtener la señal s_{out} reconstruida, final, de sonido en la salida 223.
Aunque la presente invención se ha descrito anteriormente en el presente documento mediante una realización preferida de la misma, esta realización puede modificarse a voluntad, dentro del alcance de las reivindicaciones adjuntas. Aunque la realización preferida expone el uso de señales de voz de banda ancha, será evidente para los expertos en la técnica que la invención en cuestión también está dirigida a otras realizaciones que emplean señales de banda ancha y que no se limita necesariamente a aplicaciones de voz.

Claims (60)

1. Dispositivo para recuperar un contenido de alta frecuencia de una señal de banda ancha, previamente diezmada, y para inyectar dicho contenido de alta frecuencia en una versión sintetizada, sobremuestreada, de dicha señal de banda ancha para producir una señal sintetizada de banda ancha de espectro completo, comprendiendo dicho dispositivo de recuperación del contenido de alta frecuencia:
a) un generador (213) de ruido aleatorio para producir una secuencia de ruido que tiene un espectro determinado;
b) una unidad (215) de conformación espectral para conformar el espectro de la secuencia de ruido en relación con los coeficientes de filtro de predicción lineal relacionados con dicha señal diezmada de banda ancha; y
c) un circuito (221) de inyección de señales para inyectar dicha secuencia de ruido conformada espectralmente en dicha versión sintetizada, sobremuestreada, de la señal para producir así dicha señal (223) sintetizada de banda ancha, de espectro completo.
2. Dispositivo según la reivindicación 1, en el que dicho generador de ruido aleatorio es un generador de ruido blanco aleatorio para producir una secuencia de ruido blanco que tiene un espectro plano en todo el ancho de banda de la frecuencia de la señal de banda ancha, por lo cual dicha unidad de conformación espectral produce una secuencia de ruido blanco conformada espectralmente.
3. Dispositivo según la reivindicación 2, en el que dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a dicha secuencia de ruido blanco y a un conjunto de parámetros de ajuste de la ganancia para producir una secuencia de ruido blanco escalada;
b) un conformador espectral para filtrar dicha secuencia de ruido blanco escalada en relación con una versión expandida en ancho de banda de dichos coeficientes de filtro de predicción lineal para producir una secuencia de ruido blanco escalada, filtrada, que comprende un ancho de banda de frecuencia generalmente mayor que un ancho de banda de frecuencia de dicha versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha secuencia de ruido blanco escalada, filtrada, para producir una secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar posteriormente en dicha versión sintetizada, sobremuestreada, de la señal como dicha secuencia de ruido blanco conformada espectralmente.
4. Método para recuperar un contenido de alta frecuencia de una señal de banda ancha, previamente diezmada y para inyectar dicho contenido de alta frecuencia en una versión sintetizada, sobremuestreada, de dicha señal de banda ancha, para producir una señal sintetizada de banda ancha, de espectro completo, comprendiendo dicho método de recuperación de contenidos de alta frecuencia:
a) la generación de forma aleatoria de una secuencia de ruido que tiene un espectro determinado;
b) la conformación espectral de dicha secuencia de ruido en relación con unos coeficientes de filtro de predicción lineal relacionados con dicha señal diezmada de ancho de banda; y
c) la inyección de dicha secuencia de ruido conformada espectralmente en dicha versión sintetizada, sobremuestreada, de la señal para producir así dicha señal sintetizada de banda ancha, de espectro completo.
5. Método según la reivindicación 4, en el que la generación de dicha secuencia de ruido comprende generar de forma aleatoria una secuencia de ruido blanco, por lo cual dicha conformación espectral de la secuencia de ruido produce una secuencia de ruido blanco conformada espectralmente.
6. Método según la reivindicación 5, en el que dicha conformación espectral de la secuencia de ruido comprende:
a) la producción de una secuencia de ruido blanco escalada en respuesta a dicha secuencia de ruido blanco y un conjunto de parámetros de ajuste de la ganancia;
b) el filtrado de dicha secuencia de ruido blanco escalada en relación con una versión expandida en ancho de banda de los coeficientes de filtro de predicción lineal para producir una secuencia de ruido blanco escalada, filtrada, que comprende un ancho de banda de frecuencia generalmente mayor que un ancho de banda de frecuencia de dicha versión sintetizada, sobremuestreada, de la señal; y
c) el filtrado paso banda de dicha secuencia de ruido blanco escalada, filtrada, para producir una secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar posteriormente en dicha versión sintetizada, sobremuestreada, de la señal como dicha secuencia de ruido blanco conformada espectralmente.
7. Decodificador para producir una señal sintetizada de banda ancha, que comprende:
a) un dispositivo de fragmentación de señales para recibir una versión codificada de una señal de banda ancha, previamente diezmada durante la codificación, y para extraer de dicha señal codificada de banda ancha al menos unos parámetros de tono de libro de códigos, unos parámetros innovadores de libro de códigos y unos coeficientes de filtro de predicción;
b) un libro de códigos de tono, sensible a dichos parámetros de tono de libro de códigos para producir un vector código de tono;
c) un libro de códigos de tono, sensible a dichos parámetros innovadores de libro de códigos para producir un vector código innovador;
d) un circuito combinador para combinar dicho vector código de tono y dicho vector código innovador para producir así una señal de excitación;
e) un dispositivo de síntesis de señales que incluye un filtro de predicción lineal para filtrar dicha señal de excitación en relación con dichos coeficientes de filtro de predicción lineal para producir así una señal sintetizada de banda ancha, y un sobremuestreador sensible a dicha señal sintetizada de banda ancha para producir una versión sobremuestreada de señal de la señal sintetizada de banda ancha; y
f) un dispositivo de recuperación de contenidos de alta frecuencia, tal como se mencionó en la reivindicación 1, para recuperar un contenido de alta frecuencia de dicha señal de banda ancha y para inyectar dicho contenido de alta frecuencia en dicha versión sobremuestreada de señal para producir la señal sintetizada de banda ancha, de espectro completo.
8. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 7, en el que dicho generador de ruido aleatorio comprende un generador de ruido blanco aleatorio para producir una secuencia de ruido blanco, por lo cual dicha unidad de conformación espectral produce una secuencia de ruido blanco conformada espectralmente.
9. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación B, en el que dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a dicha secuencia de ruido blanco y a un conjunto de parámetros de ajuste de la ganancia, para producir una secuencia de ruido blanco escalada;
b) un conformador espectral para filtrar dicha secuencia de ruido blanco escalada en relación con una versión expandida en ancho de banda de los coeficientes de filtro de predicción lineal para producir una secuencia de ruido blanco escalada, filtrada, que comprende un ancho de banda de frecuencia generalmente mayor que un ancho de banda de frecuencia de dicha versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha secuencia de ruido blanco escalada, filtrada, para producir una secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar posteriormente en dicha versión sintetizada, sobremuestreada, de la señal como dicha secuencia de ruido blanco conformada espectralmente.
10. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 9, que comprende adicionalmente:
a) un generador de factores de voz, sensible a dichos vectores código adaptativos e innovadores para calcular un factor de voz para enviar a dicho módulo de ajuste de la ganancia;
b) un módulo de cálculo de energía, sensible a dicha señal de excitación para calcular una energía de excitación para enviar a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales, sensible a dicha señal sinte un factor de escalamiento de la inclinación para enviar a dicho módulo de ajuste de la ganancia;
en el que dicho conjunto de parámetros de ajuste de la ganancia comprende dicho factor de voz, dicha energía de excitación y dicho factor de escalamiento de la inclinación.
11. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 10, en el que dicho generador de factores de voz comprende un medio para calcular dicho factor r_{v} de voz empleando la relación:
r_{v} = (E_{v} - E_{c})/(E_{v}+ E_{c})
donde E_{v} es la energía de una versión escalada por ganancia del vector código de tono y E_{c} es la energía de una versión escalada por ganancia del vector código innovador.
12. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 10, en el que dicha unidad de ajuste de la ganancia comprende un medio para calcular un factor de escalamiento de la energía empleando la relación:
Factor \ de \ escalamiento \ de \ la \ \text{energía} = \sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cm
n = 0, ..., N'-1
donde w' es dicha secuencia de ruido blanco y u' es una señal mejorada de excitación obtenida a partir de dicha señal de excitación.
13. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 10, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 1 - inclinación
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \leq 0 e inclinación \geq r_{v}.
14. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 10, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 10^{-0,6 inclinación}
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
15. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 9, en el que dicho filtro de paso de banda comprende un ancho de banda de frecuencia situado entre 5,6 kHz y 7,2 kHz.
16. Decodificador para producir una señal sintetizada de banda ancha, que comprende:
a) un dispositivo de fragmentación de señales para recibir una versión codificada de una señal de banda ancha, previamente diezmada durante la codificación, y para extraer de dicha señal codificada de banda ancha al menos unos parámetros de tono de libro de códigos, unos parámetros innovadores de libro de códigos, y unos coeficientes de filtro de predicción lineal;
b) un libro de códigos de tono, sensible a dichos parámetros de tono de libro de códigos para producir un vector código de tono;
\newpage
c) un libro de códigos innovador, sensible a dichos parámetros innovadores de libro de códigos para producir un vector código innovador;
d) un circuito combinador para combinar dicho vector código de tono y dicho vector código innovador para producir así una señal de excitación; y
e) un dispositivo de síntesis de señales que incluye un filtro de predicción lineal para filtrar dicha señal de excitación en relación con dichos coeficientes de filtro de predicción lineal para producir así una señal sintetizada de banda ancha, y un sobremuestreador sensible a dicha señal sintetizada de banda ancha para producir una versión sobremuestreada de señal de la señal sintetizada de banda ancha;
comprendiendo el decodificador un dispositivo de recuperación de contenidos de alta frecuencia, tal como se mencionó en la reivindicación 1, para recuperar un contenido de alta frecuencia de dicha señal de banda ancha y para inyectar dicho contenido de alta frecuencia en dicha versión sobremuestreada de la señal para producir una señal sintetizada de banda ancha, de espectro completo.
17. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 16, en el que dicho generador de ruido aleatorio comprende un generador de ruido blanco aleatorio para producir una secuencia de ruido blanco, por lo cual dicha unidad de conformación espectral produce una secuencia de ruido blanco conformada espectralmente.
18. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 17, en el que dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a dicha secuencia de ruido blanco y a un conjunto de parámetros de ajuste de la ganancia, para producir una secuencia de ruido blanco escalada;
b) un conformador espectral para filtrar dicha secuencia de ruido blanco escalada en relación con una versión expandida en ancho de banda de dichos coeficientes de filtro de predicción lineal para producir una secuencia de ruido blanco escalada, filtrada, que comprende un ancho de banda de frecuencia generalmente mayor que un ancho de banda de frecuencia de dicha versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha secuencia de ruido blanco escalada, filtrada, para producir una secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar posteriormente en dicha versión sintetizada, sobremuestreada, de la señal como dicha secuencia de ruido blanco conformada espectralmente.
19. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 18, que comprende adicionalmente:
a) un generador de factores de voz, sensible a dichos vectores código adaptativos e innovadores, para calcular un factor de voz para enviar a dicho módulo de ajuste de la ganancia;
b) un módulo de cálculo de energía, sensible a dicha señal de excitación, para calcular una energía de excitación para enviar a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales, sensible a dicha señal sintetizada, para calcular un factor de escalamiento de la inclinación para enviar a dicho módulo de ajuste de la ganancia;
en el que dicho conjunto de parámetros de ajuste de la ganancia comprende dicho factor de voz, dicho factor de escalamiento de la energía, y dicho factor de escalamiento de la inclinación.
20. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 19, en el que dicho generador de factores de voz comprende un medio para calcular dicho factor r_{v} de voz empleando la relación:
r_{v} = (E_{v}- E_{c})/(E_{v}+ E_{c})
donde E_{v} es la energía de una versión escalada por ganancia del vector código de tono y E_{c} es la energía de una versión escalada por ganancia del vector código innovador.
21. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 19, en el que dicha unidad de ajuste de la ganancia comprende un medio para calcular un factor de escalamiento de la energía que emplea la relación:
Factor \ de \ escalamiento \ de \ la \ \text{energía} = \sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cm
n = 0, ..., N'-1
donde w' es dicha secuencia de ruido blanco y u' es una señal mejorada de excitación obtenida de dicha señal de excitación.
22. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 19, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 1 - inclinación
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
23. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 19, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 10^{-0,6 inclinación}
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
24. Decodificador para producir una señal sintetizada de banda ancha según la reivindicación 18, en el que dicho filtro de paso de banda comprende un ancho de banda de frecuencia situado entre 5,6 kHz y 7,2 kHz.
25. Sistema de comunicación celular para dar servicio a una amplia zona geográfica dividida en una pluralidad de células, que comprende:
a) unidades transmisoras/receptoras móviles;
b) estaciones base celulares situadas respectivamente en dichas células;
c) un terminal de control para controlar la comunicación entre las estaciones base celulares;
d) un subsistema de comunicación inalámbrica, bidireccional, entre cada unidad móvil situada en una célula y la estación base celular de dicha célula, comprendiendo dicho subsistema de comunicación inalámbrica, bidireccional, tanto en la unidad móvil como en la estación base celular:
i)
un transmisor que incluye un codificador para codificar una señal de banda ancha y un circuito de transmisión para transmitir la señal de banda ancha codificada; y
ii)
un receptor que incluye un circuito de recepción para recibir una señal de banda ancha codificada transmitida y un decodificador según se mención en la reivindicación 7 para decodificar la señal de banda ancha codificada recibida.
26. Sistema de comunicación celular según se definió en la reivindicación 26, en el que dicho generador aleatorio de ruido comprende un generador aleatorio de ruido blanco para producir una secuencia de ruido blanco, produciendo dicha unidad de conformación espectral una secuencia de ruido blanco conformada espectralmente.
27. Sistema de comunicación celular según la reivindicación 26, en el que dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a dicha secuencia de ruido blanco y a un conjunto de parámetros de ajuste de la ganancia, para producir una secuencia de ruido blanco escalada;
b) un conformador espectral para filtrar dicha secuencia de ruido blanco escalada que comprende un ancho de banda de frecuencia normalmente mayor que un ancho de banda de frecuencia de dicha versión sintetizada, sobremuestreada de la señal; y
c) un filtro de paso de banda, sensible a dicha secuencia de ruido blanco escalada, filtrada, para producir una secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar posteriormente en dicha versión sintetizada, sobremuestreada de la señal como dicha secuencia de ruido blanco conformada espectralmente.
28. Sistema de comunicación celular según la reivindicación 27, que comprende adicionalmente:
a) un generador de factores de voz, sensible a dichos vectores código innovadores y adaptativos para calcular un factor de voz para enviar a dicho módulo de ajuste de la ganancia;
b) un módulo de cálculo de energía, sensible a dicha señal de excitación para calcular una energía de excitación para enviar a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales, sensible a dicha señal sintetizada para calcular un factor de escalamiento de la inclinación para enviar a dicho módulo de ajuste de la ganancia;
en el que dicho conjunto de parámetros de ajuste de la ganancia comprende dicho factor de voz, dicha energía de excitación, y dicho factor de escalamiento de la inclinación.
29. Sistema de comunicación celular según la reivindicación 28, en el que dicho generador de factores de voz comprende un medio para calcular dicho factor r_{v} de voz empleando la relación:
r_{r} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde E_{v} es la energía de una versión escalada por ganancia del vector código de tono y E_{c} es la energía de una versión escalada por ganancia del vector código innovador.
30. Sistema de comunicación celular según la reivindicación 28, en el que dicha unidad de ajuste de la ganancia comprende un medio para calcular un factor de escalamiento de la energía empleando la relación:
Factor \ de \ escalamiento \ de \ la \ \text{energía} = \sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cm
n = 0, ..., N'-1
donde w' es dicha secuencia de ruido blanco y u' es una señal mejorada de excitación obtenida a partir de dicha señal de excitación.
31. Sistema de comunicación celular según la reivindicación 28, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 1 - inclinación
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
32. Sistema de comunicación celular según la reivindicación 28, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 10^{-0,6 inclinación}
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
33. Sistema de comunicación celular según la reivindicación 27, en el que el filtro de paso de banda comprende un ancho de banda de frecuencia situado entre 5,6 kHz y 7,2 kHz.
34. Unidad transmisora/receptora móvil celular que comprende:
a) un transmisor que incluye un codificador para codificar una señal de banda ancha, y un circuito de transmisión para transmitir la señal codificada de banda ancha; y
b) un receptor que incluye un circuito de recepción para recibir una señal codificada, transmitida, de banda ancha y un decodificador, tal como se indicó en la reivindicación 7, para decodificar la señal codificada, recibida, de banda ancha.
35. Unidad transmisora/receptora móvil celular según la reivindicación 34, en la que dicho generador de ruido aleatorio comprende un generador de ruido blanco aleatorio para producir una secuencia de ruido blanco, por lo cual dicha unidad de conformación espectral produce una secuencia de ruido blanco conformada espectralmente.
36. Unidad transmisora/receptora móvil celular según la reivindicación 35, en la que dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a dicha secuencia de ruido blanco y a un conjunto de parámetros de ajuste de la ganancia para producir una secuencia de ruido blanco escalada;
b) un conformador espectral para filtrar dicha secuencia de ruido blanco escalada relación con una versión expandida en ancho de banda de los coeficientes de filtro de predicción lineal para producir una secuencia de ruido blanco escalada, filtrada, que comprende un ancho de banda de frecuencia generalmente mayor que un ancho de banda de frecuencia de dicha versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha secuencia de ruido blanco escalada, filtrada, para producir una secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar posteriormente en dicha versión sintetizada, sobremuestreada, de la señal como dicha secuencia de ruido blanco conformada espectralmente.
37. Unidad transmisora receptora móvil celular según la reivindicación 36, que comprende adicionalmente:
a) un generador de factores de voz, sensible a dichos vectores código adaptativos e innovadores para calcular un factor de voz para enviar a dicho módulo de ajuste de la ganancia;
b) un módulo de cálculo de energía, sensible a dicha señal de excitación para calcular una energía de excitación para enviar a dicho módulo de ajuste de la ganancia; y
\newpage
c) un calculador de inclinaciones espectrales, sensible a dicha señal sintetizada para calcular un factor de escalamiento de la inclinación para enviar a un módulo de ajuste de la ganancia;
en el que dicho conjunto de parámetros de ajuste de la ganancia comprende dicho factor de voz, dicha energía de excitación, y dicho factor de escalamiento de la inclinación.
38. Unidad transmisora/receptora móvil celular según la reivindicación 37, en el que dicho generador de factores de voz comprende un medio para calcular dicho factor r_{v} de voz empleando la relación:
r_{v}= (E_{v} - E_{c})/(E_{v} + E_{c})
donde E_{v} es la energía de una versión escalada por ganancia del vector código de tono y E_{c} es la energía de una versión escalada por ganancia del vector código innovador.
39. Unidad transmisora/receptora móvil celular según la reivindicación 37, en el que dicha unidad de ajuste de la ganancia comprende un medio para calcula un factor de escalamiento de la energía empleando la relación:
Factor \ de \ escalamiento \ de \ la \ \text{energía} = \sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cm
n = 0, ..., N'-1
donde w' es dicha secuencia de ruido blanco y u' es una señal mejorada de excitación obtenida a partir de dicha señal de excitación.
40. Unidad transmisora/receptora móvil celular según la reivindicación 37, en la que el calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 1 - inclinación
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
41. Unidad transmisora/receptora móvil celular según la reivindicación 37, en la que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 10^{-0,6 \ inclinación}
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
42. Unidad transmisora/receptora móvil celular según la reivindicación 36, en la que el filtro de paso de banda comprende un ancho de banda de frecuencia situado entre 5,6 kHz y 7,2 kHz.
43. Elemento de red celular que comprende:
a) un transmisor que incluye un codificador para codificar una señal de banda ancha y un circuito de transmisión para transmitir la señal codificada de banda ancha; y
b) un receptor que incluye un circuito de recepción para recibir una señal codificada, transmitida, de banda ancha y un decodificador, tal como se indicó en la reivindicación 7, para decodificar la señal codificada, recibida, de banda ancha.
44. Elemento de red celular según la reivindicación 43, en el que dicho generador de ruido aleatorio comprende un generador de ruido blanco aleatorio para producir una secuencia de ruido blanco, produciendo dicha unidad de conformación espectral una secuencia de ruido blanco conformada espectralmente.
45. Elemento de red celular según la reivindicación 44, en el que dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a dicha secuencia de ruido blanco y a un conjunto de parámetros de ajuste de la ganancia para producir una secuencia de ruido blanco escalada;
b) un conformador espectral para filtrar dicha secuencia de ruido blanco en relación con una versión expandida en ancho de banda de los coeficientes de filtro de predicción lineal para producir una secuencia de ruido blanco escalada, filtrada, que comprende un ancho de banda de frecuencia generalmente mayor que un ancho de banda de frecuencia de dicha versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha secuencia de ruido blanco escalada, filtrada, para producir una secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar posteriormente en dicha versión sintetizada, sobremuestreada de la señal como dicha secuencia de ruido blanco conformada espectralmente.
46. Elemento de red celular según la reivindicación 45, que además comprende:
a) un generador de factores de voz, sensible a dichos vectores código adaptativos e innovadores para calcular un factor de voz para enviar a dicho módulo de ajuste de la ganancia;
b) un módulo de cálculo de energía, sensible a dicha señal de excitación para calcular una energía de excitación para enviar a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales, sensible a dicha señal sintetizada para calcular un factor de escalamiento de la inclinación para enviar a dicho módulo de ajuste de la ganancia;
en el que dicho conjunto de parámetros de ajuste de la ganancia comprende dicho factor de voz, dicha energía de excitación, y dicho factor de escalamiento de la inclinación.
47. Elemento de red celular según la reivindicación 46, en el que dicho generador de factores de voz comprende un medio para calcular dicho factor r_{v} de voz empleando la relación:
r_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde E_{v} es la energía de una versión escalada por ganancia del vector código de tono y E_{c} es la energía de una versión escalada por ganancia del vector código innovador.
48. Elemento de red celular según la reivindicación 46, en el que dicha unidad de ajuste de la ganancia comprende un medio para calcular un factor de escalamiento de la energía empleando la relación:
Factor \ de \ escalamiento \ de \ la \ \text{energía} = \sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cm
n=0, ...,N'-1
donde w' es dicha secuencia de ruido blanco y u' es una señal mejorada de excitación obtenida a partir de dicha señal de excitación.
49. Elemento de red celular según la reivindicación 46, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 1 - inclinación
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=0} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}^{2}(n)}
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
50. Elemento de red celular según la reivindicación 46, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 10_{-0,6 inclinación}
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
51. Elemento de red celular según la reivindicación 45, en el que dicho filtro de paso de banda comprende un ancho de banda de frecuencia situado entre 5,6 kHz y 7,2 kHz.
52. Sistema de comunicación celular para dar servicio a una gran zona geográfica dividida en una pluralidad de células, que comprende: unidades transmisoras/receptoras móviles; estaciones base celulares, situadas respectivamente en dichas células; y un terminal de control para controlar la comunicación entre las estaciones base celulares:
un subsistema de comunicación inalámbrica bidireccional entre cada unidad móvil situada en una célula y la estación base celular de dicha célula, comprendiendo dicho subsistema de comunicación inalámbrica bidireccional, tanto en la unidad móvil como en la estación base celular:
a) un transmisor que incluye un codificador para codificar una señal de banda ancha y un circuito de transmisión para transmitir la señal codificada de banda ancha; y
b) un receptor que incluye un circuito de recepción para recibir una señal codificada, transmitida, de banda ancha y un decodificador, tal como se indicó en la reivindicación 7, para decodificar la señal codificada de banda ancha.
53. Subsistema de comunicación inalámbrica bidireccional según la reivindicación 52, en el que dicho generador de ruido aleatorio comprende un generador de ruido blanco aleatorio para producir una secuencia de ruido blanco, por lo cual dicha unidad de conformación espectral produce una secuencia de ruido blanco conformada espectralmente.
54. Subsistema de comunicación inalámbrica bidireccional según la reivindicación 53, en el que dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a dicha secuencia de ruido blanco y a un conjunto de parámetros de ajuste de la ganancia para producir una secuencia de ruido blanco escalada;
b) un conformador espectral para filtrar dicha secuencia de ruido blanco escalada en relación con una versión expandida en ancho de banda de los coeficientes de filtro de predicción lineal para producir una secuencia de ruido blanco escalada, filtrada, que comprende un ancho de banda de frecuencia normalmente mayor que un ancho de banda de frecuencia de dicha versión sintetizada, sobremuestreada, de la señal; y
\newpage
c) un filtro de paso de banda, sensible a dicha secuencia de ruido blanco escalada, filtrada, para producir una secuencia de ruido blanco escalada, filtrada paso banda, a inyectar posteriormente en la versión sintetizada, sobremuestreada, de la señal como una secuencia de ruido blanco conformada espectralmente.
55. Subsistema de comunicación inalámbrica bidireccional según la reivindicación 54, que comprende adicionalmente:
a) un generador de factores de voz, sensible a dichos vectores código innovadores y adaptativos para calcular un factor de voz para enviar a dicho módulo de ajuste de la ganancia;
b) un módulo de cálculo de energía, sensible a dicha señal de excitación para calcular una energía de excitación para enviarla a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales, sensible a dicha señal sintetizada para calcular un factor de escalamiento de la inclinación para enviar a dicho módulo de ajuste de la ganancia;
en el que dicho conjunto de parámetros de ajuste de la ganancia comprende dicho factor de voz, dicha energía de excitación, y dicho factor de escalamiento de la inclinación.
56. Subsistema de comunicación inalámbrica bidireccional según la reivindicación 55, en el que dicho generador de factores de voz comprende un medio para calcular dicho factor r_{v} de voz empleando la relación:
r_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde E_{v} es la energía de una versión escalada por ganancia del vector código de tono y E_{c} es la energía de una versión escala por ganancia del vector código innovador.
57. Subsistema de comunicación inalámbrica bidireccional según la reivindicación 55, en el que dicha unidad de ajuste de la ganancia comprende un medio para calcular un factor de escalamiento de la energía empleando la relación:
Factor \ de \ escalamiento \ de \ la \ \text{energía} = \sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cm
n = 0, ..., N'-1
donde w' es dicha secuencia de ruido blanco y u' es una señal mejorada de excitación obtenida de dicha señal de excitación.
58. Subsistema de comunicación inalámbrica bidireccional según la reivindicación 55, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 1 - inclinación
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
59. Subsistema de comunicación inalámbrica bidireccional según la reivindicación 55, en el que dicho calculador de inclinaciones espectrales comprende un medio para calcular dicho factor g_{t} de escalamiento de la inclinación empleando la relación:
g_{t} = 10^{-0,6 inclinación}
limitada por 0,2 \leq g_{t} \leq 1,0
donde
inclinación = \frac{\sum\limits^{N-1}_{n=1} s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e inclinación \geq r_{v}.
60. Subsistema de comunicación inalámbrica bidireccional según la reivindicación 54, en el que dicho filtro de paso de banda comprende un ancho de banda de frecuencia situado entre 5,6 kHz y 7,2 kHz.
ES99952183T 1998-10-27 1999-10-27 Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha. Expired - Lifetime ES2207968T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA002252170A CA2252170A1 (en) 1998-10-27 1998-10-27 A method and device for high quality coding of wideband speech and audio signals
CA2252170 1998-10-27

Publications (1)

Publication Number Publication Date
ES2207968T3 true ES2207968T3 (es) 2004-06-01

Family

ID=4162966

Family Applications (4)

Application Number Title Priority Date Filing Date
ES99952199T Expired - Lifetime ES2205891T3 (es) 1998-10-27 1999-10-27 Un metodo y un dispositivo para una busqueda adaptativa de tono de ancho de banda al codificar señales de banda ancha.
ES99952201T Expired - Lifetime ES2212642T3 (es) 1998-10-27 1999-10-27 Dispositivo de codificacion perceptual y metodo para la codificacion eficaz de señales de banda ancha.
ES99952183T Expired - Lifetime ES2207968T3 (es) 1998-10-27 1999-10-27 Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha.
ES99952200T Expired - Lifetime ES2205892T3 (es) 1998-10-27 1999-10-27 Aumento de la periodicidad al descodificar señales de banda ancha.

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES99952199T Expired - Lifetime ES2205891T3 (es) 1998-10-27 1999-10-27 Un metodo y un dispositivo para una busqueda adaptativa de tono de ancho de banda al codificar señales de banda ancha.
ES99952201T Expired - Lifetime ES2212642T3 (es) 1998-10-27 1999-10-27 Dispositivo de codificacion perceptual y metodo para la codificacion eficaz de señales de banda ancha.

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES99952200T Expired - Lifetime ES2205892T3 (es) 1998-10-27 1999-10-27 Aumento de la periodicidad al descodificar señales de banda ancha.

Country Status (20)

Country Link
US (8) US6795805B1 (es)
EP (4) EP1125276B1 (es)
JP (4) JP3490685B2 (es)
KR (3) KR100417634B1 (es)
CN (4) CN1127055C (es)
AT (4) ATE246389T1 (es)
AU (4) AU763471B2 (es)
BR (2) BR9914889B1 (es)
CA (5) CA2252170A1 (es)
DE (4) DE69910058T2 (es)
DK (4) DK1125276T3 (es)
ES (4) ES2205891T3 (es)
HK (1) HK1043234B (es)
MX (2) MXPA01004181A (es)
NO (4) NO318627B1 (es)
NZ (1) NZ511163A (es)
PT (4) PT1125285E (es)
RU (2) RU2217718C2 (es)
WO (4) WO2000025304A1 (es)
ZA (2) ZA200103366B (es)

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6704701B1 (en) * 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
EP1796083B1 (en) * 2000-04-24 2009-01-07 Qualcomm Incorporated Method and apparatus for predictively quantizing voiced speech
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
JP3582589B2 (ja) * 2001-03-07 2004-10-27 日本電気株式会社 音声符号化装置及び音声復号化装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
KR100393899B1 (ko) * 2001-07-27 2003-08-09 어뮤즈텍(주) 2-단계 피치 판단 방법 및 장치
US7680665B2 (en) * 2001-08-24 2010-03-16 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal adaptively
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
US8463334B2 (en) * 2002-03-13 2013-06-11 Qualcomm Incorporated Apparatus and system for providing wideband voice quality in a wireless telephone
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2392640A1 (en) 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN100531259C (zh) * 2002-12-27 2009-08-19 冲电气工业株式会社 语音通信设备
US7039222B2 (en) * 2003-02-28 2006-05-02 Eastman Kodak Company Method and system for enhancing portrait images that are processed in a batch mode
US6947449B2 (en) * 2003-06-20 2005-09-20 Nokia Corporation Apparatus, and associated method, for communication system exhibiting time-varying communication conditions
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
BRPI0414444B1 (pt) * 2003-09-16 2020-05-05 Matsushita Electric Ind Co Ltd aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação
US7792670B2 (en) * 2003-12-19 2010-09-07 Motorola, Inc. Method and apparatus for speech coding
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
CN1954363B (zh) * 2004-05-19 2011-10-12 松下电器产业株式会社 编码装置和编码方法
US8024181B2 (en) * 2004-09-06 2011-09-20 Panasonic Corporation Scalable encoding device and scalable encoding method
DE102005000828A1 (de) * 2005-01-05 2006-07-13 Siemens Ag Verfahren zum Codieren eines analogen Signals
CN102592604A (zh) * 2005-01-14 2012-07-18 松下电器产业株式会社 可扩展性解码装置及可扩展性解码方法
CN100592389C (zh) * 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
DE602006019723D1 (de) * 2005-06-08 2011-03-03 Panasonic Corp Vorrichtung und verfahren zur verbreiterung eines audiosignalbands
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
FR2889017A1 (fr) * 2005-07-19 2007-01-26 France Telecom Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants
US8417185B2 (en) 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
DK1869669T3 (da) * 2006-04-24 2008-12-01 Nero Ag Avanceret audiokodningsapparat
EP2038884A2 (en) * 2006-06-29 2009-03-25 Nxp B.V. Noise synthesis
US8358987B2 (en) * 2006-09-28 2013-01-22 Mediatek Inc. Re-quantization in downlink receiver bit rate processor
US7966175B2 (en) * 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
CN101192410B (zh) * 2006-12-01 2010-05-19 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
WO2008114075A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation An encoder
WO2008151408A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101369064B1 (ko) * 2007-07-27 2014-02-28 파나소닉 주식회사 음성 부호화 장치 및 음성 부호화 방법
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
JP5326311B2 (ja) * 2008-03-19 2013-10-30 沖電気工業株式会社 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置
CA2699316C (en) * 2008-07-11 2014-03-18 Max Neuendorf Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
KR20100057307A (ko) * 2008-11-21 2010-05-31 삼성전자주식회사 노래점수 평가방법 및 이를 이용한 가라오케 장치
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101770778B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 一种预加重滤波器、感知加权滤波方法及系统
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
GB2466673B (en) * 2009-01-06 2012-11-07 Skype Quantization
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
BRPI1008484A2 (pt) * 2009-02-26 2018-01-16 Panasonic Corp codificador, decodificador e método para os mesmos
US20110301946A1 (en) * 2009-02-27 2011-12-08 Panasonic Corporation Tone determination device and tone determination method
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
WO2011048810A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
US9812141B2 (en) 2010-01-08 2017-11-07 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
CN101854236B (zh) 2010-04-05 2015-04-01 中兴通讯股份有限公司 一种信道信息反馈方法和系统
DK2559028T3 (en) * 2010-04-14 2015-11-09 Voiceage Corp FLEXIBLE AND SCALABLE COMBINED INNOVATIONSKODEBOG FOR USE IN CELPKODER encoder and decoder
JP5749136B2 (ja) 2011-10-21 2015-07-15 矢崎総業株式会社 端子圧着電線
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CA2899059C (en) * 2013-01-29 2018-05-15 Guillaume Fuchs Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
BR112016008662B1 (pt) * 2013-10-18 2022-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala
MX355258B (es) 2013-10-18 2018-04-11 Fraunhofer Ges Forschung Concepto para codificar una señal de audio y decodificar una señal de audio usando información determinista y de tipo ruido.
WO2015079946A1 (ja) * 2013-11-29 2015-06-04 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
CN105047201A (zh) * 2015-06-15 2015-11-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于分段扩展的宽带激励信号合成方法
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
CN106601267B (zh) * 2016-11-30 2019-12-06 武汉船舶通信研究所 一种基于超短波fm调制的语音增强方法
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN113324546B (zh) * 2021-05-24 2022-12-13 哈尔滨工程大学 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法
US20230318881A1 (en) * 2022-04-05 2023-10-05 Qualcomm Incorporated Beam selection using oversampled beamforming codebooks and channel estimates

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
EP0331858B1 (en) 1988-03-08 1993-08-25 International Business Machines Corporation Multi-rate voice encoding method and device
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
JP2621376B2 (ja) 1988-06-30 1997-06-18 日本電気株式会社 マルチパルス符号化装置
JP2900431B2 (ja) 1989-09-29 1999-06-02 日本電気株式会社 音声信号符号化装置
JPH03123113A (ja) 1989-10-05 1991-05-24 Fujitsu Ltd ピッチ周期探索方式
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US6134373A (en) * 1990-08-17 2000-10-17 Samsung Electronics Co., Ltd. System for recording and reproducing a wide bandwidth video signal via a narrow bandwidth medium
US5113262A (en) * 1990-08-17 1992-05-12 Samsung Electronics Co., Ltd. Video signal recording system enabling limited bandwidth recording and playback
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
US5392284A (en) * 1990-09-20 1995-02-21 Canon Kabushiki Kaisha Multi-media communication device
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
US6006174A (en) * 1990-10-03 1999-12-21 Interdigital Technology Coporation Multiple impulse excitation speech encoder and decoder
US5235670A (en) * 1990-10-03 1993-08-10 Interdigital Patents Corporation Multiple impulse excitation speech encoder and decoder
JP3089769B2 (ja) 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
GB9218864D0 (en) * 1992-09-05 1992-10-21 Philips Electronics Uk Ltd A method of,and system for,transmitting data over a communications channel
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
IT1257431B (it) 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
DE4343366C2 (de) * 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5956624A (en) * 1994-07-12 1999-09-21 Usa Digital Radio Partners Lp Method and system for simultaneously broadcasting and receiving digital and analog signals
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
FR2729247A1 (fr) 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
AU696092B2 (en) 1995-01-12 1998-09-03 Digital Voice Systems, Inc. Estimation of excitation parameters
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
DE69628103T2 (de) * 1995-09-14 2004-04-01 Kabushiki Kaisha Toshiba, Kawasaki Verfahren und Filter zur Hervorbebung von Formanten
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
JP3063668B2 (ja) 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals

Also Published As

Publication number Publication date
DE69910239T2 (de) 2004-06-24
EP1125276A1 (en) 2001-08-22
ES2205892T3 (es) 2004-05-01
CN1328684A (zh) 2001-12-26
JP2002528983A (ja) 2002-09-03
CN1328681A (zh) 2001-12-26
DK1125285T3 (da) 2003-11-10
PT1125276E (pt) 2003-12-31
ES2205891T3 (es) 2004-05-01
ATE246836T1 (de) 2003-08-15
EP1125276B1 (en) 2003-08-06
BR9914889A (pt) 2001-07-17
WO2000025298A1 (en) 2000-05-04
RU2219507C2 (ru) 2003-12-20
DK1125286T3 (da) 2004-04-19
EP1125286A1 (en) 2001-08-22
AU6457199A (en) 2000-05-15
EP1125284B1 (en) 2003-08-06
HK1043234B (zh) 2004-07-16
CA2347735C (en) 2008-01-08
WO2000025304A1 (en) 2000-05-04
JP2002528777A (ja) 2002-09-03
EP1125286B1 (en) 2003-12-17
PT1125284E (pt) 2003-12-31
KR100417634B1 (ko) 2004-02-05
EP1125285A1 (en) 2001-08-22
CN1328683A (zh) 2001-12-26
KR20010099763A (ko) 2001-11-09
NO319181B1 (no) 2005-06-27
NO318627B1 (no) 2005-04-18
JP2002528776A (ja) 2002-09-03
NO20012067D0 (no) 2001-04-26
AU752229B2 (en) 2002-09-12
CA2347667A1 (en) 2000-05-04
NO20012068L (no) 2001-06-27
NO317603B1 (no) 2004-11-22
EP1125284A1 (en) 2001-08-22
US6807524B1 (en) 2004-10-19
US6795805B1 (en) 2004-09-21
DK1125276T3 (da) 2003-11-17
CN1127055C (zh) 2003-11-05
DE69913724D1 (de) 2004-01-29
BR9914890B1 (pt) 2013-09-24
US20050108005A1 (en) 2005-05-19
ZA200103367B (en) 2002-05-27
PT1125285E (pt) 2003-12-31
CA2347667C (en) 2006-02-14
CN1165891C (zh) 2004-09-08
WO2000025303A1 (en) 2000-05-04
DE69910058D1 (de) 2003-09-04
ATE246834T1 (de) 2003-08-15
JP3936139B2 (ja) 2007-06-27
WO2000025305A1 (en) 2000-05-04
CA2252170A1 (en) 2000-04-27
ZA200103366B (en) 2002-05-27
JP3869211B2 (ja) 2007-01-17
HK1043234A1 (en) 2002-09-06
ATE256910T1 (de) 2004-01-15
US7260521B1 (en) 2007-08-21
NO20012067L (no) 2001-06-27
AU6456999A (en) 2000-05-15
CA2347668C (en) 2006-02-14
CA2347735A1 (en) 2000-05-04
BR9914890A (pt) 2001-07-17
AU6455599A (en) 2000-05-15
RU2217718C2 (ru) 2003-11-27
CN1328682A (zh) 2001-12-26
NZ511163A (en) 2003-07-25
MXPA01004181A (es) 2003-06-06
CA2347743A1 (en) 2000-05-04
AU6457099A (en) 2000-05-15
US20050108007A1 (en) 2005-05-19
CA2347743C (en) 2005-09-27
BR9914889B1 (pt) 2013-07-30
JP3490685B2 (ja) 2004-01-26
KR100417836B1 (ko) 2004-02-05
JP2002528775A (ja) 2002-09-03
US8036885B2 (en) 2011-10-11
KR20010090803A (ko) 2001-10-19
NO20012066L (no) 2001-06-27
DK1125284T3 (da) 2003-12-01
DE69913724T2 (de) 2004-10-07
CN1165892C (zh) 2004-09-08
KR20010099764A (ko) 2001-11-09
PT1125286E (pt) 2004-05-31
NO20012066D0 (no) 2001-04-26
ES2212642T3 (es) 2004-07-16
EP1125285B1 (en) 2003-07-30
AU763471B2 (en) 2003-07-24
DE69910058T2 (de) 2004-05-19
DE69910240D1 (de) 2003-09-11
US20060277036A1 (en) 2006-12-07
MXPA01004137A (es) 2002-06-04
JP3566652B2 (ja) 2004-09-15
US7151802B1 (en) 2006-12-19
NO20012068D0 (no) 2001-04-26
ATE246389T1 (de) 2003-08-15
CA2347668A1 (en) 2000-05-04
US20100174536A1 (en) 2010-07-08
US7672837B2 (en) 2010-03-02
CN1172292C (zh) 2004-10-20
DE69910239D1 (de) 2003-09-11
NO20045257L (no) 2001-06-27
KR100417635B1 (ko) 2004-02-05
DE69910240T2 (de) 2004-06-24

Similar Documents

Publication Publication Date Title
ES2207968T3 (es) Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha.
ES2266003T3 (es) Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha.
US7280959B2 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals