ES2266003T3 - Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. - Google Patents

Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. Download PDF

Info

Publication number
ES2266003T3
ES2266003T3 ES00978928T ES00978928T ES2266003T3 ES 2266003 T3 ES2266003 T3 ES 2266003T3 ES 00978928 T ES00978928 T ES 00978928T ES 00978928 T ES00978928 T ES 00978928T ES 2266003 T3 ES2266003 T3 ES 2266003T3
Authority
ES
Spain
Prior art keywords
signal
gain
code
factor
innovative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00978928T
Other languages
English (en)
Inventor
Bruno Bessette
Redwan Salami
Roch Lefebvre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
VoiceAge Corp
Original Assignee
VoiceAge Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4164645&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2266003(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by VoiceAge Corp filed Critical VoiceAge Corp
Application granted granted Critical
Publication of ES2266003T3 publication Critical patent/ES2266003T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuits Of Receivers In General (AREA)
  • Stereophonic System (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

Un método para producir un vector de código de ganancia suavizada durante la descodificación de una señal de banda ancha codificada, a partir de un conjunto de parámetros de codificación de señal, de tal modo que dicho método comprende: hallar un vector de código (ck) y una ganancia (g) en relación con al menos un primer (k) y al menos un segundo (g) parámetros de codificación de señal, pertenecientes a dicho conjunto; calcular (501, 502) un primer factor (rv, ) representativo de un grado de articulación en voz en la señal de banda ancha, en respuesta a al menos un tercer parámetro (b, vT) de codificación de señal, perteneciente a dicho conjunto; calcular (503, 504) un segundo factor () representativo de un grado de estabilidad de dicha señal de banda ancha en respuesta a al menos un cuarto parámetro (LP) de codificación de señal, perteneciente a dicho conjunto; calcular una ganancia suavizada (gs) utilizando una operación no lineal relacionada con los primer y segundo factores (rv, ; ) y aplicada a la ganancia encontrada (g); y amplificar el vector de código hallado (ck) con dicha ganancia suavizada (gs), con el fin de producir con ello dicho vector de código suavizado en ganancia.

Description

Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha.
Antecedentes de la invención 1. Campo de la invención
La presente invención se refiere a un método y un dispositivo de suavización de la ganancia, implementados en un codificador de señal de banda ancha.
2. Breve descripción de la técnica anterior
La demanda de técnicas de codificación digitales eficaces para habla/audio de banda ancha con un buen compromiso de calidad subjetiva/velocidad de bits, está creciendo para un gran número de aplicaciones, tales como la tele-conferencia de audio/vídeo, la comunicación multimedia y las aplicaciones sin cables o inalámbricas, así como las aplicaciones de Internet y de red en paquetes. Hasta hace poco, se utilizaban principalmente en aplicaciones de codificación del habla anchuras de banda telefónicas filtradas en el intervalo entre 200 y 3.400 Hz. Sin embargo, existe una demanda creciente de aplicaciones de habla de banda ancha con el fin de incrementar la intelegibilidad o comprensibilidad, así como la naturalidad, de las señales del habla. Se ha encontrado suficiente una anchura de banda comprendida en el intervalo entre 50 y 7.000 Hz para procurar una calidad del habla frente a frente o en persona. Para las señales de audio, este intervalo proporciona una calidad de audio aceptable, pero que es aún más baja que la calidad de un CD que funciona en el intervalo entre 20 y 20.000 Hz.
Un codificador del habla convierte una señal de habla en una corriente de bits digitales que es transmitida por un canal de comunicación (o almacenada en un medio de almacenamiento). La señal de habla se digitaliza (se muestrea y cuantifica discretamente, por lo común con 16 bits por muestra) y el codificador del habla tiene el cometido de representar estas muestras digitales con un pequeño número de bits, al tiempo que mantiene una buena calidad subjetiva del habla. El descodificador del habla o sintetizador procesa o trata la corriente de bits transmitidos o almacenados con el fin de convertirla de vuelta a una señal sonora, por ejemplo, una señal de habla/audio.
Una de las mejores técnicas anteriores, capaz de conseguir un buen compromiso de calidad/velocidad de bits, es la denominada técnica de Predicción Lineal Excitada en Código (CELP - "Code Excited Linear Prediction"). De acuerdo con esta técnica, la señal de habla muestreada se procesa en bloques sucesivos de L muestras que habitualmente se denominan tramas, de tal modo que L es algún número predeterminado (correspondiente a entre 10 y 30 ms de habla). En la CELP, se computa y transmite en cada trama un filtro de síntesis de predicción lineal (LP - "linear prediction"). La trama de L muestras se divide entonces en bloques más pequeños denominados sub-tramas, de un tamaño de N muestras, donde L = kN y k es el número de sub-tramas de una trama (N corresponde habitualmente a entre 4 y 10 ms de habla). Se determina una señal de excitación en cada sub-trama, que consiste por lo común en dos componentes: una procedente de la pasada excitación (también denominada contribución de paso o código de cifrado y descifrado), y la otra procedente de un código de cifrado y descifrado innovador (también denominado código de cifrado y descifrado fijo). Esta señal de excitación es transmitida y utilizada en el descodificador como entrada del filtro de síntesis de LP con el fin de obtener un habla sintetizada.
Un código de cifrado y descifrado innovador es, en el contexto de CELP, un conjunto indexado de secuencias de N muestras de longitud a las que se hará referencia como vectores de código N-dimensionales. Cada secuencia del código de cifrado y descifrado está indexada o señalada por un entero k que varía de 1 a M, donde M representa el tamaño del código de cifrado y descifrado, expresado a menudo como un número de bits b, de tal modo que M = 2b.
Con el fin de sintetizar el habla de acuerdo con la técnica de CELP, cada bloque de N muestras es sintetizado filtrando un vector de código apropiado procedente de un código de cifrado y descifrado innovador, a través de filtros que varían con el tiempo y que configuran un modelo de las características espectrales de la señal de habla. En el extremo o terminal del codificador se computa la salida de síntesis para todos los vectores de código procedentes del código de cifrado y descifrado innovador (búsqueda en el código de cifrado y descifrado) o para un conjunto de ellos. El vector de código retenido es que produce la salida de síntesis más cercana a la señal de habla original de acuerdo con una medida de la distorsión ponderada perceptivamente. Esta ponderación perceptiva se lleva a cabo con el uso de un denominado filtro de ponderación perceptiva, que se deriva, por lo común, del filtro de síntesis de LP.
El modelo de CELP ha tenido mucho éxito a la hora de codificar señales sonoras de banda telefónica, y existen varios estándares basados en la CELP en un amplio abanico de aplicaciones, especialmente en las aplicaciones celulares digitales. En la banda telefónica, la señal sonora está limitada por la banda entre 200 y 3.400 Hz, y se toman muestras de ella a 8.000 muestras/segundo. En aplicaciones de habla/audio de banda ancha, la señal sonora está limitada por la banda entre 50 y 7.000 Hz, y se toman muestras de ella a 16.000 muestras/segundo.
Surgen algunas dificultades a la hora de aplicar el modelo de CELP optimizado de banda telefónica a las señales de banda ancha, y es preciso añadir características adicionales al modelo con el propósito de obtener señales de banda ancha de alta calidad. Las señales de banda ancha exhiben un intervalo dinámico mucho más ancho en comparación con las señales de banda telefónica, lo que da lugar a problemas de precisión cuando se requiere una implementación de coma fija del algoritmo (lo que es esencial en aplicaciones inalámbricas). Por otra parte, el modelo de CELP empleará a menudo la mayor parte de sus bits de codificación en la zona de bajas frecuencias, que tiene habitualmente mayor contenido de energía, lo que da lugar a una señal de salida de paso bajo.
El documento US-A-5.195.168 describe un dispositivo para reconstruir sustancialmente una señal. La señal se divide en intervalos de tiempo sucesivos. Cada intervalo de tiempo tiene una señal de referencia de entrada con un conjunto de vectores, y al menos una señal eléctrica representativa para cada señal de referencia de entrada. El dispositivo utiliza una unidad de código de cifrado y descifrado provista de una memoria de código de cifrado y descifrado, un dispositivo ajustador de la ganancia, una unidad de síntesis provista de un filtro de síntesis, un dispositivo de combinación y una unidad de ponderación perceptiva que utiliza las señales eléctricas representativas para generar un conjunto relacionado de vectores de señal sintetizados, con vistas a la reconstrucción sustancial de la señal.
Para cada vector de las señales de referencia de entrada, se proporciona desde la memoria de código de cifrado y descifrado un vector de código de cifrado y descifrado de excitación concreto, de tal modo que la memoria de código de cifrado y descifrado tiene un conjunto de vectores de código de excitación almacenados en ella. Si se desea, el dispositivo ajustador de la ganancia, sensible al vector de código de excitación concreto, multiplica ese vector de código por un factor de ganancia de excitación seleccionado, con el fin de proporcionar sustancialmente una correlación con una energía de la señal eléctrica representativa para cada vector de señal de referencia de entrada. El filtro de síntesis interpolado correspondiente, sensible al vector de código de excitación particular multiplicado por la ganancia particular, produce el vector de señal sintetizado.
Un problema que se aprecia en las señales de habla sintetizadas es una reducción en el rendimiento del descodificador cuando está presente ruido de fondo en la señal de habla muestreada. En el extremo o terminal del descodificador, el modelo de CELP se sirve de técnicas de filtrado ulterior y de tratamiento ulterior con el propósito de mejorar la señal sintetizada percibida. Estas técnicas han de adaptarse para su adecuación a las señales de banda ancha.
Sumario de la invención
Con el fin de superar el problema anteriormente expuesto de la técnica anterior, la presente invención proporciona un método para producir un vector de código suavizado en ganancia durante la descodificación de una señal de banda ancha codificada, a partir de un conjunto de parámetros de codificación de señal. Este método comprende hallar un vector de código y una ganancia en relación con al menos un primer y al menos un segundo parámetros de codificación de señal del conjunto, calcular un primer factor representativo de un grado de vecindad o proximidad en la señal de banda ancha, en respuesta a al menos un tercer parámetro de codificación de señal del conjunto, calcular un segundo factor representativo de un grado de estabilidad de la señal de banda ancha en respuesta a al menos un cuarto parámetro de codificación de señal del conjunto, calcular una ganancia suavizada utilizando una operación no lineal relacionada con los primer y segundo factores y aplicada a la ganancia encontrada, y amplificar el vector de código hallado con la ganancia suavizada, a fin de producir con ello el vector de código suavizado en ganancia.
La presente invención se refiere también a un método para producir un vector de código suavizado en ganancia durante la descodificación de una señal codificada, a partir de un conjunto de parámetros de codificación de señal, de tal modo que la señal contiene ruido de fondo estacionario. Este método comprende hallar un vector de código y una ganancia en relación con al menos un primer y al menos un segundo parámetros de codificación de señal del conjunto, calcular al menos un factor indicativo de un nivel de ruido de fondo estacionario en la señal, en respuesta a al menos un tercer parámetro de codificación de señal del conjunto, calcular una ganancia suavizada utilizando una operación no lineal relacionada con el factor indicativo del nivel de ruido y aplicada a la ganancia hallada, y amplificar el vector de código hallado con la ganancia suavizada, al objeto de producir con ello dicho vector de código suavizado en ganancia.
En consecuencia, la presente invención utiliza una característica de suavización de la ganancia para codificar eficazmente señales de banda ancha (entre 50 y 7.000 Hz) a través, en particular, pero no exclusivamente, de técnicas de codificación del tipo de CELP, con vistas a obtener una señal reconstruida (sintetizada) de alta calidad, especialmente en presencia de ruido de fondo en la señal de banda ancha de la que se toman muestras, o muestreada.
De acuerdo con realizaciones preferidas del método para la producción de un vector de código suavizado en ganancia:
- hallar un vector de código comprende hallar un vector de código innovador de un código de cifrado y descifrado innovador, en relación con dicho al menos un primer parámetro de codificación de señal;
- hallar una ganancia comprende hallar una ganancia de código de cifrado y descifrado innovador;
- el primer parámetro codificador de señal comprende un índice de código de cifrado y descifrado innovador;
- el al menos un tercer parámetro de codificación comprende los siguientes parámetros:
una ganancia de paso, computada durante la codificación de la señal de banda ancha;
un retardo de paso, computado durante la codificación de la señal de banda ancha;
un índice j de un filtro de paso bajo, seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha;
- el al menos un tercer parámetro de codificación de señal comprende coeficientes de un filtro de predicción lineal, calculados durante la codificación de la señal de banda ancha;
- el vector de código innovador se halla en el código de cifrado y descifrado innovador en relación con un índice k del código de cifrado y descifrado innovador, de tal modo que este índice k forma el primer parámetro de codificación de señal;
- calcular un primer factor comprende computar un factor de configuración o articulación en voz, rv, por medio de la siguiente relación:
rv = (Ev - Ec)/(Ev + Ec)
donde:
- Ev es la energía de un vector de código adaptativo regulado en escala, bvT;
- Ec es la energía de un vector de código innovador regulado en escala, gck;
- b es una ganancia de paso computada durante la codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la codificación de la señal de banda ancha;
- vT es un vector de código de cifrado y descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y descifrado innovador computada durante la codificación de la señal de banda ancha;
- k es un índice del código de cifrado y descifrado innovador computado durante la codificación de la señal de banda ancha; y
- ck es el vector de código innovador de dicho código de cifrado y descifrado innovador en el índice k;
- el factor de articulación en voz rv tiene un valor situado entre -1 y 1, de tal modo que el valor 1 corresponde a una señal articulada en voz y pura, y el valor -1 corresponde a una señal no articulada en voz y pura;
- calcular una ganancia suavizada comprende computar un factor \lambda utilizando la siguiente relación:
\lambda = 0,5(1 - rv).
- un factor \lambda = 0 indica una señal configurada o articulada en voz y pura, y un factor \lambda = 1 indica una señal no articulada en voz y pura;
- calcular un segundo factor comprende determinar una medida de distancia que proporcione una similitud entre filtros de predicción lineales adyacentes y sucesivos, computados durante la codificación de la señal de banda ancha;
- la señal de banda ancha se muestrea antes de ser codificada y es procesada por tramas durante su codificación y descodificación, y determinar una medida de distancia comprende calcular una medida de distancia de Pares Espectrales de Inmitancia entre los Pares Espectrales de Inmitancia existentes en una trama presente en ese momento, n, de la señal de banda ancha, y los Pares Espectrales de Inmitancia de una trama pasada, n - 1, de la señal de banda ancha, por medio de la siguiente relación:
D_{S} = \sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} - isp^{(n-1)}_{i}\right)^{2}
donde p es el orden del filtro de predicción lineal;
\newpage
- calcular un segundo factor comprende establecer una relación de correspondencia entre la medida de distancia de Pares Espectrales de Inmitancia, Ds, y el segundo factor \theta, a través de la siguiente relación:
\theta = 1,25 - D_{s}/400 . 000.0
limitada por 0 \leq \theta \leq 1;
- calcular una ganancia suavizada comprende calcular un factor de ganancia suavizada, Sm, basándose tanto en el primer factor \lambda como en el segundo factor \theta a través de la siguiente relación:
S_{m} = \lambda \theta
- el factor Sm tiene un valor que se aproxima a 1 para una señal de banda ancha no articulada en voz y estable, y un valor que se aproxima a 0 para una señal de banda ancha articulada en voz y pura, o para una señal de banda ancha inestable;
- calcular una ganancia suavizada comprende computar una ganancia modificada inicial g0 comparando la ganancia hallada g, computada durante la codificación de la señal de banda ancha, con un umbral dado por la ganancia modificada inicial a partir de la sub-trama pasada g - 1, como sigue:
si g < g - 1, entonces g0 = g \times 1,19, limitada por g0 \leq g - 1
y
si g \geq g - 1, entonces g0 = g/1,19, limitada por g0 \geq g - 1; y
- calcular una ganancia suavizada comprende calcular una ganancia modificada inicial g0 por comparación de la ganancia hallada con un umbral.
- calcular una ganancia suavizada comprende calcular un factor de suavización de ganancia, Sm, basándose tanto en el primer factor \lambda como en el segundo factor \theta a través de la siguiente relación:
S_{m} = \lambda \theta
y determinar dicha ganancia suavizada gs a través de la siguiente relación:
g_{s} = S_{m}\cdot g_{0} + (1 - S_{m})\cdot g
Aún adicionalmente, la presente invención se refiere:
- para implementar el método anterior, a un dispositivo para producir un vector de código suavizado en ganancia durante la descodificación de una señal de banda ancha codificada a partir de un conjunto de parámetros de codificación de señal; y
- a un sistema de comunicación celular, a un elemento de red y a un subsistema de comunicación inalámbrica y bidireccional, o en ambos sentidos, que incorporan el anterior dispositivo para producir un vector de código suavizado en ganancia durante la descodificación de la señal de banda ancha codificada a partir del conjunto de parámetros de codificación de señal.
Los anteriores y otros objetos, ventajas y características de la presente invención se podrán de manifiesto de forma más evidente con la lectura de la siguiente descripción no limitativa de una realización preferida de la misma, proporcionada tan solo con un propósito ilustrativo, con referencia a los dibujos que se acompañan.
Breve descripción de los dibujos
En los dibujos anexos:
la Figura 1 es un diagrama de bloques esquemático de un codificador de banda ancha;
la Figura 2 es un diagrama de bloques esquemático de un descodificador de banda ancha que incorpora el método y el dispositivo de suavización de la ganancia de acuerdo con la invención;
la Figura 3 es un diagrama de bloques esquemático de un dispositivo de análisis de paso;
\newpage
la Figura 4 es un diagrama de bloques esquemático y simplificado de un sistema de comunicación celular en el que pueden utilizarse el codificador de banda ancha de la Figura 1 y el descodificador de banda ancha de la Figura 2; y
la Figura 5 es un diagrama de flujo esquemático del método de suavización de la ganancia incorporado en el descodificador de banda ancha de la Figura 2.
Descripción detallada de la realización preferida
Como es bien conocido por las personas con conocimientos ordinarios de la técnica, un sistema de comunicación celular tal como el 401 (véase la Figura 4) proporciona un servicio de telecomunicación sobre una gran zona geográfica al dividir la gran zona geográfica en un cierto número C de celdas más pequeñas. Se presta servicio a las celdas C más pequeñas por respectivas estaciones de base celulares 4021, 4022, ..., 402C con el fin de proporcionar a cada celda canales por radio de señalización, de audio y de datos.
Los canales de señalización por radio se utilizan para hacer llamadas de reconocimiento de los radioteléfonos móviles (unidades trasmisoras/receptoras móviles), tales como el 403, situados dentro de los límites del área de cobertura (celda) de la estación de base celular 402, y para efectuar llamadas a otros radioteléfonos 403 situados ya sea dentro, ya sea fuera de la celda de la estación de base, o bien a otra red, tal como la Red de Telefonía Pública Conmutada (PSTN - "Public Switched Telephone Network") 404.
Una vez que un radioteléfono 403 ha efectuado o recibido con éxito una llamada, se establece un canal de audio o de datos entre este radioteléfono 403 y la estación de base celular 402 correspondiente a la celda en la que se encuentra situado el radioteléfono 403, y se conduce la comunicación entre la estación de base 402 y el radioteléfono 403 por el canal de audio o de datos. El radioteléfono 403 puede recibir también información de control o de regulación de secuencia temporal por un canal de señalización mientras una llamada está en curso.
Si un radioteléfono 403 abandona una celda y entra en otra celda adyacente mientras hay una llamada en curso, el radioteléfono 403 entrega la llamada a un canal de audio o de datos disponible de la estación de base 402 de la nueva celda. Si un radioteléfono 403 abandona una celda y entra en otra celda adyacente cuando no hay ninguna llamada en curso, el radioteléfono 403 envía un mensaje de control a través del canal de señalización para darse de alta o inscribirse en la estación de base 402 de la nueva celda. Es posible, de esta forma, la comunicación móvil a través de una extensa zona geográfica.
El sistema de comunicación celular 401 comprende adicionalmente un terminal de control 405 destinado a controlar la comunicación entre las estaciones de base celulares 402 y la PSTN 404, por ejemplo, en el curso de una comunicación entre un radioteléfono 403 y la PSTN 404, ó entre un radioteléfono 403 situado en una primera celda y un radioteléfono 403 situado en una segunda celda.
Por supuesto, se requiere un subsistema de comunicación por radio inalámbrico y bidireccional para establecer un canal de audio o de datos entre una estación de base 402 de una celda y un radioteléfono 403 situado en esa celda. Como se ha ilustrado de forma muy simplificada en la Figura 4, tal subsistema de comunicación por radio inalámbrico y bidireccional comprende, convencionalmente, en el radioteléfono 403;
- un transmisor 406, que incluye:
-
un codificador 407 para codificar el habla; y
-
un circuito transmisor 408 para transmitir el habla codificada desde el codificador 407 a través de una antena, tal como la 409; y
- un receptor 410, que incluye:
-
un circuito receptor 411 para recibir el habla codificada y transmitida habitualmente a través de la misma antena 409; y
-
un descodificador 412 para descodificar el habla codificada recibida procedente del circuito receptor 411.
El radioteléfono 403 comprende adicionalmente otros circuitos 413 de radioteléfono convencional a los que están conectados el codificador 407 y el descodificador 412, y destinados a procesar las señales procedentes de los mismos, circuitos 413 que son bien conocidos por parte de las personas con conocimientos ordinarios de la técnica y que, en consecuencia, no se describirán adicionalmente en la presente Memoria.
Asimismo, dicho subsistema de comunicación por radio inalámbrico y bidireccional comprende, de forma convencional, en cada estación de base 402:
- un transmisor 414, que incluye:
-
un codificador 415 para codificar el habla; y
-
un circuito de transmisión 416 para transmitir el habla codificada desde el codificador 415 a través de una antena, tal como la 417; y
- un receptor 418, que incluye:
-
un circuito receptor 419 para recibir el habla codificada transmitida, a través de la misma antena 417 ó a través de otra antena (no mostrada); y
-
un descodificador 420 para descodificar el habla codificada recibida, procedente del circuito receptor 419.
La estación de base 402 comprende adicionalmente, de manera convencional, un controlador 421 de estación de base, conjuntamente con su base de datos asociada 422, para controlar la comunicación entre el terminal de control 405 y el transmisor 414 y el receptor 418.
Como es bien conocido por parte de los expertos medios de la técnica, se requiere la codificación de la voz con el fin de reducir la anchura de banda necesaria para transmitir señales sonoras, por ejemplo, una señal de voz tal como el habla, a través del subsistema de comunicación por radio inalámbrico y bidireccional, esto es, entre un radioteléfono 403 y una estación de base 402.
Los codificadores de voz de LP (tales como los 415 y 407) que funcionan convencionalmente a 13 kbits/segundo y por debajo, tal como los codificadores de Predicción Lineal Excitada en Código (CELP - "Code-Excited Linear Prediction"), utilizan de manera convencional un filtro de síntesis de LP para configurar un modelo de la envolvente espectral de corto plazo del habla. La información de LP se transmite, típicamente, cada 10 ó 20 ms al descodificador (tal como el 420 y el 412) y se extrae por el terminal del descodificador.
Las nuevas técnicas que se describen en la presente Memoria pueden aplicarse a diferentes codificadores basados en LP. Sin embargo, se utiliza en la realización preferida un codificador del tipo de CELP con el propósito de presentar una ilustración no limitativa de estas técnicas. De la misma manera, dichas técnicas pueden utilizarse con señales sonoras diferentes del habla y de la voz, así como con otros tipos de señales de banda ancha.
La Figura 1 muestra un diagrama de bloques general de un codificador del habla 100 del tipo de CELP, modificado para adaptarse mejor a las señales de banda ancha.
La señal de habla de entrada muestreada 114 se divide en dos bloques de L muestras sucesivos denominados "tramas". Durante cada trama, se computan, codifican y transmiten diferentes parámetros que representan la señal de habla contenida en la trama. Los parámetros de LP que representan el filtro de síntesis de LP se computan habitualmente una vez cada trama. La trama se divide adicionalmente en bloques más pequeños de N muestras (bloques de longitud N), en los que se determinan los parámetros de excitación (paso e innovación). En la literatura de la CELP, estos bloques de longitud N se denominan "sub-tramas", y se hace referencia a las señales de N muestras de las sub-tramas como vectores N-dimensionales. En esta realización preferida, la longitud N corresponde a 5 ms, en tanto que la longitud L corresponde a 20 ms, lo que significa que una trama contiene cuatro sub-tramas (N = 80 a la velocidad de toma de muestras o muestreo de 16 kHz, y 64 tras hacer descender la toma de muestras a 12,8 kHz). En el procedimiento de codificación están implicados diversos vectores N-dimensionales. Se da aquí, en lo que sigue, una lista de los vectores que aparecen en las Figuras 1 y 2, así como una lista de los parámetros transmitidos:
\vskip1.000000\baselineskip
Lista de los vectores N-dimensionales principales
s
vector de habla de entrada de señal de banda ancha (tras la disminución de la velocidad de muestreo, el tratamiento previo y el énfasis previo);
sw
Vector de habla ponderado;
s0
Respuesta ante entrada cero del filtro de síntesis ponderado;
sp
Señal previamente tratada y muestreada a velocidad disminuida; Señal de habla sintetizada y muestreada a velocidad aumentada;
s'
Señal de síntesis antes de la reducción del énfasis;
sd
Señal de síntesis reducida en énfasis;
sh
Señal de síntesis tras la reducción del énfasis y su tratamiento ulterior;
x
Vector de objetivo para la búsqueda de paso;
x'
Vector de objetivo para la búsqueda innovadora;
h
Respuesta ante impulso del filtro de síntesis ponderado;
vT
Vector de código de cifrado y descifrado adaptativo (paso) en el retardo T;
yT
Vector de código de cifrado y descifrado de paso filtrado (vT en convolución con h);
ck
Vector de código innovador en el índice k (k-ésima entrada desde el código de cifrado y descifrado innovador);
cf
Vector de código innovador regulado en escala y mejorado;
u
Señal de excitación (vectores de código innovador y de paso regulados en escala);
u'
Excitación mejorada;
z
Secuencia de ruido de paso de banda;
w'
Secuencia de ruido blanco; y
w
Secuencia de ruido regulada en escala.
\vskip1.000000\baselineskip
Lista de parámetros transmitidos
STP
parámetros de predicción a corto plazo ("short term prediction") (que definen A(z));
T
retraso de paso (o índice de código de cifrado y descifrado de paso);
b
ganancia de paso (o ganancia de código de cifrado y descifrado de paso);
j
Índice del filtro de paso bajo aplicado al vector de código de paso;
k
índice de vector de código (entrada de código de cifrado y descifrado innovador); y
g
ganancia de código de cifrado y descifrado innovador;
En esta realización preferida, los parámetros de STP son transmitidos una vez por cada trama y el resto de los parámetros son transmitidos cuatro veces por cada trama (en cada sub-trama).
Codificador 100
La señal de habla muestreada se codifica según una pauta de bloque por bloque por parte del codificador 100 de la Figura 1, que está dividido en once (11) módulos que llevan las referencias 101 a 111, respectivamente.
El habla de entrada es procesada o tratada en el interior de los bloques de L muestras anteriormente mencionados, que se denominan tramas.
Haciendo referencia a la Figura 1, la señal de habla de entrada muestreada 114 se reduce en su velocidad de muestreo en un módulo de velocidad de muestreo reducida, o de muestreo descendente, 101. Por ejemplo, se reduce la velocidad de muestreo de la señal de 16 kHz a 12,8 kHz, con el uso de técnicas bien conocidas por parte de las personas con conocimientos ordinarios de la técnica. Puede, por supuesto, contemplarse la reducción de la velocidad de muestreo hasta una frecuencia diferente de 12,8 kHz. La reducción de la velocidad de muestreo, o muestreo descendente, incrementa la eficacia de la codificación, puesto que se codifica una anchura de banda de frecuencias más pequeña. Esto también reduce la complejidad de los algoritmos, ya que se reduce el número de muestras de una trama. El uso de la reducción de la velocidad de muestreo llega a ser significativo cuando la velocidad de los bits se reduce por debajo de 16 kbits/segundo, si bien no es esencial la reducción de la velocidad de muestreo por encima de 16 kbits/segundo.
Tras la reducción de la velocidad de muestreo, la trama de 320 muestras y de 20 ms se reduce a una trama de 256 muestras (relación de reducción de la velocidad de muestreo de 4/5).
La trama de entrada se suministra entonces al bloque de tratamiento previo opcional 102. El bloque de tratamiento previo 102 puede consistir en un filtro de paso alto con una frecuencia de corte de 50 Hz. El filtro de paso alto 102 elimina los componentes sonoros indeseados por debajo de 50 Hz.
La señal muestreada a velocidad reducida y previamente procesada se denota por sp(n), con n = 0, 1, 2, ..., L-1, donde L es la longitud de la trama (256 a una frecuencia de muestreo de 12,8 kHz). En una realización preferida del filtro de énfasis previo 103, la señal sp(n) es enfatizada previamente con el uso de la siguiente función de transferencia:
P(z) = 1 - \mu_{z}{}^{-1}
donde \mu es un factor de énfasis previo con un valor situado entre 0 y 1 (un valor típico es \mu = 0,7). Puede utilizarse también un filtro de orden superior. Ha de destacarse que es posible intercambiar el filtro de paso alto 102 y el filtro de énfasis previo 103 con el fin de obtener implementaciones de coma fija más eficaces.
La función del filtro de énfasis previo 103 es mejorar el contenido en frecuencia de la señal de entrada. Éste también reduce el intervalo dinámico de la señal de habla de entrada, lo que la hace más adecuada para la implementación de coma fija. Sin el énfasis previo, el análisis de LP en coma fija con el uso de aritmética de precisión única resulta difícil de llevar a la práctica.
El énfasis previo juega también un importante papel a la hora de conseguir una ponderación perceptiva global adecuada del error de cuantificación discreta, lo que contribuye a mejorar la calidad del sonido. Esto se explicará aquí con mayor detalle más adelante.
La salida del filtro de énfasis previo 103 se denota por s(n). Esta señal se utiliza para llevar a cabo el análisis de LP en un módulo calculador 104. El análisis de LP es una técnica bien conocida por parte de las personas con conocimientos ordinarios de la técnica. En esta realización preferida se utiliza la aproximación de auto-correlación. En la aproximación de auto-correlación, la señal s(n) se encuadra en primer lugar utilizando una ventana de Hamming (que tiene, por lo común, una longitud del orden de entre 30 y 40 ms). Las auto-correlaciones se computan a partir de la señal encuadrada, y se utiliza un tratamiento recursivo o recurrente de Levinson-Durbin para computar los coeficientes de filtro de LP, ai, donde i = 1, ..., p, y donde p es el orden de LP, que es, de manera convencional, 16 en codificación de banda ancha. Los parámetros ai son los coeficientes de la función de transferencia del filtro de LP, los cuales vienen dados por la siguiente relación:
A(z) = 1 + \sum\limits^{P}_{i=1} a_{i}z^{-1}
El análisis de LP se lleva a cabo en un módulo calculador 104, el cual realiza también la cuantificación discreta y la interpolación de los coeficientes de filtro de LP. Los coeficientes de filtro de LP se transforman primeramente en otro dominio equivalente, más adecuado para los propósitos de cuantificación discreta e interpolación. Los dominios de par espectral de línea (LSP - "line spectral pair") y de par espectral de inmitancia (ISP - "immitance spectral pair") son dos dominios en los cuales puede llevarse a cabo de forma eficiente la cuantificación discreta y la interpolación. Los 16 coeficientes de filtro de LP, ai, pueden cuantificarse de forma discreta en el orden de entre 30 y 50 bits mediante el uso de una cuantificación discreta dividida o de múltiples etapas, o bien una combinación de las mismas. El propósito de la interpolación consiste en permitir la actualización de los coeficientes de filtro de LP cada sub-trama, en tanto que son transmitidos una vez por cada trama, lo que mejora el rendimiento del codificador sin incrementar la velocidad de los bits. De otro modo, se cree que la cuantificación discreta y la interpolación de los coeficientes de filtro de LP son bien conocidas por parte de los expertos medios de la técnica y, en consecuencia, no se describirán adicionalmente en la presente Memoria.
Los párrafos que siguen describirán el resto de las operaciones de codificación que se llevan a cabo siguiendo criterio por sub-tramas. En la siguiente descripción, el filtro A(z) denota el filtro de LP interpolado y no cuantificado de forma discreta de la sub-trama, y el filtro Â(z) denota el filtro de LP cuantificado discretamente e interpolado de la sub-trama.
Ponderación perceptiva
En los codificadores de análisis por síntesis, el paso y los parámetros innovadores óptimos se buscan minimizando el error cuadrático medio entre el habla de entrada y el habla sintetizada en un dominio ponderado perceptivamente. Esto es equivalente a minimizar el error entre el habla de entrada ponderada y el habla de síntesis ponderada.
La señal ponderada sw(n) se computa en un filtro de ponderación perceptiva 105. Tradicionalmente, la señal ponderada sw(n) ha venido computándose por medio de un filtro de ponderación que tiene una función de transferencia W(z) con la forma:
W(z) = A(z/\gamma_{1})/A(z/\gamma_{2})
donde
0 < \gamma_{2} < \gamma_{1} \leq 1
Como es bien conocido por parte las personas con conocimientos ordinarios de la técnica, en los codificadores de análisis por síntesis (AbS - "analysis-by-synthesis") de la técnica anterior, el análisis muestra que el error de cuantificación discreta se pondera por una función de transferencia W-1(z) que es la inversa de la función de transferencia del filtro de ponderación perceptiva 105. Este resultado se ha descrito bien por B. S. Atal y M. R. Schroeder en la divulgación "Predictive coding of speech and subjective error criteria" ("Codificación de predicción del habla y criterios de error subjetivos"), Transacción ASSP del IEEE, vol. 27, Nº págs. 247-254, junio de 1979. La función de transferencia W-1(z) exhibe algo de la estructura constituyente o de componentes sinusoidales de la señal de habla de entrada. Se explota, de esta forma, la propiedad de enmascaramiento del oído humano al dotar al error de cuantificación discreta de una forma tal, que éste tiene más energía en las zonas constituyentes en las que se verá enmascarado por la fuerte energía de señal presente en estas zonas. La magnitud de la ponderación es controlada por los factores \gamma1 y \gamma2.
El filtro de ponderación perceptiva tradicional anterior 105 trabaja bien con las señales de banda de telefonía. Sin embargo, se ha encontrado que este filtro de ponderación perceptiva tradicional 105 tiene limitaciones intrínsecas a la hora de configurar un modelo de la estructura constituyente o de componentes sinusoidales y de la inclinación espectral requerida de forma concurrente. La inclinación espectral es más pronunciada en las señales de banda ancha debido al ancho intervalo dinámico entre las frecuencias bajas y altas. La técnica anterior ha sugerido añadir un filtro de inclinación dentro de W(z) con el propósito de controlar la inclinación y la ponderación de las constituyentes de la señal de entrada de banda ancha por separado.
Una solución novedosa para este problema consiste en introducir el filtro de énfasis previo 103 a la entrada, computar el filtro de LP A(z) basándose en el habla previamente enfatizada s(n), y utilizar un filtro modificado W(z) fijando su denominador.
El análisis de LP se lleva a cabo en un módulo 104 sobre la señal previamente enfatizada s(n) con el fin de obtener el filtro de LP A(z). Se utiliza también un nuevo filtro de ponderación perceptiva 105 con su denominador fijado. Un ejemplo de función de transferencia para el filtro de ponderación perceptiva 105 viene dado por la siguiente relación:
W(z) = A(z/\gamma_{1})/(1 - \gamma_{2}z^{-1})
donde
0 < \gamma_{2} < \gamma_{1} \leq 1
Puede utilizarse un orden superior en el denominador. Esta estructura desacopla sustancialmente la ponderación de constituyentes de la inclinación.
Nótese que, debido a que A(z) se computa basándose en la señal de habla previamente enfatizada s(n), la inclinación del filtro 1/A(z/\gamma1) es menos pronunciada en comparación con el caso en que A(z) se computa basándose en el habla original. Como la reducción del énfasis se lleva a cabo en el terminal del descodificador utilizando un filtro que tiene la función de transferencia:
P^{-1}(z) = 1/(1 - \mu_{z}^{-1}),
el espectro de errores de cuantificación discreta está conformado por un filtro que tiene una función de transferencia W - 1(z)P - 1(z). Cuando \gamma2 se establece de modo que sea igual a \mu, cual es típicamente el caso, el espectro del error de cuantificación discreta se conforma por un filtro cuya función de transferencia es 1/A(z/\gamma1), en la que A(z) se computa basándose en la señal de habla previamente enfatizada. Una escucha subjetiva demostró que esta estructura para conseguir la conformación del error por una combinación de énfasis previo y filtración de ponderación modificada, resulta muy eficaz para codificar señales de banda ancha, además de presentar las ventajas de facilidad de implementación algorítmica de coma fija.
Análisis del paso
Con el fin de simplificar el análisis del paso, se estima en primer lugar un retraso de paso de bucle abierto TOL en un módulo 106 de búsqueda de paso de bucle abierto, con el uso de la señal de habla ponderada sw(n). A continuación, el análisis de paso de bucle cerrado, que se lleva a cabo en un módulo 107 de búsqueda de paso de bucle cerrado, se restringe al entorno del retraso de paso de bucle abierto TOL, lo que reduce significativamente la complejidad de la búsqueda de los parámetros de los parámetros de LTP T y b (retraso de paso y ganancia de paso, respectivamente). El análisis de paso de bucle abierto se lleva a cabo habitualmente en el módulo 106 una vez cada 10 ms (dos sub-tramas), con el uso de técnicas bien conocidas por parte de las personas con conocimientos ordinarios de la técnica.
Se computa primeramente el vector de objetivo x para el análisis de LTP (Predicción a Largo Plazo - "Long Term Prediction"). Esto se realiza, por lo común, restando la respuesta ante entrada cero, s0, del filtro de síntesis ponderada W(z)/Â(z), de la señal de habla ponderada sw(n). Esta respuesta ante entrada cero, s0, se calcula por medio de un dispositivo calculador 108 de respuesta ante entrada cero. Más específicamente, el vector de objetivo x se calcula utilizando la siguiente relación:
x = s_{w} - s_{0}
donde x es el vector de objetivo N-dimensional, sw es el vector de habla ponderado de la sub-trama, y s0 es la respuesta ante entrada cero del filtro W(z)/Â(z), que es la salida del filtro combinado W(z)/Â(z) debido a sus estados iniciales. El calculador 108 de respuesta ante entrada cero es sensible al filtro de LP Â(z) cuantificado discretamente e interpolado, procedente del módulo calculador 104 de análisis de LP, cuantificación discreta e interpolación, y a los estados iniciales del filtro de síntesis ponderado W(z)/Â(Z), almacenado en el módulo de memoria 111, para calcular la respuesta ante entrada cero, s0 (la parte de la respuesta debida a los estados iniciales según se determina estableciendo las entradas iguales a cero), del filtro W(z)/Â(Z). De nuevo, esta operación es bien conocida por parte de las personas con conocimientos ordinarios de la técnica y, en consecuencia, no se describirá adicionalmente.
Por supuesto, pueden utilizarse soluciones alternativas pero matemáticamente equivalentes para computar el vector de objetivo x.
Se computa un vector de respuesta ante impulso N-dimensional, h, del filtro de síntesis ponderado W(z)/Â(Z), en el módulo 109 generador de respuesta ante impulso, utilizando los coeficientes de filtro de LP A(z) y Â(Z) procedentes del módulo 104. De nuevo, esta operación es bien conocida por parte de los expertos medios de la técnica y, en consecuencia, no se describirá adicionalmente en la presente Memoria.
Los parámetros de paso (o de código de cifrado y descifrado de paso) de bucle cerrado, b, T y j, son computados en el módulo 107 de búsqueda de paso de bucle cerrado, el cual utiliza como entradas el vector de objetivo x, el vector h de respuesta ante impulso y el retraso de paso de bucle abierto TOL. Tradicionalmente, la predicción del paso ha venido siendo representada por un filtro de paso que tiene la siguiente función de transferencia:
1/(1 - bz^{-T})
donde b es la ganancia de paso y T es el retardo o retraso de paso. En este caso, la contribución del paso a la señal de excitación u(n) viene dada por bu(n-T), donde la excitación total viene dada por
u(n) = bu(n - T) + gc_{k}(n)
en la que g es la ganancia de código de cifrado y descifrado innovador y ck(n) es el vector de código innovador en el índice k.
Esta representación presenta limitaciones si el retraso de paso T es más corto que la longitud N de la sub-trama. En otra representación, la contribución del paso puede verse como un código de cifrado y descifrado de paso que contiene la señal de excitación pasada. En general, cada vector del código de cifrado y descifrado de paso es una versión desplazada en uno del vector previo (desechando una muestra y añadiendo una nueva muestra). Para retrasos de paso T > N, el código de cifrado y descifrado de paso es equivalente a la estructura de filtro (1/(1-bz-T)), y el vector de código de cifrado y descifrado de paso, vT(n), para el retraso de paso T, viene dado por:
v_{T(n)} = u(n - T)
n = 0, ..., N-1.
Para los retrasos de paso T más cortos que N, se construye un vector vT(n) repitiendo las muestras disponibles desde la excitación pasada hasta que se ha completado el vector (esto no es equivalente a la estructura de fil-
tro).
En los codificadores recientes se utiliza una resolución de paso más alta, lo que mejora significativamente la calidad de los segmentos de sonido articulados con la voz. Esto se consigue aumentando la velocidad de muestreo de la señal de excitación pasada mediante el uso de filtros de interpolación polifásicos. En este caso, el vector vT(n) corresponde por lo común a una versión interpolada de la excitación pasada, de tal modo que el retraso de paso T es un retardo no entero (por ejemplo, 50,25).
La búsqueda del paso cosiste en encontrar los mejores retraso de paso T y ganancia b que minimicen el error cuadrático medio ponderado E entre el vector de objetivo x y la excitación pasada, regulada en escala y filtrada. El error E se expresa como:
E = \Arrowvert x - by_{T} \Arrowvert^{2}
\newpage
donde yT es el vector de código de cifrado y descifrado de paso filtrado en el retraso de paso T:
y_{T}(n) = v_{T}(n) \text{*} h(n) = \sum\limits^{n}_{i=0} v_{T}(i)h(n-i)
n = 0, ..., N-1.
Puede demostrarse que el error E se minimiza si se maximiza el criterio de búsqueda:
C = \frac{x^{t}y_{T}}{\sqrt{y^{t}_{T}y_{T}}}
donde t denota el transpuesto del vector.
En la realización preferida de la presente invención, se utiliza una resolución de paso de sub-muestra de 1/3 y la búsqueda de paso (código de cifrado y descifrado de paso) se compone de tres etapas.
En la primera etapa, se estima el retraso de paso de bucle abierto TOL en el módulo 106 de búsqueda de paso de bucle abierto, en respuesta a la señal de habla ponderada sw(n). Como se indica en la siguiente descripción, este análisis de paso de bucle abierto se lleva a cabo por lo común una vez cada 10 ms (dos sub-tramas), utilizando técnicas bien conocidas por las personas con conocimientos ordinarios de la técnica.
En la segunda etapa, se busca el criterio de búsqueda C en el módulo 107 de búsqueda de paso de bucle cerrado, para retrasos de paso enteros en el entorno del retraso de paso de bucle abierto TOL estimado (habitualmente \pm5), lo que simplifica de forma significativa el procedimiento de búsqueda. Puede utilizarse un procedimiento sencillo para actualizar el vector de códigos filtrado yT sin necesidad de computar la convolución para cada retraso de paso.
Una vez que se ha encontrado un retraso de paso entero óptimo en la segunda etapa, una tercera etapa de la búsqueda (módulo 107) ensaya las fracciones en el entorno del retraso de paso entero óptimo.
Cuando el elemento de predicción del paso se representa por un filtro de la forma 1/(1-bz-T), lo cual es una suposición válida para retrasos de paso T > N, el espectro del filtro de paso exhibe una estructura harmónica a través de todo el intervalo de frecuencias, con una frecuencia harmónica relacionada con 1/T. En el caso de señales de banda ancha, este estructura no es muy eficaz puesto que la estructura harmónica, en señales de banda ancha, no cubre la totalidad del espectro extendido. La estructura harmónica existe únicamente hasta una cierta frecuencia, que depende del segmento de habla. Así pues, con el fin de conseguir una representación eficaz de la contribución del paso en segmentos articulados con voz de un habla de banda ancha, el filtro de predicción del paso necesita tener la flexibilidad de variar la magnitud de la periodicidad a lo largo del espectro de banda ancha.
En la presente Memoria se describe un método nuevo que consigue configurar en un modelo eficiente la estructura harmónica del espectro de habla de señales de banda ancha, en virtud del cual se aplican diversas formas de filtros de paso bajo a la excitación pasada y se selecciona el filtro de paso bajo con la ganancia de predicción más
alta.
Cuando se utiliza una resolución de paso de sub-muestra, los filtros de paso bajo pueden ser incorporados en los filtros de interpolación que se utilizan para obtener la resolución de paso más elevada. En este caso, la tercera etapa de la búsqueda del paso, en la que se ensayan las fracciones en el entorno del retraso de paso entero escogido, se repite para los diversos filtros de interpolación que tienen diferentes características de paso bajo, y se seleccionan la fracción y el índice de filtro que maximizan el criterio de búsqueda C.
Una solución más sencilla consiste en completar la búsqueda en las tres etapas anteriormente descritas para determinar el retraso fraccional óptimo con el uso de tan solo un filtro de interpolación con una cierta respuesta en frecuencia, y seleccionar la forma de filtro de paso bajo óptima en el extremo o terminal, mediante la aplicación de los diferentes filtros de paso bajo predeterminados al vector de código de cifrado y descifrado de paso escogido, vT, y seleccionar el filtro de paso bajo que minimice el error de predicción del paso. Esta solución se expone en detalle más adelante.
La Figura 3 ilustra un diagrama de bloques esquemático de una realización preferida de la solución propuesta.
En el módulo de memoria 303 se almacena la señal de excitación pasada u(n), n < 0. El módulo 301 de búsqueda de código de cifrado y descifrado de paso es sensible al vector de objetivo x, al retraso de paso de bucle abierto TOL y a la señal de excitación pasada u(n), n < 0, procedentes del módulo de memoria 103, a fin de conducir una búsqueda de código de cifrado y descifrado de paso (código de cifrado y descifrado de paso) que minimice el criterio de búsqueda C anteriormente definido. A partir del resultado de la búsqueda llevada a cabo en el módulo 301, el módulo 302 genera el vector de código de cifrado y descifrado de paso óptimo vT. Nótese que, puesto que se utiliza una resolución de paso de sub-muestra (paso fraccional), la señal de excitación pasada u(n), n < 0, es interpolada y el vector de código de cifrado y descifrado de paso vT corresponde a la señal de excitación pasada interpolada. En esta realización preferida, el filtro de interpolación (situado en el módulo 301, pero que no se muestra), tiene una característica de filtro de paso bajo que extrae el contenido de las frecuencias por encima de 7.000 Hz.
En una realización preferida, se utilizan las características de filtro K; estas características de filtro pueden ser características de filtro de paso bajo o de paso de banda. Una vez que se ha determinado el vector de código óptimo vT y suministrado por parte del generador 302 de vector de código de paso, se computan las versiones filtradas en filtro K utilizando, respectivamente, K filtros de conformación de frecuencia diferentes, tales como los 305(j), donde j = 1, 2, ..., K. Estas versiones filtradas se denotan por vf(j), donde j = 1, 2, ..., K. Los diferentes vectores vf(j) se someten a convolución en respectivos módulos 304(j), donde j = 0, 1, 2, ..., K, con la respuesta ante impulso, h, a fin de obtener los vectores y(j), donde j = 0, 1, 2, ..., K. Al objeto de calcular el error cuadrático medio de predicción de paso para cada vector y(j), el valor y(j) se multiplica por la ganancia b por medio de un amplificador correspondiente 307(j), y el valor by(j) se resta del vector de objetivo x por medio de un dispositivo de sustracción correspondiente 308(j). El selector 309 selecciona el filtro 305(j) de conformación de frecuencia que minimiza el error cuadrático medio de predicción de paso:
e^{(j)} = \Arrowvert x - b^{(j)}y^{(j)}\Arrowvert^{2}
\hskip2cm
j = 1, 2, ..., K
Con el fin de calcular el error cuadrático medio e(j) de predicción de paso para cada valor de y(j), el valor y(j) se multiplica por la ganancia b por medio de un amplificador correspondiente 307(j), y el valor b(j)y(j) se resta del vector de objetivo x por medio de unos dispositivos de sustracción 308(j). Cada ganancia b(j) se calcula en un dispositivo calculador de ganancia correspondiente, 306(j), en asociación con el filtro de conformación de frecuencia situado en el índice j, mediante el uso de la siguiente relación:
b^{(j)} = x^{t}y^{(j)}/\Arrowvert y^{(j)}\Arrowvert^{2}
En el selector 309, los parámetros b, T y j se escogen basándose en el vT o en el vf(j), lo que minimiza el error cuadrático medio de predicción de paso, e.
Haciendo referencia de nuevo a la Figura 1, el índice T de código de cifrado y descifrado de paso se codifica y transmite al multiplexador 112. La ganancia de paso b se cuantifica y transmite al multiplexador 112. Con esta nueva solución, se requiere información extra para codificar el índice j del filtro de conformación de frecuencia seleccionado en el multiplexador 112. Por ejemplo, si se utilizan tres filtros (j = 0, 1, 2, 3), entonces se necesitan dos bits para representar esta información. La información j del índice de filtro puede también codificarse conjuntamente con la ganancia de paso b.
Búsqueda de código de cifrado y descifrado innovador
Una vez que se han determinado el paso, o los parámetros de LTP (Predicción a Largo Plazo) b, T y j, la siguiente etapa consiste en buscar la excitación innovadora óptima por medio de un módulo de búsqueda 110 mostrado en la Figura 1. En primer lugar, se actualiza el vector de objetivo x restándole la contribución de LTP:
x' = x - by_{T}
donde b es la ganancia de paso e yT es el vector de código de cifrado y descifrado de paso filtrado (la excitación pasada en el retraso T, filtrada con el filtro de paso bajo seleccionado y sometida a convolución con la respuesta ante impulso, h, según se ha descrito en relación con la Figura 3).
El procedimiento de búsqueda en la CELP se lleva a cabo encontrando el vector de código de excitación óptimo ck y la ganancia g que minimizan el error cuadrático medio E entre el vector de objetivo y el vector de código regulado en escala y filtrado:
E = \Arrowvert x' - gHc_{k} \Arrowvert^{2}
donde H es una matriz de convolución triangular inferior obtenida del vector h de respuesta ante impulso.
En la realización preferida de la presente invención, la búsqueda de código de cifrado y descifrado innovador se lleva a cabo en el módulo 110 por medio de un código de cifrado y descifrado algebraico, según se describe en las Patentes norteamericanas Nos. 5.444.816 (de Adoul et al.), expedida el 22 de agosto de 1995, 5.699.482, concedida a Adoul et al. el 17 de diciembre de 1997, 5.754.976, concedida a Adoul et al. el 19 de mayo de 1998, y 5.701.392 (de Adoul et al.), de fecha 23 de diciembre de 1997.
Una vez que se han escogido el vector de código de excitación ck y su ganancia g óptimos por parte del módulo 110, el índice de código de cifrado y descifrado k y su ganancia g son codificados y transmitidos al multiplexador
112.
Haciendo referencia a la Figura 1, los parámetros b, T, j, Â(z), k y g son multiplexados por medio del multiplexador 112 antes de ser transmitidos a través de un canal de comunicación.
Actualización de memoria
En el módulo de memoria 111 (Figura 1), los estados del filtro de síntesis ponderado W(z)/Â(z) son actualizados filtrando la señal de excitación u = gck + bvT a través del filtro de síntesis ponderado. Después de esta filtración, los estados del filtro se memorizan y utilizan en la siguiente sub-trama como estados iniciales para computar la respuesta ante entrada cero en el módulo calculador 108.
Como en el caso del vector de objetivo x, pueden utilizarse para actualizar los estados de filtro otras soluciones alternativas pero matemáticamente equivalentes que son bien conocidas por parte de las personas con conocimientos ordinarios de la técnica.
Descodificador 200
El dispositivo descodificador del habla 200 de la Figura 2 ilustra las diversas etapas que se llevan a cabo entre la entrada digital 222 (corriente de entrada al desmultiplexador 217) y el habla muestreada de salida 223 (salida del sumador 221).
El desmultiplexador 217 extrae los parámetros de modelo de síntesis de la información binaria recibida desde un canal de entrada digital. Los parámetros extraídos desde cada trama binaria recibida son:
- los parámetros de predicción a corto plazo (STP) Â(z) (una vez por trama);
- los parámetros de predicción a largo plazo (LTP) T, b y j (para cada sub-trama); y
- el índice k de código de cifrado y descifrado de innovación y la ganancia g (para cada sub-trama).
La señal de habla de ese momento se sintetiza basándose en estos parámetros, como se explicará aquí más adelante.
El código de cifrado y descifrado innovador 218 es sensible al índice k para producir el vector de códigos de innovación ck, el cual es regulado en escala por el factor de ganancia descodificado g, a través de un amplificador 224. En la realización preferida, se utiliza para representar el vector de código innovador ck un código de cifrado y descifrado innovador 218 según se describe en las Patentes norteamericanas anteriormente mencionadas números 5.444.816, 5.699.482, 5.754.976 y 5.701.392.
El vector de código gck generado y regulado en escala en la salida del amplificador 224 se procesa a través de un filtro de innovación 205.
Suavización de la ganancia
En el descodificador 200 de la Figura 2, se aplica una técnica de suavización de la ganancia no lineal a la ganancia g de código de cifrado y descifrado innovador, con el fin de mejorar el comportamiento ante el ruido de fondo. Basándose en el estatismo o inmovilidad (o estabilidad) y en la articulación en voz del segmento de habla de la señal de banda ancha, se suaviza la ganancia g del código de cifrado y descifrado innovador 218 con el fin de reducir la fluctuación de la energía de la excitación en el caso de señales estacionarias. Esto mejora el comportamiento de códec, o de codificación-descodificación, en presencia de ruido de fondo estacionario.
En una realización preferida, se utilizan dos parámetros para controlar la magnitud de la suavización, a saber: la configuración o articulación en voz de la sub-trama de señal de banda ancha y la estabilidad del filtro de LP (Predicción Lineal) 206, ambos indicativos del ruido de fondo estacionario en la señal de banda ancha.
Pueden utilizarse diferentes métodos para estimar el grado de articulación en voz de la sub-trama.
Etapa 501 (Figura 5)
En una realización preferida, se computa un factor de articulación en voz, rv, en el generador 204 de factor de articulación en voz, con el uso de la siguiente relación:
rv = (Ev - Ec)/(Ev + Ec)
donde Ev es la energía del vector de código de paso regulado en escala, bvT, y Ec es la energía del vector de código innovador regulado en escala, gck. Es decir:
\newpage
E_{v} = b^{2}v^{t}_{T}v_{T} = b^{2} \sum\limits^{N-1}_{n=0} v^{2}_{T}(n)
y
E_{c} = g^{2}c^{t}_{k}c_{k} = g^{2} \sum\limits^{N-1}_{n=0} c^{2}_{k}(n)
Nótese que el valor del factor de articulación en voz, rv, se encuentra entre -1 y 1, de tal modo que un valor de 1 corresponde a señales articuladas en voz y puras, y un valor de -1 corresponde a señales no articuladas en voz y puras.
Etapa 502 (Figura 5)
Se computa un factor \lambda en el dispositivo calculador 228 de suavización de la ganancia, basándose en el rv, por medio de la siguiente relación:
\lambda = 0,5(1 - rv)
Nótese que el factor \lambda está relacionado con la magnitud de la articulación en voz, es decir, \lambda = 0 para los segmentos articulados en voz puros y \lambda= 1 para los segmentos no articulados en voz puros.
Etapa 503 (Figura 5)
Se computa un factor de estabilidad \theta en un generador 230 de factor de estabilidad, basándose en una medida de la distancia que proporciona la similitud de los filtros de LP adyacentes. Se pueden utilizar diferentes medidas de la similitud. En esta realización preferida, los coeficientes de LP se cuantifican discretamente e interpolan en el Par Espectral de Inmitancia (ISP - "Immitance Spectral Pair"). Es conveniente, por lo tanto, obtener la medida de la distancia en el dominio de ISP. De forma alternativa, puede utilizarse igualmente la representación de Frecuencia Espectral de Línea (LSF - "Line Spectral Frequency") del filtro de LP para encontrar la distancia de similitud de los filtros de LP adyacentes. Se han utilizado también otras medidas en la técnica anterior, tal como la medida de Itakura.
En una realización preferida, la medida de la distancia de ISP entre los ISPs de la trama presente en ese momento, n, y de la trama pasada, n-1, se calcula en el generador 230 de factor de estabilidad y viene dada por la relación:
D_{S} = \sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} - isp^{(n-1)}_{i}\right)^{2}
donde p es el orden del filtro de LP 206. Nótese que los p-1 primeros ISPs que se utilizan son frecuencias comprendidas en el intervalo entre 0 y 8.000 Hz.
Etapa 504 (Figura 5)
Se establece una relación de correspondencia de la medida de la distancia ISP, en el dispositivo calculador 228 de suavización de la ganancia, con un factor de estabilidad \theta comprendido en el intervalo entre 0 y 1, y que se obtiene por:
\theta = 1,25 - D_{s}/400 . 000.0
con los límites 0 \leq \theta \leq 1.
Etapa 505 (Figura 5)
Se calcula entonces un factor Sm de suavización de la ganancia, basado tanto en la articulación en voz como en la estabilidad, en el dispositivo calculador 228 de suavización de la ganancia, y viene dado por:
S_{m} = \lambda \theta
El valor de Sm se aproxima a 1 para las señales no configuradas o articuladas en voz y estables, como es el caso de las señales de ruido de fondo estacionarias. Para las señales articuladas en voz y puras, o para las señales inestables, el valor de Sm se aproxima a 0.
\newpage
Etapa 506 (Figura 5)
Se computa una ganancia modificada inicial g0 en el dispositivo de cálculo 228 de suavización de la ganancia, al comparar la ganancia g de código de cifrado y descifrado innovador con un umbral dado por la ganancia modificada inicial procedente de la sub-trama pasada, g-1. Si g es mayor o igual que g-1, entonces g0 se computa reduciendo g en 1,5 dB con la limitación dada por g0 \geq g1. Si g es más pequeño que g-1, entonces g0 se computa incrementando g en 1,5 dB dentro de los límites de g0 \leq g-1. Nótese que el hecho de incrementar la ganancia en 1,5 dB es equivalente a multiplicarla por 1,19. En otras palabras:
si g < g - 1, entonces g0 = g \times 1,19 limitado por g0 \leq g-1
y
si g \geq g - 1, entonces g0 = g/1,19 limitado por g0 \geq g-1
Etapa 507 (Figura 5)
Finalmente, la ganancia de código de cifrado y descifrado suavizada y fija, gs, se calcula en el dispositivo calculador 228 de suavización de la ganancia, por medio de:
g_{s} = S_{m}\cdot g_{0} + (1 - S_{m})\cdot g
La ganancia suavizada gs se utiliza entonces para regular en escala el vector de código innovador ck en el amplificador 232.
Se mencionará con sólo unas pocas palabras que el anterior procedimiento de suavización de la ganancia puede ser aplicado a señales distintas de las señales de banda ancha.
Mejora la periodicidad
El vector de código generado y regulado en escala a la salida del amplificador 224 se procesa por medio de un dispositivo de mejora 205 de paso, dependiente de la frecuencia.
La mejora de la periodicidad de la señal de excitación u mejora la calidad en el caso de los segmentos articulados en voz. Esto se ha venido haciendo en el pasado filtrando el vector de innovación procedente del código de cifrado y descifrado innovador (código de cifrado y descifrado fijo) 218 por medio de un filtro con la forma 1/(1 - \varepsilonbz - T), donde \varepsilon es un factor por debajo de 0,5 que controla la magnitud de la periodicidad introducida. Esta solución resulta menos eficaz en el caso de las señales de banda ancha, ya que introduce periodicidad a lo largo de todo el espectro. Se describe una nueva solución alternativa, que forma parte de la presente invención, en virtud de la cual la mejora de la periodicidad se consigue filtrando el vector de códigos innovador ck procedente del código de cifrado y descifrado innovador (fijado), a través de un filtro de innovación 205 (F(z)) cuya respuesta en frecuencia enfatiza las frecuencias superiores más que las frecuencias inferiores. Los coeficientes de F(z) están relacionados con la magnitud de la periodicidad en la señal de excitación u.
Se encuentran disponibles muchos métodos conocidos por parte de los expertos de la técnica con el fin de obtener coeficientes de periodicidad válidos. Por ejemplo, el valor de la ganancia b proporciona una indicación de la periodicidad. Es decir, si la ganancia b es cercana a 1, entonces la periodicidad de la señal de excitación u es alta, y si la ganancia b es menor que 0,5, entonces la periodicidad es baja.
Otra forma eficaz de obtener los coeficientes de filtro F(z) que se utilizan en una realización preferida, consiste en relacionarlos con la magnitud de la contribución del paso en la señal de excitación total u. Esto da lugar a que la respuesta en frecuencia dependa de la periodicidad de la sub-trama, de tal modo que las frecuencias más altas son enfatizadas más fuertemente (pendiente total más fuerte) para ganancias de paso más altas. El filtro de innovación 205 tiene el efecto de rebajar la energía del vector de código innovador ck a frecuencias bajas cuando la señal de excitación u es más periódica, lo que mejora la periodicidad de la señal de excitación u a las frecuencias inferiores más que a las frecuencias superiores. Formas que se sugieren para el filtro de innovación 205 son:
(1)F(z) = 1 - \sigma z^{-1}
(2)F(z) = -\alpha z + 1 -\alpha z^{-1}
donde \sigma o \alpha son factores de periodicidad obtenidos a partir del nivel de periodicidad de la señal de excitación u.
La segunda forma con tres términos de F(z) se utiliza en una realización preferida. El factor de periodicidad \alpha se computa en el generador 204 de factor de configuración o articulación en voz. Es posible utilizar varios métodos para obtener el factor de periodicidad \alpha basándose en la periodicidad de la señal de excitación u. Se presentan en lo que sigue dos métodos.
Método 1
Se computa primeramente la proporción de la contribución del paso a la señal de excitación total u, en el generador 204 de factor de articulación en voz, por medio de:
R_{P} = \frac{b^{2}v_{T}{}^{t}v_{T}}{u^{t}u} = \frac{b^{2} \sum\limits^{N-1}_{n=0} v^{2}_{T}(n)}{\sum\limits^{N-1}_{n=0} u^{2}(n)}
donde vT es el vector de código de cifrado y descifrado de paso, b es la ganancia de paso y u es la señal de excitación u, proporcionada en la salida del sumador 219 por:
u = gck + bvT
Nótese que el término bvT tiene su fuente de origen en el código de cifrado y descifrado de paso (código de cifrado y descifrado adaptativo) 201, en respuesta en respuesta al retraso de paso T y al valor pasado de u que se encuentra almacenado en la memoria 203. Se procesa a continuación el vector de códigos de paso vT procedente del código de cifrado y descifrado de paso 201, a través de un filtro de paso bajo 202 cuya frecuencia de corte se ajusta por medio del índice j procedente del desmultiplexador 217. El vector de códigos resultante vT se multiplica entonces por la ganancia b procedente del desmultiplexador 217, a través de un amplificador 226, para obtener la señal bvT.
El factor \alpha se calcula en el generador 204 de factor de articulación de voz por medio de:
\alpha = qRp, con los límites dados por \alpha < q,
donde q es un factor que controla la magnitud de la mejora (q se establece en 0,25 en esta realización preferida).
Método 2
En lo que sigue se expone otro método que se utiliza en una realización preferida de la invención para calcular el factor de periodicidad \alpha.
En primer lugar, se computa un factor de articulación en voz, rv, en el generador 204 de factor de articulación en voz, por medio de:
R_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde Ev es la energía del vector de código de paso regulado en escala, bvT, y Ec es la energía del vector de código innovador regulado en escala, gck. Es decir:
E_{v} = b^{2}v_{T}{}^{t}v_{T} = b^{2} \sum\limits^{N-1}_{n=0} v^{2}_{T}(n)
y
E_{c} = g^{2}c_{k}{}^{t}c_{k} = g^{2} \sum\limits^{N-1}_{n=0}c^{2}_{k}(n)
Nótese que el valor de rv se encuentra entre -1 y 1 (1 corresponde a las señales articuladas en voz y puras, y -1 corresponde a las señales no articuladas en voz y puras).
En esta realización preferida, el factor \sigma se computa, a continuación, en el generador 204 de factor de articulación en voz, mediante:
\sigma = 0,125 (1 + rv)
lo que corresponde a un valor de 0 para las señales no articuladas en voz y puras, y de 0,25 para las señales articuladas en voz y puras.
En la primera forma, de dos términos, de F(z), el factor de periodicidad \sigma puede ser aproximado mediante el uso de \sigma = 2\alpha en los métodos 1 y 2 anteriores. En tal caso, el factor de periodicidad \sigma se calcula como sigue, según el método 1 anterior:
\sigma = 2qRp, con el límite dado por \sigma < 2q.
En el método 2, el factor de periodicidad \sigma se calcula como sigue:
\sigma = 0,25 (1 + rv).
Se computa, por lo tanto, la señal mejorada cf al filtrar el vector de código innovador regulado en escala, gck, a través del filtro de innovación 205 (F(z)).
La señal de excitación mejorada u' se computa por medio del sumador 220 como:
u' = cf + bvT
Nótese que este procedimiento no se lleva a cabo en el codificador 100. Así pues, es esencial actualizar el contenido del código de cifrado y descifrado de paso 210 utilizando la señal de excitación u sin mejora, a fin de mantener el sincronismo entre el codificador 100 y el descodificador 200. En consecuencia, la señal de excitación u se utiliza para actualizar la memoria 203 del código de cifrado y descifrado de paso 201, y la señal de excitación mejorada u' se emplea en la entrada del filtro de síntesis de LP 206.
Síntesis y reducción del énfasis
La señal sintetizada s' se computa filtrando la señal de excitación mejorada u' a través del filtro de síntesis de LP 206, que tiene la forma 1/Â(z), donde Â(z) es el filtro de LP interpolado en la sub-trama presente en ese momento. Como puede observarse en la Figura 2, los coeficientes de LP cuantificados discretamente, Â(z), de la línea 225 procedente del desmultiplexador 217, se suministran al filtro de síntesis de LP 206 al objeto de ajustar en correspondencia los parámetros del filtro de síntesis de LP 206. El filtro 207 de reducción del énfasis es el inverso del filtro de énfasis 103 de la Figura 1. La función de transferencia del filtro 207 de reducción del énfasis viene dada por:
D(z) = 1/(1 - \mu z^{-1})
donde \mu es un factor de énfasis previo con un valor situado entre 0 y 1 (un valor típico es \mu = 0,7). Puede utilizarse también un filtro de orden superior.
El vector s' se filtra a través del filtro D(z) de reducción del énfasis (módulo 207), con el fin de obtener el vector sd, el cual se hace pasar a través del filtro de paso alto 208 para eliminar las frecuencias indeseadas por debajo de 50 Hz y obtener adicionalmente la sh.
Aumento de la velocidad de muestreo y regeneración de las frecuencias superiores
El módulo 209 de aumento de la velocidad de muestreo lleva a cabo el procedimiento inverso al del módulo 101 de reducción de la velocidad de muestreo de la Figura 1. En esta realización preferida, el aumento de la velocidad de muestreo hace pasar la velocidad de muestreo de 12,8 kHz a la velocidad de muestreo inicial de 16 kHz mediante el uso de técnicas bien conocidas por parte de las personas con conocimientos ordinarios de la técnica. La señal de síntesis muestreada a velocidad aumentada se denota por \hat{S}. Se hace también referencia a la señal \hat{S} como la señal intermedia de banda ancha sintetizada.
La señal de síntesis \hat{S} muestreada a velocidad aumentada no contiene los componentes de frecuencias superiores que se perdieron por el tratamiento de reducción de la velocidad de muestreo (módulo 101 de la Figura 1) en el codificador 100. Esto proporciona una percepción de paso bajo a la señal de habla sintetizada. Con el fin de restablecer la totalidad de la banda de la señal original, se describe un procedimiento de generación de altas frecuencias. Este procedimiento se lleva a cabo en los módulos 210 a 216, así como en el sumador 221, y requiere la entrada desde el generador 204 de factor de articulación en voz (Figura 2).
En esta nueva solución, el contenido de altas frecuencias se genera llenando la parte superior del espectro con un ruido blanco regulado adecuadamente en escala en el dominio de la excitación, que se convierte a continuación al dominio del habla, preferiblemente por conformación de éste con el mismo filtro de síntesis de LP utilizado para la síntesis de la señal \hat{S} muestreada a velocidad reducida.
Se describe aquí, en lo que sigue, el procedimiento de generación de altas frecuencias.
\newpage
El generador 213 de ruido aleatorio genera una secuencia de ruido blanco w' que tiene un espectro plano a lo largo de toda la anchura de banda de frecuencias, mediante el uso de técnicas bien conocidas por parte de los expertos medios de la técnica. La secuencia generada tiene una longitud N' que es la longitud de la sub-trama en el dominio original. Nótese que N es la longitud de la sub-trama en el dominio muestreado a velocidad reducida. En esta realización preferida, N = 64 y N' = 80, lo que corresponde a 5 ms.
La secuencia de ruido blanco se regula adecuadamente en escala en el módulo 214 de ajuste de la ganancia. El ajuste de la ganancia comprende las siguientes etapas. En primer lugar, la energía de la secuencia de ruido generada w' se ajusta de manera que sea igual a la energía de la señal de excitación mejorada u' que se computa por medio de un módulo 210 de cómputo de energía, y la secuencia de ruido regulada en escala que resulta viene dada por:
w(n) = w'(n) \sqrt{\frac{\sum\limits^{N-1}_{n=0} u'{}^{2}(n)}{\sum\limits^{N'-1}_{n=0} w'{}^{2}(n)}}
n = 0, ..., N'-1.
La segunda etapa de la regulación a escala de la ganancia consiste en tener en cuenta el contenido de alta frecuencia de la señal sintetizada a la salida del generador 204 de factor de articulación en voz, con el fin de reducir la energía del ruido generado en el caso de los segmentos articulados en voz (en los que está presente menos energía a altas frecuencias, en comparación con los segmentos articulados en voz). En esta realización preferida, la medición del contenido de alta frecuencia se lleva a la práctica midiendo la inclinación de la señal de síntesis por medio de un dispositivo calculador 212 de inclinación espectral, y reduciendo la energía de acuerdo con ello. Pueden utilizarse igualmente otras mediciones, tales como mediciones de paso por cero. Cuando la inclinación es muy fuerte, lo que corresponde a los segmentos articulados en voz, la energía del ruido se reduce adicionalmente. El factor de inclinación se computa en el módulo 212 como el primer coeficiente de correlación de la señal de síntesis, sh, y viene dado por:
inclinación = \frac{\sum\limits^{N-1}_{n=1} S_{h}(n) S_{h} (n-1)}{\sum\limits^{N-1}_{n=0} S^{2}_{h}(n)}
con la condición dada por inclinación \geq 0 e inclinación \geq rv,
donde el factor de articulación en voz, rv, viene dado por:
r_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde Ev es la energía del vector de código de paso regulado en escala, bvT, y Ec es la energía del vector de código innovador regulado en escala, gck, según se ha descrito anteriormente. El factor de articulación en voz, rv, es, con la mayor frecuencia, menor que la inclinación, pero esta condición se introdujo como precaución contra los tonos de alta frecuencia en los que el valor de la inclinación es negativo y el valor de rv es alto. Esta condición reduce, por lo tanto, la energía del ruido para dichas señales de tono.
El valor de inclinación es 0 en el caso de un espectro plano y 1 en el caso de señales fuertemente articuladas en voz, y es negativo en el caso de señales no articuladas en voz en las que está presente más energía a altas frecuencias.
Pueden utilizarse diferentes métodos para obtener el factor de regulación de escala, gt, a partir de la magnitud del contenido de alta frecuencia. En esta invención, los métodos se proporcionan basándose en la inclinación de la señal anteriormente descrita.
Método 1
El factor de escala, gt, se obtiene de la inclinación por medio de:
gt = 1 - inclinación, con la limitación dada por 0,2 \leq gt \leq 1.0.
Para una señal fuertemente articulada en voz, en la que la inclinación se aproxima a 1, gt es 0,2, y, para las señales fuertemente desarticuladas en voz, gt se hace 1,0.
\newpage
Método 2
El factor de inclinación gt se restringe primeramente de modo que sea mayor o igual que cero, y, a continuación, se obtiene el factor de regulación de escala a partir de la inclinación, por medio de:
g_{t} = 10^{-0,6 \cdot inclinación}
La secuencia de ruido regulada en escala, wg, producida en el módulo 214 de ajuste de la ganancia, viene, por lo tanto, dada por:
wg = gt\cdot w.
Cuando la inclinación es próxima a cero, el factor de regulación de escala, gt, es próximo a 1, lo que no da lugar a una reducción de la energía. Cuando el valor de la inclinación es 1, el factor de regulación de escala, gt, da lugar a una reducción de 12 dB en la energía del ruido generado.
Una vez que se ha regulado en escala adecuadamente el ruido (wg), éste se lleva al dominio del habla con el uso del dispositivo conformador espectral 215. En la realización preferida, esto se consigue filtrando el ruido wg a través de una versión expandida en anchura de banda del mismo filtro de síntesis de LP utilizado en el dominio muestreado a velocidad reducida (1/Â(z/0,8)). Los coeficientes de filtro de LP expandido en anchura de banda correspondientes se calculan en el dispositivo conformador espectral 215.
La secuencia de ruido filtrada y regulada en escala, wf, se filtra entonces con paso de banda hasta obtener el intervalo de frecuencias requerido que se ha de restablecer, con el uso del filtro de paso de banda 216. En la realización preferida, el filtro de paso de banda 216 restringe la secuencia de ruido al intervalo de frecuencias entre 5,6 y 7,2 kHz. La secuencia resultante z de ruido filtrado con paso de banda, se añade en el sumador 221 a la señal de habla s' sintetizada y muestreada a velocidad aumentada, a fin de obtener la señal de sonido reconstruida final sout en la salida 223.
Si bien la presente invención se ha descrito aquí, en lo anterior, por medio de una realización preferida de la misma, esta realización puede modificarse a voluntad dentro del ámbito de las reivindicaciones que se acompañan. Incluso aunque la realización preferida expone el uso de señales de habla de banda ancha, resultará obvio para los expertos de la técnica que el objeto de la invención está también dirigido a otras realizaciones que utilizan señales de banda en general, y que no se limita necesariamente a aplicaciones de habla.

Claims (92)

1. Un método para producir un vector de código de ganancia suavizada durante la descodificación de una señal de banda ancha codificada, a partir de un conjunto de parámetros de codificación de señal, de tal modo que dicho método comprende:
hallar un vector de código (c_{k}) y una ganancia (g) en relación con al menos un primer (k) y al menos un segundo (g) parámetros de codificación de señal, pertenecientes a dicho conjunto;
calcular (501, 502) un primer factor (r_{v}, \lambda) representativo de un grado de articulación en voz en la señal de banda ancha, en respuesta a al menos un tercer parámetro (b, v_{T}) de codificación de señal, perteneciente a dicho conjunto;
calcular (503, 504) un segundo factor (\theta) representativo de un grado de estabilidad de dicha señal de banda ancha en respuesta a al menos un cuarto parámetro (LP) de codificación de señal, perteneciente a dicho conjunto;
calcular una ganancia suavizada (g_{s}) utilizando una operación no lineal relacionada con los primer y segundo factores (r_{v}, \lambda; \theta) y aplicada a la ganancia encontrada (g); y
amplificar el vector de código hallado (c_{k}) con dicha ganancia suavizada (g_{s}), con el fin de producir con ello dicho vector de código suavizado en ganancia.
2. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual:
hallar un vector de código comprende hallar un vector de código innovador en un código de cifrado y descifrado innovador, en relación con dicho al menos un primer parámetro de codificación de señal; y
hallar una ganancia comprende hallar una ganancia de código de cifrado y descifrado innovador.
3. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual:
hallar un vector de código comprende hallar un vector de código en un código de cifrado y descifrado en relación con dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un primer parámetro de codificación de señal comprende un índice de código de cifrado y descifrado innovador.
4. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual:
hallar un vector de código comprende hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un tercer parámetro de codificación de señal comprende los siguientes parámetros:
una ganancia de paso computada durante la codificación de la señal de banda ancha;
un retardo de paso computado durante la codificación de la señal de banda ancha;
un índice j de un filtro de paso bajo seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
5. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual dicho al menos un cuarto parámetro de codificación de señal comprende coeficientes de un filtro de predicción lineal calculados durante la codificación de la señal de banda ancha.
6. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual:
hallar un vector de código comprende hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con un índice k de dicho código de cifrado y descifrado innovador, de tal modo que dicho índice k forma dicho al menos un primer parámetro de codificación de señal; y
calcular un primer factor comprende computar un factor de configuración o articulación en voz, r_{v}, por medio de la siguiente relación:
r_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde:
- E_{v} es la energía de un vector de código adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y descifrado innovador computada durante la codificación de la señal de banda ancha;
- k es un índice del código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha; y
- c_{k} es el vector de código innovador de dicho código de cifrado y descifrado innovador en el índice k.
7. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 6, en el cual el factor de articulación en voz, r_{v}, tiene un valor situado entre -1 y 1, de tal modo que el valor 1 corresponde a una señal articulada en voz y pura, y el valor -1 corresponde a una señal no articulada en voz y pura.
8. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 7, en el cual calcular una ganancia suavizada comprende computar un factor \lambda utilizando la siguiente relación:
\lambda = 0,5(1 - r_{v}).
9. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 6, en el cual un factor \lambda = 0 indica una señal articulada en voz y pura, y un factor \lambda = 1 indica una señal no articulada en voz y pura.
10. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual calcular un segundo factor comprende determinar una medida de distancia proporcionando una similitud entre filtros de predicción lineal adyacentes y sucesivos, computados durante la codificación de la señal de banda ancha.
11. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 10, en el cual:
la señal de banda ancha es muestreada antes de la codificación, y es procesada o tratada por tramas durante la codificación y la descodificación; y
determinar una medida de distancia comprende calcular una medida de distancia de Pares Espectrales de Inmitancia entre los Pares Espectrales de Inmitancia de una trama presente n de la señal de banda ancha, y los Pares Espectrales de Inmitancia de una trama pasada n-1 de la señal de banda ancha, a través de la siguiente relación:
D_{S} = \sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} - isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros de predicción lineal.
12. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 11, en el cual calcular un segundo factor comprende establecer una relación de correspondencia de la medida D_{s} de distancia de Pares Espectrales de Inmitancia con dicho segundo factor \theta a través de la siguiente relación:
\theta = 1,25 – D_{s}/400.000,0
con la limitación dada por 0 \leq \theta \leq 1.
13. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual calcular una ganancia suavizada comprende calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta por medio de la siguiente relación:
S_{m} = \lambda \theta
14. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 13, en el cual el factor S_{m} tiene un valor que se aproxima a 1 para una señal de banda ancha no articulada en voz y estable, y un valor que se aproxima a 0 para una señal de banda ancha articulada en voz y pura, o una señal de banda ancha inestable.
15. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual:
hallar un vector de código comprende hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal;
la señal de banda ancha es muestreada antes de su codificación, y se procesa o trata por tramas y sub-tramas durante la codificación y la descodificación; y
calcular una ganancia suavizada comprende computar una ganancia modificada inicial g_{0} comparando la ganancia hallada g, computada durante la codificación de la señal de banda ancha, con un umbral dado por la ganancia modificada inicial procedente de la sub-trama pasada g-1, como sigue:
si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
y
si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
16. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 1, en el cual calcular una ganancia suavizada comprende calcular una ganancia modificada inicial g_{0} comparando la ganancia hallada g con un umbral.
17. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 16, en el cual:
calcular una ganancia suavizada comprende calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta a través de la siguiente relación:
S_{m} = \lambda \theta
y determinar dicha ganancia suavizada g_{s} a través de la siguiente relación:
g_{s} = S_{m}\cdot g_{0} + (1 - S_{m})\cdot g
18. Un método para la producción de un vector de código suavizado en ganancia, durante la descodificación de una señal codificada a partir de un conjunto de parámetros de codificación de señal, de tal modo que dicha señal contiene ruido de fondo estacionario y dicho método comprende:
hallar un vector de código (c_{k}) y una ganancia (g) en relación con al menos un primer (k) y al menos un segundo (g) parámetros de codificación de señal de dicho conjunto;
calcular al menos un factor (r_{v}, \lambda; \theta) indicativo de un nivel de ruido de fondo estacionario en la señal, en respuesta a al menos un tercer parámetro (b, v_{T}; LP) de codificación de señal, perteneciente a dicho conjunto;
calcular una ganancia suavizada (g_{s}) mediante el uso de una operación no lineal relacionada con el factor (r_{v}, \lambda; \theta) indicativo del nivel de ruido y aplicada a la ganancia hallada (g); y
amplificar el vector de código hallado (c_{k}) con dicha ganancia suavizada (g_{s}) para producir con ello dicho vector de código suavizado en ganancia.
19. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 18, en el cual el al menos un factor indicativo de un nivel de ruido de fondo estacionario es un factor (r_{v}, \lambda) representativo de un grado de configuración o articulación en voz de la señal.
20. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 18, en el cual el al menos un factor indicativo de un nivel de ruido de fondo estacionario es un factor (\theta) representativo de un grado de estabilidad de dicha señal.
21. Un dispositivo para producir un vector de código suavizado en ganancia durante la descodificación de una señal de banda ancha codificada a partir de un conjunto de parámetros de codificación de señal, de tal modo que dicho dispositivo comprende:
medios para hallar un vector de código (c_{k}) y una ganancia (g) en relación con al menos un primer (k) y al menos un segundo (g) parámetros de codificación de señal, pertenecientes a dicho conjunto;
medios para calcular (501, 502) un primer factor (r_{v}, \lambda) representativo de un grado de configuración o articulación en voz en la señal de banda ancha, en respuesta a al menos un tercer parámetro (b, v_{T}) de codificación de señal, perteneciente a dicho conjunto;
medios para calcular (503, 504) un segundo factor (\theta) representativo de un grado de estabilidad de dicha señal de banda ancha, en respuesta a al menos un cuarto parámetro (LP) de codificación de señal, perteneciente a dicho conjunto;
medios para calcular una ganancia suavizada (g_{s}) con el uso de una operación no lineal con respecto a los primer y segundo factores (r_{v}, \lambda; \theta) y aplicada a la ganancia hallada (g); y
medios para amplificar el vector de código hallado (c_{k}) con dicha ganancia suavizada (g_{s}), a fin de producir con ello dicho vector de código suavizado en ganancia.
22. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual:
los medios para hallar un vector de código y una ganancia comprenden: medios para hallar un vector de código innovador en un código de cifrado y descifrado, en relación con dicho al menos un primer parámetro de codificación de señal; y
medios para hallar una ganancia de código de cifrado y descifrado innovador.
23. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código en un código de cifrado y descifrado, en relación con dicho al menos un parámetro de codificación de señal; y
dicho al menos un primer parámetro de codificación de señal comprende un índice de código de cifrado y descifrado innovador.
24. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador, en relación con dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un tercer parámetro de codificación de señal comprende los siguientes parámetros:
una ganancia de paso, computada durante la codificación de la señal de banda ancha;
un retardo de paso, computado durante la codificación de la señal de banda ancha;
un índice j de un filtro de paso bajo, seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
25. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual dicho al menos un cuarto parámetro de codificación de señal comprende coeficientes de un filtro de predicción lineal calculado durante la codificación de la señal de banda ancha.
26. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador, en relación con un índice k de dicho código de cifrado y descifrado innovador, de tal modo que dicho índice k constituye dicho al menos un primer parámetro de codificación de señal; y
los medios para calcular un primer factor comprenden medios para computar un factor de configuración o articulación en voz, r_{v}, por medio de la siguiente relación:
r_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde:
- E_{v} es la energía de un vector de código adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y descifrado innovador computada durante la codificación de la señal de banda ancha;
- k es un índice del código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha; y
- c_{k} es el vector de código innovador de dicho código de cifrado y descifrado innovador en el índice k.
27. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 26, en el cual el factor de articulación en voz, r_{v}, tiene un valor situado entre -1 y 1, de tal modo que el valor 1 corresponde a una señal articulada en voz y pura, y el valor -1 corresponde a una señal no articulada en voz y pura.
28. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 27, en el cual los medios para calcular una ganancia suavizada comprenden medios para computar un factor \lambda utilizando la siguiente relación:
\lambda = 0,5(1 - r_{v}).
29. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 28, en el cual un factor \lambda = 0 indica una señal articulada en voz y pura, y un factor \lambda = 1 indica una señal no articulada en voz y pura.
30. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual los medios para calcular un segundo factor comprenden medios para determinar una medida de distancia proporcionando una similitud entre filtros de predicción lineal adyacentes y sucesivos, computados durante la codificación de la señal de banda ancha.
31. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 30, en el cual:
la señal de banda ancha es muestreada antes de la codificación, y es procesada o tratada por tramas durante la codificación y la descodificación; y
los medios para determinar una medida de distancia comprenden medios para calcular una medida de distancia de Pares Espectrales de Inmitancia entre los Pares Espectrales de Inmitancia de una trama presente n de la señal de banda ancha, y los Pares Espectrales de Inmitancia de una trama pasada n-1 de la señal de banda ancha, a través de la siguiente relación:
D_{S} = \sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} - isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros de predicción lineal.
\newpage
32. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 31, en el cual los medios para calcular un segundo factor comprenden medios para establecer una relación de correspondencia de la medida D_{s} de distancia de Pares Espectrales de Inmitancia con dicho segundo factor \theta a través de la siguiente relación:
\theta = 1,25 - D_{s}/400 . 000.0
con la limitación dada por 0 \leq \theta \leq 1.
33. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual los medios para calcular una ganancia suavizada comprenden medios para calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta por medio de la siguiente relación:
S_{m} = \lambda \theta
34. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 33, en el cual el factor S_{m} tiene un valor que se aproxima a 1 para una señal de banda ancha no articulada en voz y estable, y un valor que se aproxima a 0 para una señal de banda ancha articulada en voz y pura, o una señal de banda ancha inestable.
35. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal;
la señal de banda ancha es muestreada antes de su codificación, y se procesa o trata por tramas y sub-tramas durante la codificación y la descodificación; y
los medios para calcular una ganancia suavizada comprenden medios para computar una ganancia modificada inicial g_{0}, de tal modo que dichos medios para computar una ganancia modificada inicial comprenden medios para comparar la ganancia hallada g, computada durante la codificación de la señal de banda ancha, con un umbral dado por la ganancia modificada inicial procedente de la sub-trama pasada g-1, como sigue:
si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
y
si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
36. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 21, en el cual los medios para calcular una ganancia suavizada comprenden calcular una ganancia modificada inicial g_{0} comparando la ganancia hallada g con un umbral.
37. Un método de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 36, en el cual:
los medios para calcular una ganancia suavizada comprenden medios para calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta a través de la siguiente relación:
S_{m} = \lambda \theta
y medios para determinar dicha ganancia suavizada g_{s} a través de la siguiente relación:
g_{s} = S_{m}\cdot g_{0} + (1 - S_{m})\cdot g
38. Un dispositivo para la producción de un vector de código suavizado en ganancia, durante la descodificación de una señal codificada a partir de un conjunto de parámetros de codificación de señal, de tal modo que dicha señal contiene ruido de fondo estacionario y dicho dispositivo comprende:
medios para hallar un vector de código (c_{k}) y una ganancia (g) en relación con al menos un primer (k) y al menos un segundo (g) parámetros de codificación de señal de dicho conjunto;
medios para calcular al menos un factor (r_{v}, \lambda; \theta) indicativo de un nivel de ruido de fondo estacionario en la señal, en respuesta a al menos un tercer parámetro (b, v_{T}; LP) de codificación de señal, perteneciente a dicho conjunto;
medios para calcular una ganancia suavizada (g_{s}) mediante el uso de una operación no lineal en relación con el factor (r_{v}, \lambda; \theta) indicativo del nivel de ruido y aplicada a la ganancia hallada (g); y
medios para amplificar el vector de código hallado (c_{k}) con dicha ganancia suavizada (g_{s}) para producir con ello dicho vector de código suavizado en ganancia.
39. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 38, en el cual el al menos un factor indicativo de un nivel de ruido de fondo estacionario es un factor (r_{v}, \lambda) representativo de un grado de configuración o articulación en voz de la señal.
40. Un dispositivo de producción de vector de código suavizado en ganancia, de acuerdo con la reivindicación 38, en el cual el al menos un factor indicativo de un nivel de ruido de fondo estacionario es un factor (\theta) representativo de un grado de estabilidad de dicha señal.
41. Un sistema de comunicación celular destinado a dar servicio a un área geográfica dividida en una pluralidad de celdas, que comprende:
unidades transmisoras/receptoras móviles;
estaciones de base celulares, respectivamente situadas en dichas celdas;
medios para controlar la comunicación entre las estaciones de base celulares;
un subsistema de comunicación inalámbrica y bidireccional, o en ambos sentidos, entre cada unidad móvil situada en una celda y la estación de base celular de dicha celda, de tal manera que dicho subsistema de comunicación inalámbrica y bidireccional comprende, tanto en la unidad móvil como en la estación de base celular, (a) un transmisor, que incluye un codificador para codificar una señal de banda ancha y medios para transmitir la señal de banda ancha codificada, y (b) un receptor, que incluye medios para recibir una señal de banda ancha codificada y transmitida, y un descodificador para descodificar la señal de banda ancha codificada que se recibe;
en el cual dicho descodificador comprende medios sensibles a un conjunto de parámetros de codificación de señal, a fin de descodificar la señal de banda ancha codificada que se recibe, y en el cual dichos medios de descodificación de señal de banda ancha comprenden un dispositivo de acuerdo con la reivindicación 21, destinado a producir un vector de código de ganancia suavizada durante la descodificación de la señal de banda ancha codificada, a partir de dicho conjunto de parámetros de codificación de señal.
42. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual los medios para hallar un vector de código y una ganancia comprenden:
medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador, en relación con dicho al menos un primer parámetro de codificación de señal; y
medios para hallar una ganancia de código de cifrado y descifrado innovador.
43. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código en un código de cifrado y descifrado en relación con dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un primer parámetro de codificación de señal comprende un índice de código de cifrado y descifrado innovador.
44. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un segundo parámetro de codificación de señal comprende los siguientes parámetros:
una ganancia de paso computada durante la codificación de la señal de banda ancha;
un retardo de paso computado durante la codificación de la señal de banda ancha;
\newpage
un índice j de un filtro de paso bajo seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
45. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual dicho al menos un cuarto parámetro de codificación de señal comprende coeficientes de un filtro de predicción lineal calculados durante la codificación de la señal de banda ancha.
46. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con un índice k de dicho código de cifrado y descifrado innovador, de tal modo que dicho índice k forma dicho al menos un primer parámetro de codificación de señal; y
los medios para calcular un primer factor comprenden medios para computar un factor de configuración o articulación en voz, r_{v}, por medio de la siguiente relación:
r_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde:
- E_{v} es la energía de un vector de código adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y descifrado innovador computada durante la codificación de la señal de banda ancha;
- k es un índice del código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha; y
- c_{k} es el vector de código innovador de dicho código de cifrado y descifrado innovador en el índice k.
47. El sistema de comunicación celular de acuerdo con la reivindicación 46, en el cual el factor de articulación en voz, r_{v}, tiene un valor situado entre -1 y 1, de tal modo que el valor 1 corresponde a una señal articulada en voz y pura, y el valor -1 corresponde a una señal no articulada en voz y pura.
48. El sistema de comunicación celular de acuerdo con la reivindicación 47, en el cual los medios para calcular una ganancia suavizada comprenden medios para computar un factor \lambda utilizando la siguiente relación:
\lambda = 0,5(1 - r_{v}).
49. El sistema de comunicación celular de acuerdo con la reivindicación 48, en el cual un factor \lambda = 0 indica una señal articulada en voz y pura, y un factor \lambda = 1 indica una señal no articulada en voz y pura.
50. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual los medios para calcular un segundo factor comprenden medios para determinar una medida de distancia proporcionando una similitud entre filtros de predicción lineal adyacentes y sucesivos, computados durante la codificación de la señal de banda
ancha.
51. El sistema de comunicación celular de acuerdo con la reivindicación 50, en el cual:
la señal de banda ancha es muestreada antes de la codificación, y es procesada o tratada por tramas durante la codificación y la descodificación; y
los medios para determinar una medida de distancia comprenden medios para calcular una medida de distancia de Pares Espectrales de Inmitancia entre los Pares Espectrales de Inmitancia de una trama presente n de la señal de banda ancha, y los Pares Espectrales de Inmitancia de una trama pasada n-1 de la señal de banda ancha, a través de la siguiente relación:
D_{S} = \sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} - isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros de predicción lineal.
52. El sistema de comunicación celular de acuerdo con la reivindicación 51, en el cual los medios para calcular un segundo factor comprenden medios para establecer una relación de correspondencia de la medida D_{s} de distancia de Pares Espectrales de Inmitancia con dicho segundo factor \theta a través de la siguiente relación:
\theta = 1,25 - D_{s}/400 . 000.0
con la limitación dada por 0 \leq \theta \leq 1.
53. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual los medios para calcular una ganancia suavizada comprenden medios para calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta por medio de la siguiente relación:
S_{m} = \lambda \theta
54. El sistema de comunicación celular de acuerdo con la reivindicación 53, en el cual el factor S_{m} tiene un valor que se aproxima a 1 para una señal de banda ancha no articulada en voz y estable, y un valor que se aproxima a 0 para una señal de banda ancha articulada en voz y pura, o una señal de banda ancha inestable.
55. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal;
la señal de banda ancha es muestreada antes de su codificación, y se procesa o trata por tramas y sub-tramas durante la codificación y la descodificación; y
los medios para calcular una ganancia suavizada comprenden medios para computar una ganancia modificada inicial g_{0}, de tal modo que dichos medios de computación de ganancia modificada inicial comprenden medios para comparar la ganancia hallada g, computada durante la codificación de la señal de banda ancha, con un umbral dado por la ganancia modificada inicial procedente de la sub-trama pasada g-1, como sigue:
si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
y
si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
56. El sistema de comunicación celular de acuerdo con la reivindicación 41, en el cual los medios para calcular una ganancia suavizada comprenden medios para calcular una ganancia modificada inicial g_{0} comparando la ganancia hallada g con un umbral.
57. El sistema de comunicación celular de acuerdo con la reivindicación 56, en el cual:
los medios para calcular una ganancia suavizada comprenden medios para calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta a través de la siguiente relación:
S_{m} = \lambda \theta
y medios para determinar dicha ganancia suavizada g_{s} a través de la siguiente relación:
g_{s} = S_{m}\cdot g_{0} + (1 - S_{m})\cdot g
58. Un elemento de red que comprende un receptor que incluye medios para recibir una señal de banda ancha codificada y transmitida, y un descodificador para descodificar la señal de banda ancha codificada que se recibe;
en el que dicho descodificador comprende medios sensibles a un conjunto de parámetros de codificación de señal, destinados a descodificar la señal de banda ancha codificada que se recibe, y en el cual dichos medios descodificadores de señal de banda ancha comprenden un dispositivo de acuerdo con la reivindicación 21, destinado a producir un vector de código suavizado en ganancia, durante la descodificación de la señal de banda ancha codificada, a partir de dichos parámetros de codificación de señal.
59. Un elemento de red de acuerdo con la reivindicación 58, en el cual los medios para hallar un vector de código y una ganancia comprenden:
medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal; y
medios para hallar una ganancia de código de cifrado y descifrado innovador.
60. Un elemento de red de acuerdo con la reivindicación 58, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código en un código de cifrado y descifrado en relación con dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un primer parámetro de codificación de señal comprende un índice de código de cifrado y descifrado innovador.
61. Un elemento de red de acuerdo con la reivindicación 58, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un tercer parámetro de codificación de señal comprende los siguientes parámetros:
una ganancia de paso computada durante la codificación de la señal de banda ancha;
un retardo de paso computado durante la codificación de la señal de banda ancha;
un índice j de un filtro de paso bajo seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
62. Un elemento de red de acuerdo con la reivindicación 58, en el cual dicho al menos un cuarto parámetro de codificación de señal comprende coeficientes de un filtro de predicción lineal calculados durante la codificación de la señal de banda ancha.
63. Un elemento de red de acuerdo con la reivindicación 58, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con un índice k de dicho código de cifrado y descifrado innovador, de tal modo que dicho índice k forma dicho al menos un primer parámetro de codificación de señal; y
los medios para calcular un primer factor comprenden medios para computar un factor de configuración o articulación en voz, r_{v}, por medio de la siguiente relación:
r_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde:
- E_{v} es la energía de un vector de código adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y descifrado innovador computada durante la codificación de la señal de banda ancha;
- k es un índice del código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha; y
- c_{k} es el vector de código innovador de dicho código de cifrado y descifrado innovador en el índice k.
64. Un elemento de red de acuerdo con la reivindicación 63, en el cual el factor de articulación en voz, r_{v}, tiene un valor situado entre -1 y 1, de tal modo que el valor 1 corresponde a una señal articulada en voz y pura, y el valor -1 corresponde a una señal no articulada en voz y pura.
65. Un elemento de red de acuerdo con la reivindicación 64, en el cual los medios para calcular una ganancia suavizada comprenden medios para computar un factor \lambda utilizando la siguiente relación:
\lambda = 0,5(1 - r_{v}).
66. Un elemento de red de acuerdo con la reivindicación 65, en el cual un factor \lambda = 0 indica una señal articulada en voz y pura, y un factor \lambda = 1 indica una señal no articulada en voz y pura.
67. Un elemento de red de acuerdo con la reivindicación 58, en el cual los medios para calcular un segundo factor comprenden medios para determinar una medida de distancia proporcionando una similitud entre filtros de predicción lineal adyacentes y sucesivos, computados durante la codificación de la señal de banda ancha.
68. Un elemento de red de acuerdo con la reivindicación 67, en el cual:
la señal de banda ancha es muestreada antes de la codificación, y es procesada o tratada por tramas durante la codificación y la descodificación; y
los medios para determinar una medida de distancia comprenden medios para calcular una medida de distancia de Pares Espectrales de Inmitancia entre los Pares Espectrales de Inmitancia de una trama presente n de la señal de banda ancha, y los Pares Espectrales de Inmitancia de una trama pasada n-1 de la señal de banda ancha, a través de la siguiente relación:
D_{S} = \sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} - isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros de predicción lineal.
69. Un elemento de red de acuerdo con la reivindicación 68, en el cual los medios para calcular un segundo factor comprenden medios para establecer una relación de correspondencia de la medida D_{s} de distancia de Pares Espectrales de Inmitancia con dicho segundo factor \theta a través de la siguiente relación:
\theta = 1,25 - D_{s}/400 . 000.0
con la limitación dada por 0 \leq \theta \leq 1.
70. Un elemento de red de acuerdo con la reivindicación 58, en el cual los medios para calcular una ganancia suavizada comprenden medios para calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta por medio de la siguiente relación:
S_{m} = \lambda \theta
71. Un elemento de red de acuerdo con la reivindicación 70, en el cual el factor S_{m} tiene un valor que se aproxima a 1 para una señal de banda ancha no articulada en voz y estable, y un valor que se aproxima a 0 para una señal de banda ancha articulada en voz y pura, o una señal de banda ancha inestable.
72. Un elemento de red de acuerdo con la reivindicación 58, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal;
\newpage
la señal de banda ancha es muestreada antes de su codificación, y se procesa o trata por tramas y sub-tramas durante la codificación y la descodificación; y
los medios para calcular una ganancia suavizada comprenden medios para computar una ganancia modificada inicial g_{0}, de tal modo que dichos medios de computación de ganancia modificada inicial comprenden medios para comparar la ganancia hallada g, computada durante la codificación de la señal de banda ancha, con un umbral dado por la ganancia modificada inicial procedente de la sub-trama pasada g-1, como sigue:
si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
y
si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
73. Un elemento de red de acuerdo con la reivindicación 58, en el cual los medios para calcular una ganancia suavizada comprenden medios para calcular una ganancia modificada inicial g_{0} comparando la ganancia hallada g con un umbral.
74. Un elemento de red de acuerdo con la reivindicación 73, en el cual:
los medios para calcular una ganancia suavizada comprenden medios para calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta a través de la siguiente relación:
S_{m} = \lambda \theta
y medios para determinar dicha ganancia suavizada g_{s} a través de la siguiente relación:
g_{s} = S_{m}\cdot g_{0} + (1 - S_{m})\cdot g
75. En un sistema de comunicación destinado a dar servicio a un área geográfica, que comprende unidades móviles transmisoras/receptoras y estaciones de base, un subsistema de comunicación inalámbrica y bidireccional, o en ambos sentidos, entre cada par formado por unidad móvil y estación de base, de tal modo que dicho subsistema de comunicación inalámbrica y bidireccional comprende, tanto en la unidad móvil como en la estación de base, (a) un transmisor, que incluye un codificador para codificar una señal de banda ancha y medios para transmitir la señal de banda ancha codificada, y (b) un receptor, que incluye medios para recibir una señal de banda ancha codificada y transmitida, y un descodificador para descodificar la señal de banda ancha codificada que se recibe;
en el cual dicho descodificador comprende medios sensibles a un conjunto de parámetros de codificación de señal, a fin de descodificar la señal de banda ancha codificada que se recibe, y en el cual dichos medios de descodificación de señal de banda ancha comprenden un dispositivo de acuerdo con la reivindicación 21, destinado a producir un vector de código de ganancia suavizada durante la descodificación de la señal de banda ancha codificada, a partir de dicho conjunto de parámetros de codificación de señal.
76. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el cual los medios para hallar un vector de código comprenden:
medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal; y
medios para hallar una ganancia de código de cifrado y descifrado innovador.
77. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código en un código de cifrado y descifrado en relación con dicho al menos un primer parámetro de codificación de
señal; y
dicho al menos un primer parámetro de codificación de señal comprende un índice de código de cifrado y descifrado innovador.
78. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el
cual:
los medios para hallar un vector de código y una ganancia comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un tercer parámetro de codificación de señal comprende los siguientes parámetros:
una ganancia de paso computada durante la codificación de la señal de banda ancha;
un retardo de paso computado durante la codificación de la señal de banda ancha;
un índice j de un filtro de paso bajo seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
79. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el cual dicho al menos un cuarto parámetro de codificación de señal comprende coeficientes de un filtro de predicción lineal calculados durante la codificación de la señal de banda ancha.
80. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el cual:
los medios para hallar un vector de código comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con un índice k de dicho código de cifrado y descifrado innovador, de tal modo que dicho índice k forma dicho al menos un primer parámetro de codificación de señal; y
los medios para calcular un primer factor comprenden medios para computar un factor de configuración o articulación en voz, r_{v}, por medio de la siguiente relación:
r_{v} = (E_{v} - E_{c})/(E_{v} + E_{c})
donde:
- E_{v} es la energía de un vector de código adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y descifrado innovador computada durante la codificación de la señal de banda ancha;
- k es un índice del código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha; y
- c_{k} es el vector de código innovador de dicho código de cifrado y descifrado innovador en el índice k.
81. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 80, en el cual el factor de articulación en voz, r_{v}, tiene un valor situado entre -1 y 1, de tal modo que el valor 1 corresponde a una señal articulada en voz y pura, y el valor -1 corresponde a una señal no articulada en voz y pura.
82. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 80, en el cual los medios para calcular una ganancia suavizada comprenden medios para computar un factor \lambda utilizando la siguiente relación:
\lambda = 0,5(1 - r_{v}).
83. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 82, en el cual un factor \lambda = 0 indica una señal articulada en voz y pura, y un factor \lambda = 1 indica una señal no articulada en voz y pura.
84. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el cual los medios para calcular un segundo factor comprenden medios para determinar una medida de distancia proporcionando una similitud entre filtros de predicción lineal adyacentes y sucesivos, computados durante la codificación de la señal de banda ancha.
85. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 84, en el cual:
la señal de banda ancha es muestreada antes de la codificación, y es procesada o tratada por tramas durante la codificación y la descodificación; y
los medios para determinar una medida de distancia comprenden medios para calcular una medida de distancia de Pares Espectrales de Inmitancia entre los Pares Espectrales de Inmitancia de una trama presente n de la señal de banda ancha, y los Pares Espectrales de Inmitancia de una trama pasada n-1 de la señal de banda ancha, a través de la siguiente relación:
D_{S} = \sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} - isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros de predicción lineal.
86. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 85, en el cual los medios para calcular un segundo factor comprenden medios para establecer una relación de correspondencia de la medida D_{s} de distancia de Pares Espectrales de Inmitancia con dicho segundo factor \theta a través de la siguiente relación:
\theta = 1,25 - D_{s}/400 . 000.0
con la limitación dada por 0 \leq \theta \leq 1.
87. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el cual los medios para calcular una ganancia de suavización comprenden medios para calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta por medio de la siguiente relación:
S_{m} = \lambda \theta
88. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 87, en el cual el factor S_{m} tiene un valor que se aproxima a 1 para una señal de banda ancha no articulada en voz y estable, y un valor que se aproxima a 0 para una señal de banda ancha articulada en voz y pura, o una señal de banda ancha inestable.
89. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el cual:
los medios para hallar un vector de código comprenden medios para hallar un vector de código innovador en un código de cifrado y descifrado innovador en relación con dicho al menos un primer parámetro de codificación de señal;
la señal de banda ancha es muestreada antes de su codificación, y se procesa o trata por tramas y sub-tramas durante la codificación y la descodificación; y
los medios para calcular una ganancia suavizada comprenden medios para computar una ganancia modificada inicial g_{0}, de tal modo que dichos medios de computación de ganancia modificada inicial comprenden medios para comparar la ganancia hallada g, computada durante la codificación de la señal de banda ancha, con un umbral dado por la ganancia modificada inicial procedente de la sub-trama pasada g-1, como sigue:
si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
y
si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
90. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 75, en el cual los medios para calcular una ganancia suavizada comprenden medios para calcular una ganancia modificada inicial g_{0} comparando la ganancia hallada g con un umbral.
91. El subsistema de comunicación inalámbrica y bidireccional de acuerdo con la reivindicación 90, en el cual:
los medios para calcular una ganancia suavizada comprenden medios para calcular un factor S_{m} de suavización de ganancia basándose tanto en el primer factor \lambda como en el segundo factor \theta a través de la siguiente relación:
S_{m} = \lambda \theta
y medios para determinar dicha ganancia suavizada g_{s} a través de la siguiente relación:
g_{s} = S_{m}\cdot g_{0} + (1 - S_{m})\cdot g
92. Un teléfono móvil que incluye un dispositivo de acuerdo con la reivindicación 21.
ES00978928T 1999-11-18 2000-11-17 Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. Expired - Lifetime ES2266003T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA2290037 1999-11-18
CA002290037A CA2290037A1 (en) 1999-11-18 1999-11-18 Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals

Publications (1)

Publication Number Publication Date
ES2266003T3 true ES2266003T3 (es) 2007-03-01

Family

ID=4164645

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00978928T Expired - Lifetime ES2266003T3 (es) 1999-11-18 2000-11-17 Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha.

Country Status (13)

Country Link
US (1) US7191123B1 (es)
EP (1) EP1232494B1 (es)
JP (1) JP4662673B2 (es)
CN (1) CN1229775C (es)
AT (1) ATE336060T1 (es)
AU (1) AU1644401A (es)
CA (1) CA2290037A1 (es)
CY (1) CY1106164T1 (es)
DE (1) DE60029990T2 (es)
DK (1) DK1232494T3 (es)
ES (1) ES2266003T3 (es)
PT (1) PT1232494E (es)
WO (1) WO2001037264A1 (es)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
KR100648760B1 (ko) 2001-11-29 2006-11-23 코딩 테크놀러지스 에이비 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
RU2316059C2 (ru) * 2003-05-01 2008-01-27 Нокиа Корпорейшн Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
US7451091B2 (en) 2003-10-07 2008-11-11 Matsushita Electric Industrial Co., Ltd. Method for determining time borders and frequency resolutions for spectral envelope coding
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
WO2006085586A1 (ja) * 2005-02-10 2006-08-17 Matsushita Electric Industrial Co., Ltd. 音声符号化におけるパルス割当方法
AU2006232361B2 (en) * 2005-04-01 2010-12-23 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
PL1875463T3 (pl) * 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
CN100420155C (zh) * 2005-08-03 2008-09-17 上海杰得微电子有限公司 宽带音频压缩编码器的频带组划分方法
ATE531037T1 (de) * 2006-02-14 2011-11-15 France Telecom Vorrichtung für wahrnehmungsgewichtung bei der tonkodierung/-dekodierung
EP2118885B1 (en) 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
CN101622668B (zh) 2007-03-02 2012-05-30 艾利森电话股份有限公司 电信网络中的方法和装置
CN101266798B (zh) * 2007-03-12 2011-06-15 华为技术有限公司 一种在语音解码器中进行增益平滑的方法及装置
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CN100550133C (zh) 2008-03-20 2009-10-14 华为技术有限公司 一种语音信号处理方法及装置
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
CN101609674B (zh) * 2008-06-20 2011-12-28 华为技术有限公司 编解码方法、装置和系统
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102648493B (zh) 2009-11-24 2016-01-20 Lg电子株式会社 音频信号处理方法和设备
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN103295578B (zh) * 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
KR101398189B1 (ko) * 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
CN105745706B (zh) * 2013-11-29 2019-09-24 索尼公司 用于扩展频带的装置、方法和程序
RU2667627C1 (ru) 2013-12-27 2018-09-21 Сони Корпорейшн Устройство и способ декодирования и программа
GB201401689D0 (en) * 2014-01-31 2014-03-19 Microsoft Corp Audio signal processing
CA2940657C (en) 2014-04-17 2021-12-21 Voiceage Corporation Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US9510787B2 (en) * 2014-12-11 2016-12-06 Mitsubishi Electric Research Laboratories, Inc. Method and system for reconstructing sampled signals
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5195168A (en) 1991-03-15 1993-03-16 Codex Corporation Speech coder and method having spectral interpolation and fast codebook search
JP3186412B2 (ja) 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5960386A (en) * 1996-05-17 1999-09-28 Janiszewski; Thomas John Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
TW326070B (en) 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
US5987406A (en) * 1997-04-07 1999-11-16 Universite De Sherbrooke Instability eradication for analysis-by-synthesis speech codecs
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains

Also Published As

Publication number Publication date
PT1232494E (pt) 2006-10-31
AU1644401A (en) 2001-05-30
US7191123B1 (en) 2007-03-13
DK1232494T3 (da) 2006-11-13
CY1106164T1 (el) 2011-06-08
DE60029990D1 (de) 2006-09-21
DE60029990T2 (de) 2006-12-07
CA2290037A1 (en) 2001-05-18
CN1391689A (zh) 2003-01-15
EP1232494A1 (en) 2002-08-21
CN1229775C (zh) 2005-11-30
JP4662673B2 (ja) 2011-03-30
JP2003514267A (ja) 2003-04-15
WO2001037264A1 (en) 2001-05-25
EP1232494B1 (en) 2006-08-09
ATE336060T1 (de) 2006-09-15

Similar Documents

Publication Publication Date Title
ES2266003T3 (es) Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha.
ES2212642T3 (es) Dispositivo de codificacion perceptual y metodo para la codificacion eficaz de señales de banda ancha.
ES2266312T3 (es) Indexacion de posiciones y señales de pulso en codigos de cifrado y descifrado algebraicos para la codificacion de señales de banda ancha.
JP4824167B2 (ja) 周期的スピーチコーディング
ES2321147T3 (es) Codificacion de habla de tasa de transmision variable.
ES2625895T3 (es) Método y dispositivo para la ocultación eficiente del borrado de tramas en códecs de voz basados en la predicción lineal
ES2287150T3 (es) Metodo y sistema para estimacion artificial de una señal de banda alta en un codificador-decodificador de voz.
AU2002221389A1 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
ES2256022T3 (es) Metodos y aparators para submuestreo de la informacion.