ES2266003T3 - Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. - Google Patents
Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. Download PDFInfo
- Publication number
- ES2266003T3 ES2266003T3 ES00978928T ES00978928T ES2266003T3 ES 2266003 T3 ES2266003 T3 ES 2266003T3 ES 00978928 T ES00978928 T ES 00978928T ES 00978928 T ES00978928 T ES 00978928T ES 2266003 T3 ES2266003 T3 ES 2266003T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- gain
- code
- factor
- innovative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title description 8
- 239000013598 vector Substances 0.000 claims abstract description 240
- 238000000034 method Methods 0.000 claims abstract description 90
- 230000004044 response Effects 0.000 claims abstract description 33
- 238000004519 manufacturing process Methods 0.000 claims abstract description 20
- 238000009499 grossing Methods 0.000 claims description 68
- 230000003595 spectral effect Effects 0.000 claims description 35
- 230000001105 regulatory effect Effects 0.000 claims description 33
- 238000004891 communication Methods 0.000 claims description 32
- 230000006854 communication Effects 0.000 claims description 32
- 230000010267 cellular communication Effects 0.000 claims description 20
- 230000002457 bidirectional effect Effects 0.000 claims description 19
- 230000003044 adaptive effect Effects 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000013459 approach Methods 0.000 claims description 8
- 230000001413 cellular effect Effects 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 7
- 230000007175 bidirectional communication Effects 0.000 claims 3
- 230000005284 excitation Effects 0.000 description 45
- 238000003786 synthesis reaction Methods 0.000 description 37
- 230000015572 biosynthetic process Effects 0.000 description 36
- 238000005070 sampling Methods 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 16
- 210000004027 cell Anatomy 0.000 description 16
- 230000009467 reduction Effects 0.000 description 15
- 238000012546 transfer Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000001914 filtration Methods 0.000 description 11
- 238000011002 quantification Methods 0.000 description 9
- 230000033228 biological regulation Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000007493 shaping process Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 5
- 230000001934 delay Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 210000003771 C cell Anatomy 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 206010010071 Coma Diseases 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004578 scanning tunneling potentiometry Methods 0.000 description 1
- 235000019832 sodium triphosphate Nutrition 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuits Of Receivers In General (AREA)
- Stereophonic System (AREA)
- Control Of Amplification And Gain Control (AREA)
Abstract
Un método para producir un vector de código de ganancia suavizada durante la descodificación de una señal de banda ancha codificada, a partir de un conjunto de parámetros de codificación de señal, de tal modo que dicho método comprende: hallar un vector de código (ck) y una ganancia (g) en relación con al menos un primer (k) y al menos un segundo (g) parámetros de codificación de señal, pertenecientes a dicho conjunto; calcular (501, 502) un primer factor (rv, ) representativo de un grado de articulación en voz en la señal de banda ancha, en respuesta a al menos un tercer parámetro (b, vT) de codificación de señal, perteneciente a dicho conjunto; calcular (503, 504) un segundo factor () representativo de un grado de estabilidad de dicha señal de banda ancha en respuesta a al menos un cuarto parámetro (LP) de codificación de señal, perteneciente a dicho conjunto; calcular una ganancia suavizada (gs) utilizando una operación no lineal relacionada con los primer y segundo factores (rv, ; ) y aplicada a la ganancia encontrada (g); y amplificar el vector de código hallado (ck) con dicha ganancia suavizada (gs), con el fin de producir con ello dicho vector de código suavizado en ganancia.
Description
Suavizador de la ganancia en un descodificador
de señal de habla y audio de banda ancha.
La presente invención se refiere a un método y
un dispositivo de suavización de la ganancia, implementados en un
codificador de señal de banda ancha.
La demanda de técnicas de codificación digitales
eficaces para habla/audio de banda ancha con un buen compromiso de
calidad subjetiva/velocidad de bits, está creciendo para un gran
número de aplicaciones, tales como la
tele-conferencia de audio/vídeo, la comunicación
multimedia y las aplicaciones sin cables o inalámbricas, así como
las aplicaciones de Internet y de red en paquetes. Hasta hace poco,
se utilizaban principalmente en aplicaciones de codificación del
habla anchuras de banda telefónicas filtradas en el intervalo entre
200 y 3.400 Hz. Sin embargo, existe una demanda creciente de
aplicaciones de habla de banda ancha con el fin de incrementar la
intelegibilidad o comprensibilidad, así como la naturalidad, de las
señales del habla. Se ha encontrado suficiente una anchura de banda
comprendida en el intervalo entre 50 y 7.000 Hz para procurar una
calidad del habla frente a frente o en persona. Para las señales de
audio, este intervalo proporciona una calidad de audio aceptable,
pero que es aún más baja que la calidad de un CD que funciona en el
intervalo entre 20 y 20.000 Hz.
Un codificador del habla convierte una señal de
habla en una corriente de bits digitales que es transmitida por un
canal de comunicación (o almacenada en un medio de almacenamiento).
La señal de habla se digitaliza (se muestrea y cuantifica
discretamente, por lo común con 16 bits por muestra) y el
codificador del habla tiene el cometido de representar estas
muestras digitales con un pequeño número de bits, al tiempo que
mantiene una buena calidad subjetiva del habla. El descodificador
del habla o sintetizador procesa o trata la corriente de bits
transmitidos o almacenados con el fin de convertirla de vuelta a una
señal sonora, por ejemplo, una señal de habla/audio.
Una de las mejores técnicas anteriores, capaz de
conseguir un buen compromiso de calidad/velocidad de bits, es la
denominada técnica de Predicción Lineal Excitada en Código (CELP -
"Code Excited Linear Prediction"). De acuerdo con esta
técnica, la señal de habla muestreada se procesa en bloques
sucesivos de L muestras que habitualmente se denominan tramas, de
tal modo que L es algún número predeterminado (correspondiente a
entre 10 y 30 ms de habla). En la CELP, se computa y transmite en
cada trama un filtro de síntesis de predicción lineal (LP -
"linear prediction"). La trama de L muestras se divide entonces
en bloques más pequeños denominados sub-tramas, de
un tamaño de N muestras, donde L = kN y k es el número de
sub-tramas de una trama (N corresponde
habitualmente a entre 4 y 10 ms de habla). Se determina una señal de
excitación en cada sub-trama, que consiste por lo
común en dos componentes: una procedente de la pasada excitación
(también denominada contribución de paso o código de cifrado y
descifrado), y la otra procedente de un código de cifrado y
descifrado innovador (también denominado código de cifrado y
descifrado fijo). Esta señal de excitación es transmitida y
utilizada en el descodificador como entrada del filtro de síntesis
de LP con el fin de obtener un habla sintetizada.
Un código de cifrado y descifrado innovador es,
en el contexto de CELP, un conjunto indexado de secuencias de N
muestras de longitud a las que se hará referencia como vectores de
código N-dimensionales. Cada secuencia del código
de cifrado y descifrado está indexada o señalada por un entero k que
varía de 1 a M, donde M representa el tamaño del código de cifrado
y descifrado, expresado a menudo como un número de bits b, de tal
modo que M = 2b.
Con el fin de sintetizar el habla de acuerdo con
la técnica de CELP, cada bloque de N muestras es sintetizado
filtrando un vector de código apropiado procedente de un código de
cifrado y descifrado innovador, a través de filtros que varían con
el tiempo y que configuran un modelo de las características
espectrales de la señal de habla. En el extremo o terminal del
codificador se computa la salida de síntesis para todos los vectores
de código procedentes del código de cifrado y descifrado innovador
(búsqueda en el código de cifrado y descifrado) o para un conjunto
de ellos. El vector de código retenido es que produce la salida de
síntesis más cercana a la señal de habla original de acuerdo con
una medida de la distorsión ponderada perceptivamente. Esta
ponderación perceptiva se lleva a cabo con el uso de un denominado
filtro de ponderación perceptiva, que se deriva, por lo común, del
filtro de síntesis de LP.
El modelo de CELP ha tenido mucho éxito a la
hora de codificar señales sonoras de banda telefónica, y existen
varios estándares basados en la CELP en un amplio abanico de
aplicaciones, especialmente en las aplicaciones celulares
digitales. En la banda telefónica, la señal sonora está limitada por
la banda entre 200 y 3.400 Hz, y se toman muestras de ella a 8.000
muestras/segundo. En aplicaciones de habla/audio de banda ancha, la
señal sonora está limitada por la banda entre 50 y 7.000 Hz, y se
toman muestras de ella a 16.000 muestras/segundo.
Surgen algunas dificultades a la hora de aplicar
el modelo de CELP optimizado de banda telefónica a las señales de
banda ancha, y es preciso añadir características adicionales al
modelo con el propósito de obtener señales de banda ancha de alta
calidad. Las señales de banda ancha exhiben un intervalo dinámico
mucho más ancho en comparación con las señales de banda telefónica,
lo que da lugar a problemas de precisión cuando se requiere una
implementación de coma fija del algoritmo (lo que es esencial en
aplicaciones inalámbricas). Por otra parte, el modelo de CELP
empleará a menudo la mayor parte de sus bits de codificación en la
zona de bajas frecuencias, que tiene habitualmente mayor contenido
de energía, lo que da lugar a una señal de salida de paso bajo.
El documento
US-A-5.195.168 describe un
dispositivo para reconstruir sustancialmente una señal. La señal se
divide en intervalos de tiempo sucesivos. Cada intervalo de tiempo
tiene una señal de referencia de entrada con un conjunto de
vectores, y al menos una señal eléctrica representativa para cada
señal de referencia de entrada. El dispositivo utiliza una unidad
de código de cifrado y descifrado provista de una memoria de código
de cifrado y descifrado, un dispositivo ajustador de la ganancia,
una unidad de síntesis provista de un filtro de síntesis, un
dispositivo de combinación y una unidad de ponderación perceptiva
que utiliza las señales eléctricas representativas para generar un
conjunto relacionado de vectores de señal sintetizados, con vistas
a la reconstrucción sustancial de la señal.
Para cada vector de las señales de referencia de
entrada, se proporciona desde la memoria de código de cifrado y
descifrado un vector de código de cifrado y descifrado de excitación
concreto, de tal modo que la memoria de código de cifrado y
descifrado tiene un conjunto de vectores de código de excitación
almacenados en ella. Si se desea, el dispositivo ajustador de la
ganancia, sensible al vector de código de excitación concreto,
multiplica ese vector de código por un factor de ganancia de
excitación seleccionado, con el fin de proporcionar sustancialmente
una correlación con una energía de la señal eléctrica representativa
para cada vector de señal de referencia de entrada. El filtro de
síntesis interpolado correspondiente, sensible al vector de código
de excitación particular multiplicado por la ganancia particular,
produce el vector de señal sintetizado.
Un problema que se aprecia en las señales de
habla sintetizadas es una reducción en el rendimiento del
descodificador cuando está presente ruido de fondo en la señal de
habla muestreada. En el extremo o terminal del descodificador, el
modelo de CELP se sirve de técnicas de filtrado ulterior y de
tratamiento ulterior con el propósito de mejorar la señal
sintetizada percibida. Estas técnicas han de adaptarse para su
adecuación a las señales de banda ancha.
Con el fin de superar el problema anteriormente
expuesto de la técnica anterior, la presente invención proporciona
un método para producir un vector de código suavizado en ganancia
durante la descodificación de una señal de banda ancha codificada,
a partir de un conjunto de parámetros de codificación de señal. Este
método comprende hallar un vector de código y una ganancia en
relación con al menos un primer y al menos un segundo parámetros de
codificación de señal del conjunto, calcular un primer factor
representativo de un grado de vecindad o proximidad en la señal de
banda ancha, en respuesta a al menos un tercer parámetro de
codificación de señal del conjunto, calcular un segundo factor
representativo de un grado de estabilidad de la señal de banda ancha
en respuesta a al menos un cuarto parámetro de codificación de
señal del conjunto, calcular una ganancia suavizada utilizando una
operación no lineal relacionada con los primer y segundo factores y
aplicada a la ganancia encontrada, y amplificar el vector de código
hallado con la ganancia suavizada, a fin de producir con ello el
vector de código suavizado en ganancia.
La presente invención se refiere también a un
método para producir un vector de código suavizado en ganancia
durante la descodificación de una señal codificada, a partir de un
conjunto de parámetros de codificación de señal, de tal modo que la
señal contiene ruido de fondo estacionario. Este método comprende
hallar un vector de código y una ganancia en relación con al menos
un primer y al menos un segundo parámetros de codificación de señal
del conjunto, calcular al menos un factor indicativo de un nivel de
ruido de fondo estacionario en la señal, en respuesta a al menos un
tercer parámetro de codificación de señal del conjunto, calcular una
ganancia suavizada utilizando una operación no lineal relacionada
con el factor indicativo del nivel de ruido y aplicada a la
ganancia hallada, y amplificar el vector de código hallado con la
ganancia suavizada, al objeto de producir con ello dicho vector de
código suavizado en ganancia.
En consecuencia, la presente invención utiliza
una característica de suavización de la ganancia para codificar
eficazmente señales de banda ancha (entre 50 y 7.000 Hz) a través,
en particular, pero no exclusivamente, de técnicas de codificación
del tipo de CELP, con vistas a obtener una señal reconstruida
(sintetizada) de alta calidad, especialmente en presencia de ruido
de fondo en la señal de banda ancha de la que se toman muestras, o
muestreada.
De acuerdo con realizaciones preferidas del
método para la producción de un vector de código suavizado en
ganancia:
- hallar un vector de código comprende hallar un
vector de código innovador de un código de cifrado y descifrado
innovador, en relación con dicho al menos un primer parámetro de
codificación de señal;
- hallar una ganancia comprende hallar una
ganancia de código de cifrado y descifrado innovador;
- el primer parámetro codificador de señal
comprende un índice de código de cifrado y descifrado innovador;
- el al menos un tercer parámetro de
codificación comprende los siguientes parámetros:
- una ganancia de paso, computada durante la codificación de la señal de banda ancha;
- un retardo de paso, computado durante la codificación de la señal de banda ancha;
- un índice j de un filtro de paso bajo, seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
- un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha;
- el al menos un tercer parámetro de
codificación de señal comprende coeficientes de un filtro de
predicción lineal, calculados durante la codificación de la señal
de banda ancha;
- el vector de código innovador se halla en el
código de cifrado y descifrado innovador en relación con un índice
k del código de cifrado y descifrado innovador, de tal modo que este
índice k forma el primer parámetro de codificación de señal;
- calcular un primer factor comprende computar
un factor de configuración o articulación en voz, rv, por medio de
la siguiente relación:
rv = (Ev -
Ec)/(Ev +
Ec)
donde:
- Ev es la energía de un vector de código
adaptativo regulado en escala, bvT;
- Ec es la energía de un vector de código
innovador regulado en escala, gck;
- b es una ganancia de paso computada durante la
codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la
codificación de la señal de banda ancha;
- vT es un vector de código de cifrado y
descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y
descifrado innovador computada durante la codificación de la señal
de banda ancha;
- k es un índice del código de cifrado y
descifrado innovador computado durante la codificación de la señal
de banda ancha; y
- ck es el vector de código innovador de dicho
código de cifrado y descifrado innovador en el índice k;
- el factor de articulación en voz rv tiene un
valor situado entre -1 y 1, de tal modo que el valor 1 corresponde
a una señal articulada en voz y pura, y el valor -1 corresponde a
una señal no articulada en voz y pura;
- calcular una ganancia suavizada comprende
computar un factor \lambda utilizando la siguiente relación:
\lambda =
0,5(1 -
rv).
- un factor \lambda = 0 indica una señal
configurada o articulada en voz y pura, y un factor \lambda = 1
indica una señal no articulada en voz y pura;
- calcular un segundo factor comprende
determinar una medida de distancia que proporcione una similitud
entre filtros de predicción lineales adyacentes y sucesivos,
computados durante la codificación de la señal de banda ancha;
- la señal de banda ancha se muestrea antes de
ser codificada y es procesada por tramas durante su codificación y
descodificación, y determinar una medida de distancia comprende
calcular una medida de distancia de Pares Espectrales de Inmitancia
entre los Pares Espectrales de Inmitancia existentes en una trama
presente en ese momento, n, de la señal de banda ancha, y los Pares
Espectrales de Inmitancia de una trama pasada, n - 1, de la señal
de banda ancha, por medio de la siguiente relación:
D_{S} =
\sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} -
isp^{(n-1)}_{i}\right)^{2}
donde p es el orden del filtro de
predicción
lineal;
\newpage
- calcular un segundo factor comprende
establecer una relación de correspondencia entre la medida de
distancia de Pares Espectrales de Inmitancia, Ds, y el segundo
factor \theta, a través de la siguiente relación:
\theta = 1,25
- D_{s}/400 .
000.0
limitada por 0 \leq \theta
\leq
1;
- calcular una ganancia suavizada comprende
calcular un factor de ganancia suavizada, Sm, basándose tanto en el
primer factor \lambda como en el segundo factor \theta a través
de la siguiente relación:
S_{m} =
\lambda
\theta
- el factor Sm tiene un valor que se aproxima a
1 para una señal de banda ancha no articulada en voz y estable, y
un valor que se aproxima a 0 para una señal de banda ancha
articulada en voz y pura, o para una señal de banda ancha
inestable;
- calcular una ganancia suavizada comprende
computar una ganancia modificada inicial g0 comparando la ganancia
hallada g, computada durante la codificación de la señal de banda
ancha, con un umbral dado por la ganancia modificada inicial a
partir de la sub-trama pasada g - 1, como sigue:
si g < g - 1, entonces g0 = g \times 1,19,
limitada por g0 \leq g - 1
y
si g \geq g - 1, entonces g0 = g/1,19,
limitada por g0 \geq g - 1; y
- calcular una ganancia suavizada comprende
calcular una ganancia modificada inicial g0 por comparación de la
ganancia hallada con un umbral.
- calcular una ganancia suavizada comprende
calcular un factor de suavización de ganancia, Sm, basándose tanto
en el primer factor \lambda como en el segundo factor \theta a
través de la siguiente relación:
S_{m} =
\lambda
\theta
y determinar dicha ganancia
suavizada gs a través de la siguiente
relación:
g_{s} =
S_{m}\cdot g_{0} + (1 - S_{m})\cdot
g
Aún adicionalmente, la presente invención se
refiere:
- para implementar el método anterior, a un
dispositivo para producir un vector de código suavizado en ganancia
durante la descodificación de una señal de banda ancha codificada a
partir de un conjunto de parámetros de codificación de señal; y
- a un sistema de comunicación celular, a un
elemento de red y a un subsistema de comunicación inalámbrica y
bidireccional, o en ambos sentidos, que incorporan el anterior
dispositivo para producir un vector de código suavizado en ganancia
durante la descodificación de la señal de banda ancha codificada a
partir del conjunto de parámetros de codificación de señal.
Los anteriores y otros objetos, ventajas y
características de la presente invención se podrán de manifiesto de
forma más evidente con la lectura de la siguiente descripción no
limitativa de una realización preferida de la misma, proporcionada
tan solo con un propósito ilustrativo, con referencia a los dibujos
que se acompañan.
En los dibujos anexos:
la Figura 1 es un diagrama de bloques
esquemático de un codificador de banda ancha;
la Figura 2 es un diagrama de bloques
esquemático de un descodificador de banda ancha que incorpora el
método y el dispositivo de suavización de la ganancia de acuerdo
con la invención;
la Figura 3 es un diagrama de bloques
esquemático de un dispositivo de análisis de paso;
\newpage
la Figura 4 es un diagrama de bloques
esquemático y simplificado de un sistema de comunicación celular en
el que pueden utilizarse el codificador de banda ancha de la Figura
1 y el descodificador de banda ancha de la Figura 2; y
la Figura 5 es un diagrama de flujo esquemático
del método de suavización de la ganancia incorporado en el
descodificador de banda ancha de la Figura 2.
Como es bien conocido por las personas con
conocimientos ordinarios de la técnica, un sistema de comunicación
celular tal como el 401 (véase la Figura 4) proporciona un servicio
de telecomunicación sobre una gran zona geográfica al dividir la
gran zona geográfica en un cierto número C de celdas más pequeñas.
Se presta servicio a las celdas C más pequeñas por respectivas
estaciones de base celulares 4021, 4022, ..., 402C con el fin de
proporcionar a cada celda canales por radio de señalización, de
audio y de datos.
Los canales de señalización por radio se
utilizan para hacer llamadas de reconocimiento de los radioteléfonos
móviles (unidades trasmisoras/receptoras móviles), tales como el
403, situados dentro de los límites del área de cobertura (celda)
de la estación de base celular 402, y para efectuar llamadas a otros
radioteléfonos 403 situados ya sea dentro, ya sea fuera de la celda
de la estación de base, o bien a otra red, tal como la Red de
Telefonía Pública Conmutada (PSTN - "Public Switched Telephone
Network") 404.
Una vez que un radioteléfono 403 ha efectuado o
recibido con éxito una llamada, se establece un canal de audio o de
datos entre este radioteléfono 403 y la estación de base celular 402
correspondiente a la celda en la que se encuentra situado el
radioteléfono 403, y se conduce la comunicación entre la estación de
base 402 y el radioteléfono 403 por el canal de audio o de datos.
El radioteléfono 403 puede recibir también información de control o
de regulación de secuencia temporal por un canal de señalización
mientras una llamada está en curso.
Si un radioteléfono 403 abandona una celda y
entra en otra celda adyacente mientras hay una llamada en curso, el
radioteléfono 403 entrega la llamada a un canal de audio o de datos
disponible de la estación de base 402 de la nueva celda. Si un
radioteléfono 403 abandona una celda y entra en otra celda adyacente
cuando no hay ninguna llamada en curso, el radioteléfono 403 envía
un mensaje de control a través del canal de señalización para darse
de alta o inscribirse en la estación de base 402 de la nueva celda.
Es posible, de esta forma, la comunicación móvil a través de una
extensa zona geográfica.
El sistema de comunicación celular 401 comprende
adicionalmente un terminal de control 405 destinado a controlar la
comunicación entre las estaciones de base celulares 402 y la PSTN
404, por ejemplo, en el curso de una comunicación entre un
radioteléfono 403 y la PSTN 404, ó entre un radioteléfono 403
situado en una primera celda y un radioteléfono 403 situado en una
segunda celda.
Por supuesto, se requiere un subsistema de
comunicación por radio inalámbrico y bidireccional para establecer
un canal de audio o de datos entre una estación de base 402 de una
celda y un radioteléfono 403 situado en esa celda. Como se ha
ilustrado de forma muy simplificada en la Figura 4, tal subsistema
de comunicación por radio inalámbrico y bidireccional comprende,
convencionalmente, en el radioteléfono 403;
- un transmisor 406, que incluye:
- -
- un codificador 407 para codificar el habla; y
- -
- un circuito transmisor 408 para transmitir el habla codificada desde el codificador 407 a través de una antena, tal como la 409; y
- un receptor 410, que incluye:
- -
- un circuito receptor 411 para recibir el habla codificada y transmitida habitualmente a través de la misma antena 409; y
- -
- un descodificador 412 para descodificar el habla codificada recibida procedente del circuito receptor 411.
El radioteléfono 403 comprende adicionalmente
otros circuitos 413 de radioteléfono convencional a los que están
conectados el codificador 407 y el descodificador 412, y destinados
a procesar las señales procedentes de los mismos, circuitos 413 que
son bien conocidos por parte de las personas con conocimientos
ordinarios de la técnica y que, en consecuencia, no se describirán
adicionalmente en la presente Memoria.
Asimismo, dicho subsistema de comunicación por
radio inalámbrico y bidireccional comprende, de forma convencional,
en cada estación de base 402:
- un transmisor 414, que incluye:
- -
- un codificador 415 para codificar el habla; y
- -
- un circuito de transmisión 416 para transmitir el habla codificada desde el codificador 415 a través de una antena, tal como la 417; y
- un receptor 418, que incluye:
- -
- un circuito receptor 419 para recibir el habla codificada transmitida, a través de la misma antena 417 ó a través de otra antena (no mostrada); y
- -
- un descodificador 420 para descodificar el habla codificada recibida, procedente del circuito receptor 419.
La estación de base 402 comprende
adicionalmente, de manera convencional, un controlador 421 de
estación de base, conjuntamente con su base de datos asociada 422,
para controlar la comunicación entre el terminal de control 405 y
el transmisor 414 y el receptor 418.
Como es bien conocido por parte de los expertos
medios de la técnica, se requiere la codificación de la voz con el
fin de reducir la anchura de banda necesaria para transmitir señales
sonoras, por ejemplo, una señal de voz tal como el habla, a través
del subsistema de comunicación por radio inalámbrico y
bidireccional, esto es, entre un radioteléfono 403 y una estación
de base 402.
Los codificadores de voz de LP (tales como los
415 y 407) que funcionan convencionalmente a 13 kbits/segundo y por
debajo, tal como los codificadores de Predicción Lineal Excitada en
Código (CELP - "Code-Excited Linear
Prediction"), utilizan de manera convencional un filtro de
síntesis de LP para configurar un modelo de la envolvente espectral
de corto plazo del habla. La información de LP se transmite,
típicamente, cada 10 ó 20 ms al descodificador (tal como el 420 y
el 412) y se extrae por el terminal del descodificador.
Las nuevas técnicas que se describen en la
presente Memoria pueden aplicarse a diferentes codificadores basados
en LP. Sin embargo, se utiliza en la realización preferida un
codificador del tipo de CELP con el propósito de presentar una
ilustración no limitativa de estas técnicas. De la misma manera,
dichas técnicas pueden utilizarse con señales sonoras diferentes
del habla y de la voz, así como con otros tipos de señales de banda
ancha.
La Figura 1 muestra un diagrama de bloques
general de un codificador del habla 100 del tipo de CELP, modificado
para adaptarse mejor a las señales de banda ancha.
La señal de habla de entrada muestreada 114 se
divide en dos bloques de L muestras sucesivos denominados
"tramas". Durante cada trama, se computan, codifican y
transmiten diferentes parámetros que representan la señal de habla
contenida en la trama. Los parámetros de LP que representan el
filtro de síntesis de LP se computan habitualmente una vez cada
trama. La trama se divide adicionalmente en bloques más pequeños de
N muestras (bloques de longitud N), en los que se determinan los
parámetros de excitación (paso e innovación). En la literatura de
la CELP, estos bloques de longitud N se denominan
"sub-tramas", y se hace referencia a las
señales de N muestras de las sub-tramas como
vectores N-dimensionales. En esta realización
preferida, la longitud N corresponde a 5 ms, en tanto que la
longitud L corresponde a 20 ms, lo que significa que una trama
contiene cuatro sub-tramas (N = 80 a la velocidad
de toma de muestras o muestreo de 16 kHz, y 64 tras hacer descender
la toma de muestras a 12,8 kHz). En el procedimiento de codificación
están implicados diversos vectores N-dimensionales.
Se da aquí, en lo que sigue, una lista de los vectores que aparecen
en las Figuras 1 y 2, así como una lista de los parámetros
transmitidos:
\vskip1.000000\baselineskip
- s
- vector de habla de entrada de señal de banda ancha (tras la disminución de la velocidad de muestreo, el tratamiento previo y el énfasis previo);
- sw
- Vector de habla ponderado;
- s0
- Respuesta ante entrada cero del filtro de síntesis ponderado;
- sp
- Señal previamente tratada y muestreada a velocidad disminuida; Señal de habla sintetizada y muestreada a velocidad aumentada;
- s'
- Señal de síntesis antes de la reducción del énfasis;
- sd
- Señal de síntesis reducida en énfasis;
- sh
- Señal de síntesis tras la reducción del énfasis y su tratamiento ulterior;
- x
- Vector de objetivo para la búsqueda de paso;
- x'
- Vector de objetivo para la búsqueda innovadora;
- h
- Respuesta ante impulso del filtro de síntesis ponderado;
- vT
- Vector de código de cifrado y descifrado adaptativo (paso) en el retardo T;
- yT
- Vector de código de cifrado y descifrado de paso filtrado (vT en convolución con h);
- ck
- Vector de código innovador en el índice k (k-ésima entrada desde el código de cifrado y descifrado innovador);
- cf
- Vector de código innovador regulado en escala y mejorado;
- u
- Señal de excitación (vectores de código innovador y de paso regulados en escala);
- u'
- Excitación mejorada;
- z
- Secuencia de ruido de paso de banda;
- w'
- Secuencia de ruido blanco; y
- w
- Secuencia de ruido regulada en escala.
\vskip1.000000\baselineskip
- STP
- parámetros de predicción a corto plazo ("short term prediction") (que definen A(z));
- T
- retraso de paso (o índice de código de cifrado y descifrado de paso);
- b
- ganancia de paso (o ganancia de código de cifrado y descifrado de paso);
- j
- Índice del filtro de paso bajo aplicado al vector de código de paso;
- k
- índice de vector de código (entrada de código de cifrado y descifrado innovador); y
- g
- ganancia de código de cifrado y descifrado innovador;
En esta realización preferida, los parámetros de
STP son transmitidos una vez por cada trama y el resto de los
parámetros son transmitidos cuatro veces por cada trama (en cada
sub-trama).
La señal de habla muestreada se codifica según
una pauta de bloque por bloque por parte del codificador 100 de la
Figura 1, que está dividido en once (11) módulos que llevan las
referencias 101 a 111, respectivamente.
El habla de entrada es procesada o tratada en el
interior de los bloques de L muestras anteriormente mencionados,
que se denominan tramas.
Haciendo referencia a la Figura 1, la señal de
habla de entrada muestreada 114 se reduce en su velocidad de
muestreo en un módulo de velocidad de muestreo reducida, o de
muestreo descendente, 101. Por ejemplo, se reduce la velocidad de
muestreo de la señal de 16 kHz a 12,8 kHz, con el uso de técnicas
bien conocidas por parte de las personas con conocimientos
ordinarios de la técnica. Puede, por supuesto, contemplarse la
reducción de la velocidad de muestreo hasta una frecuencia
diferente de 12,8 kHz. La reducción de la velocidad de muestreo, o
muestreo descendente, incrementa la eficacia de la codificación,
puesto que se codifica una anchura de banda de frecuencias más
pequeña. Esto también reduce la complejidad de los algoritmos, ya
que se reduce el número de muestras de una trama. El uso de la
reducción de la velocidad de muestreo llega a ser significativo
cuando la velocidad de los bits se reduce por debajo de 16
kbits/segundo, si bien no es esencial la reducción de la velocidad
de muestreo por encima de 16 kbits/segundo.
Tras la reducción de la velocidad de muestreo,
la trama de 320 muestras y de 20 ms se reduce a una trama de 256
muestras (relación de reducción de la velocidad de muestreo de
4/5).
La trama de entrada se suministra entonces al
bloque de tratamiento previo opcional 102. El bloque de tratamiento
previo 102 puede consistir en un filtro de paso alto con una
frecuencia de corte de 50 Hz. El filtro de paso alto 102 elimina
los componentes sonoros indeseados por debajo de 50 Hz.
La señal muestreada a velocidad reducida y
previamente procesada se denota por sp(n), con n = 0, 1, 2,
..., L-1, donde L es la longitud de la trama (256 a
una frecuencia de muestreo de 12,8 kHz). En una realización
preferida del filtro de énfasis previo 103, la señal sp(n) es
enfatizada previamente con el uso de la siguiente función de
transferencia:
P(z) =
1 -
\mu_{z}{}^{-1}
donde \mu es un factor de énfasis
previo con un valor situado entre 0 y 1 (un valor típico es \mu =
0,7). Puede utilizarse también un filtro de orden superior. Ha de
destacarse que es posible intercambiar el filtro de paso alto 102 y
el filtro de énfasis previo 103 con el fin de obtener
implementaciones de coma fija más
eficaces.
La función del filtro de énfasis previo 103 es
mejorar el contenido en frecuencia de la señal de entrada. Éste
también reduce el intervalo dinámico de la señal de habla de
entrada, lo que la hace más adecuada para la implementación de coma
fija. Sin el énfasis previo, el análisis de LP en coma fija con el
uso de aritmética de precisión única resulta difícil de llevar a la
práctica.
El énfasis previo juega también un importante
papel a la hora de conseguir una ponderación perceptiva global
adecuada del error de cuantificación discreta, lo que contribuye a
mejorar la calidad del sonido. Esto se explicará aquí con mayor
detalle más adelante.
La salida del filtro de énfasis previo 103 se
denota por s(n). Esta señal se utiliza para llevar a cabo el
análisis de LP en un módulo calculador 104. El análisis de LP es una
técnica bien conocida por parte de las personas con conocimientos
ordinarios de la técnica. En esta realización preferida se utiliza
la aproximación de auto-correlación. En la
aproximación de auto-correlación, la señal
s(n) se encuadra en primer lugar utilizando una ventana de
Hamming (que tiene, por lo común, una longitud del orden de entre 30
y 40 ms). Las auto-correlaciones se computan a
partir de la señal encuadrada, y se utiliza un tratamiento recursivo
o recurrente de Levinson-Durbin para computar los
coeficientes de filtro de LP, ai, donde i = 1, ..., p, y donde p es
el orden de LP, que es, de manera convencional, 16 en codificación
de banda ancha. Los parámetros ai son los coeficientes de la
función de transferencia del filtro de LP, los cuales vienen dados
por la siguiente relación:
A(z) =
1 + \sum\limits^{P}_{i=1}
a_{i}z^{-1}
El análisis de LP se lleva a cabo en un módulo
calculador 104, el cual realiza también la cuantificación discreta
y la interpolación de los coeficientes de filtro de LP. Los
coeficientes de filtro de LP se transforman primeramente en otro
dominio equivalente, más adecuado para los propósitos de
cuantificación discreta e interpolación. Los dominios de par
espectral de línea (LSP - "line spectral pair") y de par
espectral de inmitancia (ISP - "immitance spectral pair") son
dos dominios en los cuales puede llevarse a cabo de forma eficiente
la cuantificación discreta y la interpolación. Los 16 coeficientes
de filtro de LP, ai, pueden cuantificarse de forma discreta en el
orden de entre 30 y 50 bits mediante el uso de una cuantificación
discreta dividida o de múltiples etapas, o bien una combinación de
las mismas. El propósito de la interpolación consiste en permitir la
actualización de los coeficientes de filtro de LP cada
sub-trama, en tanto que son transmitidos una vez por
cada trama, lo que mejora el rendimiento del codificador sin
incrementar la velocidad de los bits. De otro modo, se cree que la
cuantificación discreta y la interpolación de los coeficientes de
filtro de LP son bien conocidas por parte de los expertos medios de
la técnica y, en consecuencia, no se describirán adicionalmente en
la presente Memoria.
Los párrafos que siguen describirán el resto de
las operaciones de codificación que se llevan a cabo siguiendo
criterio por sub-tramas. En la siguiente
descripción, el filtro A(z) denota el filtro de LP
interpolado y no cuantificado de forma discreta de la
sub-trama, y el filtro Â(z) denota el filtro de LP
cuantificado discretamente e interpolado de la
sub-trama.
En los codificadores de análisis por síntesis,
el paso y los parámetros innovadores óptimos se buscan minimizando
el error cuadrático medio entre el habla de entrada y el habla
sintetizada en un dominio ponderado perceptivamente. Esto es
equivalente a minimizar el error entre el habla de entrada ponderada
y el habla de síntesis ponderada.
La señal ponderada sw(n) se computa en un
filtro de ponderación perceptiva 105. Tradicionalmente, la señal
ponderada sw(n) ha venido computándose por medio de un filtro
de ponderación que tiene una función de transferencia W(z)
con la forma:
W(z) =
A(z/\gamma_{1})/A(z/\gamma_{2})
donde
0 <
\gamma_{2} < \gamma_{1} \leq
1
Como es bien conocido por parte las personas con
conocimientos ordinarios de la técnica, en los codificadores de
análisis por síntesis (AbS -
"analysis-by-synthesis") de la
técnica anterior, el análisis muestra que el error de
cuantificación discreta se pondera por una función de transferencia
W-1(z) que es la inversa de la función de
transferencia del filtro de ponderación perceptiva 105. Este
resultado se ha descrito bien por B. S. Atal y M. R. Schroeder en
la divulgación "Predictive coding of speech and subjective error
criteria" ("Codificación de predicción del habla y criterios
de error subjetivos"), Transacción ASSP del IEEE, vol. 27, Nº
págs. 247-254, junio de 1979. La función de
transferencia W-1(z) exhibe algo de la
estructura constituyente o de componentes sinusoidales de la señal
de habla de entrada. Se explota, de esta forma, la propiedad de
enmascaramiento del oído humano al dotar al error de cuantificación
discreta de una forma tal, que éste tiene más energía en las zonas
constituyentes en las que se verá enmascarado por la fuerte energía
de señal presente en estas zonas. La magnitud de la ponderación es
controlada por los factores \gamma1 y \gamma2.
El filtro de ponderación perceptiva tradicional
anterior 105 trabaja bien con las señales de banda de telefonía.
Sin embargo, se ha encontrado que este filtro de ponderación
perceptiva tradicional 105 tiene limitaciones intrínsecas a la hora
de configurar un modelo de la estructura constituyente o de
componentes sinusoidales y de la inclinación espectral requerida de
forma concurrente. La inclinación espectral es más pronunciada en
las señales de banda ancha debido al ancho intervalo dinámico entre
las frecuencias bajas y altas. La técnica anterior ha sugerido
añadir un filtro de inclinación dentro de W(z) con el
propósito de controlar la inclinación y la ponderación de las
constituyentes de la señal de entrada de banda ancha por
separado.
Una solución novedosa para este problema
consiste en introducir el filtro de énfasis previo 103 a la entrada,
computar el filtro de LP A(z) basándose en el habla
previamente enfatizada s(n), y utilizar un filtro modificado
W(z) fijando su denominador.
El análisis de LP se lleva a cabo en un módulo
104 sobre la señal previamente enfatizada s(n) con el fin de
obtener el filtro de LP A(z). Se utiliza también un nuevo
filtro de ponderación perceptiva 105 con su denominador fijado. Un
ejemplo de función de transferencia para el filtro de ponderación
perceptiva 105 viene dado por la siguiente relación:
W(z) =
A(z/\gamma_{1})/(1 -
\gamma_{2}z^{-1})
donde
0 <
\gamma_{2} < \gamma_{1} \leq
1
Puede utilizarse un orden superior en el
denominador. Esta estructura desacopla sustancialmente la
ponderación de constituyentes de la inclinación.
Nótese que, debido a que A(z) se computa
basándose en la señal de habla previamente enfatizada s(n),
la inclinación del filtro 1/A(z/\gamma1) es menos
pronunciada en comparación con el caso en que A(z) se computa
basándose en el habla original. Como la reducción del énfasis se
lleva a cabo en el terminal del descodificador utilizando un filtro
que tiene la función de transferencia:
P^{-1}(z) =
1/(1 -
\mu_{z}^{-1}),
el espectro de errores de
cuantificación discreta está conformado por un filtro que tiene una
función de transferencia W - 1(z)P - 1(z).
Cuando \gamma2 se establece de modo que sea igual a \mu, cual es
típicamente el caso, el espectro del error de cuantificación
discreta se conforma por un filtro cuya función de transferencia es
1/A(z/\gamma1), en la que A(z) se computa basándose
en la señal de habla previamente enfatizada. Una escucha subjetiva
demostró que esta estructura para conseguir la conformación del
error por una combinación de énfasis previo y filtración de
ponderación modificada, resulta muy eficaz para codificar señales de
banda ancha, además de presentar las ventajas de facilidad de
implementación algorítmica de coma
fija.
Con el fin de simplificar el análisis del paso,
se estima en primer lugar un retraso de paso de bucle abierto TOL
en un módulo 106 de búsqueda de paso de bucle abierto, con el uso de
la señal de habla ponderada sw(n). A continuación, el
análisis de paso de bucle cerrado, que se lleva a cabo en un módulo
107 de búsqueda de paso de bucle cerrado, se restringe al entorno
del retraso de paso de bucle abierto TOL, lo que reduce
significativamente la complejidad de la búsqueda de los parámetros
de los parámetros de LTP T y b (retraso de paso y ganancia de paso,
respectivamente). El análisis de paso de bucle abierto se lleva a
cabo habitualmente en el módulo 106 una vez cada 10 ms (dos
sub-tramas), con el uso de técnicas bien conocidas
por parte de las personas con conocimientos ordinarios de la
técnica.
Se computa primeramente el vector de objetivo x
para el análisis de LTP (Predicción a Largo Plazo - "Long Term
Prediction"). Esto se realiza, por lo común, restando la
respuesta ante entrada cero, s0, del filtro de síntesis ponderada
W(z)/Â(z), de la señal de habla ponderada sw(n). Esta
respuesta ante entrada cero, s0, se calcula por medio de un
dispositivo calculador 108 de respuesta ante entrada cero. Más
específicamente, el vector de objetivo x se calcula utilizando la
siguiente relación:
x = s_{w} -
s_{0}
donde x es el vector de objetivo
N-dimensional, sw es el vector de habla ponderado de
la sub-trama, y s0 es la respuesta ante entrada
cero del filtro W(z)/Â(z), que es la salida del filtro
combinado W(z)/Â(z) debido a sus estados iniciales. El
calculador 108 de respuesta ante entrada cero es sensible al filtro
de LP Â(z) cuantificado discretamente e interpolado, procedente del
módulo calculador 104 de análisis de LP, cuantificación discreta e
interpolación, y a los estados iniciales del filtro de síntesis
ponderado W(z)/Â(Z), almacenado en el módulo de memoria 111,
para calcular la respuesta ante entrada cero, s0 (la parte de la
respuesta debida a los estados iniciales según se determina
estableciendo las entradas iguales a cero), del filtro
W(z)/Â(Z). De nuevo, esta operación es bien conocida por
parte de las personas con conocimientos ordinarios de la técnica y,
en consecuencia, no se describirá
adicionalmente.
Por supuesto, pueden utilizarse soluciones
alternativas pero matemáticamente equivalentes para computar el
vector de objetivo x.
Se computa un vector de respuesta ante impulso
N-dimensional, h, del filtro de síntesis ponderado
W(z)/Â(Z), en el módulo 109 generador de respuesta ante
impulso, utilizando los coeficientes de filtro de LP A(z) y
Â(Z) procedentes del módulo 104. De nuevo, esta operación es bien
conocida por parte de los expertos medios de la técnica y, en
consecuencia, no se describirá adicionalmente en la presente
Memoria.
Los parámetros de paso (o de código de cifrado y
descifrado de paso) de bucle cerrado, b, T y j, son computados en
el módulo 107 de búsqueda de paso de bucle cerrado, el cual utiliza
como entradas el vector de objetivo x, el vector h de respuesta
ante impulso y el retraso de paso de bucle abierto TOL.
Tradicionalmente, la predicción del paso ha venido siendo
representada por un filtro de paso que tiene la siguiente función de
transferencia:
1/(1 -
bz^{-T})
donde b es la ganancia de paso y T
es el retardo o retraso de paso. En este caso, la contribución del
paso a la señal de excitación u(n) viene dada por
bu(n-T), donde la excitación total viene dada
por
u(n) =
bu(n - T) +
gc_{k}(n)
en la que g es la ganancia de
código de cifrado y descifrado innovador y ck(n) es el vector
de código innovador en el índice
k.
Esta representación presenta limitaciones si el
retraso de paso T es más corto que la longitud N de la
sub-trama. En otra representación, la contribución
del paso puede verse como un código de cifrado y descifrado de paso
que contiene la señal de excitación pasada. En general, cada vector
del código de cifrado y descifrado de paso es una versión
desplazada en uno del vector previo (desechando una muestra y
añadiendo una nueva muestra). Para retrasos de paso T > N, el
código de cifrado y descifrado de paso es equivalente a la
estructura de filtro (1/(1-bz-T)),
y el vector de código de cifrado y descifrado de paso, vT(n),
para el retraso de paso T, viene dado por:
v_{T(n)} = u(n -
T)
n = 0, ...,
N-1.
Para los retrasos de paso T más cortos que N, se
construye un vector vT(n) repitiendo las muestras disponibles
desde la excitación pasada hasta que se ha completado el vector
(esto no es equivalente a la estructura de fil-
tro).
tro).
En los codificadores recientes se utiliza una
resolución de paso más alta, lo que mejora significativamente la
calidad de los segmentos de sonido articulados con la voz. Esto se
consigue aumentando la velocidad de muestreo de la señal de
excitación pasada mediante el uso de filtros de interpolación
polifásicos. En este caso, el vector vT(n) corresponde por
lo común a una versión interpolada de la excitación pasada, de tal
modo que el retraso de paso T es un retardo no entero (por ejemplo,
50,25).
La búsqueda del paso cosiste en encontrar los
mejores retraso de paso T y ganancia b que minimicen el error
cuadrático medio ponderado E entre el vector de objetivo x y la
excitación pasada, regulada en escala y filtrada. El error E se
expresa como:
E = \Arrowvert
x - by_{T}
\Arrowvert^{2}
\newpage
donde yT es el vector de código de
cifrado y descifrado de paso filtrado en el retraso de paso
T:
y_{T}(n) =
v_{T}(n) \text{*} h(n) = \sum\limits^{n}_{i=0}
v_{T}(i)h(n-i)
n = 0, ...,
N-1.
Puede demostrarse que el error E se minimiza si
se maximiza el criterio de búsqueda:
C =
\frac{x^{t}y_{T}}{\sqrt{y^{t}_{T}y_{T}}}
donde t denota el transpuesto del
vector.
En la realización preferida de la presente
invención, se utiliza una resolución de paso de
sub-muestra de 1/3 y la búsqueda de paso (código de
cifrado y descifrado de paso) se compone de tres etapas.
En la primera etapa, se estima el retraso de
paso de bucle abierto TOL en el módulo 106 de búsqueda de paso de
bucle abierto, en respuesta a la señal de habla ponderada
sw(n). Como se indica en la siguiente descripción, este
análisis de paso de bucle abierto se lleva a cabo por lo común una
vez cada 10 ms (dos sub-tramas), utilizando
técnicas bien conocidas por las personas con conocimientos
ordinarios de la técnica.
En la segunda etapa, se busca el criterio de
búsqueda C en el módulo 107 de búsqueda de paso de bucle cerrado,
para retrasos de paso enteros en el entorno del retraso de paso de
bucle abierto TOL estimado (habitualmente \pm5), lo que
simplifica de forma significativa el procedimiento de búsqueda.
Puede utilizarse un procedimiento sencillo para actualizar el
vector de códigos filtrado yT sin necesidad de computar la
convolución para cada retraso de paso.
Una vez que se ha encontrado un retraso de paso
entero óptimo en la segunda etapa, una tercera etapa de la búsqueda
(módulo 107) ensaya las fracciones en el entorno del retraso de paso
entero óptimo.
Cuando el elemento de predicción del paso se
representa por un filtro de la forma
1/(1-bz-T), lo cual es una
suposición válida para retrasos de paso T > N, el espectro del
filtro de paso exhibe una estructura harmónica a través de todo el
intervalo de frecuencias, con una frecuencia harmónica relacionada
con 1/T. En el caso de señales de banda ancha, este estructura no
es muy eficaz puesto que la estructura harmónica, en señales de
banda ancha, no cubre la totalidad del espectro extendido. La
estructura harmónica existe únicamente hasta una cierta frecuencia,
que depende del segmento de habla. Así pues, con el fin de conseguir
una representación eficaz de la contribución del paso en segmentos
articulados con voz de un habla de banda ancha, el filtro de
predicción del paso necesita tener la flexibilidad de variar la
magnitud de la periodicidad a lo largo del espectro de banda
ancha.
En la presente Memoria se describe un método
nuevo que consigue configurar en un modelo eficiente la estructura
harmónica del espectro de habla de señales de banda ancha, en virtud
del cual se aplican diversas formas de filtros de paso bajo a la
excitación pasada y se selecciona el filtro de paso bajo con la
ganancia de predicción más
alta.
alta.
Cuando se utiliza una resolución de paso de
sub-muestra, los filtros de paso bajo pueden ser
incorporados en los filtros de interpolación que se utilizan para
obtener la resolución de paso más elevada. En este caso, la tercera
etapa de la búsqueda del paso, en la que se ensayan las fracciones
en el entorno del retraso de paso entero escogido, se repite para
los diversos filtros de interpolación que tienen diferentes
características de paso bajo, y se seleccionan la fracción y el
índice de filtro que maximizan el criterio de búsqueda C.
Una solución más sencilla consiste en completar
la búsqueda en las tres etapas anteriormente descritas para
determinar el retraso fraccional óptimo con el uso de tan solo un
filtro de interpolación con una cierta respuesta en frecuencia, y
seleccionar la forma de filtro de paso bajo óptima en el extremo o
terminal, mediante la aplicación de los diferentes filtros de paso
bajo predeterminados al vector de código de cifrado y descifrado de
paso escogido, vT, y seleccionar el filtro de paso bajo que minimice
el error de predicción del paso. Esta solución se expone en detalle
más adelante.
La Figura 3 ilustra un diagrama de bloques
esquemático de una realización preferida de la solución
propuesta.
En el módulo de memoria 303 se almacena la señal
de excitación pasada u(n), n < 0. El módulo 301 de
búsqueda de código de cifrado y descifrado de paso es sensible al
vector de objetivo x, al retraso de paso de bucle abierto TOL y a
la señal de excitación pasada u(n), n < 0, procedentes del
módulo de memoria 103, a fin de conducir una búsqueda de código de
cifrado y descifrado de paso (código de cifrado y descifrado de
paso) que minimice el criterio de búsqueda C anteriormente
definido. A partir del resultado de la búsqueda llevada a cabo en
el módulo 301, el módulo 302 genera el vector de código de cifrado y
descifrado de paso óptimo vT. Nótese que, puesto que se utiliza una
resolución de paso de sub-muestra (paso fraccional),
la señal de excitación pasada u(n), n < 0, es interpolada
y el vector de código de cifrado y descifrado de paso vT corresponde
a la señal de excitación pasada interpolada. En esta realización
preferida, el filtro de interpolación (situado en el módulo 301,
pero que no se muestra), tiene una característica de filtro de paso
bajo que extrae el contenido de las frecuencias por encima de 7.000
Hz.
En una realización preferida, se utilizan las
características de filtro K; estas características de filtro pueden
ser características de filtro de paso bajo o de paso de banda. Una
vez que se ha determinado el vector de código óptimo vT y
suministrado por parte del generador 302 de vector de código de
paso, se computan las versiones filtradas en filtro K utilizando,
respectivamente, K filtros de conformación de frecuencia diferentes,
tales como los 305(j), donde j = 1, 2, ..., K. Estas
versiones filtradas se denotan por vf(j), donde j = 1, 2,
..., K. Los diferentes vectores vf(j) se someten a
convolución en respectivos módulos 304(j), donde j = 0, 1,
2, ..., K, con la respuesta ante impulso, h, a fin de obtener los
vectores y(j), donde j = 0, 1, 2, ..., K. Al objeto de
calcular el error cuadrático medio de predicción de paso para cada
vector y(j), el valor y(j) se multiplica por la
ganancia b por medio de un amplificador correspondiente
307(j), y el valor by(j) se resta del vector de
objetivo x por medio de un dispositivo de sustracción
correspondiente 308(j). El selector 309 selecciona el filtro
305(j) de conformación de frecuencia que minimiza el error
cuadrático medio de predicción de paso:
e^{(j)} =
\Arrowvert x - b^{(j)}y^{(j)}\Arrowvert^{2}
\hskip2cmj = 1, 2, ..., K
Con el fin de calcular el error cuadrático medio
e(j) de predicción de paso para cada valor de y(j), el
valor y(j) se multiplica por la ganancia b por medio de un
amplificador correspondiente 307(j), y el valor
b(j)y(j) se resta del vector de objetivo x por
medio de unos dispositivos de sustracción 308(j). Cada
ganancia b(j) se calcula en un dispositivo calculador de
ganancia correspondiente, 306(j), en asociación con el filtro
de conformación de frecuencia situado en el índice j, mediante el
uso de la siguiente relación:
b^{(j)} =
x^{t}y^{(j)}/\Arrowvert
y^{(j)}\Arrowvert^{2}
En el selector 309, los parámetros b, T y j se
escogen basándose en el vT o en el vf(j), lo que minimiza el
error cuadrático medio de predicción de paso, e.
Haciendo referencia de nuevo a la Figura 1, el
índice T de código de cifrado y descifrado de paso se codifica y
transmite al multiplexador 112. La ganancia de paso b se cuantifica
y transmite al multiplexador 112. Con esta nueva solución, se
requiere información extra para codificar el índice j del filtro de
conformación de frecuencia seleccionado en el multiplexador 112.
Por ejemplo, si se utilizan tres filtros (j = 0, 1, 2, 3), entonces
se necesitan dos bits para representar esta información. La
información j del índice de filtro puede también codificarse
conjuntamente con la ganancia de paso b.
Una vez que se han determinado el paso, o los
parámetros de LTP (Predicción a Largo Plazo) b, T y j, la siguiente
etapa consiste en buscar la excitación innovadora óptima por medio
de un módulo de búsqueda 110 mostrado en la Figura 1. En primer
lugar, se actualiza el vector de objetivo x restándole la
contribución de LTP:
x' = x -
by_{T}
donde b es la ganancia de paso e yT
es el vector de código de cifrado y descifrado de paso filtrado (la
excitación pasada en el retraso T, filtrada con el filtro de paso
bajo seleccionado y sometida a convolución con la respuesta ante
impulso, h, según se ha descrito en relación con la Figura
3).
El procedimiento de búsqueda en la CELP se lleva
a cabo encontrando el vector de código de excitación óptimo ck y la
ganancia g que minimizan el error cuadrático medio E entre el vector
de objetivo y el vector de código regulado en escala y
filtrado:
E = \Arrowvert
x' - gHc_{k}
\Arrowvert^{2}
donde H es una matriz de
convolución triangular inferior obtenida del vector h de respuesta
ante
impulso.
En la realización preferida de la presente
invención, la búsqueda de código de cifrado y descifrado innovador
se lleva a cabo en el módulo 110 por medio de un código de cifrado y
descifrado algebraico, según se describe en las Patentes
norteamericanas Nos. 5.444.816 (de Adoul et al.), expedida el
22 de agosto de 1995, 5.699.482, concedida a Adoul et al. el
17 de diciembre de 1997, 5.754.976, concedida a Adoul et al.
el 19 de mayo de 1998, y 5.701.392 (de Adoul et al.), de
fecha 23 de diciembre de 1997.
Una vez que se han escogido el vector de código
de excitación ck y su ganancia g óptimos por parte del módulo 110,
el índice de código de cifrado y descifrado k y su ganancia g son
codificados y transmitidos al multiplexador
112.
112.
Haciendo referencia a la Figura 1, los
parámetros b, T, j, Â(z), k y g son multiplexados por medio del
multiplexador 112 antes de ser transmitidos a través de un canal de
comunicación.
En el módulo de memoria 111 (Figura 1), los
estados del filtro de síntesis ponderado W(z)/Â(z) son
actualizados filtrando la señal de excitación u = gck + bvT a
través del filtro de síntesis ponderado. Después de esta
filtración, los estados del filtro se memorizan y utilizan en la
siguiente sub-trama como estados iniciales para
computar la respuesta ante entrada cero en el módulo calculador
108.
Como en el caso del vector de objetivo x, pueden
utilizarse para actualizar los estados de filtro otras soluciones
alternativas pero matemáticamente equivalentes que son bien
conocidas por parte de las personas con conocimientos ordinarios de
la técnica.
El dispositivo descodificador del habla 200 de
la Figura 2 ilustra las diversas etapas que se llevan a cabo entre
la entrada digital 222 (corriente de entrada al desmultiplexador
217) y el habla muestreada de salida 223 (salida del sumador
221).
El desmultiplexador 217 extrae los parámetros de
modelo de síntesis de la información binaria recibida desde un
canal de entrada digital. Los parámetros extraídos desde cada trama
binaria recibida son:
- los parámetros de predicción a corto plazo
(STP) Â(z) (una vez por trama);
- los parámetros de predicción a largo plazo
(LTP) T, b y j (para cada sub-trama); y
- el índice k de código de cifrado y descifrado
de innovación y la ganancia g (para cada
sub-trama).
La señal de habla de ese momento se sintetiza
basándose en estos parámetros, como se explicará aquí más
adelante.
El código de cifrado y descifrado innovador 218
es sensible al índice k para producir el vector de códigos de
innovación ck, el cual es regulado en escala por el factor de
ganancia descodificado g, a través de un amplificador 224. En la
realización preferida, se utiliza para representar el vector de
código innovador ck un código de cifrado y descifrado innovador 218
según se describe en las Patentes norteamericanas anteriormente
mencionadas números 5.444.816, 5.699.482, 5.754.976 y 5.701.392.
El vector de código gck generado y regulado en
escala en la salida del amplificador 224 se procesa a través de un
filtro de innovación 205.
En el descodificador 200 de la Figura 2, se
aplica una técnica de suavización de la ganancia no lineal a la
ganancia g de código de cifrado y descifrado innovador, con el fin
de mejorar el comportamiento ante el ruido de fondo. Basándose en
el estatismo o inmovilidad (o estabilidad) y en la articulación en
voz del segmento de habla de la señal de banda ancha, se suaviza la
ganancia g del código de cifrado y descifrado innovador 218 con el
fin de reducir la fluctuación de la energía de la excitación en el
caso de señales estacionarias. Esto mejora el comportamiento de
códec, o de codificación-descodificación, en
presencia de ruido de fondo estacionario.
En una realización preferida, se utilizan dos
parámetros para controlar la magnitud de la suavización, a saber:
la configuración o articulación en voz de la
sub-trama de señal de banda ancha y la estabilidad
del filtro de LP (Predicción Lineal) 206, ambos indicativos del
ruido de fondo estacionario en la señal de banda ancha.
Pueden utilizarse diferentes métodos para
estimar el grado de articulación en voz de la
sub-trama.
Etapa 501 (Figura
5)
En una realización preferida, se computa un
factor de articulación en voz, rv, en el generador 204 de factor de
articulación en voz, con el uso de la siguiente relación:
rv = (Ev -
Ec)/(Ev +
Ec)
donde Ev es la energía del vector
de código de paso regulado en escala, bvT, y Ec es la energía del
vector de código innovador regulado en escala, gck. Es
decir:
\newpage
E_{v} =
b^{2}v^{t}_{T}v_{T} = b^{2} \sum\limits^{N-1}_{n=0}
v^{2}_{T}(n)
y
E_{c} =
g^{2}c^{t}_{k}c_{k} = g^{2} \sum\limits^{N-1}_{n=0}
c^{2}_{k}(n)
Nótese que el valor del factor de articulación
en voz, rv, se encuentra entre -1 y 1, de tal modo que un valor de
1 corresponde a señales articuladas en voz y puras, y un valor de -1
corresponde a señales no articuladas en voz y puras.
Etapa 502 (Figura
5)
Se computa un factor \lambda en el dispositivo
calculador 228 de suavización de la ganancia, basándose en el rv,
por medio de la siguiente relación:
\lambda =
0,5(1 -
rv)
Nótese que el factor \lambda está relacionado
con la magnitud de la articulación en voz, es decir, \lambda = 0
para los segmentos articulados en voz puros y \lambda= 1 para los
segmentos no articulados en voz puros.
Etapa 503 (Figura
5)
Se computa un factor de estabilidad \theta en
un generador 230 de factor de estabilidad, basándose en una medida
de la distancia que proporciona la similitud de los filtros de LP
adyacentes. Se pueden utilizar diferentes medidas de la similitud.
En esta realización preferida, los coeficientes de LP se cuantifican
discretamente e interpolan en el Par Espectral de Inmitancia (ISP -
"Immitance Spectral Pair"). Es conveniente, por lo tanto,
obtener la medida de la distancia en el dominio de ISP. De forma
alternativa, puede utilizarse igualmente la representación de
Frecuencia Espectral de Línea (LSF - "Line Spectral Frequency")
del filtro de LP para encontrar la distancia de similitud de los
filtros de LP adyacentes. Se han utilizado también otras medidas en
la técnica anterior, tal como la medida de Itakura.
En una realización preferida, la medida de la
distancia de ISP entre los ISPs de la trama presente en ese
momento, n, y de la trama pasada, n-1, se calcula en
el generador 230 de factor de estabilidad y viene dada por la
relación:
D_{S} =
\sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} -
isp^{(n-1)}_{i}\right)^{2}
donde p es el orden del filtro de
LP 206. Nótese que los p-1 primeros ISPs que se
utilizan son frecuencias comprendidas en el intervalo entre 0 y
8.000
Hz.
Etapa 504 (Figura
5)
Se establece una relación de correspondencia de
la medida de la distancia ISP, en el dispositivo calculador 228 de
suavización de la ganancia, con un factor de estabilidad \theta
comprendido en el intervalo entre 0 y 1, y que se obtiene por:
\theta = 1,25
- D_{s}/400 .
000.0
con los límites 0 \leq \theta
\leq
1.
Etapa 505 (Figura
5)
Se calcula entonces un factor Sm de suavización
de la ganancia, basado tanto en la articulación en voz como en la
estabilidad, en el dispositivo calculador 228 de suavización de la
ganancia, y viene dado por:
S_{m} =
\lambda
\theta
El valor de Sm se aproxima a 1 para las señales
no configuradas o articuladas en voz y estables, como es el caso de
las señales de ruido de fondo estacionarias. Para las señales
articuladas en voz y puras, o para las señales inestables, el valor
de Sm se aproxima a 0.
\newpage
Etapa 506 (Figura
5)
Se computa una ganancia modificada inicial g0 en
el dispositivo de cálculo 228 de suavización de la ganancia, al
comparar la ganancia g de código de cifrado y descifrado innovador
con un umbral dado por la ganancia modificada inicial procedente de
la sub-trama pasada, g-1. Si g es
mayor o igual que g-1, entonces g0 se computa
reduciendo g en 1,5 dB con la limitación dada por g0 \geq g1. Si
g es más pequeño que g-1, entonces g0 se computa
incrementando g en 1,5 dB dentro de los límites de g0 \leq
g-1. Nótese que el hecho de incrementar la ganancia
en 1,5 dB es equivalente a multiplicarla por 1,19. En otras
palabras:
si g < g - 1, entonces g0 = g \times 1,19
limitado por g0 \leq g-1
y
si g \geq g - 1, entonces g0 = g/1,19 limitado
por g0 \geq g-1
Etapa 507 (Figura
5)
Finalmente, la ganancia de código de cifrado y
descifrado suavizada y fija, gs, se calcula en el dispositivo
calculador 228 de suavización de la ganancia, por medio de:
g_{s} =
S_{m}\cdot g_{0} + (1 - S_{m})\cdot
g
La ganancia suavizada gs se utiliza entonces
para regular en escala el vector de código innovador ck en el
amplificador 232.
Se mencionará con sólo unas pocas palabras que
el anterior procedimiento de suavización de la ganancia puede ser
aplicado a señales distintas de las señales de banda ancha.
El vector de código generado y regulado en
escala a la salida del amplificador 224 se procesa por medio de un
dispositivo de mejora 205 de paso, dependiente de la frecuencia.
La mejora de la periodicidad de la señal de
excitación u mejora la calidad en el caso de los segmentos
articulados en voz. Esto se ha venido haciendo en el pasado
filtrando el vector de innovación procedente del código de cifrado
y descifrado innovador (código de cifrado y descifrado fijo) 218 por
medio de un filtro con la forma 1/(1 - \varepsilonbz - T), donde
\varepsilon es un factor por debajo de 0,5 que controla la
magnitud de la periodicidad introducida. Esta solución resulta
menos eficaz en el caso de las señales de banda ancha, ya que
introduce periodicidad a lo largo de todo el espectro. Se describe
una nueva solución alternativa, que forma parte de la presente
invención, en virtud de la cual la mejora de la periodicidad se
consigue filtrando el vector de códigos innovador ck procedente del
código de cifrado y descifrado innovador (fijado), a través de un
filtro de innovación 205 (F(z)) cuya respuesta en frecuencia
enfatiza las frecuencias superiores más que las frecuencias
inferiores. Los coeficientes de F(z) están relacionados con
la magnitud de la periodicidad en la señal de excitación u.
Se encuentran disponibles muchos métodos
conocidos por parte de los expertos de la técnica con el fin de
obtener coeficientes de periodicidad válidos. Por ejemplo, el valor
de la ganancia b proporciona una indicación de la periodicidad. Es
decir, si la ganancia b es cercana a 1, entonces la periodicidad de
la señal de excitación u es alta, y si la ganancia b es menor que
0,5, entonces la periodicidad es baja.
Otra forma eficaz de obtener los coeficientes de
filtro F(z) que se utilizan en una realización preferida,
consiste en relacionarlos con la magnitud de la contribución del
paso en la señal de excitación total u. Esto da lugar a que la
respuesta en frecuencia dependa de la periodicidad de la
sub-trama, de tal modo que las frecuencias más
altas son enfatizadas más fuertemente (pendiente total más fuerte)
para ganancias de paso más altas. El filtro de innovación 205 tiene
el efecto de rebajar la energía del vector de código innovador ck a
frecuencias bajas cuando la señal de excitación u es más periódica,
lo que mejora la periodicidad de la señal de excitación u a las
frecuencias inferiores más que a las frecuencias superiores. Formas
que se sugieren para el filtro de innovación 205 son:
(1)F(z)
= 1 - \sigma
z^{-1}
(2)F(z)
= -\alpha z + 1 -\alpha
z^{-1}
donde \sigma o \alpha son
factores de periodicidad obtenidos a partir del nivel de
periodicidad de la señal de excitación
u.
La segunda forma con tres términos de
F(z) se utiliza en una realización preferida. El factor de
periodicidad \alpha se computa en el generador 204 de factor de
configuración o articulación en voz. Es posible utilizar varios
métodos para obtener el factor de periodicidad \alpha basándose en
la periodicidad de la señal de excitación u. Se presentan en lo que
sigue dos métodos.
Método
1
Se computa primeramente la proporción de la
contribución del paso a la señal de excitación total u, en el
generador 204 de factor de articulación en voz, por medio de:
R_{P} =
\frac{b^{2}v_{T}{}^{t}v_{T}}{u^{t}u} = \frac{b^{2}
\sum\limits^{N-1}_{n=0}
v^{2}_{T}(n)}{\sum\limits^{N-1}_{n=0}
u^{2}(n)}
donde vT es el vector de código de
cifrado y descifrado de paso, b es la ganancia de paso y u es la
señal de excitación u, proporcionada en la salida del sumador 219
por:
u = gck +
bvT
Nótese que el término bvT tiene su fuente de
origen en el código de cifrado y descifrado de paso (código de
cifrado y descifrado adaptativo) 201, en respuesta en respuesta al
retraso de paso T y al valor pasado de u que se encuentra
almacenado en la memoria 203. Se procesa a continuación el vector de
códigos de paso vT procedente del código de cifrado y descifrado de
paso 201, a través de un filtro de paso bajo 202 cuya frecuencia de
corte se ajusta por medio del índice j procedente del
desmultiplexador 217. El vector de códigos resultante vT se
multiplica entonces por la ganancia b procedente del
desmultiplexador 217, a través de un amplificador 226, para obtener
la señal bvT.
El factor \alpha se calcula en el generador
204 de factor de articulación de voz por medio de:
\alpha = qRp, con los límites
dados por \alpha <
q,
donde q es un factor que controla
la magnitud de la mejora (q se establece en 0,25 en esta realización
preferida).
Método
2
En lo que sigue se expone otro método que se
utiliza en una realización preferida de la invención para calcular
el factor de periodicidad \alpha.
En primer lugar, se computa un factor de
articulación en voz, rv, en el generador 204 de factor de
articulación en voz, por medio de:
R_{v} = (E_{v}
- E_{c})/(E_{v} +
E_{c})
donde Ev es la energía del vector
de código de paso regulado en escala, bvT, y Ec es la energía del
vector de código innovador regulado en escala, gck. Es
decir:
E_{v} =
b^{2}v_{T}{}^{t}v_{T} = b^{2}
\sum\limits^{N-1}_{n=0}
v^{2}_{T}(n)
y
E_{c} =
g^{2}c_{k}{}^{t}c_{k} = g^{2}
\sum\limits^{N-1}_{n=0}c^{2}_{k}(n)
Nótese que el valor de rv se encuentra entre -1
y 1 (1 corresponde a las señales articuladas en voz y puras, y -1
corresponde a las señales no articuladas en voz y puras).
En esta realización preferida, el factor
\sigma se computa, a continuación, en el generador 204 de factor
de articulación en voz, mediante:
\sigma = 0,125
(1 +
rv)
lo que corresponde a un valor de 0
para las señales no articuladas en voz y puras, y de 0,25 para las
señales articuladas en voz y
puras.
En la primera forma, de dos términos, de
F(z), el factor de periodicidad \sigma puede ser aproximado
mediante el uso de \sigma = 2\alpha en los métodos 1 y 2
anteriores. En tal caso, el factor de periodicidad \sigma se
calcula como sigue, según el método 1 anterior:
\sigma = 2qRp, con el límite dado
por \sigma <
2q.
En el método 2, el factor de periodicidad
\sigma se calcula como sigue:
\sigma = 0,25
(1 +
rv).
Se computa, por lo tanto, la señal mejorada cf
al filtrar el vector de código innovador regulado en escala, gck, a
través del filtro de innovación 205 (F(z)).
La señal de excitación mejorada u' se computa
por medio del sumador 220 como:
u' = cf +
bvT
Nótese que este procedimiento no se lleva a cabo
en el codificador 100. Así pues, es esencial actualizar el
contenido del código de cifrado y descifrado de paso 210 utilizando
la señal de excitación u sin mejora, a fin de mantener el
sincronismo entre el codificador 100 y el descodificador 200. En
consecuencia, la señal de excitación u se utiliza para actualizar
la memoria 203 del código de cifrado y descifrado de paso 201, y la
señal de excitación mejorada u' se emplea en la entrada del filtro
de síntesis de LP 206.
La señal sintetizada s' se computa filtrando la
señal de excitación mejorada u' a través del filtro de síntesis de
LP 206, que tiene la forma 1/Â(z), donde Â(z) es el filtro de LP
interpolado en la sub-trama presente en ese
momento. Como puede observarse en la Figura 2, los coeficientes de
LP cuantificados discretamente, Â(z), de la línea 225 procedente
del desmultiplexador 217, se suministran al filtro de síntesis de LP
206 al objeto de ajustar en correspondencia los parámetros del
filtro de síntesis de LP 206. El filtro 207 de reducción del
énfasis es el inverso del filtro de énfasis 103 de la Figura 1. La
función de transferencia del filtro 207 de reducción del énfasis
viene dada por:
D(z) =
1/(1 - \mu
z^{-1})
donde \mu es un factor de énfasis
previo con un valor situado entre 0 y 1 (un valor típico es \mu =
0,7). Puede utilizarse también un filtro de orden
superior.
El vector s' se filtra a través del filtro
D(z) de reducción del énfasis (módulo 207), con el fin de
obtener el vector sd, el cual se hace pasar a través del filtro de
paso alto 208 para eliminar las frecuencias indeseadas por debajo
de 50 Hz y obtener adicionalmente la sh.
El módulo 209 de aumento de la velocidad de
muestreo lleva a cabo el procedimiento inverso al del módulo 101 de
reducción de la velocidad de muestreo de la Figura 1. En esta
realización preferida, el aumento de la velocidad de muestreo hace
pasar la velocidad de muestreo de 12,8 kHz a la velocidad de
muestreo inicial de 16 kHz mediante el uso de técnicas bien
conocidas por parte de las personas con conocimientos ordinarios de
la técnica. La señal de síntesis muestreada a velocidad aumentada
se denota por \hat{S}. Se hace también referencia a la señal
\hat{S} como la señal intermedia de banda ancha sintetizada.
La señal de síntesis \hat{S} muestreada a
velocidad aumentada no contiene los componentes de frecuencias
superiores que se perdieron por el tratamiento de reducción de la
velocidad de muestreo (módulo 101 de la Figura 1) en el codificador
100. Esto proporciona una percepción de paso bajo a la señal de
habla sintetizada. Con el fin de restablecer la totalidad de la
banda de la señal original, se describe un procedimiento de
generación de altas frecuencias. Este procedimiento se lleva a cabo
en los módulos 210 a 216, así como en el sumador 221, y requiere la
entrada desde el generador 204 de factor de articulación en voz
(Figura 2).
En esta nueva solución, el contenido de altas
frecuencias se genera llenando la parte superior del espectro con
un ruido blanco regulado adecuadamente en escala en el dominio de la
excitación, que se convierte a continuación al dominio del habla,
preferiblemente por conformación de éste con el mismo filtro de
síntesis de LP utilizado para la síntesis de la señal \hat{S}
muestreada a velocidad reducida.
Se describe aquí, en lo que sigue, el
procedimiento de generación de altas frecuencias.
\newpage
El generador 213 de ruido aleatorio genera una
secuencia de ruido blanco w' que tiene un espectro plano a lo largo
de toda la anchura de banda de frecuencias, mediante el uso de
técnicas bien conocidas por parte de los expertos medios de la
técnica. La secuencia generada tiene una longitud N' que es la
longitud de la sub-trama en el dominio original.
Nótese que N es la longitud de la sub-trama en el
dominio muestreado a velocidad reducida. En esta realización
preferida, N = 64 y N' = 80, lo que corresponde a 5 ms.
La secuencia de ruido blanco se regula
adecuadamente en escala en el módulo 214 de ajuste de la ganancia.
El ajuste de la ganancia comprende las siguientes etapas. En primer
lugar, la energía de la secuencia de ruido generada w' se ajusta de
manera que sea igual a la energía de la señal de excitación mejorada
u' que se computa por medio de un módulo 210 de cómputo de energía,
y la secuencia de ruido regulada en escala que resulta viene dada
por:
w(n) =
w'(n) \sqrt{\frac{\sum\limits^{N-1}_{n=0}
u'{}^{2}(n)}{\sum\limits^{N'-1}_{n=0}
w'{}^{2}(n)}}
n = 0, ...,
N'-1.
La segunda etapa de la regulación a escala de la
ganancia consiste en tener en cuenta el contenido de alta
frecuencia de la señal sintetizada a la salida del generador 204 de
factor de articulación en voz, con el fin de reducir la energía del
ruido generado en el caso de los segmentos articulados en voz (en
los que está presente menos energía a altas frecuencias, en
comparación con los segmentos articulados en voz). En esta
realización preferida, la medición del contenido de alta frecuencia
se lleva a la práctica midiendo la inclinación de la señal de
síntesis por medio de un dispositivo calculador 212 de inclinación
espectral, y reduciendo la energía de acuerdo con ello. Pueden
utilizarse igualmente otras mediciones, tales como mediciones de
paso por cero. Cuando la inclinación es muy fuerte, lo que
corresponde a los segmentos articulados en voz, la energía del
ruido se reduce adicionalmente. El factor de inclinación se computa
en el módulo 212 como el primer coeficiente de correlación de la
señal de síntesis, sh, y viene dado por:
inclinación =
\frac{\sum\limits^{N-1}_{n=1} S_{h}(n) S_{h}
(n-1)}{\sum\limits^{N-1}_{n=0}
S^{2}_{h}(n)}
con la condición dada por
inclinación \geq 0 e inclinación \geq
rv,
donde el factor de articulación en voz, rv,
viene dado por:
r_{v} = (E_{v}
- E_{c})/(E_{v} +
E_{c})
donde Ev es la energía del vector
de código de paso regulado en escala, bvT, y Ec es la energía del
vector de código innovador regulado en escala, gck, según se ha
descrito anteriormente. El factor de articulación en voz, rv, es,
con la mayor frecuencia, menor que la inclinación, pero esta
condición se introdujo como precaución contra los tonos de alta
frecuencia en los que el valor de la inclinación es negativo y el
valor de rv es alto. Esta condición reduce, por lo tanto, la
energía del ruido para dichas señales de
tono.
El valor de inclinación es 0 en el caso de un
espectro plano y 1 en el caso de señales fuertemente articuladas en
voz, y es negativo en el caso de señales no articuladas en voz en
las que está presente más energía a altas frecuencias.
Pueden utilizarse diferentes métodos para
obtener el factor de regulación de escala, gt, a partir de la
magnitud del contenido de alta frecuencia. En esta invención, los
métodos se proporcionan basándose en la inclinación de la señal
anteriormente descrita.
Método
1
El factor de escala, gt, se obtiene de la
inclinación por medio de:
gt = 1 -
inclinación, con la limitación dada por 0,2 \leq gt \leq
1.0.
Para una señal fuertemente articulada en voz, en
la que la inclinación se aproxima a 1, gt es 0,2, y, para las
señales fuertemente desarticuladas en voz, gt se hace 1,0.
\newpage
Método
2
El factor de inclinación gt se restringe
primeramente de modo que sea mayor o igual que cero, y, a
continuación, se obtiene el factor de regulación de escala a partir
de la inclinación, por medio de:
g_{t} =
10^{-0,6 \cdot
inclinación}
La secuencia de ruido regulada en escala, wg,
producida en el módulo 214 de ajuste de la ganancia, viene, por lo
tanto, dada por:
wg = gt\cdot
w.
Cuando la inclinación es próxima a cero, el
factor de regulación de escala, gt, es próximo a 1, lo que no da
lugar a una reducción de la energía. Cuando el valor de la
inclinación es 1, el factor de regulación de escala, gt, da lugar a
una reducción de 12 dB en la energía del ruido generado.
Una vez que se ha regulado en escala
adecuadamente el ruido (wg), éste se lleva al dominio del habla con
el uso del dispositivo conformador espectral 215. En la realización
preferida, esto se consigue filtrando el ruido wg a través de una
versión expandida en anchura de banda del mismo filtro de síntesis
de LP utilizado en el dominio muestreado a velocidad reducida
(1/Â(z/0,8)). Los coeficientes de filtro de LP expandido en anchura
de banda correspondientes se calculan en el dispositivo conformador
espectral 215.
La secuencia de ruido filtrada y regulada en
escala, wf, se filtra entonces con paso de banda hasta obtener el
intervalo de frecuencias requerido que se ha de restablecer, con el
uso del filtro de paso de banda 216. En la realización preferida,
el filtro de paso de banda 216 restringe la secuencia de ruido al
intervalo de frecuencias entre 5,6 y 7,2 kHz. La secuencia
resultante z de ruido filtrado con paso de banda, se añade en el
sumador 221 a la señal de habla s' sintetizada y muestreada a
velocidad aumentada, a fin de obtener la señal de sonido
reconstruida final sout en la salida 223.
Si bien la presente invención se ha descrito
aquí, en lo anterior, por medio de una realización preferida de la
misma, esta realización puede modificarse a voluntad dentro del
ámbito de las reivindicaciones que se acompañan. Incluso aunque la
realización preferida expone el uso de señales de habla de banda
ancha, resultará obvio para los expertos de la técnica que el
objeto de la invención está también dirigido a otras realizaciones
que utilizan señales de banda en general, y que no se limita
necesariamente a aplicaciones de habla.
Claims (92)
1. Un método para producir un vector de código
de ganancia suavizada durante la descodificación de una señal de
banda ancha codificada, a partir de un conjunto de parámetros de
codificación de señal, de tal modo que dicho método comprende:
hallar un vector de código (c_{k}) y una
ganancia (g) en relación con al menos un primer (k) y al menos un
segundo (g) parámetros de codificación de señal, pertenecientes a
dicho conjunto;
calcular (501, 502) un primer factor (r_{v},
\lambda) representativo de un grado de articulación en voz en la
señal de banda ancha, en respuesta a al menos un tercer parámetro
(b, v_{T}) de codificación de señal, perteneciente a dicho
conjunto;
calcular (503, 504) un segundo factor (\theta)
representativo de un grado de estabilidad de dicha señal de banda
ancha en respuesta a al menos un cuarto parámetro (LP) de
codificación de señal, perteneciente a dicho conjunto;
calcular una ganancia suavizada (g_{s})
utilizando una operación no lineal relacionada con los primer y
segundo factores (r_{v}, \lambda; \theta) y aplicada a la
ganancia encontrada (g); y
amplificar el vector de código hallado (c_{k})
con dicha ganancia suavizada (g_{s}), con el fin de producir con
ello dicho vector de código suavizado en ganancia.
2. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual:
hallar un vector de código comprende hallar un
vector de código innovador en un código de cifrado y descifrado
innovador, en relación con dicho al menos un primer parámetro de
codificación de señal; y
hallar una ganancia comprende hallar una
ganancia de código de cifrado y descifrado innovador.
3. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual:
hallar un vector de código comprende hallar un
vector de código en un código de cifrado y descifrado en relación
con dicho al menos un primer parámetro de codificación de señal;
y
dicho al menos un primer parámetro de
codificación de señal comprende un índice de código de cifrado y
descifrado innovador.
4. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual:
hallar un vector de código comprende hallar un
vector de código innovador en un código de cifrado y descifrado
innovador en relación con dicho al menos un primer parámetro de
codificación de señal; y
dicho al menos un tercer parámetro de
codificación de señal comprende los siguientes parámetros:
- una ganancia de paso computada durante la codificación de la señal de banda ancha;
- un retardo de paso computado durante la codificación de la señal de banda ancha;
- un índice j de un filtro de paso bajo seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
- un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
5. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual dicho al menos un cuarto parámetro de codificación de señal
comprende coeficientes de un filtro de predicción lineal calculados
durante la codificación de la señal de banda ancha.
6. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual:
hallar un vector de código comprende hallar un
vector de código innovador en un código de cifrado y descifrado
innovador en relación con un índice k de dicho código de cifrado y
descifrado innovador, de tal modo que dicho índice k forma dicho al
menos un primer parámetro de codificación de señal; y
calcular un primer factor comprende computar un
factor de configuración o articulación en voz, r_{v}, por medio de
la siguiente relación:
r_{v} = (E_{v}
- E_{c})/(E_{v} +
E_{c})
donde:
- E_{v} es la energía de un vector de código
adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código
innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la
codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la
codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y
descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y
descifrado innovador computada durante la codificación de la señal
de banda ancha;
- k es un índice del código de cifrado y
descifrado innovador, computado durante la codificación de la señal
de banda ancha; y
- c_{k} es el vector de código innovador de
dicho código de cifrado y descifrado innovador en el índice k.
7. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 6, en el
cual el factor de articulación en voz, r_{v}, tiene un valor
situado entre -1 y 1, de tal modo que el valor 1 corresponde a una
señal articulada en voz y pura, y el valor -1 corresponde a una
señal no articulada en voz y pura.
8. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 7, en el
cual calcular una ganancia suavizada comprende computar un factor
\lambda utilizando la siguiente relación:
\lambda =
0,5(1 -
r_{v}).
9. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 6, en el
cual un factor \lambda = 0 indica una señal articulada en voz y
pura, y un factor \lambda = 1 indica una señal no articulada en
voz y pura.
10. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual calcular un segundo factor comprende determinar una medida de
distancia proporcionando una similitud entre filtros de predicción
lineal adyacentes y sucesivos, computados durante la codificación de
la señal de banda ancha.
11. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 10, en el
cual:
la señal de banda ancha es muestreada antes de
la codificación, y es procesada o tratada por tramas durante la
codificación y la descodificación; y
determinar una medida de distancia comprende
calcular una medida de distancia de Pares Espectrales de Inmitancia
entre los Pares Espectrales de Inmitancia de una trama presente n de
la señal de banda ancha, y los Pares Espectrales de Inmitancia de
una trama pasada n-1 de la señal de banda ancha, a
través de la siguiente relación:
D_{S} =
\sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} -
isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros
de predicción
lineal.
12. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 11, en el
cual calcular un segundo factor comprende establecer una relación de
correspondencia de la medida D_{s} de distancia de Pares
Espectrales de Inmitancia con dicho segundo factor \theta a través
de la siguiente relación:
\theta = 1,25
–
D_{s}/400.000,0
con la limitación dada por 0 \leq
\theta \leq
1.
13. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual calcular una ganancia suavizada comprende calcular un factor
S_{m} de suavización de ganancia basándose tanto en el primer
factor \lambda como en el segundo factor \theta por medio de la
siguiente relación:
S_{m} =
\lambda
\theta
14. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 13, en el
cual el factor S_{m} tiene un valor que se aproxima a 1 para una
señal de banda ancha no articulada en voz y estable, y un valor que
se aproxima a 0 para una señal de banda ancha articulada en voz y
pura, o una señal de banda ancha inestable.
15. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual:
hallar un vector de código comprende hallar un
vector de código innovador en un código de cifrado y descifrado
innovador en relación con dicho al menos un primer parámetro de
codificación de señal;
la señal de banda ancha es muestreada antes de
su codificación, y se procesa o trata por tramas y
sub-tramas durante la codificación y la
descodificación; y
calcular una ganancia suavizada comprende
computar una ganancia modificada inicial g_{0} comparando la
ganancia hallada g, computada durante la codificación de la señal de
banda ancha, con un umbral dado por la ganancia modificada inicial
procedente de la sub-trama pasada
g-1, como sigue:
- si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
- y
- si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
16. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 1, en el
cual calcular una ganancia suavizada comprende calcular una ganancia
modificada inicial g_{0} comparando la ganancia hallada g con un
umbral.
17. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 16, en el
cual:
calcular una ganancia suavizada comprende
calcular un factor S_{m} de suavización de ganancia basándose
tanto en el primer factor \lambda como en el segundo factor
\theta a través de la siguiente relación:
S_{m} =
\lambda
\theta
y determinar dicha ganancia
suavizada g_{s} a través de la siguiente
relación:
g_{s} =
S_{m}\cdot g_{0} + (1 - S_{m})\cdot
g
18. Un método para la producción de un vector de
código suavizado en ganancia, durante la descodificación de una
señal codificada a partir de un conjunto de parámetros de
codificación de señal, de tal modo que dicha señal contiene ruido de
fondo estacionario y dicho método comprende:
hallar un vector de código (c_{k}) y una
ganancia (g) en relación con al menos un primer (k) y al menos un
segundo (g) parámetros de codificación de señal de dicho
conjunto;
calcular al menos un factor (r_{v}, \lambda;
\theta) indicativo de un nivel de ruido de fondo estacionario en
la señal, en respuesta a al menos un tercer parámetro (b, v_{T};
LP) de codificación de señal, perteneciente a dicho conjunto;
calcular una ganancia suavizada (g_{s})
mediante el uso de una operación no lineal relacionada con el factor
(r_{v}, \lambda; \theta) indicativo del nivel de ruido y
aplicada a la ganancia hallada (g); y
amplificar el vector de código hallado (c_{k})
con dicha ganancia suavizada (g_{s}) para producir con ello dicho
vector de código suavizado en ganancia.
19. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 18, en el
cual el al menos un factor indicativo de un nivel de ruido de fondo
estacionario es un factor (r_{v}, \lambda) representativo de un
grado de configuración o articulación en voz de la señal.
20. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 18, en el
cual el al menos un factor indicativo de un nivel de ruido de fondo
estacionario es un factor (\theta) representativo de un grado de
estabilidad de dicha señal.
21. Un dispositivo para producir un vector de
código suavizado en ganancia durante la descodificación de una señal
de banda ancha codificada a partir de un conjunto de parámetros de
codificación de señal, de tal modo que dicho dispositivo
comprende:
medios para hallar un vector de código (c_{k})
y una ganancia (g) en relación con al menos un primer (k) y al menos
un segundo (g) parámetros de codificación de señal, pertenecientes a
dicho conjunto;
medios para calcular (501, 502) un primer factor
(r_{v}, \lambda) representativo de un grado de configuración o
articulación en voz en la señal de banda ancha, en respuesta a al
menos un tercer parámetro (b, v_{T}) de codificación de señal,
perteneciente a dicho conjunto;
medios para calcular (503, 504) un segundo
factor (\theta) representativo de un grado de estabilidad de dicha
señal de banda ancha, en respuesta a al menos un cuarto parámetro
(LP) de codificación de señal, perteneciente a dicho conjunto;
medios para calcular una ganancia suavizada
(g_{s}) con el uso de una operación no lineal con respecto a los
primer y segundo factores (r_{v}, \lambda; \theta) y aplicada
a la ganancia hallada (g); y
medios para amplificar el vector de código
hallado (c_{k}) con dicha ganancia suavizada (g_{s}), a fin de
producir con ello dicho vector de código suavizado en ganancia.
22. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 21,
en el cual:
los medios para hallar un vector de código y una
ganancia comprenden: medios para hallar un vector de código
innovador en un código de cifrado y descifrado, en relación con
dicho al menos un primer parámetro de codificación de señal; y
medios para hallar una ganancia de código de
cifrado y descifrado innovador.
23. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 21,
en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código en un
código de cifrado y descifrado, en relación con dicho al menos un
parámetro de codificación de señal; y
dicho al menos un primer parámetro de
codificación de señal comprende un índice de código de cifrado y
descifrado innovador.
24. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 21,
en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador, en relación con
dicho al menos un primer parámetro de codificación de señal; y
dicho al menos un tercer parámetro de
codificación de señal comprende los siguientes parámetros:
- una ganancia de paso, computada durante la codificación de la señal de banda ancha;
- un retardo de paso, computado durante la codificación de la señal de banda ancha;
- un índice j de un filtro de paso bajo, seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
- un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
25. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 21,
en el cual dicho al menos un cuarto parámetro de codificación de
señal comprende coeficientes de un filtro de predicción lineal
calculado durante la codificación de la señal de banda ancha.
26. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 21,
en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador, en relación con un
índice k de dicho código de cifrado y descifrado innovador, de tal
modo que dicho índice k constituye dicho al menos un primer
parámetro de codificación de señal; y
los medios para calcular un primer factor
comprenden medios para computar un factor de configuración o
articulación en voz, r_{v}, por medio de la siguiente
relación:
r_{v} = (E_{v}
- E_{c})/(E_{v} +
E_{c})
donde:
- E_{v} es la energía de un vector de código
adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código
innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la
codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la
codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y
descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y
descifrado innovador computada durante la codificación de la señal
de banda ancha;
- k es un índice del código de cifrado y
descifrado innovador, computado durante la codificación de la señal
de banda ancha; y
- c_{k} es el vector de código innovador de
dicho código de cifrado y descifrado innovador en el índice k.
27. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 26,
en el cual el factor de articulación en voz, r_{v}, tiene un valor
situado entre -1 y 1, de tal modo que el valor 1 corresponde a una
señal articulada en voz y pura, y el valor -1 corresponde a una
señal no articulada en voz y pura.
28. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 27,
en el cual los medios para calcular una ganancia suavizada
comprenden medios para computar un factor \lambda utilizando la
siguiente relación:
\lambda =
0,5(1 -
r_{v}).
29. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 28,
en el cual un factor \lambda = 0 indica una señal articulada en
voz y pura, y un factor \lambda = 1 indica una señal no articulada
en voz y pura.
30. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 21,
en el cual los medios para calcular un segundo factor comprenden
medios para determinar una medida de distancia proporcionando una
similitud entre filtros de predicción lineal adyacentes y sucesivos,
computados durante la codificación de la señal de banda ancha.
31. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 30,
en el cual:
la señal de banda ancha es muestreada antes de
la codificación, y es procesada o tratada por tramas durante la
codificación y la descodificación; y
los medios para determinar una medida de
distancia comprenden medios para calcular una medida de distancia de
Pares Espectrales de Inmitancia entre los Pares Espectrales de
Inmitancia de una trama presente n de la señal de banda ancha, y los
Pares Espectrales de Inmitancia de una trama pasada
n-1 de la señal de banda ancha, a través de la
siguiente relación:
D_{S} =
\sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} -
isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros
de predicción
lineal.
\newpage
32. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 31,
en el cual los medios para calcular un segundo factor comprenden
medios para establecer una relación de correspondencia de la medida
D_{s} de distancia de Pares Espectrales de Inmitancia con dicho
segundo factor \theta a través de la siguiente relación:
\theta = 1,25
- D_{s}/400 .
000.0
con la limitación dada por 0 \leq
\theta \leq
1.
33. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 21,
en el cual los medios para calcular una ganancia suavizada
comprenden medios para calcular un factor S_{m} de suavización de
ganancia basándose tanto en el primer factor \lambda como en el
segundo factor \theta por medio de la siguiente relación:
S_{m} =
\lambda
\theta
34. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 33,
en el cual el factor S_{m} tiene un valor que se aproxima a 1 para
una señal de banda ancha no articulada en voz y estable, y un valor
que se aproxima a 0 para una señal de banda ancha articulada en voz
y pura, o una señal de banda ancha inestable.
35. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 21,
en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con dicho
al menos un primer parámetro de codificación de señal;
la señal de banda ancha es muestreada antes de
su codificación, y se procesa o trata por tramas y
sub-tramas durante la codificación y la
descodificación; y
los medios para calcular una ganancia suavizada
comprenden medios para computar una ganancia modificada inicial
g_{0}, de tal modo que dichos medios para computar una ganancia
modificada inicial comprenden medios para comparar la ganancia
hallada g, computada durante la codificación de la señal de banda
ancha, con un umbral dado por la ganancia modificada inicial
procedente de la sub-trama pasada
g-1, como sigue:
- si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
- y
- si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
36. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 21, en el
cual los medios para calcular una ganancia suavizada comprenden
calcular una ganancia modificada inicial g_{0} comparando la
ganancia hallada g con un umbral.
37. Un método de producción de vector de código
suavizado en ganancia, de acuerdo con la reivindicación 36, en el
cual:
los medios para calcular una ganancia suavizada
comprenden medios para calcular un factor S_{m} de suavización de
ganancia basándose tanto en el primer factor \lambda como en el
segundo factor \theta a través de la siguiente relación:
S_{m} =
\lambda
\theta
y medios para determinar dicha
ganancia suavizada g_{s} a través de la siguiente
relación:
g_{s} =
S_{m}\cdot g_{0} + (1 - S_{m})\cdot
g
38. Un dispositivo para la producción de un
vector de código suavizado en ganancia, durante la descodificación
de una señal codificada a partir de un conjunto de parámetros de
codificación de señal, de tal modo que dicha señal contiene ruido de
fondo estacionario y dicho dispositivo comprende:
medios para hallar un vector de código (c_{k})
y una ganancia (g) en relación con al menos un primer (k) y al menos
un segundo (g) parámetros de codificación de señal de dicho
conjunto;
medios para calcular al menos un factor
(r_{v}, \lambda; \theta) indicativo de un nivel de ruido de
fondo estacionario en la señal, en respuesta a al menos un tercer
parámetro (b, v_{T}; LP) de codificación de señal, perteneciente a
dicho conjunto;
medios para calcular una ganancia suavizada
(g_{s}) mediante el uso de una operación no lineal en relación con
el factor (r_{v}, \lambda; \theta) indicativo del nivel de
ruido y aplicada a la ganancia hallada (g); y
medios para amplificar el vector de código
hallado (c_{k}) con dicha ganancia suavizada (g_{s}) para
producir con ello dicho vector de código suavizado en ganancia.
39. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 38,
en el cual el al menos un factor indicativo de un nivel de ruido de
fondo estacionario es un factor (r_{v}, \lambda) representativo
de un grado de configuración o articulación en voz de la señal.
40. Un dispositivo de producción de vector de
código suavizado en ganancia, de acuerdo con la reivindicación 38,
en el cual el al menos un factor indicativo de un nivel de ruido de
fondo estacionario es un factor (\theta) representativo de un
grado de estabilidad de dicha señal.
41. Un sistema de comunicación celular destinado
a dar servicio a un área geográfica dividida en una pluralidad de
celdas, que comprende:
unidades transmisoras/receptoras móviles;
estaciones de base celulares, respectivamente
situadas en dichas celdas;
medios para controlar la comunicación entre las
estaciones de base celulares;
un subsistema de comunicación inalámbrica y
bidireccional, o en ambos sentidos, entre cada unidad móvil situada
en una celda y la estación de base celular de dicha celda, de tal
manera que dicho subsistema de comunicación inalámbrica y
bidireccional comprende, tanto en la unidad móvil como en la
estación de base celular, (a) un transmisor, que incluye un
codificador para codificar una señal de banda ancha y medios para
transmitir la señal de banda ancha codificada, y (b) un receptor,
que incluye medios para recibir una señal de banda ancha codificada
y transmitida, y un descodificador para descodificar la señal de
banda ancha codificada que se recibe;
en el cual dicho descodificador comprende medios
sensibles a un conjunto de parámetros de codificación de señal, a
fin de descodificar la señal de banda ancha codificada que se
recibe, y en el cual dichos medios de descodificación de señal de
banda ancha comprenden un dispositivo de acuerdo con la
reivindicación 21, destinado a producir un vector de código de
ganancia suavizada durante la descodificación de la señal de banda
ancha codificada, a partir de dicho conjunto de parámetros de
codificación de señal.
42. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual los medios para hallar
un vector de código y una ganancia comprenden:
medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador, en relación con
dicho al menos un primer parámetro de codificación de señal; y
medios para hallar una ganancia de código de
cifrado y descifrado innovador.
43. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código en un
código de cifrado y descifrado en relación con dicho al menos un
primer parámetro de codificación de señal; y
dicho al menos un primer parámetro de
codificación de señal comprende un índice de código de cifrado y
descifrado innovador.
44. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con dicho
al menos un primer parámetro de codificación de señal; y
dicho al menos un segundo parámetro de
codificación de señal comprende los siguientes parámetros:
- una ganancia de paso computada durante la codificación de la señal de banda ancha;
- un retardo de paso computado durante la codificación de la señal de banda ancha;
\newpage
- un índice j de un filtro de paso bajo seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
- un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
45. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual dicho al menos un
cuarto parámetro de codificación de señal comprende coeficientes de
un filtro de predicción lineal calculados durante la codificación de
la señal de banda ancha.
46. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con un
índice k de dicho código de cifrado y descifrado innovador, de tal
modo que dicho índice k forma dicho al menos un primer parámetro de
codificación de señal; y
los medios para calcular un primer factor
comprenden medios para computar un factor de configuración o
articulación en voz, r_{v}, por medio de la siguiente
relación:
r_{v} = (E_{v}
- E_{c})/(E_{v} +
E_{c})
donde:
- E_{v} es la energía de un vector de código
adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código
innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la
codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la
codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y
descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y
descifrado innovador computada durante la codificación de la señal
de banda ancha;
- k es un índice del código de cifrado y
descifrado innovador, computado durante la codificación de la señal
de banda ancha; y
- c_{k} es el vector de código innovador de
dicho código de cifrado y descifrado innovador en el índice k.
47. El sistema de comunicación celular de
acuerdo con la reivindicación 46, en el cual el factor de
articulación en voz, r_{v}, tiene un valor situado entre -1 y 1,
de tal modo que el valor 1 corresponde a una señal articulada en voz
y pura, y el valor -1 corresponde a una señal no articulada en voz y
pura.
48. El sistema de comunicación celular de
acuerdo con la reivindicación 47, en el cual los medios para
calcular una ganancia suavizada comprenden medios para computar un
factor \lambda utilizando la siguiente relación:
\lambda =
0,5(1 -
r_{v}).
49. El sistema de comunicación celular de
acuerdo con la reivindicación 48, en el cual un factor \lambda = 0
indica una señal articulada en voz y pura, y un factor \lambda = 1
indica una señal no articulada en voz y pura.
50. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual los medios para
calcular un segundo factor comprenden medios para determinar una
medida de distancia proporcionando una similitud entre filtros de
predicción lineal adyacentes y sucesivos, computados durante la
codificación de la señal de banda
ancha.
ancha.
51. El sistema de comunicación celular de
acuerdo con la reivindicación 50, en el cual:
la señal de banda ancha es muestreada antes de
la codificación, y es procesada o tratada por tramas durante la
codificación y la descodificación; y
los medios para determinar una medida de
distancia comprenden medios para calcular una medida de distancia de
Pares Espectrales de Inmitancia entre los Pares Espectrales de
Inmitancia de una trama presente n de la señal de banda ancha, y los
Pares Espectrales de Inmitancia de una trama pasada
n-1 de la señal de banda ancha, a través de la
siguiente relación:
D_{S} =
\sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} -
isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros
de predicción
lineal.
52. El sistema de comunicación celular de
acuerdo con la reivindicación 51, en el cual los medios para
calcular un segundo factor comprenden medios para establecer una
relación de correspondencia de la medida D_{s} de distancia de
Pares Espectrales de Inmitancia con dicho segundo factor \theta a
través de la siguiente relación:
\theta = 1,25
- D_{s}/400 .
000.0
con la limitación dada por 0 \leq
\theta \leq
1.
53. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual los medios para
calcular una ganancia suavizada comprenden medios para calcular un
factor S_{m} de suavización de ganancia basándose tanto en el
primer factor \lambda como en el segundo factor \theta por medio
de la siguiente relación:
S_{m} =
\lambda
\theta
54. El sistema de comunicación celular de
acuerdo con la reivindicación 53, en el cual el factor S_{m} tiene
un valor que se aproxima a 1 para una señal de banda ancha no
articulada en voz y estable, y un valor que se aproxima a 0 para una
señal de banda ancha articulada en voz y pura, o una señal de banda
ancha inestable.
55. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con dicho
al menos un primer parámetro de codificación de señal;
la señal de banda ancha es muestreada antes de
su codificación, y se procesa o trata por tramas y
sub-tramas durante la codificación y la
descodificación; y
los medios para calcular una ganancia suavizada
comprenden medios para computar una ganancia modificada inicial
g_{0}, de tal modo que dichos medios de computación de ganancia
modificada inicial comprenden medios para comparar la ganancia
hallada g, computada durante la codificación de la señal de banda
ancha, con un umbral dado por la ganancia modificada inicial
procedente de la sub-trama pasada
g-1, como sigue:
- si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
- y
- si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
56. El sistema de comunicación celular de
acuerdo con la reivindicación 41, en el cual los medios para
calcular una ganancia suavizada comprenden medios para calcular una
ganancia modificada inicial g_{0} comparando la ganancia hallada g
con un umbral.
57. El sistema de comunicación celular de
acuerdo con la reivindicación 56, en el cual:
los medios para calcular una ganancia suavizada
comprenden medios para calcular un factor S_{m} de suavización de
ganancia basándose tanto en el primer factor \lambda como en el
segundo factor \theta a través de la siguiente relación:
S_{m} =
\lambda
\theta
y medios para determinar dicha
ganancia suavizada g_{s} a través de la siguiente
relación:
g_{s} =
S_{m}\cdot g_{0} + (1 - S_{m})\cdot
g
58. Un elemento de red que comprende un receptor
que incluye medios para recibir una señal de banda ancha codificada
y transmitida, y un descodificador para descodificar la señal de
banda ancha codificada que se recibe;
en el que dicho descodificador comprende medios
sensibles a un conjunto de parámetros de codificación de señal,
destinados a descodificar la señal de banda ancha codificada que se
recibe, y en el cual dichos medios descodificadores de señal de
banda ancha comprenden un dispositivo de acuerdo con la
reivindicación 21, destinado a producir un vector de código
suavizado en ganancia, durante la descodificación de la señal de
banda ancha codificada, a partir de dichos parámetros de
codificación de señal.
59. Un elemento de red de acuerdo con la
reivindicación 58, en el cual los medios para hallar un vector de
código y una ganancia comprenden:
medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con dicho
al menos un primer parámetro de codificación de señal; y
medios para hallar una ganancia de código de
cifrado y descifrado innovador.
60. Un elemento de red de acuerdo con la
reivindicación 58, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código en un
código de cifrado y descifrado en relación con dicho al menos un
primer parámetro de codificación de señal; y
dicho al menos un primer parámetro de
codificación de señal comprende un índice de código de cifrado y
descifrado innovador.
61. Un elemento de red de acuerdo con la
reivindicación 58, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con dicho
al menos un primer parámetro de codificación de señal; y
dicho al menos un tercer parámetro de
codificación de señal comprende los siguientes parámetros:
- una ganancia de paso computada durante la codificación de la señal de banda ancha;
- un retardo de paso computado durante la codificación de la señal de banda ancha;
- un índice j de un filtro de paso bajo seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
- un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
62. Un elemento de red de acuerdo con la
reivindicación 58, en el cual dicho al menos un cuarto parámetro de
codificación de señal comprende coeficientes de un filtro de
predicción lineal calculados durante la codificación de la señal de
banda ancha.
63. Un elemento de red de acuerdo con la
reivindicación 58, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con un
índice k de dicho código de cifrado y descifrado innovador, de tal
modo que dicho índice k forma dicho al menos un primer parámetro de
codificación de señal; y
los medios para calcular un primer factor
comprenden medios para computar un factor de configuración o
articulación en voz, r_{v}, por medio de la siguiente
relación:
r_{v} = (E_{v}
- E_{c})/(E_{v} +
E_{c})
donde:
- E_{v} es la energía de un vector de código
adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código
innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la
codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la
codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y
descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y
descifrado innovador computada durante la codificación de la señal
de banda ancha;
- k es un índice del código de cifrado y
descifrado innovador, computado durante la codificación de la señal
de banda ancha; y
- c_{k} es el vector de código innovador de
dicho código de cifrado y descifrado innovador en el índice k.
64. Un elemento de red de acuerdo con la
reivindicación 63, en el cual el factor de articulación en voz,
r_{v}, tiene un valor situado entre -1 y 1, de tal modo que el
valor 1 corresponde a una señal articulada en voz y pura, y el valor
-1 corresponde a una señal no articulada en voz y pura.
65. Un elemento de red de acuerdo con la
reivindicación 64, en el cual los medios para calcular una ganancia
suavizada comprenden medios para computar un factor \lambda
utilizando la siguiente relación:
\lambda =
0,5(1 -
r_{v}).
66. Un elemento de red de acuerdo con la
reivindicación 65, en el cual un factor \lambda = 0 indica una
señal articulada en voz y pura, y un factor \lambda = 1 indica una
señal no articulada en voz y pura.
67. Un elemento de red de acuerdo con la
reivindicación 58, en el cual los medios para calcular un segundo
factor comprenden medios para determinar una medida de distancia
proporcionando una similitud entre filtros de predicción lineal
adyacentes y sucesivos, computados durante la codificación de la
señal de banda ancha.
68. Un elemento de red de acuerdo con la
reivindicación 67, en el cual:
la señal de banda ancha es muestreada antes de
la codificación, y es procesada o tratada por tramas durante la
codificación y la descodificación; y
los medios para determinar una medida de
distancia comprenden medios para calcular una medida de distancia de
Pares Espectrales de Inmitancia entre los Pares Espectrales de
Inmitancia de una trama presente n de la señal de banda ancha, y los
Pares Espectrales de Inmitancia de una trama pasada
n-1 de la señal de banda ancha, a través de la
siguiente relación:
D_{S} =
\sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} -
isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros
de predicción
lineal.
69. Un elemento de red de acuerdo con la
reivindicación 68, en el cual los medios para calcular un segundo
factor comprenden medios para establecer una relación de
correspondencia de la medida D_{s} de distancia de Pares
Espectrales de Inmitancia con dicho segundo factor \theta a través
de la siguiente relación:
\theta = 1,25
- D_{s}/400 .
000.0
con la limitación dada por 0 \leq
\theta \leq
1.
70. Un elemento de red de acuerdo con la
reivindicación 58, en el cual los medios para calcular una ganancia
suavizada comprenden medios para calcular un factor S_{m} de
suavización de ganancia basándose tanto en el primer factor
\lambda como en el segundo factor \theta por medio de la
siguiente relación:
S_{m} =
\lambda
\theta
71. Un elemento de red de acuerdo con la
reivindicación 70, en el cual el factor S_{m} tiene un valor que
se aproxima a 1 para una señal de banda ancha no articulada en voz y
estable, y un valor que se aproxima a 0 para una señal de banda
ancha articulada en voz y pura, o una señal de banda ancha
inestable.
72. Un elemento de red de acuerdo con la
reivindicación 58, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con dicho
al menos un primer parámetro de codificación de señal;
\newpage
la señal de banda ancha es muestreada antes de
su codificación, y se procesa o trata por tramas y
sub-tramas durante la codificación y la
descodificación; y
los medios para calcular una ganancia suavizada
comprenden medios para computar una ganancia modificada inicial
g_{0}, de tal modo que dichos medios de computación de ganancia
modificada inicial comprenden medios para comparar la ganancia
hallada g, computada durante la codificación de la señal de banda
ancha, con un umbral dado por la ganancia modificada inicial
procedente de la sub-trama pasada
g-1, como sigue:
- si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
- y
- si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
73. Un elemento de red de acuerdo con la
reivindicación 58, en el cual los medios para calcular una ganancia
suavizada comprenden medios para calcular una ganancia modificada
inicial g_{0} comparando la ganancia hallada g con un umbral.
74. Un elemento de red de acuerdo con la
reivindicación 73, en el cual:
los medios para calcular una ganancia suavizada
comprenden medios para calcular un factor S_{m} de suavización de
ganancia basándose tanto en el primer factor \lambda como en el
segundo factor \theta a través de la siguiente relación:
S_{m} =
\lambda
\theta
y medios para determinar dicha
ganancia suavizada g_{s} a través de la siguiente
relación:
g_{s} =
S_{m}\cdot g_{0} + (1 - S_{m})\cdot
g
75. En un sistema de comunicación destinado a
dar servicio a un área geográfica, que comprende unidades móviles
transmisoras/receptoras y estaciones de base, un subsistema de
comunicación inalámbrica y bidireccional, o en ambos sentidos, entre
cada par formado por unidad móvil y estación de base, de tal modo
que dicho subsistema de comunicación inalámbrica y bidireccional
comprende, tanto en la unidad móvil como en la estación de base, (a)
un transmisor, que incluye un codificador para codificar una señal
de banda ancha y medios para transmitir la señal de banda ancha
codificada, y (b) un receptor, que incluye medios para recibir una
señal de banda ancha codificada y transmitida, y un descodificador
para descodificar la señal de banda ancha codificada que se
recibe;
en el cual dicho descodificador comprende medios
sensibles a un conjunto de parámetros de codificación de señal, a
fin de descodificar la señal de banda ancha codificada que se
recibe, y en el cual dichos medios de descodificación de señal de
banda ancha comprenden un dispositivo de acuerdo con la
reivindicación 21, destinado a producir un vector de código de
ganancia suavizada durante la descodificación de la señal de banda
ancha codificada, a partir de dicho conjunto de parámetros de
codificación de señal.
76. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el cual los
medios para hallar un vector de código comprenden:
medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con dicho
al menos un primer parámetro de codificación de señal; y
medios para hallar una ganancia de código de
cifrado y descifrado innovador.
77. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código en un
código de cifrado y descifrado en relación con dicho al menos un
primer parámetro de codificación de
señal; y
señal; y
dicho al menos un primer parámetro de
codificación de señal comprende un índice de código de cifrado y
descifrado innovador.
78. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el
cual:
cual:
los medios para hallar un vector de código y una
ganancia comprenden medios para hallar un vector de código innovador
en un código de cifrado y descifrado innovador en relación con dicho
al menos un primer parámetro de codificación de señal; y
dicho al menos un tercer parámetro de
codificación de señal comprende los siguientes parámetros:
- una ganancia de paso computada durante la codificación de la señal de banda ancha;
- un retardo de paso computado durante la codificación de la señal de banda ancha;
- un índice j de un filtro de paso bajo seleccionado durante la codificación de la señal de banda ancha y aplicado a un vector de código de paso computado durante la codificación de la señal de banda ancha; y
- un índice de código de cifrado y descifrado innovador, computado durante la codificación de la señal de banda ancha.
79. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el cual dicho
al menos un cuarto parámetro de codificación de señal comprende
coeficientes de un filtro de predicción lineal calculados durante la
codificación de la señal de banda ancha.
80. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el cual:
los medios para hallar un vector de código
comprenden medios para hallar un vector de código innovador en un
código de cifrado y descifrado innovador en relación con un índice k
de dicho código de cifrado y descifrado innovador, de tal modo que
dicho índice k forma dicho al menos un primer parámetro de
codificación de señal; y
los medios para calcular un primer factor
comprenden medios para computar un factor de configuración o
articulación en voz, r_{v}, por medio de la siguiente
relación:
r_{v} = (E_{v}
- E_{c})/(E_{v} +
E_{c})
donde:
- E_{v} es la energía de un vector de código
adaptativo regulado en escala, bv_{T};
- E_{c} es la energía de un vector de código
innovador regulado en escala, gc_{k};
- b es una ganancia de paso computada durante la
codificación de la señal de banda ancha;
- T es un retardo de paso computado durante la
codificación de la señal de banda ancha;
- v_{T} es un vector de código de cifrado y
descifrado adaptativo en el retardo de paso T;
- g es una ganancia de código de cifrado y
descifrado innovador computada durante la codificación de la señal
de banda ancha;
- k es un índice del código de cifrado y
descifrado innovador, computado durante la codificación de la señal
de banda ancha; y
- c_{k} es el vector de código innovador de
dicho código de cifrado y descifrado innovador en el índice k.
81. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 80, en el cual el
factor de articulación en voz, r_{v}, tiene un valor situado entre
-1 y 1, de tal modo que el valor 1 corresponde a una señal
articulada en voz y pura, y el valor -1 corresponde a una señal no
articulada en voz y pura.
82. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 80, en el cual los
medios para calcular una ganancia suavizada comprenden medios para
computar un factor \lambda utilizando la siguiente relación:
\lambda =
0,5(1 -
r_{v}).
83. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 82, en el cual un
factor \lambda = 0 indica una señal articulada en voz y pura, y un
factor \lambda = 1 indica una señal no articulada en voz y
pura.
84. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el cual los
medios para calcular un segundo factor comprenden medios para
determinar una medida de distancia proporcionando una similitud
entre filtros de predicción lineal adyacentes y sucesivos,
computados durante la codificación de la señal de banda ancha.
85. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 84, en el cual:
la señal de banda ancha es muestreada antes de
la codificación, y es procesada o tratada por tramas durante la
codificación y la descodificación; y
los medios para determinar una medida de
distancia comprenden medios para calcular una medida de distancia de
Pares Espectrales de Inmitancia entre los Pares Espectrales de
Inmitancia de una trama presente n de la señal de banda ancha, y los
Pares Espectrales de Inmitancia de una trama pasada
n-1 de la señal de banda ancha, a través de la
siguiente relación:
D_{S} =
\sum\limits^{p-1}_{i=1} \left(isp^{(n)}_{i} -
isp^{(n-1)}_{i}\right)^{2}
donde p es el orden de los filtros
de predicción
lineal.
86. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 85, en el cual los
medios para calcular un segundo factor comprenden medios para
establecer una relación de correspondencia de la medida D_{s} de
distancia de Pares Espectrales de Inmitancia con dicho segundo
factor \theta a través de la siguiente relación:
\theta = 1,25
- D_{s}/400 .
000.0
con la limitación dada por 0 \leq
\theta \leq
1.
87. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el cual los
medios para calcular una ganancia de suavización comprenden medios
para calcular un factor S_{m} de suavización de ganancia basándose
tanto en el primer factor \lambda como en el segundo factor
\theta por medio de la siguiente relación:
S_{m} =
\lambda
\theta
88. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 87, en el cual el
factor S_{m} tiene un valor que se aproxima a 1 para una señal de
banda ancha no articulada en voz y estable, y un valor que se
aproxima a 0 para una señal de banda ancha articulada en voz y pura,
o una señal de banda ancha inestable.
89. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el cual:
los medios para hallar un vector de código
comprenden medios para hallar un vector de código innovador en un
código de cifrado y descifrado innovador en relación con dicho al
menos un primer parámetro de codificación de señal;
la señal de banda ancha es muestreada antes de
su codificación, y se procesa o trata por tramas y
sub-tramas durante la codificación y la
descodificación; y
los medios para calcular una ganancia suavizada
comprenden medios para computar una ganancia modificada inicial
g_{0}, de tal modo que dichos medios de computación de ganancia
modificada inicial comprenden medios para comparar la ganancia
hallada g, computada durante la codificación de la señal de banda
ancha, con un umbral dado por la ganancia modificada inicial
procedente de la sub-trama pasada
g-1, como sigue:
- si g < g - 1, entonces g_{0} = g \times 1,19, limitada por g_{0} \leq g - 1
- y
- si g \geq g - 1, entonces g_{0} = g/1,19, limitada por g_{0} \geq g - 1.
90. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 75, en el cual los
medios para calcular una ganancia suavizada comprenden medios para
calcular una ganancia modificada inicial g_{0} comparando la
ganancia hallada g con un umbral.
91. El subsistema de comunicación inalámbrica y
bidireccional de acuerdo con la reivindicación 90, en el cual:
los medios para calcular una ganancia suavizada
comprenden medios para calcular un factor S_{m} de suavización de
ganancia basándose tanto en el primer factor \lambda como en el
segundo factor \theta a través de la siguiente relación:
S_{m} =
\lambda
\theta
y medios para determinar dicha
ganancia suavizada g_{s} a través de la siguiente
relación:
g_{s} =
S_{m}\cdot g_{0} + (1 - S_{m})\cdot
g
92. Un teléfono móvil que incluye un dispositivo
de acuerdo con la reivindicación 21.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA2290037 | 1999-11-18 | ||
CA002290037A CA2290037A1 (en) | 1999-11-18 | 1999-11-18 | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2266003T3 true ES2266003T3 (es) | 2007-03-01 |
Family
ID=4164645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES00978928T Expired - Lifetime ES2266003T3 (es) | 1999-11-18 | 2000-11-17 | Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. |
Country Status (13)
Country | Link |
---|---|
US (1) | US7191123B1 (es) |
EP (1) | EP1232494B1 (es) |
JP (1) | JP4662673B2 (es) |
CN (1) | CN1229775C (es) |
AT (1) | ATE336060T1 (es) |
AU (1) | AU1644401A (es) |
CA (1) | CA2290037A1 (es) |
CY (1) | CY1106164T1 (es) |
DE (1) | DE60029990T2 (es) |
DK (1) | DK1232494T3 (es) |
ES (1) | ES2266003T3 (es) |
PT (1) | PT1232494E (es) |
WO (1) | WO2001037264A1 (es) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
KR100648760B1 (ko) | 2001-11-29 | 2006-11-23 | 코딩 테크놀러지스 에이비 | 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
KR100480341B1 (ko) * | 2003-03-13 | 2005-03-31 | 한국전자통신연구원 | 광대역 저전송률 음성 신호의 부호화기 |
RU2316059C2 (ru) * | 2003-05-01 | 2008-01-27 | Нокиа Корпорейшн | Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи |
US7451091B2 (en) | 2003-10-07 | 2008-11-11 | Matsushita Electric Industrial Co., Ltd. | Method for determining time borders and frequency resolutions for spectral envelope coding |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
WO2006085586A1 (ja) * | 2005-02-10 | 2006-08-17 | Matsushita Electric Industrial Co., Ltd. | 音声符号化におけるパルス割当方法 |
AU2006232361B2 (en) * | 2005-04-01 | 2010-12-23 | Qualcomm Incorporated | Methods and apparatus for encoding and decoding an highband portion of a speech signal |
PL1875463T3 (pl) * | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
CN100420155C (zh) * | 2005-08-03 | 2008-09-17 | 上海杰得微电子有限公司 | 宽带音频压缩编码器的频带组划分方法 |
ATE531037T1 (de) * | 2006-02-14 | 2011-11-15 | France Telecom | Vorrichtung für wahrnehmungsgewichtung bei der tonkodierung/-dekodierung |
EP2118885B1 (en) | 2007-02-26 | 2012-07-11 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
CN101622668B (zh) | 2007-03-02 | 2012-05-30 | 艾利森电话股份有限公司 | 电信网络中的方法和装置 |
CN101266798B (zh) * | 2007-03-12 | 2011-06-15 | 华为技术有限公司 | 一种在语音解码器中进行增益平滑的方法及装置 |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN100550133C (zh) | 2008-03-20 | 2009-10-14 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
US8831936B2 (en) | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
CN101609674B (zh) * | 2008-06-20 | 2011-12-28 | 华为技术有限公司 | 编解码方法、装置和系统 |
US8538749B2 (en) | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
US9202456B2 (en) | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102648493B (zh) | 2009-11-24 | 2016-01-20 | Lg电子株式会社 | 音频信号处理方法和设备 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN103295578B (zh) * | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
KR101398189B1 (ko) * | 2012-03-27 | 2014-05-22 | 광주과학기술원 | 음성수신장치 및 음성수신방법 |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
EP3048609A4 (en) | 2013-09-19 | 2017-05-03 | Sony Corporation | Encoding device and method, decoding device and method, and program |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
CN105745706B (zh) * | 2013-11-29 | 2019-09-24 | 索尼公司 | 用于扩展频带的装置、方法和程序 |
RU2667627C1 (ru) | 2013-12-27 | 2018-09-21 | Сони Корпорейшн | Устройство и способ декодирования и программа |
GB201401689D0 (en) * | 2014-01-31 | 2014-03-19 | Microsoft Corp | Audio signal processing |
CA2940657C (en) | 2014-04-17 | 2021-12-21 | Voiceage Corporation | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
US9510787B2 (en) * | 2014-12-11 | 2016-12-06 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for reconstructing sampled signals |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5701392A (en) | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
US5754976A (en) | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5195168A (en) | 1991-03-15 | 1993-03-16 | Codex Corporation | Speech coder and method having spectral interpolation and fast codebook search |
JP3186412B2 (ja) | 1994-04-01 | 2001-07-11 | ソニー株式会社 | 情報符号化方法、情報復号化方法、及び情報伝送方法 |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US5960386A (en) * | 1996-05-17 | 1999-09-28 | Janiszewski; Thomas John | Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
TW326070B (en) | 1996-12-19 | 1998-02-01 | Holtek Microelectronics Inc | The estimation method of the impulse gain for coding vocoder |
US5987406A (en) * | 1997-04-07 | 1999-11-16 | Universite De Sherbrooke | Instability eradication for analysis-by-synthesis speech codecs |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US6260010B1 (en) * | 1998-08-24 | 2001-07-10 | Conexant Systems, Inc. | Speech encoder using gain normalization that combines open and closed loop gains |
-
1999
- 1999-11-18 CA CA002290037A patent/CA2290037A1/en not_active Abandoned
-
2000
- 2000-11-17 JP JP2001537726A patent/JP4662673B2/ja not_active Expired - Lifetime
- 2000-11-17 PT PT00978928T patent/PT1232494E/pt unknown
- 2000-11-17 AU AU16444/01A patent/AU1644401A/en not_active Abandoned
- 2000-11-17 DE DE60029990T patent/DE60029990T2/de not_active Expired - Lifetime
- 2000-11-17 US US10/129,945 patent/US7191123B1/en not_active Expired - Lifetime
- 2000-11-17 WO PCT/CA2000/001381 patent/WO2001037264A1/en active IP Right Grant
- 2000-11-17 DK DK00978928T patent/DK1232494T3/da active
- 2000-11-17 CN CNB008158541A patent/CN1229775C/zh not_active Expired - Lifetime
- 2000-11-17 EP EP00978928A patent/EP1232494B1/en not_active Expired - Lifetime
- 2000-11-17 ES ES00978928T patent/ES2266003T3/es not_active Expired - Lifetime
- 2000-11-17 AT AT00978928T patent/ATE336060T1/de active
-
2006
- 2006-09-20 CY CY20061101344T patent/CY1106164T1/el unknown
Also Published As
Publication number | Publication date |
---|---|
PT1232494E (pt) | 2006-10-31 |
AU1644401A (en) | 2001-05-30 |
US7191123B1 (en) | 2007-03-13 |
DK1232494T3 (da) | 2006-11-13 |
CY1106164T1 (el) | 2011-06-08 |
DE60029990D1 (de) | 2006-09-21 |
DE60029990T2 (de) | 2006-12-07 |
CA2290037A1 (en) | 2001-05-18 |
CN1391689A (zh) | 2003-01-15 |
EP1232494A1 (en) | 2002-08-21 |
CN1229775C (zh) | 2005-11-30 |
JP4662673B2 (ja) | 2011-03-30 |
JP2003514267A (ja) | 2003-04-15 |
WO2001037264A1 (en) | 2001-05-25 |
EP1232494B1 (en) | 2006-08-09 |
ATE336060T1 (de) | 2006-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2266003T3 (es) | Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. | |
ES2212642T3 (es) | Dispositivo de codificacion perceptual y metodo para la codificacion eficaz de señales de banda ancha. | |
ES2266312T3 (es) | Indexacion de posiciones y señales de pulso en codigos de cifrado y descifrado algebraicos para la codificacion de señales de banda ancha. | |
JP4824167B2 (ja) | 周期的スピーチコーディング | |
ES2321147T3 (es) | Codificacion de habla de tasa de transmision variable. | |
ES2625895T3 (es) | Método y dispositivo para la ocultación eficiente del borrado de tramas en códecs de voz basados en la predicción lineal | |
ES2287150T3 (es) | Metodo y sistema para estimacion artificial de una señal de banda alta en un codificador-decodificador de voz. | |
AU2002221389A1 (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals | |
ES2256022T3 (es) | Metodos y aparators para submuestreo de la informacion. |