ES2207968T3 - Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha. - Google Patents
Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha.Info
- Publication number
- ES2207968T3 ES2207968T3 ES99952183T ES99952183T ES2207968T3 ES 2207968 T3 ES2207968 T3 ES 2207968T3 ES 99952183 T ES99952183 T ES 99952183T ES 99952183 T ES99952183 T ES 99952183T ES 2207968 T3 ES2207968 T3 ES 2207968T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- white noise
- produce
- noise sequence
- synthesized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000011084 recovery Methods 0.000 title claims description 11
- 238000001228 spectrum Methods 0.000 claims abstract description 31
- 239000013598 vector Substances 0.000 claims description 111
- 230000005284 excitation Effects 0.000 claims description 80
- 230000003595 spectral effect Effects 0.000 claims description 57
- 230000015572 biosynthetic process Effects 0.000 claims description 43
- 238000003786 synthesis reaction Methods 0.000 claims description 43
- 230000001413 cellular effect Effects 0.000 claims description 35
- 230000009194 climbing Effects 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 19
- 230000006854 communication Effects 0.000 claims description 19
- 238000001914 filtration Methods 0.000 claims description 16
- 230000001143 conditioned effect Effects 0.000 claims description 15
- 230000002457 bidirectional effect Effects 0.000 claims description 14
- 230000010267 cellular communication Effects 0.000 claims description 14
- 238000007493 shaping process Methods 0.000 claims description 14
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000013467 fragmentation Methods 0.000 claims description 4
- 238000006062 fragmentation reaction Methods 0.000 claims description 4
- 238000002347 injection Methods 0.000 claims description 4
- 239000007924 injection Substances 0.000 claims description 4
- 230000007175 bidirectional communication Effects 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims 4
- 230000005236 sound signal Effects 0.000 abstract description 6
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 18
- 210000004027 cell Anatomy 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 238000012546 transfer Methods 0.000 description 13
- 238000013459 approach Methods 0.000 description 11
- 238000011002 quantification Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000001934 delay Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 210000003771 C cell Anatomy 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Optical Recording Or Reproduction (AREA)
- Error Detection And Correction (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Dc Digital Transmission (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
- Networks Using Active Elements (AREA)
- Television Systems (AREA)
- Measuring Frequencies, Analyzing Spectra (AREA)
- Mobile Radio Communication Systems (AREA)
- Optical Communication System (AREA)
- Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
- Radar Systems Or Details Thereof (AREA)
- Preliminary Treatment Of Fibers (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Image Processing (AREA)
- Stereo-Broadcasting Methods (AREA)
- Package Frames And Binding Bands (AREA)
- Installation Of Indoor Wiring (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Inorganic Insulating Materials (AREA)
- Parts Printed On Printed Circuit Boards (AREA)
- Coils Or Transformers For Communication (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
Dispositivo para recuperar un contenido de alta frecuencia de una señal de banda ancha, previamente diezmada, y para inyectar dicho contenido de alta frecuencia en una versión sintetizada, sobremuestreada, de dicha señal de banda ancha para producir una señal sintetizada de banda ancha de espectro completo, comprendiendo dicho dispositivo de recuperación del contenido de alta frecuencia: a) un generador (213) de ruido aleatorio para producir una secuencia de ruido que tiene un espectro determinado; b) una unidad (215) de conformación espectral para conformar el espectro de la secuencia de ruido en relación con los coeficientes de filtro de predicción lineal relacionados con dicha señal diezmada de banda ancha; y c) un circuito (221) de inyección de señales para inyectar dicha secuencia de ruido conformada espectralmente en dicha versión sintetizada, sobremuestreada, de la señal para producir así dicha señal (223) sintetizada de banda ancha, de espectro completo.
Description
Método de recuperación de contenidos de alta
frecuencia y dispositivo para una señal sintetizada, sobremuestreada
de banda ancha.
La presente invención se refiere a un método y a
un dispositivo para recuperar un contenido de alta frecuencia de una
señal de banda ancha, previamente diezmada, y para inyectar este
contenido de alta frecuencia en una versión sintetizada,
sobremuestreada, de la señal diezmada de banda ancha con el fin de
producir una señal sintetizada de banda ancha, de espectro
completo.
La demanda de técnicas digitales eficaces de
codificación de voz/audio de banda ancha, con una buena relación
subjetiva calidad/velocidad binaria, para numerosas aplicaciones,
tales como las aplicaciones de teleconferencias de audio/vídeo, las
aplicaciones multimedia y las aplicaciones inalámbricas, así como
las aplicaciones de Internet y de redes de paquetes, está
aumentando. Hasta hace poco, los anchos de banda telefónicos,
filtrados en el intervalo de 200-3400 Hz, se
empleaban principalmente en aplicaciones para la codificación de
voz. Sin embargo, existe una demanda creciente de aplicaciones de
voz de banda ancha con el fin de incrementar la inteligibilidad y la
naturalidad de las señales de voz. Se consideró que un ancho de
banda en el intervalo de 50-7000 Hz era suficiente
para suministrar una calidad del habla cara a cara. Para las señales
de audio, este intervalo proporciona una calidad aceptable de audio,
pero aún inferior a la calidad de CD, que funciona en el intervalo
20-20000 Hz.
Un codificador de voz convierte una señal de voz
en un flujo de bits que se transmite por un canal de comunicación (o
se almacena en un medio de almacenamiento). La señal de voz se
digitaliza (se muestrea y cuantifica, normalmente con 16 bits por
muestra) y el codificador de voz tiene el papel de representar estas
muestras digitales con un número menor de bits, mientras conserva
una buena calidad subjetiva de voz. El decodificador o sintetizador
de voz trabaja sobre el flujo de bits transmitido o almacenado y lo
convierte de nuevo en una señal sonora.
En la técnica anterior, el documento
US-A-5 455 888 describe un esquema
de ampliación del ancho de banda de voz que emplea el análisis
LPC.
Una de las mejores técnicas de la técnica
anterior que es capaz de conseguir una buena relación
calidad/velocidad binaria es la llamada técnica de Predicción Lineal
Excitada por Código (CELP). Según esta técnica, la señal muestreada
de voz se trata en bloques sucesivos de L muestras
normalmente llamados tramas, donde L es un número
predeterminado (que corresponde a 10-30 ms de
habla). En la CELP, un filtro de síntesis de predicción lineal (LP)
se calcula y transmite a cada trama. Luego se divide la trama de
L muestras en bloques más pequeños, llamados subtramas, de un
tamaño de N muestras, donde L = kN y k es el número de
subtramas en una trama (N normalmente corresponde a
4-10 ms de habla). En cada subtrama se determina una
señal de excitación, que normalmente se compone de dos componentes:
uno de la excitación pasada (también llamada contribución de tono o
libro de códigos adaptativo) y el otro, de un libro de códigos
innovador (también llamado libro de códigos fijo). Esta señal de
excitación se transmite y emplea en el decodificador como la entrada
del filtro LP de síntesis con el fin de obtener el habla
sintetizada.
Un libro de códigos innovador en el contexto CELP
es un conjunto de secuencias indexado de N tramas de largo,
que se denominarán vectores códigos N-dimensionales. Cada
secuencia de libro de códigos está indexada por un entero k
que va desde 1 a M, donde M representa el tamaño del
libro de códigos, habitualmente expresado como un número b de bits,
donde M = 2^{b}.
Para sintetizar el habla según la técnica CELP,
cada bloque de N muestras se sintetiza filtrando un vector
código apropiado de un libro de códigos a través de filtros que
varían el tiempo, que modelan las características espectrales de la
señal de voz. En el extremo del codificador, la salida de síntesis
se calcula para todos, o para un subconjunto de, los vectores código
del libro de códigos (búsqueda en el libro de códigos). El vector
código conservado es el que produce la salida de síntesis más
parecida a la señal original de voz según una medida de la
distorsión ponderada perceptualmente. Esta ponderación perceptual se
realiza empleando un llamado filtro de ponderación perceptual, que
se obtiene normalmente del filtro LP de síntesis.
El modelo CELP ha sido muy exitoso en la
codificación de señales telefónicas de banda de sonido, y existen
varios estándares basados en la CELP en una amplia gama de
aplicaciones, especialmente en aplicaciones celulares digitales. En
la banda telefónica, la señal sonora se encuentra limitada en banda
a 200-3400 Hz y se muestrea a 8000 muestras/s. En
aplicaciones de voz/audio de banda ancha, la señal sonora está
limitada en banda a 50-7000 Hz y se muestrea a 16000
muestras/s.
Cuando se aplica el modelo CELP optimizado en
banda telefónica a señales de banda ancha, aparecen algunas
dificultades, y necesitan añadirse prestaciones adicionales al
modelo con el fin de obtener señales de banda ancha de alta calidad.
Las señales de banda ancha presentan un intervalo dinámico mucho más
amplio en comparación con las señales de banda telefónica, lo que da
como resultado problemas de precisión cuando se requiere una
ejecución de punto fijo del algoritmo (lo que es esencial en
aplicaciones inalámbricas). Además, frecuentemente el modelo CELP
utilizará la mayoría de sus bits codificadores en la región de baja
frecuencia, que tiene normalmente un contenido más alto de energía,
lo que da como resultado una señal de salida de paso bajo. Para
solucionar este problema, el filtro de ponderación perceptual debe
modificarse con el fin de acomodar las señales de banda ancha, y las
técnicas de preénfasis que mejoran las regiones de alta frecuencia
se vuelven importantes para reducir el intervalo dinámico,
procurando una implementación de punto fijo más sencilla, y para
garantizar una mejor codificación de los contenidos de más alta
frecuencia de la señal. Además, el contenido de tono en el espectro
de los segmentos hablados en las señales de banda ancha no se
extiende por todo el intervalo del espectro, y la cantidad de habla
muestra más variación en comparación con las señales de banda
estrecha. Por tanto, es importante mejorar el análisis de tono del
bucle cerrado para acomodar mejor las variaciones del nivel de
voz.
Cuando se aplica el modelo CELP optimizado de
banda telefónica a señales de banda ancha, surgen algunas
dificultades y deben añadirse prestaciones adicionales al modelo con
el fin de obtener señales de banda ancha de alta calidad.
Como ejemplo, con el fin de mejorar la eficacia
en la codificación y de reducir la complejidad algorítmica del
algoritmo de codificación de banda ancha, la señal de banda ancha de
entrada se diezma desde 16 kHz hasta aproximadamente 12,8 kHz. Esto
reduce el número de muestras en una trama, el tiempo de tratamiento
y el ancho de banda de la señal por debajo de 7000 Hz para permitir
así la reducción de la velocidad binaria hasta 12 kbit/s mientras se
mantiene una señal decodificada de sonido de calidad muy alta.
También se reduce la complejidad debido al número menor de muestras
por trama de habla. En el decodificador, es necesario reintroducir
los contenidos de alta frecuencia de la señal para eliminar el
efecto de filtrado de paso bajo de la señal sintetizada decodificada
y recuperar la calidad de sonido natural de las señales de banda
ancha. Con este propósito, se necesita una técnica eficaz para
recuperar el contenido de alta frecuencia de la señal de banda ancha
para producir así una señal sintetizada de banda ancha, de espectro
completo, al tiempo que se mantiene una calidad cercana a la señal
original.
Un objeto de la presente invención es, por tanto,
proporcionar una técnica eficaz de este tipo para la recuperación
del contenido de alta frecuencia.
Más concretamente, según la presente invención,
se proporciona un método para recuperar un contenido de alta
frecuencia de una señal de banda ancha, previamente diezmada, y para
inyectar el contenido de alta frecuencia en una versión sintetizada,
sobremuestreada, de la señal de banda ancha con el fin de producir
una señal sintetizada de banda ancha de espectro completo. Este
método de recuperación del contenido de alta frecuencia comprende:
la generación de una secuencia de ruido; la conformación espectral
de la secuencia de ruido en relación con unos parámetros de
conformación representativos de la señal diezmada de banda ancha; y
la inyección de la secuencia de ruido conformada espectralmente en
la versión sintetizada, sobremuestreada, de la señal para producir
así la señal sintetizada de banda ancha, de espectro completo.
Además, la presente invención trata de un
dispositivo para recuperar un contenido de alta frecuencia de una
señal de banda ancha, previamente diezmada, y para inyectar este
contenido de alta frecuencia en una versión sintetizada,
sobremuestreada, de la señal de banda ancha con el fin de producir
una señal sintetizada de banda ancha de espectro completo. Este
dispositivo de recuperación del contenido de alta frecuencia
comprende un generador de ruido para producir una secuencia de
ruido, una unidad de conformación espectral para conformar la
secuencia de ruido en relación con unos parámetros de conformación
representativos de la señal diezmada de banda ancha, y un circuito
de inyección de señales para inyectar la secuencia de ruido
conformada espectralmente en la versión sintetizada,
sobremuestreada, de la señal, para producir así la señal sintetizada
de banda ancha, de espectro completo.
Según una realización preferida, la secuencia de
ruido es una secuencia de ruido blanco.
Preferiblemente, la conformación espectral de la
secuencia de ruido comprende:
la producción de una secuencia de ruido blanco
escalada en respuesta a la secuencia de ruido blanco y a un primer
subconjunto de los parámetros de conformación; el filtrado de la
secuencia de ruido blanco escalada en relación con un segundo
subconjunto de los parámetros de conformación, que comprende unos
coeficientes de filtro de síntesis expandidos en ancho de banda para
producir una secuencia de ruido blanco escalada, filtrada,
caracterizada por una ancho de banda de frecuencias mayor, en
general, que un ancho de banda de frecuencias de la versión
sintetizada, sobremuestreada, de la señal; y el filtrado de paso
banda de la secuencia de ruido blanco filtrada, escalada, para
producir una secuencia de ruido blanco escalada, filtrada paso
banda, a inyectar posteriormente en la versión sintetizada,
sobremuestreada, de la señal como la secuencia de ruido blanco
conformada espectralmente.
Aún según la presente invención, se proporciona
un decodificador para producir una señal sintetizada de banda ancha,
que comprende:
a) un dispositivo de fragmentación de señales
para recibir una versión codificada de una señal de banda ancha,
previamente diezmada durante la codificación, y para extraer de la
versión codificada de la señal de banda ancha al menos unos
parámetros de tono de libro de códigos, unos parámetros innovadores
de libro de códigos y unos coeficientes de filtro de síntesis;
b) un libro de códigos de tono, sensible a los
parámetros del libro de códigos de tono para producir un vector
código de tono;
c) un libro de códigos innovador, sensible a los
parámetros innovadores de libro de códigos para producir un vector
código innovador;
d) un circuito combinador para combinar el vector
código de tono y el vector código innovador para producir así una
señal de excitación;
e) un dispositivo de síntesis de señales que
incluye un filtro de síntesis para filtrar la señal de excitación en
relación con los coeficientes de filtrado de síntesis, para producir
así una señal sintetizada de banda ancha, y un sobremuestreador
sensible a la señal sintetizada de banda ancha para producir una
versión sobremuestreada de la señal de la señal sintetizada de banda
ancha; y
f) un dispositivo de recuperación de contenidos
de alta frecuencia tal como se ha descrito anteriormente en el
presente documento, para recuperar un contenido de alta frecuencia
de la señal de banda ancha y para inyectar el contenido de alta
frecuencia en la versión sobremuestreada de la señal, para producir
la señal sintetizada de banda ancha, de espectro completo.
Según una realización preferida, el decodificador
comprende adicionalmente:
a) un generador de factores de voz, sensible a
los vectores código adaptativos e innovadores, para calcular un
factor de voz para enviar al módulo de ajuste de la ganancia;
b) un módulo de cálculo de energía, sensible a la
señal de excitación, para calcular una energía de excitación para
enviar al módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales,
sensible a la señal sintetizada, para calcular un factor de
escalamiento de inclinación para enviar al módulo de ajuste de la
ganancia. El primer subconjunto de parámetros de conformación
comprende el factor de voz, el factor de escalamiento de energía y
el factor de escalamiento de inclinación, y el segundo subconjunto
de los parámetros de conformación incluye coeficientes de predicción
lineal.
Según otras realizaciones preferidas del
decodificador:
- el generador de factores de voz calcula el
factor r_{v} de voz empleando la relación:
r_{v} = (E_{v} - E_{c}) /
(E_{v} +
E_{c})
donde E_{v} es la energía del vector código de
tono escalado por ganancia y E_{c} es la energía del vector código
innovador escalado por
ganancia;
- la unidad de ajuste de la ganancia calcula un
factor de escalamiento de la energía empleando la relación:
Factor \ de \ escalamiento \
de \ la \ \text{energía} =
\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cmn=0, ..., N'-1
donde w' es la secuencia de ruido blanco y
u' es una señal mejorada de excitación obtenida a partir de
la señal de
excitación;
- el calculador de inclinaciones espectrales
calcula el factor g_{t} de escalamiento de la inclinación
empleando la relación:
g_{t} = 1 -
inclinación
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v},
o la relación:
g_{t} =
10^{-0,6inclinación}
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
Preferiblemente, el filtro de paso de banda tiene
un ancho de banda de frecuencias situado entre 5,6 kHz y 7,2
kHz.
También según la presente invención, en un
decodificador para producir una señal sintetizada de banda ancha,
que comprende:
a) un dispositivo de fragmentación de señales
para recibir una versión codificada de una señal de banda ancha,
previamente diezmada durante la codificación, y para extraer de la
versión codificada de la señal de banda ancha al menos unos
parámetros de libro de códigos de tono, unos parámetros innovadores
de libro de códigos y unos coeficientes de filtro de síntesis;
b) un libro de códigos de tono, sensible a los
parámetros del libro de códigos de tono, para producir un vector
código de tono;
c) un libro de códigos innovador, sensible a los
parámetros innovadores del libro de códigos, para producir un vector
código innovador;
d) un circuito combinador para combinar el vector
código de tono y el vector código innovador, para producir así una
señal de excitación; y
e) un dispositivo de síntesis de señales que
incluye un filtro de síntesis para filtrar la señal de excitación en
relación con los coeficientes del filtro de síntesis para producir
así una señal sintetizada de banda ancha, y un sobremuestreador
sensible a la señal sintetizada de banda ancha, para producir una
versión sobremuestreada de la señal de la señal sintetizada de banda
ancha;
comprendiendo la mejora un dispositivo de
recuperación de contenidos de alta frecuencia, tal como se ha
descrito anteriormente en el presente documento, para recuperar un
contenido de alta frecuencia de la señal de banda ancha y para
inyectar el contenido de alta frecuencia en la versión
sobremuestreada de la señal para producir la señal sintetizada de
banda ancha, de espectro completo.
Por último, la presente invención comprende un
sistema de comunicación celular, una unidad transmisora/receptora
móvil celular, un elemento de red celular y un subsistema de
comunicación inalámbrica, bidireccional, que comprende el
decodificador anteriormente descrito.
Los objetos, ventajas y otras características de
la presente invención serán más evidentes con la lectura de la
siguiente descripción no restrictiva de una realización preferida de
la misma, facilitada únicamente a título de ejemplo con referencia a
los dibujos adjuntos.
\newpage
En los dibujos adjuntos:
la figura 1 es un diagrama de bloques esquemático
de una realización preferida del dispositivo codificador de banda
ancha;
la figura 2 es un diagrama de bloques esquemático
de una realización preferida del dispositivo decodificador de banda
ancha;
la figura 3 es un diagrama de bloques esquemático
de una realización preferida del dispositivo de análisis de tono;
y
la figura 4 es un diagrama de bloques
esquemático, simplificado de un sistema de comunicación celular en
el que pueden emplearse el dispositivo codificador de banda ancha de
la figura 1 y el dispositivo decodificador de banda ancha de la
figura 2.
Como saben bien aquellos individuos con una
habilidad normal en la técnica, un sistema de comunicación celular,
tal como el 401 (véase la figura 4), proporciona un servicio de
telecomunicaciones en una gran zona geográfica al dividir esa gran
zona geográfica en un número C de células más pequeñas. Unas
estaciones 402_{1}, 402_{2} ... 402_{C} base celulares
correspondientes dan servicio a las C células más pequeñas para
dotar a cada célula de canales de señalización de radio, de audio y
de datos.
Los canales de señalización de radio se emplean
para buscar por radio radioteléfonos móviles (unidades
transmisoras/receptoras móviles), tales como la 403, dentro de los
límites de la zona de cobertura (la célula) de la estación 402 base
celular, y para establecer llamadas con otros radioteléfonos 403
situados dentro o fuera de la célula de la estación base o con otra
red, tal como la Red Telefónica Pública Conmutada (RTPC) 404.
Una vez que un radioteléfono 403 ha establecido o
recibido con éxito una llamada, se establece un canal de audio o de
datos entre este radioteléfono 403 y la estación 402 base celular
que corresponde a la célula en la que está situado el radioteléfono
403, y la comunicación entre la estación 402 base y el radioteléfono
403 se realiza por ese canal de audio o de datos. El radioteléfono
403 también puede recibir información de control o de sincronización
por un canal de señalización mientras una llamada está en curso.
Si un radioteléfono 403 deja una célula y entra
en otra célula adyacente mientras una llamada está en curso, el
radioteléfono 403 traspasa la llamada a un canal disponible de audio
o de datos de la nueva estación 402 base celular. Si un
radioteléfono 403 deja una célula y entra en otra célula adyacente
cuando no hay llamada alguna en curso, el radioteléfono 403 envía un
mensaje de control por el canal de señalización para entrar en la
estación 402 base de la nueva célula. De esta manera es posible la
comunicación móvil en una amplia zona geográfica.
El sistema 401 de comunicación celular comprende
adicionalmente un terminal 405 de control para controlar la
comunicación entre las estaciones 402 base celulares y la RTPC 404,
por ejemplo, durante una comunicación entre un radioteléfono 403 y
la RTPC 404, o entre un radioteléfono 403 situado en una primera
célula y un radioteléfono 403 situado en una segunda célula.
Por supuesto, se requiere un subsistema de
radiocomunicaciones inalámbrico, bidireccional para establecer un
canal de audio o de datos entre una estación 402 base de una célula
y un radioteléfono 403 situado en esa célula. Tal como se ha
ilustrado de manera muy simplificada en la figura 4, este tipo de
subsistema inalámbrico, bidireccional, de radiocomunicaciones
comprende típicamente en el radioteléfono 403:
- un transmisor 406 que incluye:
- -
- un codificador 407 para codificar la señal de voz; y
- -
- un circuito 408 transmisor para transmitir la señal codificada de voz procedente del codificador 407 por una antena, tal como la 409; y
- un receptor 410 que incluye:
- -
- un circuito 411 receptor para recibir una señal codificada, transmitida, de voz, normalmente por la misma antena 409; y
- -
- un decodificador 412 para decodificar la señal codificada, recibida, de voz procedente del circuito 411 receptor.
El radioteléfono comprende adicionalmente otros
circuitos 413 radiotelefónicos convencionales a los que están
conectados el codificador 407 y el decodificador 412, y para tratar
las señales procedentes de los mismos, circuitos 413 que son bien
conocidos por aquellos individuos de habilidad normal en la técnica
y, por consiguiente, no se describirán más en la presente memoria
descriptiva.
Asimismo, este tipo de subsistema inalámbrico,
bidireccional, de radiocomunicaciones comprende típicamente en la
estación 402 base celular:
- un transmisor 414 que incluye:
- -
- un codificador 415 para codificar la señal de voz; y
- -
- un circuito 416 transmisor para transmitir la señal codificada de voz procedente del codificador 415 por una antena, tal como la 417; y
- un receptor 418 que incluye:
- -
- un circuito 419 receptor para recibir una señal codificada, transmitida, de voz por la misma antena 417 o por otra antena (no mostrada); y
- -
- un decodificador 420 para decodificar la señal codificada, recibida, de voz procedente del circuito 419 receptor.
Típicamente, la estación 402 base celular
comprende adicionalmente un controlador 421 de estación base, junto
con su base 422 de datos asociada, para controlar las comunicaciones
entre el terminal 405 de control y el transmisor 414 y el receptor
418.
Tal como es bien sabido por aquellos individuos
con una habilidad normal en la técnica, la codificación de voz se
requiere con el fin de reducir el ancho de banda necesario para
transmitir una señal de sonido, por ejemplo, una señal de voz tal
como el habla, a través del subsistema de radiocomunicaciones,
inalámbricas bidireccionales es decir, entre un radioteléfono 403 y
una estación 402 base.
Los codificadores LP de voz (tales como el 415 y
el 407), que funcionan típicamente a 13 kbits/segundo y menos, tales
como los codificadores de Predicción Lineal Excitada por Código
(CELP), típicamente emplean un filtro LP de síntesis para modelar la
envolvente espectral a corto plazo de la señal de voz. Típicamente,
la información LP se transmite cada 10 o 20 ms al decodificador (tal
como el 420 y el 412) y se extrae en el extremo del
decodificador.
Las técnicas novedosas descritas en la presente
memoria descriptiva pueden aplicarse a diferentes sistemas de
codificación basados en la LP. Sin embargo, en la realización
preferida se emplea un sistema de codificación de tipo CELP con el
propósito de presentar un ejemplo no limitativo de estas técnicas.
De la misma manera, tales técnicas pueden emplearse con señales
sonoras distintas de la voz y el habla, así como con otros tipos de
señales de banda ancha.
La figura 1 muestra un diagrama de bloques
general de un dispositivo 100 de codificación de voz de tipo CELP,
modificado para acomodar mejor las señales de banda ancha.
La señal 114 muestreada de voz, de entrada, se
divide en bloques sucesivos de L muestras llamados
"tramas". En cada trama, se calculan, codifican y transmiten
diferentes parámetros que representan la señal de voz en la trama.
Unos parámetros LP que representan el filtro LP de síntesis, se
calculan normalmente una vez por trama. Adicionalmente, la trama se
divide en bloques más pequeños de N muestras (bloques de
longitud N), en los que se determinan los parámetros de
excitación (tono e innovación). En la literatura CELP, estos bloques
de longitud N se llaman "subtramas", y las señales de
N muestras en las subtramas se denominan vectores
N-dimensionales. En esta realización preferida, la longitud
N corresponde a 5 ms, mientras que la longitud L
corresponde a 20 ms, lo que significa que una trama contiene cuatro
subtramas (N = 80 a la velocidad de muestreo de 16 kHz, y 64
tras un diezmado a 12,8 kHz). Durante el procedimiento de
codificación se producen varios vectores N-dimensionales. A
continuación, en el presente documento, se presenta una lista con
los vectores que aparecen en las figuras 1 y 2, así como una lista
de los parámetros transmitidos:
s | Vector de voz de entrada de la señal de banda ancha (tras el diezmado, el |
pretratamiento y el preénfasis); | |
s_{w} | Vector de voz ponderado; |
s_{0} | Respuesta de entrada nula del filtro de síntesis ponderado; |
s_{p} | Señal pretratada diezmada; |
Señal sintetizada, sobremuestreada, de voz; | |
s' | Señal de síntesis antes del deénfasis; |
s_{d} | Señal deenfatizada de síntesis; |
s_{h} | Señal de síntesis tras el deénfasis y el postratamiento; |
x | Vector objetivo para la búsqueda de tono; |
x' | Vector objetivo para la búsqueda de la innovación; |
h | Respuesta ponderada de impulso del filtro de síntesis; |
v_{T} | Vector del libro de códigos adaptativo (tono) para el retardo T; |
y_{T} | Vector filtrado del libro de códigos de tono (v_{T} convolucionado con h); |
c_{k} | Vector código innovador en el índice k (k-ésima entrada del libro de códigos de innovación); |
c_{f} | Vector código de innovación mejorado, escalado; |
u | Señal de excitación (vectores código de innovación y de tono escalados); |
u' | Excitación mejorada; |
z | Secuencia de ruido de paso de banda; |
w' | Secuencia de ruido blanco; y |
w | Secuencia de ruido escalada. |
STP | Parámetros de predicción a corto plazo (definen A(z)); |
T | Retardo de tono (o índice del libro de códigos de tono); |
b | Ganancia de tono (o ganancia del libro de códigos de tono); |
j | Índice del filtro de paso bajo empleado con el vector código de tono; |
k | Índice del vector código (entrada del libro de códigos de innovación); y |
g | Ganancia del libro de códigos de innovación. |
En esta realización preferida, los parámetros STP
se transmiten una vez por trama y el resto de los parámetros se
transmite cuatro veces por trama (cada subtrama).
La señal muestreada de voz es codificada bloque a
bloque por el dispositivo 100 codificador de la figura 1, que está
dividido en once módulos numerados de 101 a 111.
El habla de entrada se trata en los bloques de
L muestras, llamados tramas, mencionados anteriormente.
Haciendo referencia a la figura 1, la señal 114
muestreada de voz, de entrada, se diezma en un módulo 101 diezmador.
Por ejemplo, la señal se diezma desde 16 kHz hasta 12,8 kHz,
empleando técnicas bien conocidas por aquellos individuos con una
habilidad normal en la técnica. Por supuesto, puede preverse el
diezmado hasta otra frecuencia. El diezmado aumenta la eficacia de
la codificación, puesto que se codifica un ancho de banda de
frecuencias más pequeño. Esto también reduce la complejidad
algorítmica dado que se reduce el número de muestras en una trama.
El empleo del diezmado adquiere importancia cuando la velocidad
binaria se reduce a menos de 16 kbit/s, aunque el diezmado no es
esencial por encima de 16 kbit/s.
Tras el diezmado, la trama de 320 muestras, de 20
ms, se reduce a una trama de 256 muestras (una proporción de
diezmado de 4/5).
La trama de entrada se suministra entonces al
bloque 102 opcional de pretratamiento. El bloque 102 de
pretratamiento puede componerse de un filtro de paso alto con una
frecuencia de corte de 50 Hz. El filtro 102 de paso alto elimina los
componentes de ruido no deseados por debajo de 50 Hz.
La señal pretratada, diezmada, viene indicada por
s_{p}(n), n = 0, 1, 2, ..., L - 1, donde
L es la longitud de la trama (256 con una frecuencia de
muestreo de 12,8 kHz). En una realización preferida del filtro 103
de preénfasis, la señal s_{p}(n) se preenfatiza empleando
un filtro que tiene la siguiente función de transferencia:
P(z) = 1 - \mu
z^{-1}
donde \mu es un factor de preénfasis con un
valor situado entre 0 y 1 (un valor típico es \mu = 0,7). También
podría emplearse un filtro de mayor orden. Debe indicarse que el
filtro 102 de paso alto y el filtro 103 de preénfasis pueden
intercambiarse para obtener ejecuciones de punto fijo más
eficaces.
La función de filtro 103 de preénfasis es mejorar
el contenido de alta frecuencia de la señal de entrada. También
reduce el intervalo dinámico de la señal de voz de entrada, lo que
la hace más adecuada para la ejecución de punto fijo. Sin el
preénfasis, el análisis LP en punto fijo utilizando una aritmética
de precisión finita es difícil de ejecutar.
El preénfasis también desempeña un papel
importante para conseguir una ponderación perceptual global adecuada
del error de cuantificación, lo que contribuye a una calidad sonora
mejorada. Esto se explicará con más detalle a continuación en el
presente documento.
La salida del filtro 103 de preénfasis se denota
como s(n). Esta señal se emplea para realizar el
análisis LP en el módulo 104 calculador. El análisis LP es una
técnica que conocen bien aquellos individuos de habilidad normal en
la técnica. En esta realización preferida, se utiliza el enfoque de
autocorrelación. Desde el punto de vista de la autocorrelación,
primero se aplica una ventana a la señal s(n)
empleando una ventana de Hamming (que normalmente tiene una longitud
del orden de 30-40 ms). Las autocorrelaciones se
calculan a partir de la señal a la que se ha aplicado la ventana, y
se emplea la recursión de Levison-Durbin para
calcular los coeficientes del filtro LP, a_{j}, donde i =
1, ..., p, y donde p es el orden LP, que normalmente
es 16 en la codificación de banda ancha. Los parámetros a_{i} son
los coeficientes de la función de transferencia del filtro LP, que
viene dada por la siguiente relación:
A(z) =
1\sum\limits^{p}_{j=1}a_{j}z^{-1}
El análisis LP se realiza en el módulo 104
calculador, que también realiza la cuantificación y la interpolación
de los coeficientes del filtro LP. Los coeficientes del filtro LP se
transforman primero en otro dominio equivalente más adecuado para
los propósitos de cuantificación e interpolación. Los dominios del
par espectral de línea (LSP) y del par espectral de inmitancia (ISP)
son dos dominios en los que puede realizarse eficazmente la
cuantificación y la interpolación. Los 16 coeficientes del filtro
LP, a_{i}, pueden cuantificarse en el orden de 30 a 50 bits
utilizando la cuantificación dividida o la multietapa, o una
combinación de las mismas. El fin de la interpolación es permitir la
actualización de los coeficientes del filtro LP cada subtrama
mientras se transmiten una vez por trama, lo que mejora el
rendimiento del codificador sin incrementar la velocidad binaria. Se
supone que la cuantificación e interpolación de los coeficientes del
filtro LP son bien conocidas por aquellos individuos con una
habilidad normal en la técnica y, por consiguiente, no se describirá
adicionalmente en la presente memoria descriptiva.
Los siguientes párrafos describirán el resto de
las operaciones de codificación realizadas en base a las subtramas.
En la siguiente descripción, el filtro A(z) denota el
filtro LP interpolado, no cuantificado, de la subtrama, y el filtro
Â(z) denota el filtro LP interpolado, cuantificado, de
la subtrama.
En los codificadores de análisis por síntesis,
los parámetros óptimos de tono e innovación se buscan minimizando el
error cuadrático medio entre el habla de entrada y el habla
sintetizada en un dominio ponderado perceptualmente. Esto es
equivalente a minimizar el error entre el habla ponderada de entrada
y el habla ponderada de síntesis.
La señal s_{w}(n) ponderada se calcula
en un filtro 105 de ponderación perceptual. Tradicionalmente, la
señal s_{w}(n) ponderada es calculada por un filtro
ponderador que tiene una función W(z) de
transferencia de la forma:
W(z) =
A(z/\gamma_{1}) /
A(z/\gamma_{2})
donde 0 < \gamma_{2} < \gamma_{1}
\leq 1.Como es bien sabido por aquellos individuos de habilidad
normal en la técnica, en los codificadores de análisis por síntesis
(AbS) de la técnica anterior, el análisis muestra que el error de
cuantificación está ponderado por una función W^{-1}(z) de
transferencia, que es la inversa de la función de transferencia del
filtro 105 de ponderación perceptual. Este resultado lo describen
bien B.S. Atal y M.R. Schroeder en "Predictive coding of speech
and subjective error criteria", IEEE Transaction ASSP, vol. 27,
nº 3, págs. 247-254, Junio 1979. La función
W^{-1}(z) de transferencia exhibe algo de la estructura
formante de la señal de voz de entrada. Por tanto, se aprovecha la
propiedad de enmascaramiento del oído humano al conformar el error
de cuantificación, de manera que ésta tiene más energía en las
regiones formantes, donde estará enmascarada por la fuerte energía
de señal presente en estas regiones. La cantidad de ponderación está
controlada por los factores \gamma_{1}y
\gamma_{2}.
El anterior filtro 105 de ponderación perceptual
tradicional funciona bien con señales de banda telefónica. Sin
embargo, se encontró que este filtro 105 de ponderación perceptual
tradicional no es adecuado para la eficiente ponderación perceptual
de las señales de banda ancha. También se encontró que el filtro 105
de ponderación perceptual tradicional tiene limitaciones inherentes
al modelar simultáneamente la estructura formante y la inclinación
espectral requerida. La inclinación espectral es más pronunciada en
las señales de banda ancha debido al amplio intervalo dinámico entre
las frecuencias bajas y altas. La técnica anterior ha sugerido
añadir un filtro de inclinación en W(z) con el fin de
controlar por separado la ponderación de la inclinación y de la
formante de la señal de entrada de banda ancha.
Una solución novedosa a este problema es, según
la presente invención, introducir el filtro 103 de preénfasis en la
entrada, calcular el filtro LP A(z) basándose en el
habla s(n) preenfatizada, y utilizar un filtro
W(z) modificado fijando su denominador.
\newpage
El análisis LP se realiza en el módulo 104, sobre
la señal s(n) preenfatizada para obtener el filtro LP
A(z). Asimismo, se emplea un nuevo filtro 105 de
ponderación perceptual con denominador fijo. Un ejemplo de función
de transferencia para el filtro 104 de ponderación perceptual viene
dado por la siguiente relación:
W(z) =
A(z/\gamma_{1}) / (1 -
\gamma_{2}z^{-1})
donde 0 < \gamma_{2} < \gamma_{1}
\leq
1.
En el denominador puede emplearse un orden mayor.
Esta estructura desacopla sustancialmente la ponderación de la
formante de la inclinación.
Obsérvese que dado que A(z) se
calcula basándose en la señal s(n) preenfatizada de
voz, la inclinación del filtro 1/A(z/\gamma_{1}) es menos
pronunciada en comparación con el caso en el que A(z)
se calcula sobre la base del habla original. Puesto que el deénfasis
se realiza en el extremo del decodificador empleando un filtro que
tiene la función de transferencia:
P^{-1}(z) = 1/(1 - \mu
z^{-1}),
el espectro del error de cuantificación está
conformado por un filtro que tiene una función
W^{-1}(z)P^{-1}(z) de transferencia. Cuando
\gamma_{2} se hace igual a \mu, lo que típicamente es el caso,
el espectro del error de cuantificación está conformado por un
filtro cuya función de transferencia es
1/A(z/\gamma_{1}), con A(z) calculada sobre
la base de la señal preenfatizada de voz. La escucha subjetiva
mostró que esta estructura para conseguir la conformación del error
mediante una combinación del preénfasis y el filtrado ponderado,
modificado, es muy eficaz para codificar señales de banda ancha,
además de las ventajas de la facilidad de la ejecución algorítmica
de punto
fijo.
Con el fin de simplificar el análisis del tono,
primero se estima un retardo T_{OL} de tono, de bucle abierto, en
el módulo 106 de búsqueda de tono, de bucle abierto, empleando la
señal s_{w}(n) ponderada de voz. A continuación, el
análisis del tono, de bucle cerrado, que se realiza en el módulo 107
de búsqueda de tono, de bucle cerrado, basado en subtramas, está
limitado en torno al retardo T_{OL} de tono, de bucle abierto, que
reduce significativamente la complejidad de búsqueda de los
parámetros T y b LTP (retardo de tono y ganancia de
tono). El análisis de tono, de bucle abierto, se realiza normalmente
en el módulo 106 una vez cada 10 ms (dos subtramas), empleando
técnicas bien conocidas por aquellos individuos de habilidad normal
en la técnica.
El vector x objetivo para el análisis LTP
(Predicción a Largo Plazo) se calcula primero. Habitualmente, esto
se realiza restando la respuesta s_{0} de entrada nula del filtro
W(z)/Â(z) de síntesis ponderado de la
señal s_{w}(n) ponderada de voz. Esta respuesta s_{0} de
entrada nula es calculada por un calculador 108 de respuesta de
entrada nula. Más concretamente, el vector x objetivo se
calcula empleando la siguiente relación:
x = s_{w} -
s_{0}
donde x es el vector objetivo
N-dimensional, s_{w} es el vector ponderado de voz en la
subtrama, y s_{0} es la respuesta de entrada nula del filtro
W(z)/Â(z), que es la salida del filtro
W(z)/Â(z) combinado debido a sus estados
iniciales. El calculador 108 de respuesta de entrada nula es
sensible al filtro Â(z) LP interpolado, cuantificado,
del análisis LP, al calculador 104 de cuantificación e interpolación
y a los estados iniciales del filtro
W(z)/Â(z) ponderado de síntesis
almacenado en el módulo 111 de memoria, para calcular la respuesta
s_{0} de entrada nula (esa parte de la respuesta debida a los
estados iniciales, tal como se determina al hacer las entradas
iguales a cero) del filtro W(z)/Â(z).
Esta operación es bien conocida por aquellos individuos de habilidad
normal en la técnica y, por consiguiente, no se describirá
adicionalmente.
Por supuesto, pueden emplearse enfoques
alternativos pero matemáticamente equivalentes para calcular el
vector x objetivo.
Un vector h N-dimensional de
respuesta de impulso del filtro
W(z)/Â(z) ponderado de síntesis se
calcula en el generador 109 de respuesta de impulsos empleando los
coeficientes A(z) y Â(z) del filtro LP
procedentes del módulo 104. De nuevo, esta operación es bien
conocida por aquellos individuos de habilidad normal en la técnica
y, por consiguiente, no se describirá adicionalmente en la presente
memoria descriptiva.
Los parámetros b, T y j de
tono, de bucle cerrado, (o de libro de códigos de tono), se calculan
en el módulo 107 de búsqueda de tono, de bucle cerrado, que emplea
como entradas el vector x objetivo, el vector h de
respuesta de impulsos y el retardo T_{OL} de tono, de bucle
abierto. Tradicionalmente, la predicción de tono ha estado
representada por un filtro de tono que tiene la siguiente función de
transferencia:
1 / (1 -
bz^{-T})
donde b es la ganancia de tono y T
es el retraso o retardo de tono. En este caso, la contribución de
tono a la señal u(n) de excitación viene dada por
bu (n - T), donde la excitación total viene
dada
por
u(n) = bu(n -
T) +
gc_{k}(n)
con g siendo la ganancia innovadora de
libro de códigos y c_{k}(n) el vector código innovador en
el índice
k.
Esta representación tiene limitaciones si el
retardo T de tono es más corto que la longitud N de
subtrama. En otra representación, la contribución de tono puede
verse como un libro de códigos de tono que contiene la señal
anterior de excitación. En general, cada vector en el libro de
códigos de tono es una versión desplazada una unidad del vector
anterior (desechando una muestra y añadiendo una nueva muestra).
Para retardos de tono T > N, el libro de códigos de
tono es equivalente a la estructura (1/(1 - bz^{-T})) de filtro,
y un vector v_{T}(n) de libro de códigos de tono, para el
retardo T de tono, viene dado por
v_{T}(n) = u (n -
T),
n = 0, ..., N -
1.
Para retardos T de tono más cortos que
N, se construye un vector v_{T}(n) repitiendo las
muestras disponibles a partir de la excitación pasada hasta que se
completa el vector (esto no es equivalente a la estructura del
filtro).
En codificadores recientes, se emplea una mayor
resolución de tono que mejora significativamente la calidad de los
segmentos de sonido hablados. Esto se consigue mediante el
sobremuestreo de la señal anterior de excitación, empleando filtros
polifásicos de interpolación. En este caso, el vector
v_{T}(n) corresponde normalmente a una versión interpolada
de la excitación pasada, con el retardo T de tono siendo un
retraso no entero (por ejemplo, 50,25).
La búsqueda de tono consiste en encontrar el
mejor retardo T y ganancia b de tono que minimizan el
error E cuadrático medio ponderado entre el vector x
objetivo y la excitación pasada, filtrada, escalada. Estando
expresado el error E como:
E =
||x-by_{T}||^{2}
donde y_{T} es el vector filtrado de libro de
códigos de tono para el retardo T de
tono:
y_{T}(n) = v_{T}(n) *
h(n) =
\sum\limits^{n}_{i=0}v_{T}(i)h(n-i),
\hskip0,5cmn=0,...N-1
Puede mostrarse que el error E se minimiza
maximizando el criterio de búsqueda
C =
\frac{x^{1}y_{T}}{\sqrt{y^{t}_{T}y_{T}}}
donde t denota la transpuesta del
vector.
En la realización preferida de la presente
invención, se emplea una resolución de tono de submuestra de 1/3, y
la búsqueda de tono (libro de códigos de tono) se compone de tres
etapas.
En la primera etapa se estima un retardo T_{OL}
de tono, de bucle abierto, en el módulo 106 de búsqueda de tono, de
bucle abierto, en respuesta a la señal s_{w}(n) ponderada
de voz. Tal como se ha indicado en la descripción anterior, este
análisis de tono, de bucle abierto, se realiza normalmente una vez
cada 10 ms (dos subtramas) empleando técnicas bien conocidas por
aquellos individuos de habilidad normal en la técnica.
En la segunda etapa, el criterio C de
búsqueda se busca en el módulo 107 de búsqueda de tono, de bucle
cerrado, para retardos de tono enteros alrededor del retardo
T_{OL} de tono, de bucle abierto, estimado, (normalmente \pm 5),
lo que simplifica significativamente el procedimiento de búsqueda.
Se emplea un procedimiento sencillo para actualizar el vector código
y_{T} filtrado sin necesidad de calcular la convolución para cada
retardo de tono.
\newpage
Una vez que se encuentra un retardo de tono,
entero, óptimo, en la segunda etapa, una tercera etapa de la
búsqueda (módulo 107) evalúa las fracciones alrededor de ese retardo
de tono, entero, óptimo.
Cuando el predictor de tono está representado por
un filtro de la forma 1 / (1 - bz^{-T}), lo que es una suposición
válida para retardos de tono T > N, el espectro del
filtro de tono exhibe una estructura armónica en todo el intervalo
de frecuencia, con una frecuencia armónica relacionada con
1/T. En caso de señales de banda ancha, esta estructura no es
muy eficaz puesto que la estructura armónica en las señales de
banda ancha no cubre la totalidad del espectro ampliado. La
estructura armónica existe solamente hasta una cierta frecuencia,
dependiendo del segmento de habla. Por tanto, con el fin de
conseguir una representación eficaz de la contribución del tono en
segmentos hablados de habla de banda ancha, el filtro de predicción
de tono necesita tener la flexibilidad de variar la cantidad de
periodicidad en el espectro de banda ancha.
Un nuevo método que logra una modelización eficaz
de la estructura armónica del espectro de voz de señales de banda
ancha se describe en la presente memoria descriptiva, por lo cual se
aplican varias formas de filtros de paso bajo a la excitación pasada
y se selecciona el filtro de paso bajo con la ganancia más alta de
predicción.
Cuando se emplea una resolución de tono de
subtrama, los filtros de paso bajo pueden incorporarse en los
filtros de interpolación empleados para obtener la mayor resolución
de tono. En este caso, la tercera etapa de la búsqueda de tono, en
la que se evalúan las fracciones alrededor del retardo de tono,
entero, elegido, se repite para los varios filtros de interpolación
que tienen diferentes características de paso bajo, y se seleccionan
la fracción y el índice de filtro que maximizan el criterio C
de búsqueda.
Un enfoque más sencillo es completar la búsqueda
en las tres etapas descritas anteriormente, para determinar el
retardo de tono, fraccional, óptimo, empleando únicamente un filtro
de interpolación con una cierta respuesta de frecuencia, y
seleccionar al final la forma óptima de filtro de paso bajo
aplicando los diferentes filtros de paso bajo predeterminados al
vector v_{T} elegido de libro de códigos de tono, y seleccionar el
filtro de paso bajo que minimiza el error de predicción de tono.
Este enfoque se expone en detalle a continuación.
La figura 3 ilustra un diagrama de bloques
esquemático de una realización preferida del enfoque propuesto.
En el módulo 303 de memoria se almacena la
anterior señal u(n) de excitación, n < 0. El
módulo 301 de búsqueda del libro de códigos de tono es sensible al
vector x objetivo, al retardo T_{OL} de tono, de bucle
abierto, y a la anterior señal u(n) de excitación,
n < 0, procedente del módulo 303 de memoria, para realizar
una búsqueda del libro de códigos de tono (libro de códigos de tono)
que minimice el criterio C de búsqueda anteriormente
definido. A partir del resultado de la búsqueda realizada en el
módulo 301, el módulo 302 genera el vector v_{T} óptimo de libro
de códigos de tono. Cabe observarse que, puesto que se emplea una
resolución de tono de submuestra (tono fraccional), la anterior
señal u(n) de excitación, n < 0, se
interpola y el vector v_{T} de libro de códigos de tono
corresponde a la anterior señal de excitación interpolada. En esta
realización preferida, el filtro de interpolación (en el módulo 301,
pero no mostrado) tiene una característica de filtro de paso bajo
que elimina los contenidos de frecuencia por encima de 7000 Hz.
En una realización preferida, se emplean K
características de filtro; estas características de filtro podrían
ser características de filtro de paso bajo o de paso de banda. Una
vez que el vector código v_{T} óptimo es determinado y
suministrado por el generador 302 de vectores código de tono, se
calculan K versiones filtradas de v_{T} empleando
respectivamente K filtros de conformación de frecuencia
diferentes, tales como los 305^{(j)}, donde j = 1, 2, ...,
K. Estas versiones filtradas se denotan por v^{(j)}_{f},
donde j = 1, 2, ..., K. Los diferentes vectores
v^{(j)}_{f} se convolucionan en unos módulos 304^{(j)}
respectivos, donde j = 0, 1, 2, ..., K, con la
respuesta h de impulso para obtener los vectores y^{(j)},
donde j = 0, 1, 2, ..., K. Para calcular el error
cuadrático medio de predicción de tono para cada vector y^{(j)},
el valor y^{(j)} se multiplica por la ganancia b mediante un
amplificador 307^{(j)} correspondiente, y el valor by^{(j)} se
resta del vector x objetivo mediante un restador 308^{(j)}
correspondiente. El selector 309 selecciona el filtro 305^{(j)} de
conformación de frecuencia, que minimiza el error cuadrático medio
de predicción de tono
e^{(j)} =
||x-b^{(j)}y^{(j)}||^{2},
j = 1,2, ..., K
Para calcular el error e^{(j)} cuadrático medio
de predicción de tono para cada valor de y^{(j)}, el valor
y^{(j)} se multiplica por la ganancia b mediante un
amplificador 307^{(j)} correspondiente, y el valor
b^{(j)}y^{(j)} se resta del vector x objetivo mediante
los restadores 308^{(j)}. Cada ganancia b^{(j)} se calcula en un
calculador 306^{(j)} de ganancia correspondiente, en asociación
con el filtro de conformación de frecuencia en el índice j,
empleando la siguiente relación:
b^{(j)} =
x^{1}y^{(j)}/||y^{(j)}||^{2}
En el selector 309, los parámetros b,
T y j se eligen basándose en v_{T} o
v^{(j)}_{f}, lo que minimiza el error e cuadrático medio
de predicción de tono.
Haciendo referencia de nuevo a la figura 1, el
índice T de libro de códigos de tono se codifica y transmite
al multiplexor 112. La ganancia b de tono se cuantifica y
transmite al multiplexor 112. Con este nuevo enfoque, se necesita
información adicional para codificar el índice j del filtro
de conformación de frecuencia seleccionado en el multiplexor 112.
Por ejemplo, si se emplean tres filtros (j = 0, 1, 2, 3),
entonces se necesitan dos bits para representar esta información. La
información del índice j de filtro también puede codificarse
conjuntamente con la ganancia b de tono.
Una vez que se determinan el tono o los
parámetros LTP (Predicción a Largo Plazo) b, T y
j, la siguiente etapa es buscar la excitación innovadora
óptima mediante el módulo 110 de búsqueda de la figura 1. Primero,
el vector x objetivo se actualiza restando la contribución
LTP:
x' = x -
by_{T}
donde b es la ganancia de tono e y_{T}
es el vector filtrado de libro de códigos de tono (la excitación
anterior en el retraso T, filtrada con el filtro seleccionado
de paso bajo y convolucionada con la respuesta h de impulso,
tal como se ha descrito con referencia a la figura
3).
El procedimiento de búsqueda en la CELP se
realiza buscando el vector código c_{k} de excitación óptimo y la
ganancia g que minimizan el error cuadrático medio entre el
vector objetivo y el vector código filtrado, escalado
E = ||x' -
gHc_{k}||^{2}
donde H es una matriz triangular inferior
de convolución, obtenida a partir del vector h de respuesta
de
impulso.
En la realización preferida de la presente
invención, la búsqueda de libro de códigos innovador se realiza en
el módulo 110 mediante un libro de códigos algebraico, tal como se
describe en las patentes estadounidenses 5.444.816 (Adoul et al),
concedida el 22 de agosto de 1995; 5.699.482, concedida a Adoul et
al el 17 de diciembre de 1997; 5.754.976, concedida a Adoul et al el
19 de mayo de 1998; y 5.701.392 (Adoul et al), fechada en el 23 de
diciembre de 1997.
Una vez que el vector código c_{k} óptimo de
excitación y su ganancia g son elegidos por el módulo 110, el
índice k de libro de códigos y la ganancia g se
codifican y transmiten al multiplexor 112.
Haciendo referencia a la figura 1, los parámetros
b, T, Â(z), k y g se multiplexan
a través del multiplexor 112 antes de transmitirse por un canal de
comunicación.
En el módulo 111 de memoria (figura 1) se
actualizan los estados del filtro
W(z)/Â(z) ponderado de síntesis mediante
el filtrado de la señal u = gc_{k} + bv_{T} de excitación
a través del filtro ponderado de síntesis. Tras este filtrado, los
estados del filtro se memorizan y emplean en la siguiente subtrama
como estados iniciales para calcular la respuesta de entrada nula en
el módulo 108 calculador.
Tal como en el caso del vector x objetivo,
pueden emplearse otros enfoques alternativos, pero matemáticamente
equivalentes, bien conocidos por aquellos individuos de habilidad
normal en la técnica, para actualizar los estados de los
filtros.
El dispositivo 200 decodificador de voz de la
figura 2 ilustra las varias etapas llevadas a cabo entre la entrada
222 digital (flujo de entrada al demultiplexor 217) y el habla 223
muestreada de salida (salida del sumador 221).
El demultiplexor 217 extrae los parámetros del
modelo de síntesis a partir de la información binaria recibida de un
canal digital de entrada. A partir de cada trama binaria recibida,
los parámetros extraídos son:
- los parámetros Â(z) de predicción a
corto plazo (STP) (una vez por trama);
- los parámetros T, b y j de
predicción a largo plazo (LTP) (para cada subtrama); y
- el índice k del libro de códigos de
innovación y la ganancia g (para cada subtrama).
La señal actual de voz se sintetiza basándose en
estos parámetros, tal como se explicará a continuación en el
presente documento.
El libro 218 de códigos innovador es sensible al
índice k para producir el vector código c_{k} de
innovación, que está escalado por el factor g decodificado de
ganancia a través de un amplificador 224. En la realización
preferida, un libro 218 de códigos innovador, tal como el descrito
en las patentes estadounidenses 5.444.816; 5.669.482; 5.754.976; y
5.701.392, mencionadas anteriormente, se emplea para representar el
vector código c_{k} innovador.
El vector código gc_{k} generado, escalado, en
la salida del amplificador 224, se trata a través de un filtro 205
de innovación.
El vector código generado, escalado, en la salida
del amplificador 224 se trata a través de un dispositivo 205 de
mejora de tono, dependiente de la frecuencia.
La mejora de la periodicidad de la señal u
de excitación mejora la calidad en caso de segmentos hablados. En el
pasado, esto se hizo filtrando el vector de innovación del libro 218
de códigos innovador (libro de códigos fijo) a través de un filtro
en forma de 1/(1 - \varepsilonbz^{-T}), donde e es un factor
menor que 0,5 que controla la cantidad de periodicidad introducida.
Este enfoque es menos eficaz en caso de señales de banda ancha ya
que introduce periodicidad en todo el espectro. Se describe un nuevo
enfoque alternativo, que es parte de la presente invención, por el
cual la mejora de la periodicidad se consigue filtrando el vector
código c_{k} innovador del libro de códigos innovador (fijo) a
través de de un filtro 205 de innovación (F(z)), cuya
respuesta en frecuencia enfatiza las frecuencias superiores más que
las frecuencias inferiores. Los coeficientes de F(z)
están relacionados con la cantidad de periodicidad en la señal
u de excitación.
Muchos métodos conocidos por los expertos en la
técnica están disponibles para obtener coeficientes de periodicidad
válidos. Por ejemplo, el valor de la ganancia b proporciona
una indicación de la periodicidad. Es decir, si la ganancia b
es próxima a 1, la periodicidad de la señal u de excitación
es alta, y si la ganancia b es menor que 0,5, entonces la
periodicidad es baja.
Otra manera eficaz de obtener los coeficientes
del filtro F(z) empleados en una realización
preferida, es relacionarlos a la cantidad de contribución de tono en
la señal u total de excitación. Esto tiene como resultado una
respuesta en frecuencia que depende de la periodicidad de subtrama,
donde las frecuencias más altas están más enfatizadas (pendiente
total más pronunciada) para las ganancias de tono más elevadas. El
filtro 205 de innovación tiene el efecto de reducir la energía del
vector código c_{k} innovador en las frecuencias bajas cuando la
señal u de excitación es más periódica, lo que mejora la
periodicidad de la señal u de excitación para frecuencias más
bajas más que para frecuencias altas. Formas sugeridas para el
filtro 205 de innovación son
(1)F(z) = 1 - \sigma
z^{-1},
(2)F(z) = \alpha z +
1 - \alpha
z^{-1}
o
donde \sigma o \alpha son factores de
periodicidad obtenidos del nivel de periodicidad de la señal
u de excitación.
La segunda forma de tres términos de
F(z) se emplea en una realización preferida. El factor
\alpha de periodicidad se calcula en el generador 204 de factores
de voz. Pueden emplearse varios métodos para obtener el
factor
\alpha de periodicidad basándose en la periodicidad de la señal u de excitación. A continuación, se presentan dos métodos.
\alpha de periodicidad basándose en la periodicidad de la señal u de excitación. A continuación, se presentan dos métodos.
La relación entre la contribución de tono y la
señal u total de excitación se calcula primero en el
generador 204 de factores de voz mediante
R_{p} =
\frac{b^{2}v_{T}{}^{t} v_{T}}{u^{t}u} =
\frac{b^{2}\sum\limits^{N-1}_{n=0}v_{T}{}^{2}(n)}{\sum\limits^{N-1}_{n=0}u^{2}(n)}
donde v_{T} es el vector del libro de códigos
de tono, b es la ganancia de tono, y u es la señal
u de excitación dada a la salida del sumador 219
por
u = gc_{k} +
bv_{T}
Cabe observarse que el término bv_{T} tiene su
origen en el libro 201 de códigos de tono (libro de códigos de tono)
en respuesta al retardo T de tono y al valor anterior de
u almacenado en la memoria 203. El vector código v_{T} de
tono del libro 201 de códigos de tono se trata entonces a través de
un filtro 202 de paso bajo cuya frecuencia de corte se ajusta
mediante el índice j del demultiplexor 217. El vector código
v_{T} resultante se multiplica entonces por la ganancia b
procedente del demultiplexor 217 a través de un amplificador 226
para obtener la señal bv_{T}.
El factor a se calcula en el generador 204 de
factores de voz mediante
\alpha =
qR_{p}
limitado por \alpha <
q
donde q es un factor que controla la
cantidad de mejora (q se fija en 0,25 en esta realización
preferida).
Otro método empleado en una realización preferida
de la invención para calcular el factor \alpha de periodicidad se
expone a continuación.
Primero se calcula un factor r_{v} de voz en el
generador 204 de factores de voz mediante
r_{v} = (Ev - Ec) / (Ev +
Ec)
donde Ev es la energía del vector código
bv_{T} escalado de tono y E_{c} es la energía del vector código
gc_{k} innovador, escalado. Es
decir
E_{v} =
b^{2}v_{T}{}^{t}v_{T} =
b^{2}\sum\limits^{N-1}_{n=0}v_{T}{}^{2}(n)
y
E_{c} =
g^{2}c_{k}{}^{t}c_{k} =
g^{2}\sum\limits^{N-1}_{n=0}c_{k}{}^{2}(n)
Obsérvese que el valor de r_{v} está entre -1 y
1 (1 corresponde a señales únicamente habladas y -1 corresponde a
señales únicamente no habladas).
En esta realización preferida, el factor \alpha
se calcula entonces en el generador 204 de factores de voz
mediante
\alpha = 0,125(1 +
r_{v})
que corresponde a un valor de 0 para señales
únicamente no habladas y 0,25 para señales únicamente
habladas.
En la primera forma de dos términos de
F(z), puede aproximarse el factor \sigma de
periodicidad empleando \sigma = 2\alpha en los métodos 1 y 2
anteriores. En tal caso, el factor \sigma de periodicidad se
calcula como sigue en el método 1 anterior:
\sigma =
2qR_{p}
limitado por \sigma <
2q.
En el método 2, el factor \sigma de
periodicidad se calcula como sigue:
\sigma = 0,25(1 +
r_{v}).
Por tanto, la señal c_{f} mejorada se calcula
filtrando el vector código gc_{k} innovador, escalado, a través
del filtro 205 (F(z)) de innovación.
La señal u' mejorada de excitación es
calculada por el sumador 220 como:
u' = c_{f} +
bv_{T}
Obsérvese que este proceso no se realiza en el
codificador 100. Por tanto, es esencial actualizar el contenido del
libro 201 de códigos de tono empleando la señal u de
excitación sin mejora para mantener el sincronismo entre el
codificador 100 y el decodificador 200. Por tanto, la señal u
de excitación se utiliza para actualizar la memoria 203 del libro
201 de códigos de tono, y la señal u' mejorada de excitación
se emplea en la entrada del filtro 206 de síntesis LP.
La señal s' sintetizada se calcula
filtrando la señal u' mejorada de excitación a través del
filtro 206 de síntesis LP, que tiene la forma 1/Â(z),
donde Â(z) es el filtro LP interpolado en la subtrama
actual. Tal como puede observarse en la figura 2, los coeficientes
Â(z) LP cuantificados en la línea 225 del
demultiplexor 217, se suministran al filtro 206 de síntesis LP para
ajustar los parámetros del filtro 206 de síntesis LP en
consecuencia. El filtro 207 de deénfasis es el inverso del filtro
103 de preénfasis de la figura 1. La función de transferencia del
filtro 207 de deénfasis viene dada por
D(z) = 1/(1 - \mu
z^{-1})
donde \mu es un factor de preénfasis con un
valor situado entre 0 y 1 (un valor típico es \mu = 0,7). También
podría emplearse un filtro de un orden
mayor.
El vector s' se filtra a través del filtro
D(z) (módulo 207) de deénfasis para obtener el vector
s_{d}, que se hace pasar a través del filtro 208 de paso alto para
eliminar las frecuencias indeseadas por debajo de 50 Hz y obtener
además s_{h}.
El módulo 209 de sobremuestreo realiza el proceso
inverso al del módulo 101 de diezmado de la figura 1. En esta
realización preferida, el sobremuestreo convierte desde la tasa de
muestreo 12,8 kHz a la tasa original de muestreo de 16kHz, empleando
técnicas bien conocidas para aquellos individuos de habilidad normal
en la técnica. La señal sobremuestreada de síntesis se denota como
S. A la señal S también se hace referencia como la
señal intermedia, sintetizada, de banda ancha.
La señal S sobremuestreada de síntesis no
contiene los componentes de frecuencia más alta que se perdieron en
el proceso de diezmado (módulo 101 de la figura 1) en el codificador
100. Esto da una percepción de paso bajo a la señal sintetizada de
voz. Para reestablecer la banda total de la señal original, se
describe un procedimiento de generación de altas frecuencias. Este
procedimiento se realiza en los módulos 210 y 216, y en el sumador
221, y requiere la entrada procedente del generador 204 de factores
de voz (figura 2).
En este nuevo enfoque, los contenidos de alta
frecuencia se generan llenando la parte superior del espectro con un
ruido blanco adecuadamente escalado en el dominio de excitación,
luego convertido al dominio de habla, preferiblemente al conformarlo
con el mismo filtro de síntesis LP empleado para sintetizar la señal
S diezmada.
A continuación se describe el procedimiento de
generación de altas frecuencias según la presente invención.
El generador 213 de ruido aleatorio genera una
secuencia w' de ruido blanco con un espectro plano en la
totalidad del ancho de banda de las frecuencias, empleando técnicas
bien conocidas por los expertos en la técnica. La secuencia generada
tiene una longitud N' que es la longitud de subtrama en el
dominio original. Cabe observarse que N es la longitud de
subtrama en el dominio diezmado. En esta realización preferida,
N = 64 u N' = 80, que corresponde a 5 ms.
La secuencia de ruido blanco se escala
adecuadamente en el módulo 214 de ajuste de la ganancia. El ajuste
de la ganancia comprende las siguientes etapas. Primero, la energía
de la secuencia w' de ruido generada se ajusta igual a la
energía de la señal u' mejorada de excitación calculada por
un módulo 210 de cálculo de energía, y la secuencia de ruido
escalada resultante viene dada por
w(n) = w'(n)
\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}w{'}^{2}(n)}},
\hskip0.5cmn = 0, ..., N'-1.
La segunda etapa en el escalamiento de la
ganancia es tener el cuenta los contenidos de alta frecuencia de la
señal sintetizada en la salida del generador 204 de factores de voz
con el fin de reducir la energía del ruido generado en caso de
segmentos hablados (donde hay menos energía presente a frecuencias
altas en comparación con los segmentos no hablados). En esta
realización preferida, la medición del contenido de alta frecuencia
se ejecuta midiendo la inclinación de la señal de síntesis a través
de un calculador 212 de inclinación espectral y reduciendo la
energía en consecuencia. Igualmente, pueden emplearse otras
mediciones, tales como las mediciones de los pasos por el punto cero
de una función. Cuando la inclinación es muy pronunciada, que
corresponde con los segmentos hablados, la energía del ruido se
reduce adicionalmente. El factor de inclinación se calcula en el
módulo 212 como el primer coeficiente de correlación de la señal
s_{h} de síntesis y viene dado por:
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}
donde el factor r_{v} de habla viene dado
por
r_{v}= (E_{v} - E_{c}) /
(E_{v} +
E_{c})
donde E_{v} es la energía del vector código
bv_{T} escalado de tono y E_{c} es la energía del vector código
gc_{k} innovador, escalado, tal como se ha descrito anteriormente.
El factor r_{v} de habla es muy frecuentemente menor que la
inclinación pero esta condición se introdujo como una
precaución contra los tonos de alta frecuencia en los que el valor
de la inclinación es negativo y el valor de r_{v} es elevado. Por
tanto, esta condición reduce la energía del ruido para tales señales
tonales.
El valor de la inclinación es 0 en caso el de un
espectro plano y 1, en el caso de señales considerablemente
habladas, y es negativo en el caso de señales no habladas en las que
hay más energía presente a frecuencias altas.
Pueden emplearse diferentes métodos para obtener
el factor g_{t} de escalamiento a partir de la cantidad de
contenidos de alta frecuencia. En esta invención, se proporcionan
dos métodos basados en la inclinación de la señal descrita
anteriormente.
El factor g_{t} de escalamiento se obtiene a
partir de la inclinación por
g_{t} = 1 -
inclinación
limitada por 0,2 \leq g_{t} \leq
1,0
Para una señal considerablemente hablada en la
que la inclinación se aproxima a 1, g_{t} es 0,2, y para señales
considerablemente no habladas, g_{t} se vuelve 1,0.
Primero, el factor g_{t} de inclinación está
limitado en primer lugar para ser mayor o igual que cero, luego el
factor de escalamiento se obtiene a partir de la inclinación por
g_{t} =
10^{-0,6inclinación}
La secuencia w_{g} de ruido escalada producida
en el módulo 214 de ajuste de la ganancia viene dada, por tanto,
por:
w_{g} = g_{t}
w.
Cuando la inclinación es cercana a cero, el
factor g_{t} de escalamiento es próximo a 1, lo que no tiene como
resultado una reducción de la energía. Cuando el valor de la
inclinación es 1, el factor g_{t} de escalamiento da como
resultado una reducción de 12 dB en la energía del ruido
generado.
Una vez que el ruido está escalado adecuadamente
(w_{g}), se lleva al dominio del habla empleando el conformador
215 espectral. En la realización preferida, esto se consigue
filtrando el ruido w_{g} a través de de una versión de ancho de
banda expandido del mismo filtro de síntesis LP empleado en el
dominio (1/Â(z/0,8)) diezmado. Los correspondientes
coeficientes de filtro LP ampliados en ancho de banda se calculan en
el conformador 215 espectral.
Entonces, la secuencia w_{f} filtrada,
escalada, de ruido se filtra paso banda al intervalo de frecuencia
requerido a restaurar, empleando el filtro 216 de paso de banda. En
la realización preferida, el filtro 216 de paso de banda limita la
secuencia de ruido al intervalo de frecuencia
5,6-7,2 kHz. La secuencia z de ruido
resultante, filtrada paso banda, se suma en el sumador 221 a la
señal ^s sintetizada, sobremuestreada, de voz para obtener la señal
s_{out} reconstruida, final, de sonido en la salida 223.
Aunque la presente invención se ha descrito
anteriormente en el presente documento mediante una realización
preferida de la misma, esta realización puede modificarse a
voluntad, dentro del alcance de las reivindicaciones adjuntas.
Aunque la realización preferida expone el uso de señales de voz de
banda ancha, será evidente para los expertos en la técnica que la
invención en cuestión también está dirigida a otras realizaciones
que emplean señales de banda ancha y que no se limita necesariamente
a aplicaciones de voz.
Claims (60)
1. Dispositivo para recuperar un contenido de
alta frecuencia de una señal de banda ancha, previamente diezmada, y
para inyectar dicho contenido de alta frecuencia en una versión
sintetizada, sobremuestreada, de dicha señal de banda ancha para
producir una señal sintetizada de banda ancha de espectro completo,
comprendiendo dicho dispositivo de recuperación del contenido de
alta frecuencia:
a) un generador (213) de ruido aleatorio para
producir una secuencia de ruido que tiene un espectro
determinado;
b) una unidad (215) de conformación espectral
para conformar el espectro de la secuencia de ruido en relación con
los coeficientes de filtro de predicción lineal relacionados con
dicha señal diezmada de banda ancha; y
c) un circuito (221) de inyección de señales para
inyectar dicha secuencia de ruido conformada espectralmente en dicha
versión sintetizada, sobremuestreada, de la señal para producir así
dicha señal (223) sintetizada de banda ancha, de espectro
completo.
2. Dispositivo según la reivindicación 1, en el
que dicho generador de ruido aleatorio es un generador de ruido
blanco aleatorio para producir una secuencia de ruido blanco que
tiene un espectro plano en todo el ancho de banda de la frecuencia
de la señal de banda ancha, por lo cual dicha unidad de conformación
espectral produce una secuencia de ruido blanco conformada
espectralmente.
3. Dispositivo según la reivindicación 2, en el
que dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a
dicha secuencia de ruido blanco y a un conjunto de parámetros de
ajuste de la ganancia para producir una secuencia de ruido blanco
escalada;
b) un conformador espectral para filtrar dicha
secuencia de ruido blanco escalada en relación con una versión
expandida en ancho de banda de dichos coeficientes de filtro de
predicción lineal para producir una secuencia de ruido blanco
escalada, filtrada, que comprende un ancho de banda de frecuencia
generalmente mayor que un ancho de banda de frecuencia de dicha
versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha
secuencia de ruido blanco escalada, filtrada, para producir una
secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar
posteriormente en dicha versión sintetizada, sobremuestreada, de la
señal como dicha secuencia de ruido blanco conformada
espectralmente.
4. Método para recuperar un contenido de alta
frecuencia de una señal de banda ancha, previamente diezmada y para
inyectar dicho contenido de alta frecuencia en una versión
sintetizada, sobremuestreada, de dicha señal de banda ancha, para
producir una señal sintetizada de banda ancha, de espectro completo,
comprendiendo dicho método de recuperación de contenidos de alta
frecuencia:
a) la generación de forma aleatoria de una
secuencia de ruido que tiene un espectro determinado;
b) la conformación espectral de dicha secuencia
de ruido en relación con unos coeficientes de filtro de predicción
lineal relacionados con dicha señal diezmada de ancho de banda;
y
c) la inyección de dicha secuencia de ruido
conformada espectralmente en dicha versión sintetizada,
sobremuestreada, de la señal para producir así dicha señal
sintetizada de banda ancha, de espectro completo.
5. Método según la reivindicación 4, en el que la
generación de dicha secuencia de ruido comprende generar de forma
aleatoria una secuencia de ruido blanco, por lo cual dicha
conformación espectral de la secuencia de ruido produce una
secuencia de ruido blanco conformada espectralmente.
6. Método según la reivindicación 5, en el que
dicha conformación espectral de la secuencia de ruido comprende:
a) la producción de una secuencia de ruido blanco
escalada en respuesta a dicha secuencia de ruido blanco y un
conjunto de parámetros de ajuste de la ganancia;
b) el filtrado de dicha secuencia de ruido blanco
escalada en relación con una versión expandida en ancho de banda de
los coeficientes de filtro de predicción lineal para producir una
secuencia de ruido blanco escalada, filtrada, que comprende un ancho
de banda de frecuencia generalmente mayor que un ancho de banda de
frecuencia de dicha versión sintetizada, sobremuestreada, de la
señal; y
c) el filtrado paso banda de dicha secuencia de
ruido blanco escalada, filtrada, para producir una secuencia de
ruido blanco escalada, filtrada pasa banda, a inyectar
posteriormente en dicha versión sintetizada, sobremuestreada, de la
señal como dicha secuencia de ruido blanco conformada
espectralmente.
7. Decodificador para producir una señal
sintetizada de banda ancha, que comprende:
a) un dispositivo de fragmentación de señales
para recibir una versión codificada de una señal de banda ancha,
previamente diezmada durante la codificación, y para extraer de
dicha señal codificada de banda ancha al menos unos parámetros de
tono de libro de códigos, unos parámetros innovadores de libro de
códigos y unos coeficientes de filtro de predicción;
b) un libro de códigos de tono, sensible a dichos
parámetros de tono de libro de códigos para producir un vector
código de tono;
c) un libro de códigos de tono, sensible a dichos
parámetros innovadores de libro de códigos para producir un vector
código innovador;
d) un circuito combinador para combinar dicho
vector código de tono y dicho vector código innovador para producir
así una señal de excitación;
e) un dispositivo de síntesis de señales que
incluye un filtro de predicción lineal para filtrar dicha señal de
excitación en relación con dichos coeficientes de filtro de
predicción lineal para producir así una señal sintetizada de banda
ancha, y un sobremuestreador sensible a dicha señal sintetizada de
banda ancha para producir una versión sobremuestreada de señal de la
señal sintetizada de banda ancha; y
f) un dispositivo de recuperación de contenidos
de alta frecuencia, tal como se mencionó en la reivindicación 1,
para recuperar un contenido de alta frecuencia de dicha señal de
banda ancha y para inyectar dicho contenido de alta frecuencia en
dicha versión sobremuestreada de señal para producir la señal
sintetizada de banda ancha, de espectro completo.
8. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 7, en el que
dicho generador de ruido aleatorio comprende un generador de ruido
blanco aleatorio para producir una secuencia de ruido blanco, por lo
cual dicha unidad de conformación espectral produce una secuencia de
ruido blanco conformada espectralmente.
9. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación B, en el que
dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a
dicha secuencia de ruido blanco y a un conjunto de parámetros de
ajuste de la ganancia, para producir una secuencia de ruido blanco
escalada;
b) un conformador espectral para filtrar dicha
secuencia de ruido blanco escalada en relación con una versión
expandida en ancho de banda de los coeficientes de filtro de
predicción lineal para producir una secuencia de ruido blanco
escalada, filtrada, que comprende un ancho de banda de frecuencia
generalmente mayor que un ancho de banda de frecuencia de dicha
versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha
secuencia de ruido blanco escalada, filtrada, para producir una
secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar
posteriormente en dicha versión sintetizada, sobremuestreada, de la
señal como dicha secuencia de ruido blanco conformada
espectralmente.
10. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 9, que comprende
adicionalmente:
a) un generador de factores de voz, sensible a
dichos vectores código adaptativos e innovadores para calcular un
factor de voz para enviar a dicho módulo de ajuste de la
ganancia;
b) un módulo de cálculo de energía, sensible a
dicha señal de excitación para calcular una energía de excitación
para enviar a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales,
sensible a dicha señal sinte un factor de escalamiento de la
inclinación para enviar a dicho módulo de ajuste de la ganancia;
en el que dicho conjunto de parámetros de ajuste
de la ganancia comprende dicho factor de voz, dicha energía de
excitación y dicho factor de escalamiento de la inclinación.
11. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 10, en el que
dicho generador de factores de voz comprende un medio para calcular
dicho factor r_{v} de voz empleando la relación:
r_{v} = (E_{v} -
E_{c})/(E_{v}+
E_{c})
donde E_{v} es la energía de una versión
escalada por ganancia del vector código de tono y E_{c} es la
energía de una versión escalada por ganancia del vector código
innovador.
12. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 10, en el que
dicha unidad de ajuste de la ganancia comprende un medio para
calcular un factor de escalamiento de la energía empleando la
relación:
Factor \ de \ escalamiento \
de \ la \ \text{energía} =
\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cmn = 0, ..., N'-1
donde w' es dicha secuencia de ruido
blanco y u' es una señal mejorada de excitación obtenida a
partir de dicha señal de
excitación.
13. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 10, en el que
dicho calculador de inclinaciones espectrales comprende un medio
para calcular dicho factor g_{t} de escalamiento de la inclinación
empleando la relación:
g_{t} = 1 -
inclinación
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \leq 0 e
inclinación \geq
r_{v}.
14. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 10, en el que
dicho calculador de inclinaciones espectrales comprende un medio
para calcular dicho factor g_{t} de escalamiento de la inclinación
empleando la relación:
g_{t} = 10^{-0,6
inclinación}
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
15. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 9, en el que
dicho filtro de paso de banda comprende un ancho de banda de
frecuencia situado entre 5,6 kHz y 7,2 kHz.
16. Decodificador para producir una señal
sintetizada de banda ancha, que comprende:
a) un dispositivo de fragmentación de señales
para recibir una versión codificada de una señal de banda ancha,
previamente diezmada durante la codificación, y para extraer de
dicha señal codificada de banda ancha al menos unos parámetros de
tono de libro de códigos, unos parámetros innovadores de libro de
códigos, y unos coeficientes de filtro de predicción lineal;
b) un libro de códigos de tono, sensible a dichos
parámetros de tono de libro de códigos para producir un vector
código de tono;
\newpage
c) un libro de códigos innovador, sensible a
dichos parámetros innovadores de libro de códigos para producir un
vector código innovador;
d) un circuito combinador para combinar dicho
vector código de tono y dicho vector código innovador para producir
así una señal de excitación; y
e) un dispositivo de síntesis de señales que
incluye un filtro de predicción lineal para filtrar dicha señal de
excitación en relación con dichos coeficientes de filtro de
predicción lineal para producir así una señal sintetizada de banda
ancha, y un sobremuestreador sensible a dicha señal sintetizada de
banda ancha para producir una versión sobremuestreada de señal de la
señal sintetizada de banda ancha;
comprendiendo el decodificador un dispositivo de
recuperación de contenidos de alta frecuencia, tal como se mencionó
en la reivindicación 1, para recuperar un contenido de alta
frecuencia de dicha señal de banda ancha y para inyectar dicho
contenido de alta frecuencia en dicha versión sobremuestreada de la
señal para producir una señal sintetizada de banda ancha, de
espectro completo.
17. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 16, en el que
dicho generador de ruido aleatorio comprende un generador de ruido
blanco aleatorio para producir una secuencia de ruido blanco, por lo
cual dicha unidad de conformación espectral produce una secuencia de
ruido blanco conformada espectralmente.
18. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 17, en el que
dicha unidad de conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a
dicha secuencia de ruido blanco y a un conjunto de parámetros de
ajuste de la ganancia, para producir una secuencia de ruido blanco
escalada;
b) un conformador espectral para filtrar dicha
secuencia de ruido blanco escalada en relación con una versión
expandida en ancho de banda de dichos coeficientes de filtro de
predicción lineal para producir una secuencia de ruido blanco
escalada, filtrada, que comprende un ancho de banda de frecuencia
generalmente mayor que un ancho de banda de frecuencia de dicha
versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha
secuencia de ruido blanco escalada, filtrada, para producir una
secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar
posteriormente en dicha versión sintetizada, sobremuestreada, de la
señal como dicha secuencia de ruido blanco conformada
espectralmente.
19. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 18, que comprende
adicionalmente:
a) un generador de factores de voz, sensible a
dichos vectores código adaptativos e innovadores, para calcular un
factor de voz para enviar a dicho módulo de ajuste de la
ganancia;
b) un módulo de cálculo de energía, sensible a
dicha señal de excitación, para calcular una energía de excitación
para enviar a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales,
sensible a dicha señal sintetizada, para calcular un factor de
escalamiento de la inclinación para enviar a dicho módulo de ajuste
de la ganancia;
en el que dicho conjunto de parámetros de ajuste
de la ganancia comprende dicho factor de voz, dicho factor de
escalamiento de la energía, y dicho factor de escalamiento de la
inclinación.
20. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 19, en el que
dicho generador de factores de voz comprende un medio para calcular
dicho factor r_{v} de voz empleando la relación:
r_{v} = (E_{v}-
E_{c})/(E_{v}+
E_{c})
donde E_{v} es la energía de una versión
escalada por ganancia del vector código de tono y E_{c} es la
energía de una versión escalada por ganancia del vector código
innovador.
21. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 19, en el que
dicha unidad de ajuste de la ganancia comprende un medio para
calcular un factor de escalamiento de la energía que emplea la
relación:
Factor \ de \ escalamiento \
de \ la \ \text{energía} =
\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cmn = 0, ..., N'-1
donde w' es dicha secuencia de ruido
blanco y u' es una señal mejorada de excitación obtenida de
dicha señal de
excitación.
22. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 19, en el que
dicho calculador de inclinaciones espectrales comprende un medio
para calcular dicho factor g_{t} de escalamiento de la inclinación
empleando la relación:
g_{t} = 1 -
inclinación
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
23. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 19, en el que
dicho calculador de inclinaciones espectrales comprende un medio
para calcular dicho factor g_{t} de escalamiento de la inclinación
empleando la relación:
g_{t} = 10^{-0,6
inclinación}
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
24. Decodificador para producir una señal
sintetizada de banda ancha según la reivindicación 18, en el que
dicho filtro de paso de banda comprende un ancho de banda de
frecuencia situado entre 5,6 kHz y 7,2 kHz.
25. Sistema de comunicación celular para dar
servicio a una amplia zona geográfica dividida en una pluralidad de
células, que comprende:
a) unidades transmisoras/receptoras móviles;
b) estaciones base celulares situadas
respectivamente en dichas células;
c) un terminal de control para controlar la
comunicación entre las estaciones base celulares;
d) un subsistema de comunicación inalámbrica,
bidireccional, entre cada unidad móvil situada en una célula y la
estación base celular de dicha célula, comprendiendo dicho
subsistema de comunicación inalámbrica, bidireccional, tanto en la
unidad móvil como en la estación base celular:
- i)
- un transmisor que incluye un codificador para codificar una señal de banda ancha y un circuito de transmisión para transmitir la señal de banda ancha codificada; y
- ii)
- un receptor que incluye un circuito de recepción para recibir una señal de banda ancha codificada transmitida y un decodificador según se mención en la reivindicación 7 para decodificar la señal de banda ancha codificada recibida.
26. Sistema de comunicación celular según se
definió en la reivindicación 26, en el que dicho generador aleatorio
de ruido comprende un generador aleatorio de ruido blanco para
producir una secuencia de ruido blanco, produciendo dicha unidad de
conformación espectral una secuencia de ruido blanco conformada
espectralmente.
27. Sistema de comunicación celular según la
reivindicación 26, en el que dicha unidad de conformación espectral
comprende:
a) un módulo de ajuste de la ganancia, sensible a
dicha secuencia de ruido blanco y a un conjunto de parámetros de
ajuste de la ganancia, para producir una secuencia de ruido blanco
escalada;
b) un conformador espectral para filtrar dicha
secuencia de ruido blanco escalada que comprende un ancho de banda
de frecuencia normalmente mayor que un ancho de banda de frecuencia
de dicha versión sintetizada, sobremuestreada de la señal; y
c) un filtro de paso de banda, sensible a dicha
secuencia de ruido blanco escalada, filtrada, para producir una
secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar
posteriormente en dicha versión sintetizada, sobremuestreada de la
señal como dicha secuencia de ruido blanco conformada
espectralmente.
28. Sistema de comunicación celular según la
reivindicación 27, que comprende adicionalmente:
a) un generador de factores de voz, sensible a
dichos vectores código innovadores y adaptativos para calcular un
factor de voz para enviar a dicho módulo de ajuste de la
ganancia;
b) un módulo de cálculo de energía, sensible a
dicha señal de excitación para calcular una energía de excitación
para enviar a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales,
sensible a dicha señal sintetizada para calcular un factor de
escalamiento de la inclinación para enviar a dicho módulo de ajuste
de la ganancia;
en el que dicho conjunto de parámetros de ajuste
de la ganancia comprende dicho factor de voz, dicha energía de
excitación, y dicho factor de escalamiento de la inclinación.
29. Sistema de comunicación celular según la
reivindicación 28, en el que dicho generador de factores de voz
comprende un medio para calcular dicho factor r_{v} de voz
empleando la relación:
r_{r} = (E_{v} -
E_{c})/(E_{v} +
E_{c})
donde E_{v} es la energía de una versión
escalada por ganancia del vector código de tono y E_{c} es la
energía de una versión escalada por ganancia del vector código
innovador.
30. Sistema de comunicación celular según la
reivindicación 28, en el que dicha unidad de ajuste de la ganancia
comprende un medio para calcular un factor de escalamiento de la
energía empleando la relación:
Factor \ de \ escalamiento \
de \ la \ \text{energía} =
\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cmn = 0, ..., N'-1
donde w' es dicha secuencia de ruido
blanco y u' es una señal mejorada de excitación obtenida a
partir de dicha señal de
excitación.
31. Sistema de comunicación celular según la
reivindicación 28, en el que dicho calculador de inclinaciones
espectrales comprende un medio para calcular dicho factor g_{t} de
escalamiento de la inclinación empleando la relación:
g_{t} = 1 -
inclinación
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
32. Sistema de comunicación celular según la
reivindicación 28, en el que dicho calculador de inclinaciones
espectrales comprende un medio para calcular dicho factor g_{t} de
escalamiento de la inclinación empleando la relación:
g_{t} = 10^{-0,6
inclinación}
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
33. Sistema de comunicación celular según la
reivindicación 27, en el que el filtro de paso de banda comprende un
ancho de banda de frecuencia situado entre 5,6 kHz y 7,2 kHz.
34. Unidad transmisora/receptora móvil celular
que comprende:
a) un transmisor que incluye un codificador para
codificar una señal de banda ancha, y un circuito de transmisión
para transmitir la señal codificada de banda ancha; y
b) un receptor que incluye un circuito de
recepción para recibir una señal codificada, transmitida, de banda
ancha y un decodificador, tal como se indicó en la reivindicación 7,
para decodificar la señal codificada, recibida, de banda ancha.
35. Unidad transmisora/receptora móvil celular
según la reivindicación 34, en la que dicho generador de ruido
aleatorio comprende un generador de ruido blanco aleatorio para
producir una secuencia de ruido blanco, por lo cual dicha unidad de
conformación espectral produce una secuencia de ruido blanco
conformada espectralmente.
36. Unidad transmisora/receptora móvil celular
según la reivindicación 35, en la que dicha unidad de conformación
espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a
dicha secuencia de ruido blanco y a un conjunto de parámetros de
ajuste de la ganancia para producir una secuencia de ruido blanco
escalada;
b) un conformador espectral para filtrar dicha
secuencia de ruido blanco escalada relación con una versión
expandida en ancho de banda de los coeficientes de filtro de
predicción lineal para producir una secuencia de ruido blanco
escalada, filtrada, que comprende un ancho de banda de frecuencia
generalmente mayor que un ancho de banda de frecuencia de dicha
versión sintetizada, sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha
secuencia de ruido blanco escalada, filtrada, para producir una
secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar
posteriormente en dicha versión sintetizada, sobremuestreada, de la
señal como dicha secuencia de ruido blanco conformada
espectralmente.
37. Unidad transmisora receptora móvil celular
según la reivindicación 36, que comprende adicionalmente:
a) un generador de factores de voz, sensible a
dichos vectores código adaptativos e innovadores para calcular un
factor de voz para enviar a dicho módulo de ajuste de la
ganancia;
b) un módulo de cálculo de energía, sensible a
dicha señal de excitación para calcular una energía de excitación
para enviar a dicho módulo de ajuste de la ganancia; y
\newpage
c) un calculador de inclinaciones espectrales,
sensible a dicha señal sintetizada para calcular un factor de
escalamiento de la inclinación para enviar a un módulo de ajuste de
la ganancia;
en el que dicho conjunto de parámetros de ajuste
de la ganancia comprende dicho factor de voz, dicha energía de
excitación, y dicho factor de escalamiento de la inclinación.
38. Unidad transmisora/receptora móvil celular
según la reivindicación 37, en el que dicho generador de factores de
voz comprende un medio para calcular dicho factor r_{v} de voz
empleando la relación:
r_{v}= (E_{v} -
E_{c})/(E_{v} +
E_{c})
donde E_{v} es la energía de una versión
escalada por ganancia del vector código de tono y E_{c} es la
energía de una versión escalada por ganancia del vector código
innovador.
39. Unidad transmisora/receptora móvil celular
según la reivindicación 37, en el que dicha unidad de ajuste de la
ganancia comprende un medio para calcula un factor de escalamiento
de la energía empleando la relación:
Factor \ de \ escalamiento \
de \ la \ \text{energía} =
\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cmn = 0, ..., N'-1
donde w' es dicha secuencia de ruido
blanco y u' es una señal mejorada de excitación obtenida a
partir de dicha señal de
excitación.
40. Unidad transmisora/receptora móvil celular
según la reivindicación 37, en la que el calculador de inclinaciones
espectrales comprende un medio para calcular dicho factor
g_{t} de escalamiento de la inclinación empleando la
relación:
g_{t} = 1 -
inclinación
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
41. Unidad transmisora/receptora móvil celular
según la reivindicación 37, en la que dicho calculador de
inclinaciones espectrales comprende un medio para calcular dicho
factor g_{t} de escalamiento de la inclinación empleando la
relación:
g_{t} = 10^{-0,6 \
inclinación}
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
42. Unidad transmisora/receptora móvil celular
según la reivindicación 36, en la que el filtro de paso de banda
comprende un ancho de banda de frecuencia situado entre 5,6 kHz y
7,2 kHz.
43. Elemento de red celular que comprende:
a) un transmisor que incluye un codificador para
codificar una señal de banda ancha y un circuito de transmisión para
transmitir la señal codificada de banda ancha; y
b) un receptor que incluye un circuito de
recepción para recibir una señal codificada, transmitida, de banda
ancha y un decodificador, tal como se indicó en la reivindicación 7,
para decodificar la señal codificada, recibida, de banda ancha.
44. Elemento de red celular según la
reivindicación 43, en el que dicho generador de ruido aleatorio
comprende un generador de ruido blanco aleatorio para producir una
secuencia de ruido blanco, produciendo dicha unidad de conformación
espectral una secuencia de ruido blanco conformada
espectralmente.
45. Elemento de red celular según la
reivindicación 44, en el que dicha unidad de conformación espectral
comprende:
a) un módulo de ajuste de la ganancia, sensible a
dicha secuencia de ruido blanco y a un conjunto de parámetros de
ajuste de la ganancia para producir una secuencia de ruido blanco
escalada;
b) un conformador espectral para filtrar dicha
secuencia de ruido blanco en relación con una versión expandida en
ancho de banda de los coeficientes de filtro de predicción lineal
para producir una secuencia de ruido blanco escalada, filtrada, que
comprende un ancho de banda de frecuencia generalmente mayor que un
ancho de banda de frecuencia de dicha versión sintetizada,
sobremuestreada, de la señal; y
c) un filtro de paso de banda, sensible a dicha
secuencia de ruido blanco escalada, filtrada, para producir una
secuencia de ruido blanco escalada, filtrada pasa banda, a inyectar
posteriormente en dicha versión sintetizada, sobremuestreada de la
señal como dicha secuencia de ruido blanco conformada
espectralmente.
46. Elemento de red celular según la
reivindicación 45, que además comprende:
a) un generador de factores de voz, sensible a
dichos vectores código adaptativos e innovadores para calcular un
factor de voz para enviar a dicho módulo de ajuste de la
ganancia;
b) un módulo de cálculo de energía, sensible a
dicha señal de excitación para calcular una energía de excitación
para enviar a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales,
sensible a dicha señal sintetizada para calcular un factor de
escalamiento de la inclinación para enviar a dicho módulo de ajuste
de la ganancia;
en el que dicho conjunto de parámetros de ajuste
de la ganancia comprende dicho factor de voz, dicha energía de
excitación, y dicho factor de escalamiento de la inclinación.
47. Elemento de red celular según la
reivindicación 46, en el que dicho generador de factores de voz
comprende un medio para calcular dicho factor r_{v} de voz
empleando la relación:
r_{v} = (E_{v} -
E_{c})/(E_{v} +
E_{c})
donde E_{v} es la energía de una versión
escalada por ganancia del vector código de tono y E_{c} es la
energía de una versión escalada por ganancia del vector código
innovador.
48. Elemento de red celular según la
reivindicación 46, en el que dicha unidad de ajuste de la ganancia
comprende un medio para calcular un factor de escalamiento de la
energía empleando la relación:
Factor \ de \ escalamiento \
de \ la \ \text{energía} =
\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cmn=0, ...,N'-1
donde w' es dicha secuencia de ruido
blanco y u' es una señal mejorada de excitación obtenida a
partir de dicha señal de
excitación.
49. Elemento de red celular según la
reivindicación 46, en el que dicho calculador de inclinaciones
espectrales comprende un medio para calcular dicho factor g_{t} de
escalamiento de la inclinación empleando la relación:
g_{t} = 1 -
inclinación
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=0}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}^{2}(n)}
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
50. Elemento de red celular según la
reivindicación 46, en el que dicho calculador de inclinaciones
espectrales comprende un medio para calcular dicho factor g_{t} de
escalamiento de la inclinación empleando la relación:
g_{t} = 10_{-0,6
inclinación}
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
51. Elemento de red celular según la
reivindicación 45, en el que dicho filtro de paso de banda comprende
un ancho de banda de frecuencia situado entre 5,6 kHz y 7,2 kHz.
52. Sistema de comunicación celular para dar
servicio a una gran zona geográfica dividida en una pluralidad de
células, que comprende: unidades transmisoras/receptoras móviles;
estaciones base celulares, situadas respectivamente en dichas
células; y un terminal de control para controlar la comunicación
entre las estaciones base celulares:
un subsistema de comunicación inalámbrica
bidireccional entre cada unidad móvil situada en una célula y la
estación base celular de dicha célula, comprendiendo dicho
subsistema de comunicación inalámbrica bidireccional, tanto en la
unidad móvil como en la estación base celular:
a) un transmisor que incluye un codificador para
codificar una señal de banda ancha y un circuito de transmisión para
transmitir la señal codificada de banda ancha; y
b) un receptor que incluye un circuito de
recepción para recibir una señal codificada, transmitida, de banda
ancha y un decodificador, tal como se indicó en la reivindicación 7,
para decodificar la señal codificada de banda ancha.
53. Subsistema de comunicación inalámbrica
bidireccional según la reivindicación 52, en el que dicho generador
de ruido aleatorio comprende un generador de ruido blanco aleatorio
para producir una secuencia de ruido blanco, por lo cual dicha
unidad de conformación espectral produce una secuencia de ruido
blanco conformada espectralmente.
54. Subsistema de comunicación inalámbrica
bidireccional según la reivindicación 53, en el que dicha unidad de
conformación espectral comprende:
a) un módulo de ajuste de la ganancia, sensible a
dicha secuencia de ruido blanco y a un conjunto de parámetros de
ajuste de la ganancia para producir una secuencia de ruido blanco
escalada;
b) un conformador espectral para filtrar dicha
secuencia de ruido blanco escalada en relación con una versión
expandida en ancho de banda de los coeficientes de filtro de
predicción lineal para producir una secuencia de ruido blanco
escalada, filtrada, que comprende un ancho de banda de frecuencia
normalmente mayor que un ancho de banda de frecuencia de dicha
versión sintetizada, sobremuestreada, de la señal; y
\newpage
c) un filtro de paso de banda, sensible a dicha
secuencia de ruido blanco escalada, filtrada, para producir una
secuencia de ruido blanco escalada, filtrada paso banda, a inyectar
posteriormente en la versión sintetizada, sobremuestreada, de la
señal como una secuencia de ruido blanco conformada
espectralmente.
55. Subsistema de comunicación inalámbrica
bidireccional según la reivindicación 54, que comprende
adicionalmente:
a) un generador de factores de voz, sensible a
dichos vectores código innovadores y adaptativos para calcular un
factor de voz para enviar a dicho módulo de ajuste de la
ganancia;
b) un módulo de cálculo de energía, sensible a
dicha señal de excitación para calcular una energía de excitación
para enviarla a dicho módulo de ajuste de la ganancia; y
c) un calculador de inclinaciones espectrales,
sensible a dicha señal sintetizada para calcular un factor de
escalamiento de la inclinación para enviar a dicho módulo de ajuste
de la ganancia;
en el que dicho conjunto de parámetros de ajuste
de la ganancia comprende dicho factor de voz, dicha energía de
excitación, y dicho factor de escalamiento de la inclinación.
56. Subsistema de comunicación inalámbrica
bidireccional según la reivindicación 55, en el que dicho generador
de factores de voz comprende un medio para calcular dicho factor
r_{v} de voz empleando la relación:
r_{v} = (E_{v} -
E_{c})/(E_{v} +
E_{c})
donde E_{v} es la energía de una versión
escalada por ganancia del vector código de tono y E_{c} es la
energía de una versión escala por ganancia del vector código
innovador.
57. Subsistema de comunicación inalámbrica
bidireccional según la reivindicación 55, en el que dicha unidad de
ajuste de la ganancia comprende un medio para calcular un factor de
escalamiento de la energía empleando la relación:
Factor \ de \ escalamiento \
de \ la \ \text{energía} =
\sqrt{\frac{\sum\limits^{N-1}_{n=0}u{'}^{2}(n)}{\sum\limits^{N'-1}_{n=0}W{'}^{2}(n)}},
\hskip0.5cmn = 0, ..., N'-1
donde w' es dicha secuencia de ruido
blanco y u' es una señal mejorada de excitación obtenida de
dicha señal de
excitación.
58. Subsistema de comunicación inalámbrica
bidireccional según la reivindicación 55, en el que dicho calculador
de inclinaciones espectrales comprende un medio para calcular dicho
factor g_{t} de escalamiento de la inclinación empleando la
relación:
g_{t} = 1 -
inclinación
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
59. Subsistema de comunicación inalámbrica
bidireccional según la reivindicación 55, en el que dicho calculador
de inclinaciones espectrales comprende un medio para calcular dicho
factor g_{t} de escalamiento de la inclinación empleando la
relación:
g_{t} = 10^{-0,6
inclinación}
limitada por 0,2 \leq g_{t} \leq
1,0
donde
inclinación =
\frac{\sum\limits^{N-1}_{n=1}
s_{h}(n)s_{h}(n-1)}{\sum\limits^{N-1}_{n=0}s_{h}{}^{2}(n)},
condicionada por inclinación \geq 0 e
inclinación \geq
r_{v}.
60. Subsistema de comunicación inalámbrica
bidireccional según la reivindicación 54, en el que dicho filtro de
paso de banda comprende un ancho de banda de frecuencia situado
entre 5,6 kHz y 7,2 kHz.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA002252170A CA2252170A1 (en) | 1998-10-27 | 1998-10-27 | A method and device for high quality coding of wideband speech and audio signals |
CA2252170 | 1998-10-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2207968T3 true ES2207968T3 (es) | 2004-06-01 |
Family
ID=4162966
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES99952199T Expired - Lifetime ES2205891T3 (es) | 1998-10-27 | 1999-10-27 | Un metodo y un dispositivo para una busqueda adaptativa de tono de ancho de banda al codificar señales de banda ancha. |
ES99952201T Expired - Lifetime ES2212642T3 (es) | 1998-10-27 | 1999-10-27 | Dispositivo de codificacion perceptual y metodo para la codificacion eficaz de señales de banda ancha. |
ES99952183T Expired - Lifetime ES2207968T3 (es) | 1998-10-27 | 1999-10-27 | Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha. |
ES99952200T Expired - Lifetime ES2205892T3 (es) | 1998-10-27 | 1999-10-27 | Aumento de la periodicidad al descodificar señales de banda ancha. |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES99952199T Expired - Lifetime ES2205891T3 (es) | 1998-10-27 | 1999-10-27 | Un metodo y un dispositivo para una busqueda adaptativa de tono de ancho de banda al codificar señales de banda ancha. |
ES99952201T Expired - Lifetime ES2212642T3 (es) | 1998-10-27 | 1999-10-27 | Dispositivo de codificacion perceptual y metodo para la codificacion eficaz de señales de banda ancha. |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES99952200T Expired - Lifetime ES2205892T3 (es) | 1998-10-27 | 1999-10-27 | Aumento de la periodicidad al descodificar señales de banda ancha. |
Country Status (20)
Country | Link |
---|---|
US (8) | US6795805B1 (es) |
EP (4) | EP1125276B1 (es) |
JP (4) | JP3490685B2 (es) |
KR (3) | KR100417634B1 (es) |
CN (4) | CN1127055C (es) |
AT (4) | ATE246389T1 (es) |
AU (4) | AU763471B2 (es) |
BR (2) | BR9914889B1 (es) |
CA (5) | CA2252170A1 (es) |
DE (4) | DE69910058T2 (es) |
DK (4) | DK1125276T3 (es) |
ES (4) | ES2205891T3 (es) |
HK (1) | HK1043234B (es) |
MX (2) | MXPA01004181A (es) |
NO (4) | NO318627B1 (es) |
NZ (1) | NZ511163A (es) |
PT (4) | PT1125285E (es) |
RU (2) | RU2217718C2 (es) |
WO (4) | WO2000025304A1 (es) |
ZA (2) | ZA200103366B (es) |
Families Citing this family (120)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6704701B1 (en) * | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
EP1796083B1 (en) * | 2000-04-24 | 2009-01-07 | Qualcomm Incorporated | Method and apparatus for predictively quantizing voiced speech |
JP3538122B2 (ja) * | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
US7010480B2 (en) * | 2000-09-15 | 2006-03-07 | Mindspeed Technologies, Inc. | Controlling a weighting filter based on the spectral content of a speech signal |
US6691085B1 (en) * | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
JP3582589B2 (ja) * | 2001-03-07 | 2004-10-27 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
JP2003044098A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
KR100393899B1 (ko) * | 2001-07-27 | 2003-08-09 | 어뮤즈텍(주) | 2-단계 피치 판단 방법 및 장치 |
US7680665B2 (en) * | 2001-08-24 | 2010-03-16 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal adaptively |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP2003255976A (ja) * | 2002-02-28 | 2003-09-10 | Nec Corp | 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法 |
US8463334B2 (en) * | 2002-03-13 | 2013-06-11 | Qualcomm Incorporated | Apparatus and system for providing wideband voice quality in a wireless telephone |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2392640A1 (en) | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7254533B1 (en) * | 2002-10-17 | 2007-08-07 | Dilithium Networks Pty Ltd. | Method and apparatus for a thin CELP voice codec |
JP4433668B2 (ja) * | 2002-10-31 | 2010-03-17 | 日本電気株式会社 | 帯域拡張装置及び方法 |
KR100503415B1 (ko) * | 2002-12-09 | 2005-07-22 | 한국전자통신연구원 | 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법 |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
CN100531259C (zh) * | 2002-12-27 | 2009-08-19 | 冲电气工业株式会社 | 语音通信设备 |
US7039222B2 (en) * | 2003-02-28 | 2006-05-02 | Eastman Kodak Company | Method and system for enhancing portrait images that are processed in a batch mode |
US6947449B2 (en) * | 2003-06-20 | 2005-09-20 | Nokia Corporation | Apparatus, and associated method, for communication system exhibiting time-varying communication conditions |
KR100651712B1 (ko) * | 2003-07-10 | 2006-11-30 | 학교법인연세대학교 | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 |
BRPI0414444B1 (pt) * | 2003-09-16 | 2020-05-05 | Matsushita Electric Ind Co Ltd | aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação |
US7792670B2 (en) * | 2003-12-19 | 2010-09-07 | Motorola, Inc. | Method and apparatus for speech coding |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
WO2005111568A1 (ja) * | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
CN1954363B (zh) * | 2004-05-19 | 2011-10-12 | 松下电器产业株式会社 | 编码装置和编码方法 |
US8024181B2 (en) * | 2004-09-06 | 2011-09-20 | Panasonic Corporation | Scalable encoding device and scalable encoding method |
DE102005000828A1 (de) * | 2005-01-05 | 2006-07-13 | Siemens Ag | Verfahren zum Codieren eines analogen Signals |
CN102592604A (zh) * | 2005-01-14 | 2012-07-18 | 松下电器产业株式会社 | 可扩展性解码装置及可扩展性解码方法 |
CN100592389C (zh) * | 2008-01-18 | 2010-02-24 | 华为技术有限公司 | 合成滤波器状态更新方法及装置 |
DE602006019723D1 (de) * | 2005-06-08 | 2011-03-03 | Panasonic Corp | Vorrichtung und verfahren zur verbreiterung eines audiosignalbands |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
FR2889017A1 (fr) * | 2005-07-19 | 2007-01-26 | France Telecom | Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants |
US8417185B2 (en) | 2005-12-16 | 2013-04-09 | Vocollect, Inc. | Wireless headset and method for robust voice data communication |
US7885419B2 (en) | 2006-02-06 | 2011-02-08 | Vocollect, Inc. | Headset terminal with speech functionality |
US7773767B2 (en) | 2006-02-06 | 2010-08-10 | Vocollect, Inc. | Headset terminal with rear stability strap |
DK1869669T3 (da) * | 2006-04-24 | 2008-12-01 | Nero Ag | Avanceret audiokodningsapparat |
EP2038884A2 (en) * | 2006-06-29 | 2009-03-25 | Nxp B.V. | Noise synthesis |
US8358987B2 (en) * | 2006-09-28 | 2013-01-22 | Mediatek Inc. | Re-quantization in downlink receiver bit rate processor |
US7966175B2 (en) * | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
CN101192410B (zh) * | 2006-12-01 | 2010-05-19 | 华为技术有限公司 | 一种在编解码中调整量化质量的方法和装置 |
GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
WO2008114075A1 (en) * | 2007-03-16 | 2008-09-25 | Nokia Corporation | An encoder |
WO2008151408A1 (en) * | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101369064B1 (ko) * | 2007-07-27 | 2014-02-28 | 파나소닉 주식회사 | 음성 부호화 장치 및 음성 부호화 방법 |
TWI346465B (en) * | 2007-09-04 | 2011-08-01 | Univ Nat Central | Configurable common filterbank processor applicable for various audio video standards and processing method thereof |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US8300849B2 (en) * | 2007-11-06 | 2012-10-30 | Microsoft Corporation | Perceptually weighted digital audio level compression |
JP5326311B2 (ja) * | 2008-03-19 | 2013-10-30 | 沖電気工業株式会社 | 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置 |
CA2699316C (en) * | 2008-07-11 | 2014-03-18 | Max Neuendorf | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing |
USD605629S1 (en) | 2008-09-29 | 2009-12-08 | Vocollect, Inc. | Headset |
KR20100057307A (ko) * | 2008-11-21 | 2010-05-31 | 삼성전자주식회사 | 노래점수 평가방법 및 이를 이용한 가라오케 장치 |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
CN101770778B (zh) * | 2008-12-30 | 2012-04-18 | 华为技术有限公司 | 一种预加重滤波器、感知加权滤波方法及系统 |
CN101604525B (zh) * | 2008-12-31 | 2011-04-06 | 华为技术有限公司 | 基音增益获取方法、装置及编码器、解码器 |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466675B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
BRPI1008484A2 (pt) * | 2009-02-26 | 2018-01-16 | Panasonic Corp | codificador, decodificador e método para os mesmos |
US20110301946A1 (en) * | 2009-02-27 | 2011-12-08 | Panasonic Corporation | Tone determination device and tone determination method |
US8160287B2 (en) | 2009-05-22 | 2012-04-17 | Vocollect, Inc. | Headset with adjustable headband |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
WO2011048810A1 (ja) * | 2009-10-20 | 2011-04-28 | パナソニック株式会社 | ベクトル量子化装置及びベクトル量子化方法 |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
US8438659B2 (en) | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
US9812141B2 (en) | 2010-01-08 | 2017-11-07 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals |
CN101854236B (zh) | 2010-04-05 | 2015-04-01 | 中兴通讯股份有限公司 | 一种信道信息反馈方法和系统 |
DK2559028T3 (en) * | 2010-04-14 | 2015-11-09 | Voiceage Corp | FLEXIBLE AND SCALABLE COMBINED INNOVATIONSKODEBOG FOR USE IN CELPKODER encoder and decoder |
JP5749136B2 (ja) | 2011-10-21 | 2015-07-15 | 矢崎総業株式会社 | 端子圧着電線 |
KR102138320B1 (ko) | 2011-10-28 | 2020-08-11 | 한국전자통신연구원 | 통신 시스템에서 신호 코덱 장치 및 방법 |
CN105761724B (zh) * | 2012-03-01 | 2021-02-09 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN105469805B (zh) | 2012-03-01 | 2018-01-12 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
US9070356B2 (en) * | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9263053B2 (en) * | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
CN105976830B (zh) * | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CA2899059C (en) * | 2013-01-29 | 2018-05-15 | Guillaume Fuchs | Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10614816B2 (en) | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
BR112016008662B1 (pt) * | 2013-10-18 | 2022-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala |
MX355258B (es) | 2013-10-18 | 2018-04-11 | Fraunhofer Ges Forschung | Concepto para codificar una señal de audio y decodificar una señal de audio usando información determinista y de tipo ruido. |
WO2015079946A1 (ja) * | 2013-11-29 | 2015-06-04 | ソニー株式会社 | 周波数帯域拡大装置および方法、並びにプログラム |
KR102251833B1 (ko) * | 2013-12-16 | 2021-05-13 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US10163447B2 (en) | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN105336339B (zh) | 2014-06-03 | 2019-05-03 | 华为技术有限公司 | 一种语音频信号的处理方法和装置 |
CN105047201A (zh) * | 2015-06-15 | 2015-11-11 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于分段扩展的宽带激励信号合成方法 |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
CN106601267B (zh) * | 2016-11-30 | 2019-12-06 | 武汉船舶通信研究所 | 一种基于超短波fm调制的语音增强方法 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
CN113324546B (zh) * | 2021-05-24 | 2022-12-13 | 哈尔滨工程大学 | 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法 |
US20230318881A1 (en) * | 2022-04-05 | 2023-10-05 | Qualcomm Incorporated | Beam selection using oversampled beamforming codebooks and channel estimates |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8500843A (nl) | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
JPH0738118B2 (ja) * | 1987-02-04 | 1995-04-26 | 日本電気株式会社 | マルチパルス符号化装置 |
EP0331858B1 (en) | 1988-03-08 | 1993-08-25 | International Business Machines Corporation | Multi-rate voice encoding method and device |
US5359696A (en) * | 1988-06-28 | 1994-10-25 | Motorola Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
JP2621376B2 (ja) | 1988-06-30 | 1997-06-18 | 日本電気株式会社 | マルチパルス符号化装置 |
JP2900431B2 (ja) | 1989-09-29 | 1999-06-02 | 日本電気株式会社 | 音声信号符号化装置 |
JPH03123113A (ja) | 1989-10-05 | 1991-05-24 | Fujitsu Ltd | ピッチ周期探索方式 |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
US5754976A (en) | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
US5701392A (en) | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US6134373A (en) * | 1990-08-17 | 2000-10-17 | Samsung Electronics Co., Ltd. | System for recording and reproducing a wide bandwidth video signal via a narrow bandwidth medium |
US5113262A (en) * | 1990-08-17 | 1992-05-12 | Samsung Electronics Co., Ltd. | Video signal recording system enabling limited bandwidth recording and playback |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
US5392284A (en) * | 1990-09-20 | 1995-02-21 | Canon Kabushiki Kaisha | Multi-media communication device |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
US5235670A (en) * | 1990-10-03 | 1993-08-10 | Interdigital Patents Corporation | Multiple impulse excitation speech encoder and decoder |
JP3089769B2 (ja) | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
GB9218864D0 (en) * | 1992-09-05 | 1992-10-21 | Philips Electronics Uk Ltd | A method of,and system for,transmitting data over a communications channel |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
IT1257431B (it) | 1992-12-04 | 1996-01-16 | Sip | Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi |
US5621852A (en) * | 1993-12-14 | 1997-04-15 | Interdigital Technology Corporation | Efficient codebook structure for code excited linear prediction coding |
DE4343366C2 (de) * | 1993-12-18 | 1996-02-29 | Grundig Emv | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen |
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5956624A (en) * | 1994-07-12 | 1999-09-21 | Usa Digital Radio Partners Lp | Method and system for simultaneously broadcasting and receiving digital and analog signals |
JP3483958B2 (ja) | 1994-10-28 | 2004-01-06 | 三菱電機株式会社 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
FR2729247A1 (fr) | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
AU696092B2 (en) | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
JP3189614B2 (ja) | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
DE69628103T2 (de) * | 1995-09-14 | 2004-04-01 | Kabushiki Kaisha Toshiba, Kawasaki | Verfahren und Filter zur Hervorbebung von Formanten |
US5819213A (en) * | 1996-01-31 | 1998-10-06 | Kabushiki Kaisha Toshiba | Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks |
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
JPH10124088A (ja) | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
JP3063668B2 (ja) | 1997-04-04 | 2000-07-12 | 日本電気株式会社 | 音声符号化装置及び復号装置 |
US5999897A (en) * | 1997-11-14 | 1999-12-07 | Comsat Corporation | Method and apparatus for pitch estimation using perception based analysis by synthesis |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
-
1998
- 1998-10-27 CA CA002252170A patent/CA2252170A1/en not_active Abandoned
-
1999
- 1999-10-27 AT AT99952200T patent/ATE246389T1/de active
- 1999-10-27 JP JP2000578808A patent/JP3490685B2/ja not_active Expired - Lifetime
- 1999-10-27 DE DE69910058T patent/DE69910058T2/de not_active Expired - Lifetime
- 1999-10-27 JP JP2000578812A patent/JP3936139B2/ja not_active Expired - Lifetime
- 1999-10-27 ES ES99952199T patent/ES2205891T3/es not_active Expired - Lifetime
- 1999-10-27 BR BRPI9914889-7B1A patent/BR9914889B1/pt not_active IP Right Cessation
- 1999-10-27 DK DK99952199T patent/DK1125276T3/da active
- 1999-10-27 PT PT99952200T patent/PT1125285E/pt unknown
- 1999-10-27 CN CN99813602A patent/CN1127055C/zh not_active Expired - Lifetime
- 1999-10-27 AU AU64569/99A patent/AU763471B2/en not_active Expired
- 1999-10-27 EP EP99952199A patent/EP1125276B1/en not_active Expired - Lifetime
- 1999-10-27 WO PCT/CA1999/001010 patent/WO2000025304A1/en active IP Right Grant
- 1999-10-27 DE DE69913724T patent/DE69913724T2/de not_active Expired - Lifetime
- 1999-10-27 RU RU2001114193/09A patent/RU2217718C2/ru active
- 1999-10-27 CA CA002347667A patent/CA2347667C/en not_active Expired - Lifetime
- 1999-10-27 CN CNB998136018A patent/CN1172292C/zh not_active Expired - Lifetime
- 1999-10-27 KR KR10-2001-7005325A patent/KR100417634B1/ko active IP Right Grant
- 1999-10-27 AU AU64570/99A patent/AU6457099A/en not_active Abandoned
- 1999-10-27 ES ES99952201T patent/ES2212642T3/es not_active Expired - Lifetime
- 1999-10-27 AU AU64571/99A patent/AU752229B2/en not_active Expired
- 1999-10-27 AT AT99952183T patent/ATE246836T1/de active
- 1999-10-27 DE DE69910240T patent/DE69910240T2/de not_active Expired - Lifetime
- 1999-10-27 BR BRPI9914890-0B1A patent/BR9914890B1/pt not_active IP Right Cessation
- 1999-10-27 NZ NZ511163A patent/NZ511163A/en not_active IP Right Cessation
- 1999-10-27 MX MXPA01004181A patent/MXPA01004181A/es active IP Right Grant
- 1999-10-27 PT PT99952201T patent/PT1125286E/pt unknown
- 1999-10-27 CN CNB998136417A patent/CN1165892C/zh not_active Expired - Lifetime
- 1999-10-27 WO PCT/CA1999/001008 patent/WO2000025298A1/en active IP Right Grant
- 1999-10-27 EP EP99952183A patent/EP1125284B1/en not_active Expired - Lifetime
- 1999-10-27 AT AT99952199T patent/ATE246834T1/de active
- 1999-10-27 AU AU64555/99A patent/AU6455599A/en not_active Abandoned
- 1999-10-27 AT AT99952201T patent/ATE256910T1/de active
- 1999-10-27 WO PCT/CA1999/001009 patent/WO2000025303A1/en active IP Right Grant
- 1999-10-27 ES ES99952183T patent/ES2207968T3/es not_active Expired - Lifetime
- 1999-10-27 US US09/830,331 patent/US6795805B1/en not_active Expired - Lifetime
- 1999-10-27 CA CA002347743A patent/CA2347743C/en not_active Expired - Lifetime
- 1999-10-27 PT PT99952199T patent/PT1125276E/pt unknown
- 1999-10-27 DK DK99952183T patent/DK1125284T3/da active
- 1999-10-27 JP JP2000578811A patent/JP3566652B2/ja not_active Expired - Lifetime
- 1999-10-27 RU RU2001114194/09A patent/RU2219507C2/ru active
- 1999-10-27 CN CNB998136409A patent/CN1165891C/zh not_active Expired - Lifetime
- 1999-10-27 CA CA002347668A patent/CA2347668C/en not_active Expired - Lifetime
- 1999-10-27 PT PT99952183T patent/PT1125284E/pt unknown
- 1999-10-27 US US09/830,114 patent/US7260521B1/en not_active Expired - Lifetime
- 1999-10-27 US US09/830,332 patent/US7151802B1/en not_active Expired - Lifetime
- 1999-10-27 DK DK99952200T patent/DK1125285T3/da active
- 1999-10-27 EP EP99952200A patent/EP1125285B1/en not_active Expired - Lifetime
- 1999-10-27 KR KR10-2001-7005326A patent/KR100417635B1/ko active IP Right Grant
- 1999-10-27 KR KR10-2001-7005324A patent/KR100417836B1/ko active IP Right Grant
- 1999-10-27 JP JP2000578810A patent/JP3869211B2/ja not_active Expired - Lifetime
- 1999-10-27 CA CA002347735A patent/CA2347735C/en not_active Expired - Lifetime
- 1999-10-27 EP EP99952201A patent/EP1125286B1/en not_active Expired - Lifetime
- 1999-10-27 DE DE69910239T patent/DE69910239T2/de not_active Expired - Lifetime
- 1999-10-27 US US09/830,276 patent/US6807524B1/en not_active Expired - Lifetime
- 1999-10-27 MX MXPA01004137A patent/MXPA01004137A/es active IP Right Grant
- 1999-10-27 WO PCT/CA1999/000990 patent/WO2000025305A1/en active IP Right Grant
- 1999-10-27 ES ES99952200T patent/ES2205892T3/es not_active Expired - Lifetime
- 1999-10-27 DK DK99952201T patent/DK1125286T3/da active
-
2001
- 2001-04-25 ZA ZA200103366A patent/ZA200103366B/en unknown
- 2001-04-25 ZA ZA200103367A patent/ZA200103367B/en unknown
- 2001-04-26 NO NO20012067A patent/NO318627B1/no not_active IP Right Cessation
- 2001-04-26 NO NO20012068A patent/NO317603B1/no not_active IP Right Cessation
- 2001-04-26 NO NO20012066A patent/NO319181B1/no not_active IP Right Cessation
-
2002
- 2002-06-20 HK HK02104592.2A patent/HK1043234B/zh not_active IP Right Cessation
-
2004
- 2004-10-15 US US10/964,752 patent/US20050108005A1/en not_active Abandoned
- 2004-10-18 US US10/965,795 patent/US20050108007A1/en not_active Abandoned
- 2004-12-01 NO NO20045257A patent/NO20045257L/no unknown
-
2006
- 2006-08-04 US US11/498,771 patent/US7672837B2/en not_active Expired - Fee Related
-
2009
- 2009-11-17 US US12/620,394 patent/US8036885B2/en not_active Expired - Fee Related
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2207968T3 (es) | Metodo de recuperacion de contenidos de alta frecuencia y dispositivo para una señal sintetizada, sobremuestreada de banda ancha. | |
ES2266003T3 (es) | Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. | |
US7280959B2 (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals |