MXPA97010462A

MXPA97010462A - Metodo y aparato para cambio de escala temporal enproductos para comunicaciones

Info

Publication number: MXPA97010462A
Application number: MXPA/A/1997/010462A
Authority: MX
Inventors: Satyamurti Sunil; Sibecas Salvador
Original assignee: Motorola Inc
Priority date: 1995-06-26
Filing date: 1997-12-19
Publication date: 1998-10-15

Abstract

La presente invención se refiere a un sistema de comunicaciones (100) que proporciona compresión de voz incluye una estación de base que tieneun dispositivo de entrada (113) para recibir un mensaje de voz de sonido, una memoria (209) para guardar el mensaje y un dispositivo procesador (206) para digitalizar el mensaje para proporcionar una señal de entrada para análisis. La señal de entrada se divide en una secuencia de cuadros de tiempo, se determinan diferencias en un espectro de frecuencia de corto plazo entre cuadros de tiempo adyacentes para obtener una secuencia de mediciones de distancia, se computa un primer factor de velocidad como un promedio de la secuencia de mediciones de distancia y se cambia la escala de tiempo de la señal de entrada de acuerdo con el primer factor de velocidad para proporcionar una señal de cambio de escala temporal que es transmitida por el transmisor (102). Una cantidad de receptores de llamadas selectivos (112) incluye el receptor de llamadas selectivo (105) para recibir la señal de cambio de escala temporal, un dispositivo procesador (106) para desmodular y expandir la señal de cambio de escala temporal con el primer factor de velocidad para proporcionar una señal reconstruida que es amplificada por un amplificador (108) para producir una señal de sonido reconstruida.

Description

MÉTODO Y APARATO PARA. CAMBIO DE ESCALA TEMPORAL, EN PRODUCTOS PARA COMUNICACIONES Campo técnico Esta invención se relaciona en general con técnicas de cambio de escala temporal y más particularmente con un método y aparato para cambio de escala temporai p?e.j.orado utilizando un factor de velocidad derivado de una señal de entrada.

Antecedentes , Se usan métodos de cambio de escala temporal para comprimir y expandir señales de entrada, en particular señales de entrada de habla. Además, las técnicas de- cambio-, de- escala temporal cuando se usan con sistemas de comunicaciones permiten un sistema más eficiente de ancho de banda que otras técnicas. El cambio de escala temporal de señales de voz también generalmente presenta intercambios en,tre relaciones de compresión de voz y calidad de habla después de la reconstrucción. Las técnicas de cambio de escala temporal no han considerado totalmente que los diferentes halantes pueden hablar a diferentes ritmos o veiocidades.

Por lo tanto, usando las técnicas existentes, la voz de hablantes más rápidos puede comprimirse demasiado y por lo tanto proporcionar habla reconstruida de menor calidad y la voz de los hablantes más lentos no se comprimirla lo suficiente, causando asi una compresión ineficiente. También ciertas técnicas como el dictado y la edición de sonido requieren que todos los mensajes se reproduzcan a la misma velocidad sin respetar cuan rápido o despacio habla la persona. Estos dispositivos se beneficiarían con el uso de un factor de velocidad como una entrada en un algoritmo de modificación de cambio de escala temporal y además usan el factor de velocidad para igualar el ritmo de voz.

Con respecto al aspecto de recepción de llamadas selectiva que implica cambio de escala temporal de señales de voz y a otras aplicaciones como dictado y mensaje de, voz, los métodos actuales de cambio de escala temporal carecen de combinaciones ideales de provisión de calidad y flexibilidad de voz adecuada que permita a un diseñador optimizar la aplicación dentro de las limitaciones dadas. Por lo tanto existe una necesidad de un sistema de comunicaciones de voz que sea económicamente viable y flexible en permitir la optimización dentro de una configuración dada, y más particularmente con respecto a aplicaciones de receptor de llamada selectivo, que además mantenga muchas de las ventajas de los protocolos de receptor de llamadas selectivo de alta velocidad de Motorola.

Síntesis de la Invención En un aspecto de la presente invención, un método para-, la modificación de escala temporal de una señal de entrada comprende los pasos de digitalizar la señal de entrada para su análisis, guardar la señal de entrada en una memoria y luego dividir la señal de entrada en cuadros de tiempo..-. El método luego determina una diferencia en el espectro de frecuecia a corto plazo entre los cuadros de tiempo adyacentes para proporcionar un primer factor de velocidad y se cambia la escala temporal de la señal de entrada^ de acuerdo con el primer factor de velocidad.

En otro aspecto de la presente invención, un sistema de comunicaciones que usa compresión de voz que tiene al menos una estación de base transmisora y una canti ad de receptores de llamadas selectivos, comprende en la estación de base transmisora, un dipositivo de entrada para recibir una señal de sonido, un dispositivo procesador para digitalizar la señal de sonido para proporcionar, una señal de entrada para el análisis, para dividir la señal de entrada en cuadros de tiempo equivalentes,, para c-eterminar una diferencia en el espectro de frecuencia de corto plazo entre cuadros de tiempo adyacentes para proporcionar un primer factor de velocidad para el cambio, de. escala temporal de la señal de entrada de acuerdo con el primer factor de velocidad para proporcionar, una señal de escala temporal cambiada, .una memoria para guardar la señal de sonido y un transmisor para transmitir la señal, de escala temporal cambiada. Cada uno de la cantidad de receptores de llamadas selectivos en el sistema de comunicaciones comprende un receptor de llamadas selectivo para recibir la señal de escala temporal cambiada, un dispositivo de procesamiento para desmodular y expandir la señal de escala de tiempo cambiada para proporcionar una señal reconstruida y un amplificador para amplificar la señal reconstruida en una señal de sonido reconstruida.

En otro aspecto de la presente invención, un dispastivo para modificación de escala temporal de voz, comprende un dispositivo de entrada para recibir una señal de. sonido.,, un dispositivo de procesamiento para digitalizar la señal de sonido para proporcionar una señal de entrada para análisis, para dividir la señal de entrada en cuadros de tiempo equivalentes, para determinar una diferencia en el espectro de frecuencia de corto plazo entre cuadros de tiempo adyacentes para proporcionar un primer factor de velocidad y para cambiar la escala temporal de la señal de entrada de acuerdo con el primer factor de velocidad para proporcionar una señal de escala temporal, cambiada y una memoria para guardar la señal de sonido.

Breve descripción de los dibujos La Fig.1 es un diagrama en bloques de un sistema de comunicaciones de voz de acuerdo con la presente invención. La fig.2 es un diagrama en bloques de un transmisor de estación de base de acuerdo con la presente invención. La fig.3 es un diagrama en bloques eléctrico expandido de un analizador de cambio de escala temporal de acuerdo con la presente invención. La Fig.4 es un diagrama en bloques eléctrico expandida del transmisor de estación de base de acuerdo con la presente invención. La Fig.5 es un diagrama en bloques expandido de otro transmisor de estación de base de acuerdo con la presente invención.

Descripción Detallada de la Realización Preferida La presente invención proporciona un método para detectar si un hablante está hablando rápido o lento y dar un factor de compresión óptimo para proporcionar cierta calidad de voz reconstruida cuando se usa con técnicas de cambio de escala temporal. Existen varios parámetros o factores que pueden usarse para determinar cuan rápido o lento está hablando un hablante. El primero es un ritmo al cual el espectro de frecuencia a corto plazo cambia en la voz... El segundo parámetro o factor son las duraciones de las pausas entre palabras. Estos dos factores se usan para determinar un factor de velocidad que determina cuan rápido o lento habla un hablante. Optativamete, un tercer, factor seria, el tono aproximado determinado a partir de un hablante particular para mejorar la precisión del factor de velocidad.

El sistema comprende digitalizar ln voz. y luego preferentemente dividir la en cuadros de 10 ms. El Análisis de Predicción Lineal (análisis LPC) se realiza en cada cuadro de voz y la diferencia en el espectro de frecuencia de corto plazo entre bloques adyacentes se determina usando la medida de distancia de Ita ura D que se representa con la fórmula: donde ** "R" es la matriz de autocorrelación relacionada con un cuadro n, "a" es el vector de LPC relacionado con el cuadro n y "b" es el vector de LPC relacionado con el cuadro n+l__ D es la medida de distancia entre el cuadro n y n+1. Cuanto mayor es la distancia D mayor es la diferencia, en las frecuencias entre cuadros adyacentes. Una medida promedio general de distancia se calcula, entonces para, la horac,ión de voz completa. . Esto da una medida del factor de velocidad.

Luego las intersecciones de energía y cero se. miden para cada cuadro y se detectan periodos de silencio. El poncentaje de periodos de silencio en la oración de voz da otra medida del factor de velocidad. Estos dos parámetros (y optativamente un parámetro de estimación de- tonal se usan para determinar el factor de compresión correcto que se necesita usar junto con las técnicas de cambio de escala de tiempo de manera de lograr una calidad dada de voz reconstruida.

Una breve descripción de un procedimiento de es imación de tono de muestra se da a continuación. 1) Encuadrar voz de entrada en bloques de 20 ms 2) Computar energía en cada bloque 3) Computar energía promedio por bloque 4) Determinar umbral de energía para detectar habla de voz como función de la energía promedio por bloque.

) Usar el umbral de energía para determinar blaques contiguos de habla de voz de un largo de por lo menos 5 bloques . 6) En cada bloque de habla de voz contigua, hallado en, el paso 5, realizar un análisis del tono. Esto puede hacerse usando variados métodos incluyendo el método de Autocorrelación Modificada, AMDF o método de autocorrelación limitada. 7) Los valores de tono se emparejan usando un filtra medio I para eliminar errores de estimación. 8) Promediar todos los valores de tona par obtener una estimación aproximada del tono del hablante.

Un régimen de muestreo de 8 kHz es asumido en tadas. los casos anteriores aunque se contemplan otros regímenes de muestreo y otros métodos de estimación, de. tano dentro, de la presente invención.

Como se mostrará con respecto a. la Eig_.3.,_ Si y S¿ son los factores de velocidad determinados usando la medida de distancia de Itakura D y los perladas de. silencio respectivamente. Son a su vez (optativamente, junto con la estimación de tono) usados para determinar el factor, de compresión y expansión final a. Por lo tanto, la medición de distancia de Itakura y el periodo de silencia se usa. para determinar el factor de velocidad para una oración de voz dada y además se usa para computar un factor de compresión/expansión para una calidad dada de ?voz reconstruida.

Con referencia a la fig.1, se muestra un sistema de comunicaciones ilustrativo de las técnicas de compresión y expansión de voz de la presente invención en un diagrama en bloques del sistema de llamadas selectivo 100 que comprende un dispositivo de entrada para recibir una señal de entrada como un teléfono 114 desde el cual se inician llamadas selectivas basadas en voz para la transmisión a receptores de llamadas selectivos en el sistema 100. Cada llamada selectiva entrada por el teléfono 114 (u otro dispositivo de entrada como una computadora) generalmente comprende (a) una dirección de receptor de al menos una de los. receptares de llamadas selectivos en el sistema y (b) un mensaje de voz. Las llamadas selectivas generalmente son proporcionadas a una estación de base transmisora o a un terminal de llamadas selectivo 113 para formato y puesta en espera. Los circuitos de compresión de voz 101 del terminal 113 sirven para comprimir el largo de tiempo del mensaje de voz provisto (la operación detallada de dichos circuitos de compresión de voz 101 se discuten más en la siguiente descripción de las Figs. 2-5). Preferentemente, los circuitos de compresión de voz 101 incluyen un dispositivo de procesamiento para comprimir la señal de sonido usando una técnica de cambio de escala temporal y una técnica,, de modulación de banda lateral única para proporcionar una señal procesada, aunque otras técnicas de. modulación de voz son contempladas para su uso en la presente invención. La llamada selectiva se ingresa luego en el transmisor de llamadas selectivo 102 donde se aplica como modulación a una señal de radiofrecuencia que se envia con un factor de cambio de escala temporal por el aire a través de un transmisor de modulación para transmitir la. señal procesada, aunque se contemplan otros transmisores para su uso en la presente invención.

Una antena 104 dentro de un receptor de llamadas selectivo 112 recibe la señal de radinfr r.nenci a. modulada, transmitida y la ingresa en un receptor de llamadas selectivo o módulo receptor de radiafnecnencia- 1Q5. para recibir la señal procesada o señal de radiofrecuencia, donde la señal de radiofrecuencia es desmodulada y la dirección del receptor y la señal (QAM) de banda lateral única son recuperadas. Preferentemente,, el receptor de llamadas selectivo 112 incluye un dispositivo de procesamiento para desmodular la señal procesada recibida usando una técnica de desmodulación de banda lateral única y una técnica de expansión de cambio de escala temporal para proporcionar una señal reconstruida. El mensaje de voz comprimida se proporciona luego a un circuito de expansión de voz 106 donde la duración de tiempo del mensaje de voz preferentemente se expande al valor deseado. El mensaje de voz es provisto luego a un conversor digital a analógico (no mostrado) y un amplificador co o el amplüiaador de sonido 108 con el propósito de amplificarlo a una señal de sonido reconstruida.

La dierección de receptor desmodulada y ei factor de cambio de escala temporal se suministran desde el receptor de radiofrecuencia 105 a un decodificador 107. Si la dirección del receptor coincide con cualquiera de las direcciones de receptor guardadas en el decodificadar iQ7,_ una. alarma 111 se activa optativamente, proporcionando una indicación sensorial breve al usuario del receptor de llamadas selectivo 112 de que se ha recibido una llamada selectiva. La indicación sensorial breve puede comprender una. señal auditiva, una señal táctil como una vibración, o una señal visual como una luz, o una combinación de ellas. El mensaje de voz amplificada se suministra de un amplificador de sonido 108 a un altoparlante de sonido dentro de la alarma 111 para el anuncio del mensaje y la revisión por el usuario.

El decodificador 107 puede comprender una memoria en la cual los mensajes de voz recibidos pueden guardarse, y se puede repetir el llamado en forma reiterada para revisar la actuación de uno o más controles 110.

En otro aspecto de la invención, las porciones, de. la Eig.l pueden interpretarse igualmente como parte de un dispositivo de dictado, sistema de mensaje, d. voz, contestador automático de llamadas o dispositivo de edición de surcos de sonidopor ejemplo. Quitando los. aspectos inalámbricos del sistema 100 incluyendo el quitado del transmisor de llamadas selectivo 102 y el receptar de radiofrecuencia 105, el sistema puede optativamente conectarse por cable desde el circuito de. compre ión de. voz 101 al circuito de expansión de voz 106 a través del A/D 115 como se muestra con la linea punteada .. Ean l tanto.,,, en un mensaje de voz, el contestador automático de llamadas, sistema de edición de surcos de. sonido a de_ dictado, un dispositivo de entrada 114 suministrarla una señal de entrada acústica como una señal de voz al terminal 113 que tiene circuito de compresión 101. El circuito de expansión de voz 106 y los controles 110 suministrarían el medio para escuchar y manipular la señal de voz de entrada en un mensaje de voz, contestador automático de llamadas, dictado, edición de surco de sonido u otro sistema aplicable. Esta invención claramente contempla que las técnicas de cambio de escala temporal, de la invención reivindicada tienen muchas otras aplicaciones además de la recepción de llamadas selectiva. El ejemplo de. recepción, de llamadas selectiva de aqui es simplemente ilustrativo de una de esas aplicaciones.

Con referencia a la Fig.2, la estación de base, y la porción de transmisión 200 de la presente invención se muestra en la Fig.2. En operación, los mensajes de voz entrantes se reciben por las lineas telefónicas 203, 205, 207, son procesadas por los circuitos de, interfaz. de linea telefónica normales 202 (incluyendo preferentemente un sistema de PBX) y luego se graban temporalmente, en cinta magnética o en una memoria electrónica, es decir en una memoria de buffer. La interfaz telefónica, comunes, y las porciones de memoria de buffer en bloque 202 se denominan como un sistema de almacenamiento y avance de voz y se describen en detalle en el Manual de Instrucciones de Motorola No. 68P81105C25, titulado, "Vaice Store and Forward Modax Plus/Metro-Page".

Luego, los mensajes se recuperan desde la memoria de buffer dentro del bloque 202 y son procesados por un bloque detector de voz 206 que preferentemente incluye circuitos de análisis LPC que analizan la señal de voz y generan los parámetros LPC digitales que corresponden a la señal de. voz de entrada.

El detector de régimen de voz 206 compnt y proporciona un factor de cambio de escala temporal a a un Bloque de Cambio de Escala Temporal de Compresión 208 que comprime, la se?al de voz de entrada de acuerdo con el factor de cambio de escala temporal. El Bloque 208 se conecta con el controlador 210 y puede optativamente incluir el bloque de memoria 209.

En el sistema de voz de la presente invención, la intención es proporcionar una técnica en la cual los mensajes de voz pueden transmitirse en el tiempo que hoy se requiere para transmitir un mensaje mientras minimiza los efectos en la calidad de voz.

Como se mencionó arriba, las señal es de. vaz_ entradas de linea telefónica 203,205 y 207 se guardan temporalmente en una memoria de almacenamiento dentro del bloque 202. Esto se hace para manejar cargas de entrada de pico alto sin que se necesite un gran número de analizadores costosos. La voz guardada se recuperan de la memoria bajo la dirección del controlador 210 que, en la práctica puede ser una microcomputadora.

La fig.3 ilustra un diagrama en bloques detallado del detector de régimen- de voz 206 de la Eig.,2-.. El dLetectar-, de régimen de voz 206 preferentemente comprende varios pasos de análisis que finalmente produce compresión a expansj-ón más eficiente con un nivel opcional de calidad de voz deseada. El detector 206 preferentemente, comprende, un analizador LPC 250 que proporciona un análisis LPC en los cuadros de entrada de la señal de entrada. Preferentemente como se discutió previamente, la señal de entrada se digitaliza y divide en cuadros de 2.0. mi ] i segundos y_ se guarda en una memoria (ver memoria 209, fig.2). En el bloque 254, la distancia promedio usando, la distancia D desde cada cuadro para una señal de voz completa (por ejemplo, desde una oración completa, que comprende un mensaje), se computa preferentemente desde una fuente o hablante. Como resultado de la distancia promedio, computada y determinando una diferencia en el espectro de frecuencia de corto plazo entre los cuadros de tiempo adyacentes en el •— bloque 254, una medida de distancia total y como resultado de un primer factor de velocidad Si se. proporcion al bloque de decisión final 258. El bloque de decisión final 258 puede entonces proporcionar un factor de, cambia, de. escala temporal a para comprimir aproximadamente (o expandir) la señal de voz de entrada de acuerdo con el factor de cambio de escala temporal. Según la estimación de ritmo de del hablante, las distancias de Itakura pueden usarse para comprimir señales de entrada de voz, de acuerdo con el siguiente cuadro: ESCALA DE DISTANCIA DE ITAKURA *Tono <40 muestras *Tono >40 muestras RÉGIMEN COMPRESIÓN -0,4 a -0,45 < -0,3 4 -0,45 a -0,5 -0,35 a -0,4 3,5 -0,5 a -0,55 -0,4 a -0^45 3(25 < -0,55 -0,45 a -0,5 3 *Muestras de régimen de muestreo de 8 kilohertz.

Los valores de arriba pueden variar para la opti ización en diferentes sistemas. Factores como lenguaje, número de usuarios, relación entre géneros entre de un sistema pueden ser algunos de los muchos factores que pueden usarse para alterar las cifras el cuadro de arriba para proporcionar un sistema óptimo.

El mayor refinamiento del método puede lograrse usando un segundo factor de velocidad de voz S2 ejecutando un análisis de silencios en el bloque 260. En otras palabras, las intersecciones energía y cero se miden para cada cuadro usando esto, se detectan periodos de silencio. En el bloque 262, el porcentaje periodos de silencio en la señal de entrada de voz proporciona entonces, otra, medí da y un segundo factor de velocidad S2 que se computa en el bloque 264. En consecuencia, en vista del gráfico de arriba, si el silencio es inferior al 10%, usted puede reducir el régimen de compresión por 0,25. El valor realmente, ohtenido del bloque 264 puede ajustarse en base al nivel de la calidad de la voz deseada. En consecuencia, en este caso, los dos factores de velocidad Si y S2 son provistos al bloque de decisión 258 y se usan para determinar luego ei. factor, de compresión (o expansión) general correcto que es necesario usar junto con técnicas de cambio de escala temporal para lograr una calidad dada de la voz reconstruida. Además, la presente invención puede optativamente, determinar una estimación de tono promedio en el bloque 256 para proporcionar otro factor al bloque de decisión 258, permitiendo mayor refinamiento en la decisión para comprimir sin afectar en forma auditiva la calidad, óptima deseada de la voz resultante. Las estimación tono promedio en este caso ayudará a determinar si un hablante masculino o femenino está proporcionando la señal de entrada. Este conocimiento combinado con el factor de voz determinado previamente proporcionará un factor de cambio de escala temporal que se usa para obtener voz. reconstruida de calidad óptima.

La Fig.4 ilustra un diagrama en bloques de una. primera realización de un transmisor 300 de acuerdo con la presente invención. Una señal de voz analógica e ingresada en_ un filtro pasabajos 301 que atenúa fuertemente todas las frecuencias por encima la mitad del régimen de mues.tr.eo de un conversor analógico a digital (ADC) 303 que además se conecta al filtro 301. El ADC 303 preferentemente- convierte la señal de voz analógica en una señal digital de mariéra que pueda realizarse un nuevo procesamiento de señales usando técnicas de procesamiento digital. El procesamiento digital es el método preferido, pera las mismas funciones puden también ser cumplidas con técnicas analógicas o una combinación de técnicas analógicas y digitales.

Un filtro pasabandas 305 conectado al ADC 303 atenúa fuertemente las frecuencias por debajo y por encima de las frecuencias de corte. La frecuencia de corte inferior es preferentemente de 300 Hz lo cual permite que pasen frecuencias de voz significativas, pero atenúa las frecuencias más bajas que interferirían con una portadora piloto. La frecuencia de corte superior es preferentemente de 2800 Hz lo cual permite que pasen frecuencias de vaz. significativas pero atenúa frecuencias más altas que interferirían con los canales de transmisión adyacentes. Un bloque de control de ganancia automático (AGíD 307 preferentemente conectado con el filtro 305 iguala el nivel de volumen de diferentes voces. El bloque 3.07 luego proporciona una señal al bloque detector de régimen de voz 206, que opera como se describió previamente con respecto a la Fig.3 para proporcionar un factor de cambio de escala temporal al bloque de compresión de tiempo 309.

El bloque de compresión de tiempo 30.9 preferentemente conectado con el bloque de AGC 307 acorta el tiempo requerido para la transmisión de señal, de. voz permitiendo esencialmente el mismo espectro de señal que la salida del filtro pasabandas 305. El método de campresin de. tiempo, es preferentemente WSOLA-SD (como se explica en la solicitud de patente estadounidense No. 08/395^739), pera pueden usarse otros métodos. Un bloque de compresión de amplitud 311, y el bloque de expansión de amplitud correspondiente en un receptor (no mostrado) , forman un dispositivo compansor que se sabe que aumenta la relación señal-ru;i.do aparente de la voz recibida. La relación compansora es preferentemente de 2 a 1 en decibelea, pero pueden usarse otras relaciones de acuerdo con la presente invención. En el caso particular de un sistema de comunicaciones como un sistema receptor de llamadas selectivo, los dispositivos 301-309 pueden incluirse en un terminal receptor de llamadas selectivo (113 de la Fig.1) y los componentes restantes de la Fig.4 pueden constituir, un. transmior llamadas selectivo (102 de la Fig.1). En ese caso, habría típicamente una conexión entre el terminal receptor de llamadas selectivo y el transmisor de llamadas selectivo. Por ejemplo, la señal después dei. blaque 309 podría codificarse usando una técnica de modulación de código de pulsos (PCM) y luego decodificarse usando PCM para reducir el número de bits transferidos entre el terminal de llamadas selectivo y el transmisor de llamadas selectivo.

En cualquier caso, un segundo filtro pasabandas 308 conectado con el bloque de compresión 311 atenúa fuertemente frecuencias por debajo y por encima de sus frecuencias de corte para quitar cualquier omponen e ? de frecuencia espurio generado por el AGC 307, el bloque de compresión de tiempo 309 o el bloque de compresión de amplitud 311. La frecuencia de corte inferior es preferentemente de 300 Hz lo cual permite que. pasen frecuencias de voz significativas, pero atenúa frecuencias más bajas que interferirían con la portadora piloto. La frecuencia de corte superior es preferentemente de 2800 Hz lo cual permite que pasen significativas frecuencias de vaz pero atenúa frecuencias más altas que inferferirian con canales de transmisión adyacentes.

Las muestras de voz de tiempo comprimido preferentemente se guardan en un buffer 313 hasta que se haya pracesada. un mensaje de voz completo. Esto permite que el mensaje de voz de tiempo comprimido se transmita luego en su totalidad^ El método de buffer preferentemente se usa para el servicio de llamadas selectivo (que generalmente es un servicio, en tiempo no real) . Otros métodos de buffer pueden ser preferibles para otras aplicaciones. Por ejempla^. para una aplicación que implica conversación en tiempo real bidireccional, el retardo causado por este tipa de. buffer puede ser intolerable. En ese caso seria preferible intercalar pequeños segmentos de varias conversaciones .. Por ejemplo, si la relación de compresión de tiempo es de 3:1, luego 3 señales de voz en tiempo real pueden transmitirse a través de un canal único. Las tres transmisiones pueden intercalarse en el canal en impulsos de.15Q milis gundos y los retardos resultantes serian objetables. La señal de voz de tiempo comprimido del buffer 313 se aplica tanto a un filtro de transformación de Hilbert 323 como a un bloque de retardo de tiempo 315 que tiene el retardo de tiempo del filtro de transformación de Hilbert, pero no afecta de otro modo la señal.

La salida del bloque de retardo de tiempo 315 (a través del circuito sumador 317) y el filtro de transformación. de Hilbert 323 forman respectivamente los componentes en fase (I) y cuadratura (Q) de la señal de banda lateral única (SSB) de banda lateral superior (USB). La salida del retardo de tiempo y la negativa (325) del filtra de transformación de Hilbert forman, respectivamente, los componentes en fase (I) y cuadratura (Q) de una señal de banda lateral única de banda lateral inferiro (LSB) . Por lo tanto la transmisión puede ser en cualquiera de. la_ banda lateral superior o inferior, como lo indica la conexión punteada.

Si bien la banda lateral superior se, usa para, transmitir una señal de voz de tiempo comprimido, la banda lateral inferior puede usarse para transmitir si muí táneamen e una segunda señal de voz de tiempo comprimido usando otro transmisor similar que opera en la banda, lateral inferior.

La SSB es el método de modulación preferido debido al uso eficiente del ancho de banda de transmisión y a la resistencia a la diafonia. La Modulación de Amplitud de banda lateral doble (AM) o la modulación de frecuencia (FM) pueden usarse, pero requieren de por lo menos el doble del ancho de banda para la transmisión. También es posible transmitir una señal de voz de tiempo comprimido directamente a través del componente I y una segunda se?al de voz de tiempo comprimido directamente a través del componente Q; sin embargo, en la presente realización este método está sujeto a diafonia entre las dos señales cuando se produce recepción de múltiple trayectoria, en el receptor.

Una señal de corriente continua (DC) se agrega al componente I de la señal para generar la portadora piloto, que se transmite junto con la señal, y es usada por. el receptor para anular sustancialmente los efectos de ganancia y variaciones de fase o desvanecimiento en el canal de transmisión. Los componentes I y Q de la señal son convertidos en la forma analógica por. conversares, digital a analógico (DAC) 319 y 327 respectivamente. Las dos señales son filtradas luego por los filtros de reconstrucción de pasabajos 321 y 329 respectivamente para quitar componentes de frecuencia espuria resultantes del procesa de. conv.ersj.on de digital a analógico. Un modulador de modulación de amplitud en cuadratura (QAM) 333 modula las señales I y Q en una portadora de radiofrecuencia a bajo nivel de potencia. Otros métodos de modulación, ej .. síntesis digital directa de la señal modulada lograrían el mismo propósito que los DACs (319 y 327), filtros de reconstrucción (321 y 329) y modulador QAM 333. Finalmente, un amplificador de potencia de radiofrecuencia lineal 335 amplifica la señal de radiofrecuencia modulada al nivel de potencia deseado, generalmente de 50 watts o más. Luego, la salida del amplificador de potencia de radiofrecuencia 335 ae conecta con la antena transmisora. Otras variaciones pueden producir esencialmente los mismos resultados. Por ejemplo, la compresión de amplitud podria realizarse antes de la compresión de tiempo u omitirse completamente y el dispositivo aun cumplirla esencialmente la misma función.

La Fig.5 ilustra un diagrama en bloques de una segunda realización de un transmisor 400 de acuerdo con la presente invención. En la Fig.5, las bandas laterales superior e inferior se usan para transmitir simultáneamente diferentes porciones de la misma señal de tiempa comprimido.. El transmisor 400 preferentemente incluye un filtro anti-alias 404, un ADC 403, un filtro pasabandas 405, un AGC. 4_Q7,_ un bloque de compresión de tiempo 409, un bloque de compresión de amplitud 411 y un filtro pasabandaa 4.08 conectadas y configurados como en la Fig.4. El bloque 407 proporciona una señal al bloque detector de régimen de voz 206, que opera como se describió anteriormente con respecto a la fig.3 para proporcionar un factor de cambio de escala temporal al bloque de compresión de tiempo 409. La operación del transmisor de la Fig.4 es la misma que en la Fig.3 hasta que todo el mensaje de voz ha. sido procesado y guardado en un buffer 413. Las muestras de tiempo comprimido guardadas en el buffer 413 se dividen luego para ser transmtidas en la banda lateral superior o inferior. Preferentemente, la" primera mitad del menaaj.e de, voz, de tiempo comprimido se transmite a través de una banda lateral y la segunda mitad del mensaje de voz, de. tiempo comprimido se transmite a través de la otra banda lateral (o alternativamente en cada uno de los componentes L. y Q directamente) .

La primera porción de la señal de vaz, de, tiempa comprimido desde el buffer 413 se aplica al primer filtro de transformación de Hilbert 423 y al primer, alaque. de. retardo 415 que tiene el mismo retardo que el filtro de transformación de Hilbert 423 pero no afect de, otro modo la señal. La salida del primer retardo de tiempo (a través del circuito sumador 417) y el primer filtra de transformación de Hilbert 423 (a través del circuito sumador 465) son componentes de señal en fase (I) y de fase de cuadratura (Q) que, cuando se conectan con las entradas I y Q del modulador QAM, generan la señal de band lateral superior que tiene información sólo desde la primera porción de las muestras de voz de tiempo comprimido. La segunda señal de voz de tiempo comprimido desde el buffer 413 se aplica tanto a un segundo filtro de transformación de Hilbert 461 como a un segunda bloque, de. retarda de tiempo 457 que tiene el mismo retardo de tiempo que el filtro de transformación de Hilbert 4.61. pero no. fecta,, de otro modo la señal. La salida del segundo retardo de tiempo (a través del circuito sumador 459 y 417)? y ei negativo (463) de la salida del segundo filtro de transformación de Hilbert 461 (y nuevamente a través del circuito sumador 465) son componentes en fase (I) de fase de cuadratura (Q) que, cuando se conectan con las entradas L y Q del modulador QAM, generan una señal de banda lateral superior que tiene información sólo de la segunda, porción de. las muestras de voz de teimpo comprimido. Los componentes I de las señales de banda lateral superior e in eriar, se, agregan con un componente de portadora piloto de corriente continua (a través del circuito sumador 4.59) para, formar un componente I compuesto para la transmisión. Los componentes Q de las señales de banda lateral superior e_ inferior, se agregan (a través del circuito sumador 465) para formar un componente Q compuesto para la transmisión* Se apreciará que los elementos 415, 423, 457, 461, 417, 459, 463, 465, 419, 427, 421 y 429 forman un procesador, que. genera componentes I y Q procesados, que cuando se conectan con el modulador QAM 453 generan dos señales de banda lat única, que tienen información independiente en cada banda lateral.

El transmisor 400 comprende además DACs 419 y 427, filtros de reconstrucción " 421 y 429, modulador QAM 433 y amplificador de potencia de. radiófrecuenci a 4.5.5. dispuestos y construidos como se describe en la Fig.4. La operación del resto del transmisor de la Fig.5 es iguai a. la d la Fig.4.

Preferentemente, en ambos transmisores 300 y 400 de las Figs. 4 y 5 respectivamente, sólo los filtros anti-alias, los filtros de reconstrucción, el amplificador, de. potencia de radiofrecuencia y optativamente el conversor analógico a digital y los conversores digital a analógico pueden preferentemente incorporarse en software que puede correrse en un procesador, preferentemente un procesador de señales digitales.

Claims

REIVINDICACIONES

1. Un sistema de comunicaciones que usa compresión de. voz que tiene al menos "una estación de base transmisora y una cantidad de receptores de llamadas sele.ctivas^_ que comprende : en la por lo menos una estación de base, transmi o a: un dispositivo de entrada para recibir un mensaje de voz de sonido; memoria para guardar el mensaje de voz de sonido; un dispostivo procesador para digitalizar, el mensaje de voz de sonido para proporcionar una señal de entrada para análisis, para dividir la, seña] de entrada en una secuencia de cuadros de tiempo equivalenes, para determinar diferencias, en. un espectro de frecuencia de corto plazo entre cuadros de tiempo adyacentes para, obtener, una secuencia de mediciones de distancia, computar un primer factor de velocidad como un promedio d la. secuenci de. de mediciones de distancia, y para cambiar la escala temporal de la señal de entrada de. acuerdo can el primer factor de velocidad para proporcionar una señal de escala temporal cambiada; un transmisor para transmitir la señal de cambio de escala temporal; en cada uno de la cantidad de receptores de llamadas selectivos: un receptor de llamadas selectivo para recibir la señal de cambio de escala temporal; un dispositivo" procesador para de.smod. l r y, expandir la señal de cambio de escala de tiempo de acuerdo con el primer factor de velocidad para, proporcionar una señal reconstruida; y un amplificador para amplificar la señal, reconstruida en una señal de sonido reconstruida.

2. El sistema de co ?nicaciones de. la_ reisri ndi c i ó.? 1 donde el dispositivo procesador para digitalizar el mensaje de voz de sonido determina también un porcentaje, de periodos de silencio dentro de la señal de entrada para el análisis para proporcionar un segundo factor d- velocidad y que además cambia la escala temporal de la señal de entrada de acuerdo con el primer factor de velocidad y. el. segundo factor de velocidad.

3. El sistema de comunicaciones de la reivindicación 1 donde el dispositivo de procesamiento en la por lo menos una estación de base transmisora determina las diferencias en el espectro de frecuencia de corto plazo realizando un análisis de predicción lineal en cada uno de la secuencia de cuadros de tiempo equivalentes.

4. El sistema de comunicaciones de la reivindicación 1 donde el dispositivo procesador en la por la menos una estación de base transmisora determina las diferencias en el espectro de frecuencia de corto plazo usando la medida de distancia de Itakura D.

5. El sistema de comunicaciones de la. reivindicaci ón 1 donde el paso de determinar un procentaje de periodos de silencio comprende los pasos de medir intersecciones energía y cero para cada uno de la secuencia de cuadros de tiempo equivalentes. „?

6. Una estación de base transmisora que comprende: un dispositivo de entrada para recibir un mensaje de voz de sonido; memoria para guardar el mensaje de voz. d sonido;, un dispositivo de procesamiento para digitalizar el mensaje de voz de sonido para proporcionar una señal de entrada para análisis, para dividir la señal de entrada en una secuencia de cuadros equivalentes, para determinar diferencias en un espectro de frecuencia de corto plazo entre cuadros de tiempo adyacentes para obtener una secuencia de mediciones de distancia, computar un primer factor de velocidad como un promedio de la secuencia de mediciones de distancia y para cambiar la escala temporal de la señal de entrada de acuerdo con el, primer, fa tor, de velocidad para proporcionar una señal de cambio de escala temporal; un transmisor para transmitir la señal de cambio de escala temporal .

7. La estación de base transmisora de. la. reivindicación 6, donde el dispositivo procesador para digitalizar el mensaje de voz de sonido determina un porcentaje de. periodos de silencio dentro de la señal deentrada para análisis para proporcionar un segundo factor de velocidad y además cambia la escala temporal de la señal de entrada de acuerdo con el primer factor de velocidad y el. segunda factor de velocidad.

8. La estación de base transmisora de_ la reivi dicación 6, donde el dispositivo procesador determina las diferencias en el espectro de frecuencia de corto plazo usando una medida de distancia de Itakura D.

9. La estación de base transmisora da la reivindicación 6, donde el paso de determinar un porcentaje de periodos de silencio comprende los pasos de medir intersecciones íe energía y cero para cada uno de la secuencia de cuadros.1 de tiempo equivalentes.