MXPA02002812A - Metodo y dispositivo para distinguir entre conversacion de voz y reconocimiento automatico. - Google Patents
Metodo y dispositivo para distinguir entre conversacion de voz y reconocimiento automatico.Info
- Publication number
- MXPA02002812A MXPA02002812A MXPA02002812A MXPA02002812A MXPA02002812A MX PA02002812 A MXPA02002812 A MX PA02002812A MX PA02002812 A MXPA02002812 A MX PA02002812A MX PA02002812 A MXPA02002812 A MX PA02002812A MX PA02002812 A MXPA02002812 A MX PA02002812A
- Authority
- MX
- Mexico
- Prior art keywords
- destination
- signal
- phonation
- address
- speech
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000005540 biological transmission Effects 0.000 claims abstract description 34
- 241000282414 Homo sapiens Species 0.000 claims description 23
- 238000002716 delivery method Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
Un metodo y dispositivo para ejecutar algun procesamiento previo sobre transmisiones de voz dependiendo del destino pretendido de la transmision. El dispositivo incluye un componente receptor configurado para recibir una senal de voz a partir de una fuente sobre una red. El dispositivo incluye tambien un componente de procesamiento configurado para determinar una direccion de destino asociada con la senal recibida, determinar un algoritmo de procesamiento de senal a partir de una pluralidad de algoritmos de procesamiento de senal en base a la direccion determinada, y procesar la senal de voz de acuerdo con el algoritmo especificado. El dispositivo incluye ademas un componente de suministro configurado para enviar la senal procesada hacia la direccion asociada.
Description
MÉTODO Y DISPOSITIVO PARA DISTINGUIR ENTRE CONVERSACIÓN DE VOZ Y RECONOCIMIENTO AUTOMATICO DEL
HABLA.
RECLAMACIÓN DE PRIORIDAD.
Esta solicitud reclama la prioridad de las Solicitudes Provisionales de los Estados Unidos de Norteamérica presentadas el 29 de Marzo del 2001, de Número de Serie 60/280,377, Número de Referencia del Apoderado WING-1-1002, y el 2 de Abril del 2001, de Número de Serie 60/278,454, de Número de Referencia del Apoderado WING-1-1006, y la Solicitud No Provisional de los Estados Unidos de Norteamérica presentada el 16 de Junio del 2001, de Número de Serie 09/884,902, Número de Referencia del Apoderado WING-1015.
ANTECEDENTES.
La transmisión de voz sobre una red inalámbrica digital involucra la captura de ondas sonoras utilizando un micrófono y convirtiéndolas en señales eléctricas y después en datos binarios. El proceso comprende el muestreo, digitalización y otros procesaos de señal digital en la unidad receptora (por ejemplo, módulo telemático o teléfono celular).
Existe una diferencia fundamente al entre la forma en que los seres humanos procesan la entrada audible y la forma en que los servidores de reconocimiento de voz automatizada (ASR) procesan la entrada de voz. Por tanto, diferentes algoritmos para la señal de procesamiento deben utilizarse. Sin embargo, en las aplicaciones actuales, se utiliza un proceso de compromiso individual, con las ineficiencias resultantes.
BREVE DESCRIPCIÓN.
La presente invención proporciona un método y dispositivo en base a computadora para ejecutar el procesamiento previo sobre transmisiones de voz que dependen del destino de la transmisión pretendida. El dispositivo incluye un componente receptor configurado para recibir una señal de voz desde una fuente sobre una red. Se incluye también un componente de procesamiento configurado para determinar una dirección de destino asociada con la señal recibida, determinar un algoritmo de procesamiento de señal a partir de una pluralidad de algoritmos de procesamiento de señal en base a la dirección de destino, y procesar la señal de voz de acuerdo con el algoritmo especificado. El dispositivo incluye además un componente de suministro configurado para enviar la señal procesada hacia la dirección asociada. De acuerdo con otros aspectos de la invención, el dispositivo incluye también la memoria configurada para almacenar direcciones con un algoritmo de procesamiento de señal asociada, en donde el componente de procesamiento se encuentra en la memoria un algoritmo de procesamiento de señal que está asociado con la dirección de destino determinada. De acuerdo con otros aspectos adicionales de la invención, el dispositivo incluye un componente de alerta configurado para alertar al receptor de que la señal de voz es desde un sistema en base a computadora, si la fuente es un sistema en base a computadora. De acuerdo con otro aspecto más de la invención, el dispositivo en base a computadora incluye cuatro componentes adicionales utilizados para facilitar la presente invención: un primer componente configurado para seleccionar una dirección para una transmisión de voz; un segundó componente configurado para recibir una fonación introducida para la transmisión de voz; un tercer componente configurado para procesar la fonación recibida de acuerdo con un algoritmo asociado con un dispositivo de reconocimiento de voz (si la dirección seleccionada está asociada con un dispositivo de reconocimiento de voz) y enviar la fonación procesada hacia el destino seleccionado; y un cuarto componente configurado para enviar la fonación recibida hacia el destino seleccionado de acuerdo con un método de suministros asociado con los receptores humanos (sí la dirección seleccionada no está asociada con un dispositivo de reconocimiento de voz). De acuerdo con aspectos adicionales de la invención, un dispositivo en base a computadora incluye cuatro componentes adicionales utilizados para facilitar la presente invención: un primer componente configurado para procesar una fonación en una fuente para recepción mediante un receptor humano; un segundo componente configurado para enviar la fonación procesada hacia un destino de acuerdo con una dirección asociada con la fonación; un tercer componente configurado para recibir una señal de cambio desde el destino; y un cuarto componente configurado para procesar una siguiente fonación para recepción mediante un servidor de reconocimiento de voz de acuerdo con una señal de cambio recibida, y enviar la fonación recién procesada hacia el destino. Como se apreciará más fácilmente a partir de la breve descripción anterior, la invención proporciona un método y dispositivo para mejorar las transmisiones de voz al ejecutar algún procesamiento previo sobre las transmisiones de voz dependiendo del destino deseado, y para proporcionar receptores con información de identificación de quien llama si la transmisión es generada por computadora.
BREVE DESCRIPCIÓN DE LOS DIBUJOS.
Las modalidades preferidas y alternativas de la presente invención se describen en detalle a continuación con referencia a los siguientes dibujos.
La figura 1 es un diagrama que ilustra un sistema de muestra para recibir y procesar señales de transmisión de voz sobre una red inalámbrica de acuerdo con la presente invención; La figura 2 es un diagrama de flujo que ilustra la operación de la presente invención; La figura 3 es un diagrama de flujo que ilustra un aspecto alternativo de la presente invención; y Las figuras 4-5 son diagramas de flujo que ilustran aspectos alternativos de la presente invención.
DESCRIPCIÓN DETALLADA DE LA MODALIDAD PREFERIDA.
La presente invención proporciona un método y dispositivo para determinar el destino de una señal de transmisión de voz y aplicar un algoritmo de procesamiento de señal de datos apropiados en base al destino determinado. El mismo sistema proporciona también un método para distinguir entre las llamadas entrantes enviadas desde un servidor o desde un ser humano a fin de notificar a la persona que recibe la llamada que se está enviando una llamada no solicitada. A manera de revisión y con referencia a la figura 1, la presente invención incluye un sistema 10 que comprende un transmisor 12 y una compuerta de distribución 16. El transmisor 12 incluye un teléfono celular o de línea alámbrica, un teléfono de red, otro dispositivo de comunicación o una computadora de generación de voz que genera una señal de sonido de voz para transmisión hacia las unidades finales (usuarios 24 o servidores de reconocimiento de voz 26) sobre una red, tal como una red inalámbrica o una red no inalámbrica primaria (por ejemplo, Internet). La compuerta de distribución 16 incluye un procesador 17, un receptor 18, un transmisor 19 y una base de datos 20. El receptor 18 en la compuerta de distribución 16 es preferiblemente un módulo de comunicación inalámbrico capaz de recibir voz y datos por medio de un enlace de comunicación inalámbrico. El transmisor 19 en la compuerta de distribución 16 es preferiblemente un módulo de comunicación inalámbrico capaz de enviar voz y datos por medio de un enlace de comunicación inalámbrico. La compuerta de distribución 16 está en comunicación con una o más unidades finales de usuario 24 y uno o más servidores dé reconocimiento de voz automatizada (ASR) 26, ya sea directamente o sobre una red (no mostrada). El procesador 17 compara una dirección incluida en la señal de transmisión de voz desde el transmisor 12, tal como una dirección de protocolo de Internet (IP), un número telefónico u otro método de identificación de una llamada entrante, para una tabla de búsqueda almacenada en la base de datos 20 El procesador aplica uno de un número de algoritmos de procesamiento de señal dependiendo de los resultados de la comparación. Debido a que existe una diferencia fundamental entre la forma en que los humanos procesan la entrada audible y la forma en que los servidores ASR procesan la entrada de voz, se aplican diferentes algoritmos a la señal de transmisión de voz para optimizar el beneficio para el destino determinado. Por ejemplo, si el destino es un servidor ASR 26, el algoritmo convierte la transmisión a forma digital (en caso de que no esté ya en formato digital) y ejecuta otro procesamiento de señal digital que beneficia el proceso que ejecutará el servidor ASR. Haciendo referencia ahora a la figura 2, una rutina ilustrativa
30 para la operación de la presente invención será descrita. En el bloque 32, la compuerta de distribución 16 recibe una señal de transmisión de voz. Comúnmente, la señal de transmisión de voz incluye una voz humana o voz generada por una computadora. En el bloque 34, el procesador 17 busca la información en la base de datos 20 que corresponde a una dirección de destino o número telefónico incluido en ja señal de transmisión de voz. La base de datos incluye una tabla de números telefónicos o una tabla de direcciones IP de destinos (unidades finales de usuario 24 y servidores 26) que están asociadas con cada algoritmo. Una dirección IP es especificada por el protocolo de Internet e identifica en forma única una computadora sobre la Internet. El procesador 17 determina que algoritmos (identificado como el algoritmo asociado) se utiliza para la optimización dependiendo de la dirección IP de destino de la transmisión de voz recibida. Por lo tanto, cuando se establece una llamada hacia uno de los números asociados con un servidor ASR, el procesador selecciona el algoritmo optimizado para un servidor ASR. De otra manera, el procesador selecciona el algoritmo para la conversación de voz en una unidad de usuario final 24.
En el bloque de decisión 36, el procesador 17 determina si el número de destino asociado es un servidor ASR 26. Si, en el boque 36, el procesador determina que el número de destino asociado es un servidor ASR 26, entonces, en el boque 38, el procesador procesa la transmisión de voz de acuerdo con el algoritmo de optimización para un servidor ASR y envía la señal de transmisión de voz procesada hacia el destino determinado. Si, en el bloque 36, el procesador determina que el número de destino asociado no es un servidor ASR 26, el procesador procesa la señal de transmisión de voz para medios de audición humanos de acuerdo con un algoritmo de optimización utilizado para producir un resultado más adecuado para un receptor humano. En el bloque 40, el procesador envía la señal de transmisión de voz procesada hacia el destino determinado. La figura 3 es un diagrama de flujo que ilustra una operación del envío de una señal hacia un receptor humano en el bloque 40 de la figura 2. En esta situación, en el bloque 54, el procesador 17 busca la información de identificación de la persona que llama relacionada con el origen de la señal (transmisor 12 en la base de datos 20). En el bloque de decisión 56, el procesador determina el origen de la señal de transmisión de voz mediante la comparación de la dirección de envío incluida en la señal de transmisión de voz hacia una tabla de direcciones IP almacenadas o números telefónicos n la base de datos 20. Por tanto, el procesador distingue entre las llamadas entrantes desde un servidor ASR u otras llamadas. Si, en el bloque 56, el procesador determina que la señal de transmisión de voz originada desde un servidor ASR, la lógica procede hacia el bloque 58, donde la unidad de usuario es informada que la llamada entrante es una señal de transmisión de voz generada por servidor ASR (es decir una petición). Si, en el bloque 56, el procesador determina que el origen no es desde el servidor ASR, entonces la lógica procede hacia el bloque 60, donde la información de identificación de la persona que llama es presentada al usuario. En una modalidad alternativa, las funciones ejecutadas por la compuerta de distribución 16 son ejecutadas en uña unidad de origen de usuario o transmisor 12 o en una unidad final de usuario 24. La unidad de origen de usuario o transmisor 12 es preferiblemente un dispositivo móvil que está implementado en un vehículo. En la unidad de origen de usuario puede ser un dispositivo similar a la unidad final de usuario 24. Las figuras 4 y 5 ilustran diagramas de flujo que presentan dos modalidades para ejecutar algún procesamiento de señal en la unidad de origen de usuario o transmisor 12. En una primera modalidad (figura 4) donde las funciones de compuerta de distribución se ejecutan en la unidad de origen del usuario o transmisor 12, un procesador en la unidad de origen de usuario o transmisor 12 está implícito para procesar una señal de voz de salida con un algoritmo optimizado para suministro hacia un servidor ASR. En el bloque 72, el procesador en la unidad de origen de usuario o transmisor 12 recibe la entrada de voz desde el usuario y una dirección asociada con la entrada de voz. La dirección asociada puede ser registrada por el usuario o generada automáticamente por el procesador en la unidad de origen de usuario o transmisor 12. En el bloque de decisión 74, el procesador en la unidad de origen de usuario o transmisor 12 compara la dirección asociada con la señal de voz introducida para las direcciones (números telefónicos, direcciones IP u otro tipo de direcciones) asociadas con los servidores ASR que están almacenados dentro de una base de datos en la unidad de usuario. Cuando el procesador determina que la dirección asociada corresponde a una dirección almacenada, la voz introducida es procesada de acuerdo con el algoritmo implícito (algoritmo de reconocimiento de voz automatizada) en el bloque 76. De otra manera, la lógica procede hacia el bloque 78, donde el procesador procesa la voz introducida utilizando un algoritmo de comunicación de voz para receptores humanos. En una segunda modalidad (figura 5) donde las funciones del servidor son ejecutadas en la unidad de origen de usuario o transmisor 12, el procesador en la unidad de origen de usuario o transmisor 12 está implícito para procesar una señal de voz de salida con un algoritmo optimizado para conversación de voz (receptor humano) (bloque 90). En el bloque 92, la señal de voz procesada es enviada hacia la dirección asociada con la señal de voz. En el bloque 94, si la señal de voz de salida va hacia un servidor ASR, el servidor ASR envía una señal de regreso hacia la unidad de origen de usuario instruyendo al procesador de la unidad de origen de usuario para que conmute a un algoritmo utilizado para un servidor ASR. Cuando la unidad de origen de usuario recibe una señal para conmutar, La unidad procesa las señales de voz registradas utilizando un algoritmo para un servidor ASR (bloque 96). La señal enviada por el servidor ASR es enviada preferiblemente en frecuencia múltiple de tono doble conocida también como marcación de multifrecuencia, aunque puede también ser enviada en otros formatos. Cuando la señal de voz es procesada en la unidad de origen de usuario o transmisor 12, hay ocasiones cuando el destino conmuta desde un servidor ASR a un receptor humano o desde un receptor humano a un servidor ASR. Un sistema de operados (receptor humano) o servidor ASR informa a la unidad de origen de usuario cuando se ha presentado una conmutación. Una vez que la unidad de origen de usuario ha sido informada de la conmutación, la unidad empieza a procesar de acuerdo con el nuevo receptor. En tanto que la modalidad preferida de la invención se ha ilustrado y descrito, como se observó antes, pueden hacerse muchos cambios sin apartarse del espíritu y alcance de la invención. En consecuencia, el alcance de la invención no está limitado por la descripción de la modalidad preferida. En vez de ello, la invención debe determinarse completamente mediante referencia a las reivindicaciones siguientes.
Claims (15)
1. Un método que comprende: recibir una señal de voz desde una fuente sobre una red; determinar un destino asociado con la señal recibida; determinar un algoritmo de procesamiento de señal a partir de una pluralidad de algoritmos de procesamiento de señal en base a la dirección determinada; procesar la señal de voz de acuerdo con el algoritmo determinado; y enviar la señal procesada hacia la dirección asociada.
2. El método de conformidad con la reivindicación 1, caracterizado porque la determinación del algoritmo de procesamiento comprende encontrar en la memoria un algoritmo de procesamiento de señal que esté asociado con la dirección de destino determinada.
3. El método dé conformidad con la reivindicación 1, que comprende además: determinar el origen de la señal de voz, si se determina que el destino es un receptor humano; y si se determina que el origen, es un sistema en base a computadora, alertar al receptor de que la señal de voz es a partir de un sistema en base a computadora.
4. Un método que comprende: seleccionar la dirección para una transmisión de voz;. recibir en una unidad de entrada de usuario la fonación introducida para la transmisión de voz; si la dirección seleccionada está asociada con un dispositivo de reconocimiento de voz, procesar la fonación recibida de acuerdo con un algoritmo asociado con el dispositivo de reconocimiento de voz y enviar la fonación procesada hacia el destino seleccionado; y si la dirección seleccionada no está asociada con un dispositivo de reconocimiento de voz, procesar la fonación recibida hacia el destino seleccionado de acuerdo con un método de suministro asociado con receptores humanos.
5. El método de conformidad con la reivindicación 4, que comprende además: conmutar el destino desde un destino asociado con un receptor humano hacia un destino asociado con un dispositivo de reconocimiento de voz; enviar una señal de conmutación hacia la unidad de entrada de usuario en base al destino conmutado; y enviar la fonación recibida hacia el destino seleccionado de acuerdo con un método de suministro asociado con receptores humanos.
6. El método de conformidad con la reivindicación 4, que comprende además: conmutar el destino de un destino asociado con un dispositivo de reconocimiento de voz a un destino asociado con un receptor humano; enviar una señal de conmutación hacia la unidad de entrada de usuario en base ál destino conmutado; y procesar la fonación recibida de acuerdo con un algoritmo asociado con el dispositivo de reconocimiento de voz y enviar la fonación procesada hacia el destino seleccionado; y
7. Un método que comprende: enviar una señal desde una fuente hacia un destino de conformidad con una dirección asociada con una fonación que va a ser generada; y si el destino es un servidor de reconocimiento de voz, enviar una señal de cambio desde el destino a la fuente, generar una fonación para recepción mediante un servidor de reconocimiento de voz, y enviar la fonación recién procesada, de otra manera generar una fonación en la fuente para recepción mediante un receptor humano.
8. Un dispositivo en base a computadora que comprende: un componente receptor configurado para recibir una señal de voz desde una fuente sobre una red; un componente de procesamiento configurado para determinar una dirección de destino asociada con una señal recibida, determinar un algoritmo de procesamiento de señal a partir de una pluralidad de algoritmos de procesamiento de señal en base a la dirección determinada, y procesar la señal de voz de acuerdo con el algoritmo determinado; y un componente de suministro configurado para enviar la señal procesada hacia la dirección asociada.
9. El dispositivo de conformidad con la reivindicación 8, que comprende además memoria configurada para almacenar direcciones con un algoritmo de procesamiento de señal asociado, en donde el componente de procesamiento encuentra en la memoria un algoritmo de procesamiento de señal que está asociado con la dirección de destino determinada.
10. El dispositivo de conformidad con la reivindicación 8, que comprende además un componente de alerta configurado para alertar al receptor de que la señal de voz es a partir de un sistema en base a computadora, si la fuente es un sistema en base a computadora.
11. Un dispositivo en base a computadora que comprende: un primer componente configurado para seleccionar una dirección para una transmisión de voz; un segundo componente configurado para recibir una fonación introducida para la transmisión de voz; un tercer componente configurado para procesar la fonación recjbida de acuerdo con un algoritmo asociado con un dispositivo de reconocimiento de voz, si la dirección seleccionada está asociada con un dispositivo de reconocimiento de voz y envía la fonación procesada hacia el destino seleccionado; y un cuarto componente configurado para enviar la fonación recibida hacia el destino seleccionado de acuerdo con un método de suministro asociado con receptores humanos, si la dirección seleccionada no está asociada con un dispositivo de reconocimiento de voz.
12. Un dispositivo en base a computadora que comprende: un primer componente configurado para procesar una fuente para recepción mediante un receptor humano; un segundo componente configurado para enviar una fonación procesada hacia un destino de acuerdo con una dirección asociada con la fonación; un tercer componente configurado para recibir una señal de cambio de el destino; y un cuarto componente configurado para procesar la siguiente fonación para recepción mediante un servidor de reconocimiento de voz de acuerdo con una señal de cambio recibida, y enviar la fonación recién procesada hacia el destino.
13. Un aparato que comprende: medios para recibir una señal de voz desde una fuente sobre una red; medios para determinar un destino asociado con la señal recibida; medios para determinar un algoritmo de procesamiento de señal a partir de una pluralidad de algoritmos de procesamiento de señal en base a la dirección determinada; medios para procesar la señal de voz de acuerdo con el algoritmo determinado; y medios para enviar la señal procesada hacia la dirección asociada.
14. Un aparato que comprende: medios para seleccionar una dirección para una transmisión de voz; medios para recibir la fonación introducida para la transmisión de voz; si la dirección seleccionada está asociada con un dispositivo de reconocimiento de voz, medios para procesar la fonación recibida de acuerdo con un algoritmo asociado con el dispositivo de reconocimiento de voz y medios para enviar la fonación procesada hacia el destino seleccionado; y si la dirección seleccionada no está asociada con un dispositivo de reconocimiento de voz, medios para enviar la fonación recibida hacia el destino seleccionado dé acuerdo con un método de suministro asociado con receptores humanos.
15. Un aparato que comprende: medios para procesar una fonación en una fuente para la recepción mediante un receptor humano; medios para enviar la fonación procesada hacia un destino de acuerdo con una dirección asociada con la fonación; y si el destino es un servidor de reconocimiento de voz, medios para enviar una señal de cambio desde el destino a la fuente, medios para procesar una siguiente fonación para recepción mediante un servidor de reconocimiento de voz, y medios para enviar la fonación recién procesada.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28037701P | 2001-03-29 | 2001-03-29 | |
US27845401P | 2001-04-02 | 2001-04-02 | |
US09/884,902 US7392191B2 (en) | 2001-03-29 | 2001-06-18 | Method and device to distinguish between voice conversation and automated speech recognition |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA02002812A true MXPA02002812A (es) | 2005-10-05 |
Family
ID=27402992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA02002812A MXPA02002812A (es) | 2001-03-29 | 2002-03-14 | Metodo y dispositivo para distinguir entre conversacion de voz y reconocimiento automatico. |
Country Status (5)
Country | Link |
---|---|
US (2) | US7392191B2 (es) |
EP (1) | EP1386309A4 (es) |
CA (1) | CA2378540C (es) |
MX (1) | MXPA02002812A (es) |
WO (1) | WO2002080145A1 (es) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8175886B2 (en) * | 2001-03-29 | 2012-05-08 | Intellisist, Inc. | Determination of signal-processing approach based on signal destination characteristics |
US7406421B2 (en) | 2001-10-26 | 2008-07-29 | Intellisist Inc. | Systems and methods for reviewing informational content in a vehicle |
US20050065779A1 (en) * | 2001-03-29 | 2005-03-24 | Gilad Odinak | Comprehensive multiple feature telematics system |
US7392191B2 (en) * | 2001-03-29 | 2008-06-24 | Intellisist, Inc. | Method and device to distinguish between voice conversation and automated speech recognition |
US20120203557A1 (en) * | 2001-03-29 | 2012-08-09 | Gilad Odinak | Comprehensive multiple feature telematics system |
US7164922B2 (en) * | 2001-10-05 | 2007-01-16 | Intellisist, Inc. | Local phone number lookup and cache |
US7162414B2 (en) * | 2001-12-07 | 2007-01-09 | Intel Corporation | Method and apparatus to perform speech recognition over a data channel |
US8249880B2 (en) * | 2002-02-14 | 2012-08-21 | Intellisist, Inc. | Real-time display of system instructions |
JP2004349802A (ja) * | 2003-05-20 | 2004-12-09 | Sharp Corp | Ip電話装置 |
JP3625212B1 (ja) * | 2003-09-16 | 2005-03-02 | 独立行政法人科学技術振興機構 | 3次元仮想空間シミュレータ、3次元仮想空間シミュレーションプログラム、およびこれを記録したコンピュータ読み取り可能な記録媒体 |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4644107A (en) * | 1984-10-26 | 1987-02-17 | Ttc | Voice-controlled telephone using visual display |
US4856066A (en) * | 1986-11-06 | 1989-08-08 | Lemelson Jerome H | Speech communication system and method |
US4827500A (en) * | 1987-01-30 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Automatic speech recognition to select among call destinations |
US4928302A (en) * | 1987-11-06 | 1990-05-22 | Ricoh Company, Ltd. | Voice actuated dialing apparatus |
US5566229A (en) * | 1992-08-24 | 1996-10-15 | At&T | Voice directed communications system employing shared subscriber identifiers |
US5396542A (en) * | 1993-08-31 | 1995-03-07 | At&T Corp. | Method for use by a telecommunications system in enabling improved attendant services |
US5440627A (en) * | 1994-04-21 | 1995-08-08 | Puri; Rajendra P. | Computer phone dialing system |
US5556229A (en) * | 1995-01-04 | 1996-09-17 | Bishop; Robert J. | Shoreline erosion control system |
FI98776C (fi) * | 1995-11-02 | 1997-08-11 | Nokia Telecommunications Oy | Uuden puhekoodausmenetelmän lisääminen olemassaolevaan tietoliikennejärjestelmään |
US5764644A (en) * | 1996-01-02 | 1998-06-09 | Lucent Technologies Inc. | Method and apparatus for transport of communication signals over a public network |
US5719921A (en) * | 1996-02-29 | 1998-02-17 | Nynex Science & Technology | Methods and apparatus for activating telephone services in response to speech |
US6175856B1 (en) * | 1996-09-30 | 2001-01-16 | Apple Computer, Inc. | Method and apparatus for dynamic selection of compression processing during teleconference call initiation |
US5855003A (en) * | 1996-10-11 | 1998-12-29 | Motorola, Inc. | Method and apparatus for establishing a link in a wireless communication system |
US6122613A (en) * | 1997-01-30 | 2000-09-19 | Dragon Systems, Inc. | Speech recognition using multiple recognizers (selectively) applied to the same input sample |
US5937040A (en) * | 1997-04-18 | 1999-08-10 | Siemens Information And Communication Networks, Inc. | Method and apparatus for using a D-channel for displaying user data |
US6404876B1 (en) * | 1997-09-25 | 2002-06-11 | Gte Intelligent Network Services Incorporated | System and method for voice activated dialing and routing under open access network control |
US7203288B1 (en) * | 1997-11-21 | 2007-04-10 | Dictaphone Corporation | Intelligent routing of voice files in voice data management system |
US6154662A (en) * | 1998-02-27 | 2000-11-28 | Lucent Technologies Inc. | Providing voice dialing service for wireless roamers |
US6505159B1 (en) * | 1998-03-03 | 2003-01-07 | Microsoft Corporation | Apparatus and method for providing speech input to a speech recognition system |
US7082397B2 (en) * | 1998-12-01 | 2006-07-25 | Nuance Communications, Inc. | System for and method of creating and browsing a voice web |
US6587871B1 (en) * | 1998-12-22 | 2003-07-01 | Ericsson Inc. | System, method, and apparatus for converting voice mail to text and transmitting as an email or facsimile |
US6370237B1 (en) * | 1998-12-29 | 2002-04-09 | Alcatel Usa Sourcing, Lp | Voice activated dialing with reduced storage requirements |
US6398105B2 (en) * | 1999-01-29 | 2002-06-04 | Intermec Ip Corporation | Automatic data collection device that intelligently switches data based on data type |
US6195636B1 (en) * | 1999-02-19 | 2001-02-27 | Texas Instruments Incorporated | Speech recognition over packet networks |
GB2348566A (en) * | 1999-03-31 | 2000-10-04 | Ibm | Computer network telephony |
US6363349B1 (en) * | 1999-05-28 | 2002-03-26 | Motorola, Inc. | Method and apparatus for performing distributed speech processing in a communication system |
US6766291B2 (en) * | 1999-06-18 | 2004-07-20 | Nortel Networks Limited | Method and apparatus for controlling the transition of an audio signal converter between two operative modes based on a certain characteristic of the audio input signal |
JP3408461B2 (ja) * | 1999-07-09 | 2003-05-19 | エヌイーシーインフロンティア株式会社 | 電話システム |
KR20010019786A (ko) * | 1999-08-30 | 2001-03-15 | 윤종용 | 이동통신 시스템에서 음성인식 및 문자표시 장치 및 방법 |
US6370506B1 (en) * | 1999-10-04 | 2002-04-09 | Ericsson Inc. | Communication devices, methods, and computer program products for transmitting information using voice activated signaling to perform in-call functions |
US6446042B1 (en) * | 1999-11-15 | 2002-09-03 | Sharp Laboratories Of America, Inc. | Method and apparatus for encoding speech in a communications network |
JP3694888B2 (ja) * | 1999-12-03 | 2005-09-14 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、情報処理装置および方法、並びに記録媒体 |
US6754232B1 (en) * | 2000-01-12 | 2004-06-22 | Cisco Technology, Inc. | Dynamic codec speed selection and bandwidth preallocation in a voice packet network method and apparatus |
WO2001061980A2 (en) * | 2000-02-17 | 2001-08-23 | Phoneguard, Inc. | Telephone privacy protection system |
US7120585B2 (en) * | 2000-03-24 | 2006-10-10 | Eliza Corporation | Remote server object architecture for speech recognition |
US6539354B1 (en) * | 2000-03-24 | 2003-03-25 | Fluent Speech Technologies, Inc. | Methods and devices for producing and using synthetic visual speech based on natural coarticulation |
EP1168737B8 (en) * | 2000-06-30 | 2010-03-10 | Alcatel Lucent | Telecommunication system, and switch, and server, and method |
JP2002077223A (ja) * | 2000-08-29 | 2002-03-15 | Fujitsu Ltd | メディア変換サービス提供方法 |
KR100659197B1 (ko) * | 2000-09-05 | 2006-12-21 | 유티스타콤코리아 유한회사 | 통합 인터넷 프로토콜 망에서의 보코딩 방법 |
US7215684B1 (en) * | 2000-09-20 | 2007-05-08 | Qualcomm Incorporated | Method and apparatus for reducing transmission overhead in a communication system |
JP4066600B2 (ja) * | 2000-12-20 | 2008-03-26 | 富士ゼロックス株式会社 | 多言語文書検索システム |
US20030194074A1 (en) * | 2000-12-21 | 2003-10-16 | Jayson Newlin | Methods and systems for communicating and controlling facsimile information |
US6775360B2 (en) * | 2000-12-28 | 2004-08-10 | Intel Corporation | Method and system for providing textual content along with voice messages |
US20020126813A1 (en) * | 2001-01-05 | 2002-09-12 | Hadi Partovi | Phone based rewards programs method and apparatus prepared by tellme networks, Inc |
US6587558B2 (en) * | 2001-01-29 | 2003-07-01 | Immequire, Llc | System and method for virtual interactive response unit |
US7024359B2 (en) * | 2001-01-31 | 2006-04-04 | Qualcomm Incorporated | Distributed voice recognition system using acoustic feature vector modification |
US7444156B2 (en) * | 2001-02-20 | 2008-10-28 | Microsoft Corporation | User-tagging of cellular telephone locations |
US7177402B2 (en) * | 2001-03-01 | 2007-02-13 | Applied Voice & Speech Technologies, Inc. | Voice-activated interactive multimedia information processing system |
US7024364B2 (en) * | 2001-03-09 | 2006-04-04 | Bevocal, Inc. | System, method and computer program product for looking up business addresses and directions based on a voice dial-up session |
US20050208954A1 (en) * | 2001-03-26 | 2005-09-22 | Microsoft Corporation | User-tagging of cellular telephone locations |
US6738743B2 (en) * | 2001-03-28 | 2004-05-18 | Intel Corporation | Unified client-server distributed architectures for spoken dialogue systems |
US20120203557A1 (en) * | 2001-03-29 | 2012-08-09 | Gilad Odinak | Comprehensive multiple feature telematics system |
US7392191B2 (en) * | 2001-03-29 | 2008-06-24 | Intellisist, Inc. | Method and device to distinguish between voice conversation and automated speech recognition |
US20050065779A1 (en) * | 2001-03-29 | 2005-03-24 | Gilad Odinak | Comprehensive multiple feature telematics system |
US8175886B2 (en) * | 2001-03-29 | 2012-05-08 | Intellisist, Inc. | Determination of signal-processing approach based on signal destination characteristics |
-
2001
- 2001-06-18 US US09/884,902 patent/US7392191B2/en not_active Expired - Lifetime
-
2002
- 2002-03-14 MX MXPA02002812A patent/MXPA02002812A/es active IP Right Grant
- 2002-03-22 CA CA2378540A patent/CA2378540C/en not_active Expired - Lifetime
- 2002-03-27 EP EP02725379A patent/EP1386309A4/en not_active Withdrawn
- 2002-03-27 WO PCT/US2002/009485 patent/WO2002080145A1/en not_active Application Discontinuation
-
2007
- 2007-10-30 US US11/929,301 patent/US20080140418A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2002080145A1 (en) | 2002-10-10 |
CA2378540C (en) | 2011-06-14 |
US7392191B2 (en) | 2008-06-24 |
EP1386309A1 (en) | 2004-02-04 |
US20020143552A1 (en) | 2002-10-03 |
EP1386309A4 (en) | 2005-10-12 |
US20080140418A1 (en) | 2008-06-12 |
CA2378540A1 (en) | 2002-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20080140418A1 (en) | Method and device to distinguish between voice conversation and automated speech recognition | |
US6327346B1 (en) | Method and apparatus for setting user communication parameters based on voice identification of users | |
US6118778A (en) | Method and apparatus for data network call processing | |
US6456618B2 (en) | Method and apparatus for DTMF signaling on compressed voice networks | |
US20060094472A1 (en) | Intelligent codec selection to optimize audio transmission in wireless communications | |
US7206404B2 (en) | Communications system and method utilizing centralized signal processing | |
US20070263604A1 (en) | Ring back notification system and method therefor | |
RU2003102504A (ru) | Система обеспечения и способ работы терминала, по меньшей мере, в двух режимах связи | |
US6529585B2 (en) | Voice label processing apparatus and method | |
US6587548B2 (en) | Method and system of using a single telephone number for multiple services | |
CN109120804B (zh) | 一种基于应答信息辨识的外呼系统 | |
US8290140B2 (en) | Sound event processing with echo analysis | |
EP1710992B1 (en) | Method for call origination using short key in mobile communication terminal and mobile communication terminal implementing the same | |
CN114039803A (zh) | 群组对讲消息管理方法、装置、计算机设备及存储介质 | |
JP2004040541A (ja) | VoIPアダプタ装置及びVoIPアダプタ装置の着信通知方法 | |
KR100272593B1 (ko) | 랜 전화 시스템 | |
EP1737205A2 (en) | Centralised conference initiation | |
EP1379060A1 (en) | Improvements in or relating to DTMF control | |
CN1631045A (zh) | 用于基于生成应答呼叫消息的音频信号的方法和装置 | |
JP4154184B2 (ja) | 音声端末及び音声通信方法 | |
KR20010070771A (ko) | 음성 인식을 이용한 자동 교환 시스템 및 방법 | |
EP1229518A1 (en) | Speech recognition system, and terminal, and system unit, and method | |
JP2003304332A (ja) | 音声発呼装置 | |
KR20040075447A (ko) | 이동통신 기반의 음성인식 시스템 및 방법 | |
JP2003309878A (ja) | 着信通知システムおよび着信通知方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GB | Transfer or rights | ||
FG | Grant or registration |