MXPA02002812A - Metodo y dispositivo para distinguir entre conversacion de voz y reconocimiento automatico. - Google Patents

Metodo y dispositivo para distinguir entre conversacion de voz y reconocimiento automatico.

Info

Publication number
MXPA02002812A
MXPA02002812A MXPA02002812A MXPA02002812A MXPA02002812A MX PA02002812 A MXPA02002812 A MX PA02002812A MX PA02002812 A MXPA02002812 A MX PA02002812A MX PA02002812 A MXPA02002812 A MX PA02002812A MX PA02002812 A MXPA02002812 A MX PA02002812A
Authority
MX
Mexico
Prior art keywords
destination
signal
phonation
address
speech
Prior art date
Application number
MXPA02002812A
Other languages
English (en)
Inventor
Odinak Gilad
Original Assignee
Intellisist Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intellisist Llc filed Critical Intellisist Llc
Publication of MXPA02002812A publication Critical patent/MXPA02002812A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Un metodo y dispositivo para ejecutar algun procesamiento previo sobre transmisiones de voz dependiendo del destino pretendido de la transmision. El dispositivo incluye un componente receptor configurado para recibir una senal de voz a partir de una fuente sobre una red. El dispositivo incluye tambien un componente de procesamiento configurado para determinar una direccion de destino asociada con la senal recibida, determinar un algoritmo de procesamiento de senal a partir de una pluralidad de algoritmos de procesamiento de senal en base a la direccion determinada, y procesar la senal de voz de acuerdo con el algoritmo especificado. El dispositivo incluye ademas un componente de suministro configurado para enviar la senal procesada hacia la direccion asociada.

Description

MÉTODO Y DISPOSITIVO PARA DISTINGUIR ENTRE CONVERSACIÓN DE VOZ Y RECONOCIMIENTO AUTOMATICO DEL HABLA.
RECLAMACIÓN DE PRIORIDAD.
Esta solicitud reclama la prioridad de las Solicitudes Provisionales de los Estados Unidos de Norteamérica presentadas el 29 de Marzo del 2001, de Número de Serie 60/280,377, Número de Referencia del Apoderado WING-1-1002, y el 2 de Abril del 2001, de Número de Serie 60/278,454, de Número de Referencia del Apoderado WING-1-1006, y la Solicitud No Provisional de los Estados Unidos de Norteamérica presentada el 16 de Junio del 2001, de Número de Serie 09/884,902, Número de Referencia del Apoderado WING-1015.
ANTECEDENTES.
La transmisión de voz sobre una red inalámbrica digital involucra la captura de ondas sonoras utilizando un micrófono y convirtiéndolas en señales eléctricas y después en datos binarios. El proceso comprende el muestreo, digitalización y otros procesaos de señal digital en la unidad receptora (por ejemplo, módulo telemático o teléfono celular).
Existe una diferencia fundamente al entre la forma en que los seres humanos procesan la entrada audible y la forma en que los servidores de reconocimiento de voz automatizada (ASR) procesan la entrada de voz. Por tanto, diferentes algoritmos para la señal de procesamiento deben utilizarse. Sin embargo, en las aplicaciones actuales, se utiliza un proceso de compromiso individual, con las ineficiencias resultantes.
BREVE DESCRIPCIÓN.
La presente invención proporciona un método y dispositivo en base a computadora para ejecutar el procesamiento previo sobre transmisiones de voz que dependen del destino de la transmisión pretendida. El dispositivo incluye un componente receptor configurado para recibir una señal de voz desde una fuente sobre una red. Se incluye también un componente de procesamiento configurado para determinar una dirección de destino asociada con la señal recibida, determinar un algoritmo de procesamiento de señal a partir de una pluralidad de algoritmos de procesamiento de señal en base a la dirección de destino, y procesar la señal de voz de acuerdo con el algoritmo especificado. El dispositivo incluye además un componente de suministro configurado para enviar la señal procesada hacia la dirección asociada. De acuerdo con otros aspectos de la invención, el dispositivo incluye también la memoria configurada para almacenar direcciones con un algoritmo de procesamiento de señal asociada, en donde el componente de procesamiento se encuentra en la memoria un algoritmo de procesamiento de señal que está asociado con la dirección de destino determinada. De acuerdo con otros aspectos adicionales de la invención, el dispositivo incluye un componente de alerta configurado para alertar al receptor de que la señal de voz es desde un sistema en base a computadora, si la fuente es un sistema en base a computadora. De acuerdo con otro aspecto más de la invención, el dispositivo en base a computadora incluye cuatro componentes adicionales utilizados para facilitar la presente invención: un primer componente configurado para seleccionar una dirección para una transmisión de voz; un segundó componente configurado para recibir una fonación introducida para la transmisión de voz; un tercer componente configurado para procesar la fonación recibida de acuerdo con un algoritmo asociado con un dispositivo de reconocimiento de voz (si la dirección seleccionada está asociada con un dispositivo de reconocimiento de voz) y enviar la fonación procesada hacia el destino seleccionado; y un cuarto componente configurado para enviar la fonación recibida hacia el destino seleccionado de acuerdo con un método de suministros asociado con los receptores humanos (sí la dirección seleccionada no está asociada con un dispositivo de reconocimiento de voz). De acuerdo con aspectos adicionales de la invención, un dispositivo en base a computadora incluye cuatro componentes adicionales utilizados para facilitar la presente invención: un primer componente configurado para procesar una fonación en una fuente para recepción mediante un receptor humano; un segundo componente configurado para enviar la fonación procesada hacia un destino de acuerdo con una dirección asociada con la fonación; un tercer componente configurado para recibir una señal de cambio desde el destino; y un cuarto componente configurado para procesar una siguiente fonación para recepción mediante un servidor de reconocimiento de voz de acuerdo con una señal de cambio recibida, y enviar la fonación recién procesada hacia el destino. Como se apreciará más fácilmente a partir de la breve descripción anterior, la invención proporciona un método y dispositivo para mejorar las transmisiones de voz al ejecutar algún procesamiento previo sobre las transmisiones de voz dependiendo del destino deseado, y para proporcionar receptores con información de identificación de quien llama si la transmisión es generada por computadora.
BREVE DESCRIPCIÓN DE LOS DIBUJOS.
Las modalidades preferidas y alternativas de la presente invención se describen en detalle a continuación con referencia a los siguientes dibujos.
La figura 1 es un diagrama que ilustra un sistema de muestra para recibir y procesar señales de transmisión de voz sobre una red inalámbrica de acuerdo con la presente invención; La figura 2 es un diagrama de flujo que ilustra la operación de la presente invención; La figura 3 es un diagrama de flujo que ilustra un aspecto alternativo de la presente invención; y Las figuras 4-5 son diagramas de flujo que ilustran aspectos alternativos de la presente invención.
DESCRIPCIÓN DETALLADA DE LA MODALIDAD PREFERIDA.
La presente invención proporciona un método y dispositivo para determinar el destino de una señal de transmisión de voz y aplicar un algoritmo de procesamiento de señal de datos apropiados en base al destino determinado. El mismo sistema proporciona también un método para distinguir entre las llamadas entrantes enviadas desde un servidor o desde un ser humano a fin de notificar a la persona que recibe la llamada que se está enviando una llamada no solicitada. A manera de revisión y con referencia a la figura 1, la presente invención incluye un sistema 10 que comprende un transmisor 12 y una compuerta de distribución 16. El transmisor 12 incluye un teléfono celular o de línea alámbrica, un teléfono de red, otro dispositivo de comunicación o una computadora de generación de voz que genera una señal de sonido de voz para transmisión hacia las unidades finales (usuarios 24 o servidores de reconocimiento de voz 26) sobre una red, tal como una red inalámbrica o una red no inalámbrica primaria (por ejemplo, Internet). La compuerta de distribución 16 incluye un procesador 17, un receptor 18, un transmisor 19 y una base de datos 20. El receptor 18 en la compuerta de distribución 16 es preferiblemente un módulo de comunicación inalámbrico capaz de recibir voz y datos por medio de un enlace de comunicación inalámbrico. El transmisor 19 en la compuerta de distribución 16 es preferiblemente un módulo de comunicación inalámbrico capaz de enviar voz y datos por medio de un enlace de comunicación inalámbrico. La compuerta de distribución 16 está en comunicación con una o más unidades finales de usuario 24 y uno o más servidores dé reconocimiento de voz automatizada (ASR) 26, ya sea directamente o sobre una red (no mostrada). El procesador 17 compara una dirección incluida en la señal de transmisión de voz desde el transmisor 12, tal como una dirección de protocolo de Internet (IP), un número telefónico u otro método de identificación de una llamada entrante, para una tabla de búsqueda almacenada en la base de datos 20 El procesador aplica uno de un número de algoritmos de procesamiento de señal dependiendo de los resultados de la comparación. Debido a que existe una diferencia fundamental entre la forma en que los humanos procesan la entrada audible y la forma en que los servidores ASR procesan la entrada de voz, se aplican diferentes algoritmos a la señal de transmisión de voz para optimizar el beneficio para el destino determinado. Por ejemplo, si el destino es un servidor ASR 26, el algoritmo convierte la transmisión a forma digital (en caso de que no esté ya en formato digital) y ejecuta otro procesamiento de señal digital que beneficia el proceso que ejecutará el servidor ASR. Haciendo referencia ahora a la figura 2, una rutina ilustrativa 30 para la operación de la presente invención será descrita. En el bloque 32, la compuerta de distribución 16 recibe una señal de transmisión de voz. Comúnmente, la señal de transmisión de voz incluye una voz humana o voz generada por una computadora. En el bloque 34, el procesador 17 busca la información en la base de datos 20 que corresponde a una dirección de destino o número telefónico incluido en ja señal de transmisión de voz. La base de datos incluye una tabla de números telefónicos o una tabla de direcciones IP de destinos (unidades finales de usuario 24 y servidores 26) que están asociadas con cada algoritmo. Una dirección IP es especificada por el protocolo de Internet e identifica en forma única una computadora sobre la Internet. El procesador 17 determina que algoritmos (identificado como el algoritmo asociado) se utiliza para la optimización dependiendo de la dirección IP de destino de la transmisión de voz recibida. Por lo tanto, cuando se establece una llamada hacia uno de los números asociados con un servidor ASR, el procesador selecciona el algoritmo optimizado para un servidor ASR. De otra manera, el procesador selecciona el algoritmo para la conversación de voz en una unidad de usuario final 24.
En el bloque de decisión 36, el procesador 17 determina si el número de destino asociado es un servidor ASR 26. Si, en el boque 36, el procesador determina que el número de destino asociado es un servidor ASR 26, entonces, en el boque 38, el procesador procesa la transmisión de voz de acuerdo con el algoritmo de optimización para un servidor ASR y envía la señal de transmisión de voz procesada hacia el destino determinado. Si, en el bloque 36, el procesador determina que el número de destino asociado no es un servidor ASR 26, el procesador procesa la señal de transmisión de voz para medios de audición humanos de acuerdo con un algoritmo de optimización utilizado para producir un resultado más adecuado para un receptor humano. En el bloque 40, el procesador envía la señal de transmisión de voz procesada hacia el destino determinado. La figura 3 es un diagrama de flujo que ilustra una operación del envío de una señal hacia un receptor humano en el bloque 40 de la figura 2. En esta situación, en el bloque 54, el procesador 17 busca la información de identificación de la persona que llama relacionada con el origen de la señal (transmisor 12 en la base de datos 20). En el bloque de decisión 56, el procesador determina el origen de la señal de transmisión de voz mediante la comparación de la dirección de envío incluida en la señal de transmisión de voz hacia una tabla de direcciones IP almacenadas o números telefónicos n la base de datos 20. Por tanto, el procesador distingue entre las llamadas entrantes desde un servidor ASR u otras llamadas. Si, en el bloque 56, el procesador determina que la señal de transmisión de voz originada desde un servidor ASR, la lógica procede hacia el bloque 58, donde la unidad de usuario es informada que la llamada entrante es una señal de transmisión de voz generada por servidor ASR (es decir una petición). Si, en el bloque 56, el procesador determina que el origen no es desde el servidor ASR, entonces la lógica procede hacia el bloque 60, donde la información de identificación de la persona que llama es presentada al usuario. En una modalidad alternativa, las funciones ejecutadas por la compuerta de distribución 16 son ejecutadas en uña unidad de origen de usuario o transmisor 12 o en una unidad final de usuario 24. La unidad de origen de usuario o transmisor 12 es preferiblemente un dispositivo móvil que está implementado en un vehículo. En la unidad de origen de usuario puede ser un dispositivo similar a la unidad final de usuario 24. Las figuras 4 y 5 ilustran diagramas de flujo que presentan dos modalidades para ejecutar algún procesamiento de señal en la unidad de origen de usuario o transmisor 12. En una primera modalidad (figura 4) donde las funciones de compuerta de distribución se ejecutan en la unidad de origen del usuario o transmisor 12, un procesador en la unidad de origen de usuario o transmisor 12 está implícito para procesar una señal de voz de salida con un algoritmo optimizado para suministro hacia un servidor ASR. En el bloque 72, el procesador en la unidad de origen de usuario o transmisor 12 recibe la entrada de voz desde el usuario y una dirección asociada con la entrada de voz. La dirección asociada puede ser registrada por el usuario o generada automáticamente por el procesador en la unidad de origen de usuario o transmisor 12. En el bloque de decisión 74, el procesador en la unidad de origen de usuario o transmisor 12 compara la dirección asociada con la señal de voz introducida para las direcciones (números telefónicos, direcciones IP u otro tipo de direcciones) asociadas con los servidores ASR que están almacenados dentro de una base de datos en la unidad de usuario. Cuando el procesador determina que la dirección asociada corresponde a una dirección almacenada, la voz introducida es procesada de acuerdo con el algoritmo implícito (algoritmo de reconocimiento de voz automatizada) en el bloque 76. De otra manera, la lógica procede hacia el bloque 78, donde el procesador procesa la voz introducida utilizando un algoritmo de comunicación de voz para receptores humanos. En una segunda modalidad (figura 5) donde las funciones del servidor son ejecutadas en la unidad de origen de usuario o transmisor 12, el procesador en la unidad de origen de usuario o transmisor 12 está implícito para procesar una señal de voz de salida con un algoritmo optimizado para conversación de voz (receptor humano) (bloque 90). En el bloque 92, la señal de voz procesada es enviada hacia la dirección asociada con la señal de voz. En el bloque 94, si la señal de voz de salida va hacia un servidor ASR, el servidor ASR envía una señal de regreso hacia la unidad de origen de usuario instruyendo al procesador de la unidad de origen de usuario para que conmute a un algoritmo utilizado para un servidor ASR. Cuando la unidad de origen de usuario recibe una señal para conmutar, La unidad procesa las señales de voz registradas utilizando un algoritmo para un servidor ASR (bloque 96). La señal enviada por el servidor ASR es enviada preferiblemente en frecuencia múltiple de tono doble conocida también como marcación de multifrecuencia, aunque puede también ser enviada en otros formatos. Cuando la señal de voz es procesada en la unidad de origen de usuario o transmisor 12, hay ocasiones cuando el destino conmuta desde un servidor ASR a un receptor humano o desde un receptor humano a un servidor ASR. Un sistema de operados (receptor humano) o servidor ASR informa a la unidad de origen de usuario cuando se ha presentado una conmutación. Una vez que la unidad de origen de usuario ha sido informada de la conmutación, la unidad empieza a procesar de acuerdo con el nuevo receptor. En tanto que la modalidad preferida de la invención se ha ilustrado y descrito, como se observó antes, pueden hacerse muchos cambios sin apartarse del espíritu y alcance de la invención. En consecuencia, el alcance de la invención no está limitado por la descripción de la modalidad preferida. En vez de ello, la invención debe determinarse completamente mediante referencia a las reivindicaciones siguientes.

Claims (15)

REIVINDICACIONES
1. Un método que comprende: recibir una señal de voz desde una fuente sobre una red; determinar un destino asociado con la señal recibida; determinar un algoritmo de procesamiento de señal a partir de una pluralidad de algoritmos de procesamiento de señal en base a la dirección determinada; procesar la señal de voz de acuerdo con el algoritmo determinado; y enviar la señal procesada hacia la dirección asociada.
2. El método de conformidad con la reivindicación 1, caracterizado porque la determinación del algoritmo de procesamiento comprende encontrar en la memoria un algoritmo de procesamiento de señal que esté asociado con la dirección de destino determinada.
3. El método dé conformidad con la reivindicación 1, que comprende además: determinar el origen de la señal de voz, si se determina que el destino es un receptor humano; y si se determina que el origen, es un sistema en base a computadora, alertar al receptor de que la señal de voz es a partir de un sistema en base a computadora.
4. Un método que comprende: seleccionar la dirección para una transmisión de voz;. recibir en una unidad de entrada de usuario la fonación introducida para la transmisión de voz; si la dirección seleccionada está asociada con un dispositivo de reconocimiento de voz, procesar la fonación recibida de acuerdo con un algoritmo asociado con el dispositivo de reconocimiento de voz y enviar la fonación procesada hacia el destino seleccionado; y si la dirección seleccionada no está asociada con un dispositivo de reconocimiento de voz, procesar la fonación recibida hacia el destino seleccionado de acuerdo con un método de suministro asociado con receptores humanos.
5. El método de conformidad con la reivindicación 4, que comprende además: conmutar el destino desde un destino asociado con un receptor humano hacia un destino asociado con un dispositivo de reconocimiento de voz; enviar una señal de conmutación hacia la unidad de entrada de usuario en base al destino conmutado; y enviar la fonación recibida hacia el destino seleccionado de acuerdo con un método de suministro asociado con receptores humanos.
6. El método de conformidad con la reivindicación 4, que comprende además: conmutar el destino de un destino asociado con un dispositivo de reconocimiento de voz a un destino asociado con un receptor humano; enviar una señal de conmutación hacia la unidad de entrada de usuario en base ál destino conmutado; y procesar la fonación recibida de acuerdo con un algoritmo asociado con el dispositivo de reconocimiento de voz y enviar la fonación procesada hacia el destino seleccionado; y
7. Un método que comprende: enviar una señal desde una fuente hacia un destino de conformidad con una dirección asociada con una fonación que va a ser generada; y si el destino es un servidor de reconocimiento de voz, enviar una señal de cambio desde el destino a la fuente, generar una fonación para recepción mediante un servidor de reconocimiento de voz, y enviar la fonación recién procesada, de otra manera generar una fonación en la fuente para recepción mediante un receptor humano.
8. Un dispositivo en base a computadora que comprende: un componente receptor configurado para recibir una señal de voz desde una fuente sobre una red; un componente de procesamiento configurado para determinar una dirección de destino asociada con una señal recibida, determinar un algoritmo de procesamiento de señal a partir de una pluralidad de algoritmos de procesamiento de señal en base a la dirección determinada, y procesar la señal de voz de acuerdo con el algoritmo determinado; y un componente de suministro configurado para enviar la señal procesada hacia la dirección asociada.
9. El dispositivo de conformidad con la reivindicación 8, que comprende además memoria configurada para almacenar direcciones con un algoritmo de procesamiento de señal asociado, en donde el componente de procesamiento encuentra en la memoria un algoritmo de procesamiento de señal que está asociado con la dirección de destino determinada.
10. El dispositivo de conformidad con la reivindicación 8, que comprende además un componente de alerta configurado para alertar al receptor de que la señal de voz es a partir de un sistema en base a computadora, si la fuente es un sistema en base a computadora.
11. Un dispositivo en base a computadora que comprende: un primer componente configurado para seleccionar una dirección para una transmisión de voz; un segundo componente configurado para recibir una fonación introducida para la transmisión de voz; un tercer componente configurado para procesar la fonación recjbida de acuerdo con un algoritmo asociado con un dispositivo de reconocimiento de voz, si la dirección seleccionada está asociada con un dispositivo de reconocimiento de voz y envía la fonación procesada hacia el destino seleccionado; y un cuarto componente configurado para enviar la fonación recibida hacia el destino seleccionado de acuerdo con un método de suministro asociado con receptores humanos, si la dirección seleccionada no está asociada con un dispositivo de reconocimiento de voz.
12. Un dispositivo en base a computadora que comprende: un primer componente configurado para procesar una fuente para recepción mediante un receptor humano; un segundo componente configurado para enviar una fonación procesada hacia un destino de acuerdo con una dirección asociada con la fonación; un tercer componente configurado para recibir una señal de cambio de el destino; y un cuarto componente configurado para procesar la siguiente fonación para recepción mediante un servidor de reconocimiento de voz de acuerdo con una señal de cambio recibida, y enviar la fonación recién procesada hacia el destino.
13. Un aparato que comprende: medios para recibir una señal de voz desde una fuente sobre una red; medios para determinar un destino asociado con la señal recibida; medios para determinar un algoritmo de procesamiento de señal a partir de una pluralidad de algoritmos de procesamiento de señal en base a la dirección determinada; medios para procesar la señal de voz de acuerdo con el algoritmo determinado; y medios para enviar la señal procesada hacia la dirección asociada.
14. Un aparato que comprende: medios para seleccionar una dirección para una transmisión de voz; medios para recibir la fonación introducida para la transmisión de voz; si la dirección seleccionada está asociada con un dispositivo de reconocimiento de voz, medios para procesar la fonación recibida de acuerdo con un algoritmo asociado con el dispositivo de reconocimiento de voz y medios para enviar la fonación procesada hacia el destino seleccionado; y si la dirección seleccionada no está asociada con un dispositivo de reconocimiento de voz, medios para enviar la fonación recibida hacia el destino seleccionado dé acuerdo con un método de suministro asociado con receptores humanos.
15. Un aparato que comprende: medios para procesar una fonación en una fuente para la recepción mediante un receptor humano; medios para enviar la fonación procesada hacia un destino de acuerdo con una dirección asociada con la fonación; y si el destino es un servidor de reconocimiento de voz, medios para enviar una señal de cambio desde el destino a la fuente, medios para procesar una siguiente fonación para recepción mediante un servidor de reconocimiento de voz, y medios para enviar la fonación recién procesada.
MXPA02002812A 2001-03-29 2002-03-14 Metodo y dispositivo para distinguir entre conversacion de voz y reconocimiento automatico. MXPA02002812A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US28037701P 2001-03-29 2001-03-29
US27845401P 2001-04-02 2001-04-02
US09/884,902 US7392191B2 (en) 2001-03-29 2001-06-18 Method and device to distinguish between voice conversation and automated speech recognition

Publications (1)

Publication Number Publication Date
MXPA02002812A true MXPA02002812A (es) 2005-10-05

Family

ID=27402992

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA02002812A MXPA02002812A (es) 2001-03-29 2002-03-14 Metodo y dispositivo para distinguir entre conversacion de voz y reconocimiento automatico.

Country Status (5)

Country Link
US (2) US7392191B2 (es)
EP (1) EP1386309A4 (es)
CA (1) CA2378540C (es)
MX (1) MXPA02002812A (es)
WO (1) WO2002080145A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8175886B2 (en) * 2001-03-29 2012-05-08 Intellisist, Inc. Determination of signal-processing approach based on signal destination characteristics
US7406421B2 (en) 2001-10-26 2008-07-29 Intellisist Inc. Systems and methods for reviewing informational content in a vehicle
US20050065779A1 (en) * 2001-03-29 2005-03-24 Gilad Odinak Comprehensive multiple feature telematics system
US7392191B2 (en) * 2001-03-29 2008-06-24 Intellisist, Inc. Method and device to distinguish between voice conversation and automated speech recognition
US20120203557A1 (en) * 2001-03-29 2012-08-09 Gilad Odinak Comprehensive multiple feature telematics system
US7164922B2 (en) * 2001-10-05 2007-01-16 Intellisist, Inc. Local phone number lookup and cache
US7162414B2 (en) * 2001-12-07 2007-01-09 Intel Corporation Method and apparatus to perform speech recognition over a data channel
US8249880B2 (en) * 2002-02-14 2012-08-21 Intellisist, Inc. Real-time display of system instructions
JP2004349802A (ja) * 2003-05-20 2004-12-09 Sharp Corp Ip電話装置
JP3625212B1 (ja) * 2003-09-16 2005-03-02 独立行政法人科学技術振興機構 3次元仮想空間シミュレータ、3次元仮想空間シミュレーションプログラム、およびこれを記録したコンピュータ読み取り可能な記録媒体

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4644107A (en) * 1984-10-26 1987-02-17 Ttc Voice-controlled telephone using visual display
US4856066A (en) * 1986-11-06 1989-08-08 Lemelson Jerome H Speech communication system and method
US4827500A (en) * 1987-01-30 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Automatic speech recognition to select among call destinations
US4928302A (en) * 1987-11-06 1990-05-22 Ricoh Company, Ltd. Voice actuated dialing apparatus
US5566229A (en) * 1992-08-24 1996-10-15 At&T Voice directed communications system employing shared subscriber identifiers
US5396542A (en) * 1993-08-31 1995-03-07 At&T Corp. Method for use by a telecommunications system in enabling improved attendant services
US5440627A (en) * 1994-04-21 1995-08-08 Puri; Rajendra P. Computer phone dialing system
US5556229A (en) * 1995-01-04 1996-09-17 Bishop; Robert J. Shoreline erosion control system
FI98776C (fi) * 1995-11-02 1997-08-11 Nokia Telecommunications Oy Uuden puhekoodausmenetelmän lisääminen olemassaolevaan tietoliikennejärjestelmään
US5764644A (en) * 1996-01-02 1998-06-09 Lucent Technologies Inc. Method and apparatus for transport of communication signals over a public network
US5719921A (en) * 1996-02-29 1998-02-17 Nynex Science & Technology Methods and apparatus for activating telephone services in response to speech
US6175856B1 (en) * 1996-09-30 2001-01-16 Apple Computer, Inc. Method and apparatus for dynamic selection of compression processing during teleconference call initiation
US5855003A (en) * 1996-10-11 1998-12-29 Motorola, Inc. Method and apparatus for establishing a link in a wireless communication system
US6122613A (en) * 1997-01-30 2000-09-19 Dragon Systems, Inc. Speech recognition using multiple recognizers (selectively) applied to the same input sample
US5937040A (en) * 1997-04-18 1999-08-10 Siemens Information And Communication Networks, Inc. Method and apparatus for using a D-channel for displaying user data
US6404876B1 (en) * 1997-09-25 2002-06-11 Gte Intelligent Network Services Incorporated System and method for voice activated dialing and routing under open access network control
US7203288B1 (en) * 1997-11-21 2007-04-10 Dictaphone Corporation Intelligent routing of voice files in voice data management system
US6154662A (en) * 1998-02-27 2000-11-28 Lucent Technologies Inc. Providing voice dialing service for wireless roamers
US6505159B1 (en) * 1998-03-03 2003-01-07 Microsoft Corporation Apparatus and method for providing speech input to a speech recognition system
US7082397B2 (en) * 1998-12-01 2006-07-25 Nuance Communications, Inc. System for and method of creating and browsing a voice web
US6587871B1 (en) * 1998-12-22 2003-07-01 Ericsson Inc. System, method, and apparatus for converting voice mail to text and transmitting as an email or facsimile
US6370237B1 (en) * 1998-12-29 2002-04-09 Alcatel Usa Sourcing, Lp Voice activated dialing with reduced storage requirements
US6398105B2 (en) * 1999-01-29 2002-06-04 Intermec Ip Corporation Automatic data collection device that intelligently switches data based on data type
US6195636B1 (en) * 1999-02-19 2001-02-27 Texas Instruments Incorporated Speech recognition over packet networks
GB2348566A (en) * 1999-03-31 2000-10-04 Ibm Computer network telephony
US6363349B1 (en) * 1999-05-28 2002-03-26 Motorola, Inc. Method and apparatus for performing distributed speech processing in a communication system
US6766291B2 (en) * 1999-06-18 2004-07-20 Nortel Networks Limited Method and apparatus for controlling the transition of an audio signal converter between two operative modes based on a certain characteristic of the audio input signal
JP3408461B2 (ja) * 1999-07-09 2003-05-19 エヌイーシーインフロンティア株式会社 電話システム
KR20010019786A (ko) * 1999-08-30 2001-03-15 윤종용 이동통신 시스템에서 음성인식 및 문자표시 장치 및 방법
US6370506B1 (en) * 1999-10-04 2002-04-09 Ericsson Inc. Communication devices, methods, and computer program products for transmitting information using voice activated signaling to perform in-call functions
US6446042B1 (en) * 1999-11-15 2002-09-03 Sharp Laboratories Of America, Inc. Method and apparatus for encoding speech in a communications network
JP3694888B2 (ja) * 1999-12-03 2005-09-14 ソニー株式会社 復号装置および方法、符号化装置および方法、情報処理装置および方法、並びに記録媒体
US6754232B1 (en) * 2000-01-12 2004-06-22 Cisco Technology, Inc. Dynamic codec speed selection and bandwidth preallocation in a voice packet network method and apparatus
WO2001061980A2 (en) * 2000-02-17 2001-08-23 Phoneguard, Inc. Telephone privacy protection system
US7120585B2 (en) * 2000-03-24 2006-10-10 Eliza Corporation Remote server object architecture for speech recognition
US6539354B1 (en) * 2000-03-24 2003-03-25 Fluent Speech Technologies, Inc. Methods and devices for producing and using synthetic visual speech based on natural coarticulation
EP1168737B8 (en) * 2000-06-30 2010-03-10 Alcatel Lucent Telecommunication system, and switch, and server, and method
JP2002077223A (ja) * 2000-08-29 2002-03-15 Fujitsu Ltd メディア変換サービス提供方法
KR100659197B1 (ko) * 2000-09-05 2006-12-21 유티스타콤코리아 유한회사 통합 인터넷 프로토콜 망에서의 보코딩 방법
US7215684B1 (en) * 2000-09-20 2007-05-08 Qualcomm Incorporated Method and apparatus for reducing transmission overhead in a communication system
JP4066600B2 (ja) * 2000-12-20 2008-03-26 富士ゼロックス株式会社 多言語文書検索システム
US20030194074A1 (en) * 2000-12-21 2003-10-16 Jayson Newlin Methods and systems for communicating and controlling facsimile information
US6775360B2 (en) * 2000-12-28 2004-08-10 Intel Corporation Method and system for providing textual content along with voice messages
US20020126813A1 (en) * 2001-01-05 2002-09-12 Hadi Partovi Phone based rewards programs method and apparatus prepared by tellme networks, Inc
US6587558B2 (en) * 2001-01-29 2003-07-01 Immequire, Llc System and method for virtual interactive response unit
US7024359B2 (en) * 2001-01-31 2006-04-04 Qualcomm Incorporated Distributed voice recognition system using acoustic feature vector modification
US7444156B2 (en) * 2001-02-20 2008-10-28 Microsoft Corporation User-tagging of cellular telephone locations
US7177402B2 (en) * 2001-03-01 2007-02-13 Applied Voice & Speech Technologies, Inc. Voice-activated interactive multimedia information processing system
US7024364B2 (en) * 2001-03-09 2006-04-04 Bevocal, Inc. System, method and computer program product for looking up business addresses and directions based on a voice dial-up session
US20050208954A1 (en) * 2001-03-26 2005-09-22 Microsoft Corporation User-tagging of cellular telephone locations
US6738743B2 (en) * 2001-03-28 2004-05-18 Intel Corporation Unified client-server distributed architectures for spoken dialogue systems
US20120203557A1 (en) * 2001-03-29 2012-08-09 Gilad Odinak Comprehensive multiple feature telematics system
US7392191B2 (en) * 2001-03-29 2008-06-24 Intellisist, Inc. Method and device to distinguish between voice conversation and automated speech recognition
US20050065779A1 (en) * 2001-03-29 2005-03-24 Gilad Odinak Comprehensive multiple feature telematics system
US8175886B2 (en) * 2001-03-29 2012-05-08 Intellisist, Inc. Determination of signal-processing approach based on signal destination characteristics

Also Published As

Publication number Publication date
WO2002080145A1 (en) 2002-10-10
CA2378540C (en) 2011-06-14
US7392191B2 (en) 2008-06-24
EP1386309A1 (en) 2004-02-04
US20020143552A1 (en) 2002-10-03
EP1386309A4 (en) 2005-10-12
US20080140418A1 (en) 2008-06-12
CA2378540A1 (en) 2002-09-29

Similar Documents

Publication Publication Date Title
US20080140418A1 (en) Method and device to distinguish between voice conversation and automated speech recognition
US6327346B1 (en) Method and apparatus for setting user communication parameters based on voice identification of users
US6118778A (en) Method and apparatus for data network call processing
US6456618B2 (en) Method and apparatus for DTMF signaling on compressed voice networks
US20060094472A1 (en) Intelligent codec selection to optimize audio transmission in wireless communications
US7206404B2 (en) Communications system and method utilizing centralized signal processing
US20070263604A1 (en) Ring back notification system and method therefor
RU2003102504A (ru) Система обеспечения и способ работы терминала, по меньшей мере, в двух режимах связи
US6529585B2 (en) Voice label processing apparatus and method
US6587548B2 (en) Method and system of using a single telephone number for multiple services
CN109120804B (zh) 一种基于应答信息辨识的外呼系统
US8290140B2 (en) Sound event processing with echo analysis
EP1710992B1 (en) Method for call origination using short key in mobile communication terminal and mobile communication terminal implementing the same
CN114039803A (zh) 群组对讲消息管理方法、装置、计算机设备及存储介质
JP2004040541A (ja) VoIPアダプタ装置及びVoIPアダプタ装置の着信通知方法
KR100272593B1 (ko) 랜 전화 시스템
EP1737205A2 (en) Centralised conference initiation
EP1379060A1 (en) Improvements in or relating to DTMF control
CN1631045A (zh) 用于基于生成应答呼叫消息的音频信号的方法和装置
JP4154184B2 (ja) 音声端末及び音声通信方法
KR20010070771A (ko) 음성 인식을 이용한 자동 교환 시스템 및 방법
EP1229518A1 (en) Speech recognition system, and terminal, and system unit, and method
JP2003304332A (ja) 音声発呼装置
KR20040075447A (ko) 이동통신 기반의 음성인식 시스템 및 방법
JP2003309878A (ja) 着信通知システムおよび着信通知方法

Legal Events

Date Code Title Description
GB Transfer or rights
FG Grant or registration