ES2786079T3 - Aparato para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar y método relacionado - Google Patents

Aparato para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar y método relacionado Download PDF

Info

Publication number
ES2786079T3
ES2786079T3 ES13721550T ES13721550T ES2786079T3 ES 2786079 T3 ES2786079 T3 ES 2786079T3 ES 13721550 T ES13721550 T ES 13721550T ES 13721550 T ES13721550 T ES 13721550T ES 2786079 T3 ES2786079 T3 ES 2786079T3
Authority
ES
Spain
Prior art keywords
message
text
speech
recipient
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13721550T
Other languages
English (en)
Inventor
Carney Carolina T De
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Saronikos Trading and Services Unipessoal Ltda
Original Assignee
Saronikos Trading and Services Unipessoal Ltda
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Saronikos Trading and Services Unipessoal Ltda filed Critical Saronikos Trading and Services Unipessoal Ltda
Application granted granted Critical
Publication of ES2786079T3 publication Critical patent/ES2786079T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/642Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations storing speech in digital form
    • H04M1/645Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations storing speech in digital form with speech synthesis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/642Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations storing speech in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/663Preventing unauthorised calls to a telephone set
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices
    • H04W88/06Terminal devices adapted for operation in multiple networks or having at least two operational modes, e.g. multi-mode terminals

Abstract

Aparato (1a; 1b) para responder a una llamada telefónica cuando un destinatario de dicha llamada telefónica decide que resulta inapropiado hablar, comprendiendo dicho aparato (1a; 1b): - unos medios de control, en particular una tecla (3a; 3b), para enviar una orden dedicada que abre una conversación de voz con un llamante, para poner dicho aparato (1a; 1b) en un modo de mensaje y responder así a dicha llamada telefónica; - un micrófono (5a; 5b) que se silencia después de enviar dicha orden dedicada para el periodo completo durante el cual dicho aparato (1a; 1b) se mantiene en dicho modo de mensaje; - un dispositivo de auricular (7a; 7b) para escuchar a dicho llamante; - un módulo de inyección de mensaje de voz (9) para enviar un mensaje de voz de alerta a dicho llamante, diciendo dicho mensaje de voz de alerta que dicho destinatario no está hablando, sino que ha sido sustituido por dicho aparato de inyección de texto a voz (20), - comprendiendo, dichos medios de control, un teclado (4a; 4b), que está adaptado para la escritura de un mensaje de texto por dicho destinatario de dicho aparato (1a; 1b); - un aparato de inyección de texto a voz (20) que comprende un aparato de traducción de texto a voz (11) y una base de datos (13) para sintetizar dicho mensaje de texto en un mensaje de habla y transmitir dicho mensaje de habla a dicho llamante durante dicha conversación de voz, caracterizado por el hecho de que dicho aparato de traducción de texto a voz (11) está adaptado para reconocer una voz de dicho destinatario durante una conversación y para distinguir, palabra por palabra, las palabras que está pronunciando dicho destinatario; estando adaptado dicho aparato de inyección de texto a voz (20) para almacenar dichas palabras reconocidas que han sido utilizadas por dicho destinatario durante una conversación, y para sustituir dichas palabras reconocidas y almacenadas en lugar de las palabras de voz sintetizada realizadas sobre la base de una voz de hombre o mujer predefinida.

Description

DESCRIPCIÓN
Aparato para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar y método relacionado
La presente invención se refiere a un aparato para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar, así como al método relacionado.
Es conocido que el destinatario de una llamada telefónica puede decidir que resulta inapropiado hablar para responder a una llamada entrante.
Dicha situación puede surgir debido a la ubicación concreta del destinatario, por ejemplo, cuando el mismo está usando un medio de transporte público donde desea mantener en la confidencialidad el contenido de la llamada, o en una conferencia o reunión de negocios donde resulta inapropiado iniciar una conversación telefónica, incluso si el tema objeto de la llamada es importante o urgente. Otra de las situaciones en la que resulta prácticamente imposible hablar y, por lo tanto, responder a una llamada telefónica, tiene lugar cuando el destinatario está ubicado en un lugar con mucho ruido (tal como un estadio deportivo) e, incluso gritando al micrófono del aparato, no es suficiente para que el llamante distinga lo que está diciendo el destinatario con respecto al ruido que le rodea.
Normalmente, cuando el destinatario de una llamada telefónica se encuentra en una de las situaciones mencionadas anteriormente, prefiere no responder a la llamada telefónica entrante y comienza a enviar mensajes al llamante usando uno de los servicios del aparato telefónico, por ejemplo, el servicio de SMS.
No obstante, responder a una llamada telefónica de esta manera significa perder las ventajas asociadas a una llamada de voz, debido al hecho de que, en primer lugar, el usuario tiene que abandonar la llamada telefónica y obligar además al llamante a usar el mismo servicio de mensajería. Por otra parte, todos los sistemas conocidos de mensajería de texto requieren una cantidad determinada de tiempo para introducir las palabras y se pierde la inmediatez de una conversación telefónica con preguntas y respuestas inmediatas. Esto resulta más evidente en relación con el hecho de que, para enviar un SMS, es necesario terminar la frase o mensaje completo antes de enviarlo. El documento GB 2.408.170 da a conocer una comunicación telefónica con una característica de respuesta silenciosa. De acuerdo con el documento, puede recibirse una llamada telefónica cuando el destinatario de una llamada decide que resulta inapropiado hablar. De acuerdo con la invención, se proporcionan opciones de respuestas derivadas de análisis de reconocimiento de habla y semánticos de aportaciones de las otras partes y se facilita una generación de una respuesta habilitando al destinatario para que seleccione una de las opciones como respuesta.
Por lo tanto, es un objetivo de la presente invención proporcionar un aparato y un método, que superen los inconvenientes de la técnica anterior, para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar.
Es otro objetivo de la presente invención proporcionar un aparato y un método para ayudar al destinatario de una llamada telefónica a responder a una llamada sin hablar, aunque introduciendo datos en el aparato de una manera muy rápida.
Es un objetivo adicional de la presente invención proporcionar un aparato y un método para sustituir la voz del destinatario de una llamada telefónica, cuando el mismo decide que resulta inapropiado hablar, por algo que sea lo más similar posible a una conversación normal cuando el destinatario de una llamada telefónica responde hablando con el llamante.
Estos y otros objetivos de la invención se alcanzan a través de un aparato y un método para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar, según se expone en las reivindicaciones adjuntas, las cuales forman parte de la presente descripción.
En resumen, se describen un aparato y un método para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar, comprendiendo el aparato medios de control, en particular una tecla, para enviar una orden dedicada, abrir una conversación de voz con un llamante, situar el aparato en un modo de mensaje y, de este modo, responder a la llamada telefónica; un micrófono que se silencia después de enviar la orden dedicada por el periodo completo durante el cual el aparato se mantiene en el modo de mensaje; los medios de control, en particular un teclado, están adaptados para que el destinatario del aparato teclee un mensaje de texto; un dispositivo de auricular para escuchar al llamante; un aparato de inyección de texto a voz (“text-to-speech”) que comprende un aparato de traducción de texto a voz y una base de datos de palabras para sintetizar el mensaje de texto obteniendo un mensaje de habla y transmitir el mensaje de habla al llamante durante la conversación de voz; y un módulo de inyección de mensajes de voz para enviar un mensaje de voz de alerta al llamante, de manera que el mensaje de voz de alerta dice que el destinatario no está hablando sino que ha sido sustituido por el aparato de inyección de texto a voz.
Se exponen otras características de la invención en las reivindicaciones adjuntas, las cuales están destinadas a formar parte de la presente descripción.
Los objetivos anteriores se pondrán más claramente de manifiesto a partir de la siguiente descripción detallada de un aparato y un método para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar, de acuerdo con la presente invención, haciendo referencia particularmente a los dibujos adjuntos, en los que:
- la figura 1 representa un aparato según la presente invención;
- la figura 2 representa un escenario según la presente invención.
Haciendo referencia a la figura 1, se muestra una parte de un primer aparato 1a de acuerdo con la presente invención, pudiendo ser dicho primer aparato 1a un teléfono inteligente, un teléfono móvil tradicional, una tableta y similares.
El primer aparato 1a comprende unos primeros medios de control, en particular una primera tecla dedicada 3a y un primer teclado 4a. El primer aparato 1a comprende asimismo un primer micrófono 5a. Resulta evidente que dicha tecla dedicada 3a y dicho primer teclado 4a pueden formar parte de un dispositivo de pantalla táctil moderno, generalmente proporcionado en un teléfono inteligente. La primera tecla dedicada 3a permite que un usuario envíe una orden dedicada para situar el primer aparato 1a en un "modo de mensaje" y, sustancialmente al mismo tiempo, responder a una llamada telefónica entrante abriendo una conversación de voz con un llamante. La primera tecla dedicada 3a asimismo produce el silenciamiento de señales provenientes del micrófono 5a del primer aparato 1a por el periodo completo durante el cual el primer aparato 1a se mantiene en dicho "modo de mensaje".
La función descrita anteriormente, es decir, el "modo de mensaje", asimismo se puede habilitar con una tecla de apertura de una llamada telefónica (por ejemplo, la tecla verde convencional para responder a una llamada entrante), aunque, en este caso, el primer aparato 1a se debe fijar previamente en un modo de silencio/vibración. A continuación, para deshabilitar el "modo de mensaje", el destinatario puede presionar la primera tecla dedicada 3a o salir del modo de silencio/vibración.
Si el primer aparato 1a no se encuentra en el modo de silencio/vibración y el destinatario presiona la tecla de apertura para abrir la llamada entrante, entonces el primer aparato 1a establece una comunicación de voz normal entre el llamante y el destinatario. Por lo tanto, el primer aparato 1a está configurado de tal manera que la primera tecla dedicada 3a y la tecla de apertura de una llamada entrante accionan funciones diferentes dependiendo del modo en curso del mismo (modo de silencio/vibración o no).
Es evidente que esta función de "modo de mensaje" y la ejecución de dicha función ayudan al destinatario de una llamada telefónica a responder inmediatamente sin hablar, únicamente enviando una orden al primer aparato 1a, en particular presionando la primera tecla dedicada 3a o la tecla de apertura (por ejemplo, la tecla verde convencional) cuando el aparato 1a está en el modo de silencio/vibración.
Una vez que el destinatario ha invocado el "modo de mensaje", el primer aparato 1a permite que el destinatario envíe mensajes de texto al llamante por medio de una red de telecomunicaciones. El resultado es que el destinatario puede enviar e introducir datos en el primer aparato 1a de una manera muy rápida.
El primer teclado 4a es útil para teclear un mensaje de texto por parte del destinatario. El primer teclado 4a puede ser un teclado de software o físico. Teclado de software significa que el primer aparato 1a comprende una pantalla (no representada en la figura 1) que permite la visualización de teclas del teclado. Teclado físico significa que el teclado comprende teclas físicas.
El primer aparato 1a asimismo comprende un primer dispositivo de auricular 7a que puede ser interno o externo con respecto al primer aparato 1a. En la figura 1 se muestra el primer dispositivo de auricular 7a externo al primer aparato 1a, aunque representa solamente una forma de realización no limitativa del mismo. En este caso, el primer dispositivo de auricular 7a se conecta al primer aparato 1a a través de una primera conexión inalámbrica o por cable 6a.
Haciendo referencia nuevamente a la figura 1, el primer aparato 1a comprende un aparato de inyección de texto a voz 20 y un módulo de inyección de mensajes de voz 9. Este está conectado (no representándose en la figura 1 para simplificar) al resto del aparato (un teléfono inteligente, un teléfono móvil tradicional, una tableta y similares) para enviar respuestas de voz, ya que la voz llegaría del micrófono 5a.
El aparato de inyección de texto a voz 20 comprende un aparato de traducción de texto a voz 11, que comprende una base de datos 13. Por otra parte, el aparato de inyección de texto a voz 20 comprende un aparato de reconocimiento e interpretación de habla 15.
Haciendo referencia a la figura 2, se muestra un escenario 10 útil para explicar la presente invención. El escenario 10 comprende el primer aparato 1a según se ha descrito anteriormente y un segundo aparato 1b. Se supone que un primer usuario del primer aparato 1a es un destinatario de una llamada telefónica y un segundo usuario del segundo aparato 1b es un llamante de la llamada telefónica. El primer aparato 1a y el segundo aparato 1b están en comunicación por medio de una red de telecomunicaciones 23.
El segundo aparato 1b es similar al primer aparato 1a, de hecho el segundo aparato 1b asimismo puede comprender unos segundos medios de control, en particular una segunda tecla dedicada 3b, un segundo teclado 4b. Asimismo comprende un segundo micrófono 5b y un segundo dispositivo de auricular 7b. De manera similar, el segundo dispositivo de auricular 7b puede conectarse al segundo aparato 1b a través de una segunda conexión inalámbrica o por cable 6b.
El aparato de traducción de texto a voz 11 es responsable de capturar un mensaje de texto y de transformar o traducir en un mensaje de habla este mensaje de texto, enviado desde un usuario, por ejemplo desde el destinatario a través del primer aparato 1a.
La base de datos 13 contiene un vocabulario útil para la traducción, en particular permite una asociación entre cadenas de texto, es decir, palabras o frases, y señales de voz. Cada cadena de texto está asociada a una señal de voz. La señal de voz representa el mensaje o una parte del mismo.
El aparato de inyección de texto a voz 20 está asociado a una conversación de voz/texto, establecida sobre un canal a través de la red de telecomunicaciones 23, entre el destinatario del primer aparato 1a y el llamante del segundo aparato 1b.
Además de lo descrito anteriormente en la presente memoria, cuando el destinatario activa el "modo de mensaje", el mismo envía automáticamente, a través del módulo de inyección de mensajes de voz 9, un mensaje de voz de alerta (memorizado en el aparato 1a) al llamante, en particular un mensaje que dice que el destinatario no está hablando, sino que ha sido sustituido por un aparato de inyección de texto a voz 20.
A continuación, el destinatario puede escribir un mensaje de texto usando un teclado 4a del primer aparato 1a como respuesta a las preguntas planteadas por el llamante.
Dicho mensaje de texto se sintetiza obteniendo un mensaje de habla y se transmite al llamante por medio de la red de telecomunicaciones 23, a través de la parte restante del aparato 1a. El módulo de inyección de mensajes de voz 9 analiza asimismo la conversación de voz activa y detecta periodos de silencio del llamante, durante los cuales se inyecta en la conversación de voz dicho mensaje de habla.
Cuando se detecta un periodo de silencio, el módulo de inyección de mensajes de voz 9 inyecta el mensaje de habla en el mismo canal de audio que la conversación de voz con el fin de que el destinatario del segundo aparato 1b pueda oír el anterior mensaje de texto creado por el llamante del primer aparato 1a.
Con mayor detalle, el mensaje de texto se sintetiza obteniendo el mensaje de habla con el uso de la base de datos 13 incluida en un aparato de traducción de texto a voz 11 y software de síntesis de habla disponible comercialmente en la actualidad.
El destinatario del primer aparato 1a puede enviar el mensaje de texto al aparato de traducción de texto a voz 11 usando un formato similar al SMS ("Servicio de Mensajes Cortos"), o similar a un formato del Servicio de IM ("Servicio de Mensajería Instantánea"), en particular "WhatsApp", "Google Talk", "Skype", "Viber", y otros. Lo que es importante es que, cuando una cierta parte de la frase introducida por el destinatario se adecúa a lo que requiere una respuesta a una pregunta, incluso si la frase completa no se ha terminado todavía, el destinatario puede enviar este texto para convertirlo en habla con una simple orden, como retorno (return) u OK. En este caso, cuando el destinatario comienza nuevamente a introducir palabras, el aparato de traducción de texto a voz 11 está de nuevo listo para preparar otras frases o parte de ellas para su traducción a habla.
El aparato de reconocimiento e interpretación de habla 15 recibe las expresiones vocales provenientes del llamante y analiza frases formuladas por el mismo, extrae algunas palabras de estas frases y les asigna un significado relacionado con las frases habituales utilizadas en una conversación telefónica.
El aparato de reconocimiento e interpretación de habla 15 almacena asimismo en la base de datos 13 frases completadas útiles, por ejemplo, para responder a una pregunta planteada por el llamante, y las extrae y propone al destinatario en función de la pregunta concreta planteada por el llamante. Para llevar a cabo esto, el aparato de reconocimiento e interpretación de habla 15 analiza el significado de la frase, en particular una pregunta planteada por el llamante, y busca una serie de respuestas en la base de datos 13 que pueden ser apropiadas para esa pregunta. Las respuestas se almacenan en la base de datos 13 antes o durante el uso. Alternativamente, el aparato de reconocimiento e interpretación de habla 15 almacena en la base de datos 13 tanto preguntas como respuestas. De esta manera, cada pregunta está asociada a por lo menos una respuesta que puede ser propuesta al destinatario.
Cuando un destinatario fija su primer aparato 1a en el "modo de mensaje" tal como se ha descrito anteriormente, el llamante puede hablar con el destinatario, incluso si este no dice nada. Suponiendo que el llamante formula una pregunta, esta última se analiza a través del aparato de reconocimiento e interpretación de habla 15 que convierte una señal de voz de la pregunta en un formato de texto (realiza una traducción de voz-a-texto); a continuación compara dicho formato de texto con frases almacenadas en la base de datos 13. Es importante especificar que dicha comparación se lleva a cabo de manera sintáctica o semántica.
Si la pregunta en un formato de texto está contenida dentro de la base de datos 13, el aparato de reconocimiento e interpretación de habla 15 recupera por lo menos una respuesta predefinida almacenada, asociada a dicha pregunta, y la propone al destinatario en formato de texto, es decir, asiste al destinatario en la introducción de la respuesta por teclado.
De este modo, el destinatario verá la respuesta en formato de texto en una pantalla del primer aparato 1a y puede seleccionar inmediatamente la respuesta que prefiera, si es que se ha propuesto una pluralidad de respuestas.
Con mayor detalle, por ejemplo, una frase/pregunta típica almacenada en la base de datos 13 puede ser “¿Cómo estás?"; entonces las respuestas asociadas pueden ser "Estoy bien." o "Muy bien, gracias, ¿y tú?" o "No mal del todo, ¡gracias!" y otras. Otra pregunta típica podría ser "¿Estás ocupado?"; entonces las respuestas asociadas pueden ser "Sí, lo siento, llámame más tarde" o "No, no te preocupes, ¿qué tal? " y otras. Resulta evidente que, en la base de datos 13, se puede almacenar una cantidad enorme de preguntas y respuestas.
Por lo tanto, la característica recién descrita permite ayudar a un usuario, en particular al destinatario, a contestar rápidamente a una pregunta a través de un mensaje de texto sin tener que teclear en su totalidad la respuesta en el primer teclado 4a.
Además, el aparato de traducción de texto a voz 11 asimismo funciona en un "modo de aprendizaje". Dicho "modo de aprendizaje" puede ser activado por un usuario, por ejemplo, por el destinatario de la llamada telefónica, prevé el reconocimiento de la voz del usuario cuando el primer aparato 1a no está en el "modo de mensaje", es decir, durante una conversación, y distingue palabras, de una en una, que son pronunciadas por el usuario.
El aparato de traducción de texto a voz 11 almacena asimismo las palabras reconocidas de una manera automática o manual. La manera manual prevé que el usuario pueda validar el almacenamiento de las palabras reconocidas a través de su aparato 1a enviando una información al aparato de inyección de texto a voz 20 que lleva a cabo la validación y confirma el almacenamiento de la palabra individual, es decir, la señal acústica vocal de la palabra individual.
A continuación, cuando el primer aparato 1a está funcionando en el "modo de mensaje", el aparato de inyección de texto a voz 20 sustituye las palabras de voz sintetizada que se han materializado basándose en una voz predefinida de hombre o mujer, por las palabras validadas y reconocidas, es decir, la señal de habla acústica de la palabra. No obstante, la voz de hombre o mujer se usa por defecto. Además, la voz de hombre o mujer es seleccionable por el usuario, por ejemplo, el destinatario, a través de un sistema de menús del primer aparato 1a.
El llamante de la conversación puede entonces oír la voz real del destinatario y no la voz predefinida de hombre o mujer.
Por ejemplo, si el destinatario del primer aparato 1a, durante una conversación que no se encuentra en el "modo de mensaje" con el llamante del segundo aparato 1b, pronuncia la siguiente frase "Hola Mark, nos vemos, adiós", el aparato de traducción de texto a voz 11 reconoce cada palabra individual de esa frase y almacena de una manera automática o manual la señal acústica de habla de cada palabra en la base de datos 13. Por lo tanto, en la base de datos 13, por ejemplo, la palabra "vemos" correspondiente a la voz predefinida de hombre o mujer se sustituye por las señales acústicas de habla correspondientes a la voz del destinatario en relación con el primer aparato 1a. A continuación se reconoce cada palabra de la frase y la señal acústica de habla respectiva se almacena en la base de datos 13.
Cuando el destinatario fija su primer aparato 1a en "modo de mensaje" y envía un mensaje de texto al llamante del segundo aparato 1b, el aparato de traducción de texto a voz 11 sustituye las palabras de voz sintetizada materializadas sobre la base de la voz predefinida de hombre o mujer por las palabras validadas y reconocidas, es decir la señal acústica de habla de la palabra, es decir, selecciona estas últimas. El resultado de la traducción de texto a voz es un mensaje de habla que comprende señales acústicas de habla correspondientes a la voz real del destinatario. Además, después de un tiempo, los mensajes de voz enviados al llamante se materializarán en su totalidad por medio del habla acústica correspondiente a la voz real del usuario.
Para acelerar el envío de un mensaje de texto, el primer aparato 1a identifica y extrae palabras de texto, usadas para crear el mensaje de habla, de la base de datos 13, considerando letras individuales de una palabra que está introduciendo un usuario, por ejemplo el destinatario, en el teclado 4a, y sugiere al usuario la palabra completa antes de que la misma se introduzca en su totalidad.
Con mayor detalle, el primer aparato 1a identifica palabras de texto cuando un usuario teclea una palabra en el teclado 4a, y a continuación el primer aparato 1a envía por lo menos una letra de dicha palabra al aparato de traducción de texto a voz 11 que consulta la base de datos 13 para extraer por lo menos una palabra que contiene esas letras. Por ejemplo, si el usuario comienza a teclear "El", estas letras se envían al aparato de traducción de texto a voz 11 que consulta la base de datos 13 para extraer por lo menos una palabra que contiene esas letras. A continuación, la base de datos 13 devuelve por lo menos una palabra de su vocabulario, es decir "Ella", "Ellos", "Ellas", "Elsa", etcétera. El aparato de traducción de texto a voz 11 entonces devuelve estas palabras al primer aparato 1a que las visualizará en su pantalla. Por lo tanto, el usuario puede seleccionar inmediatamente con el teclado 4a la palabra que prefiera sin perder tiempo tecleando la palabra completa. Esta característica es particularmente eficiente en aparatos como teléfonos inteligentes que tienen una pantalla, donde es posible mostrar en múltiples líneas, situadas una encima de las otras, todas las palabras posibles que pueden adecuarse al mensaje que se va a enviar, de manera que el usuario puede simplemente seleccionar la más apropiada, desplazándolas verticalmente. Por otra parte, el aparato de traducción de texto a voz 11 prevé el almacenamiento de todos los mensajes de texto pasados en la base de datos 13, convertidos en los mensajes de habla, y la sugerencia de frases completas al usuario, por ejemplo al destinatario, cuando, en dichos mensajes de texto anteriores, ya se han usado por lo menos dos palabras consecutivas.
Es decir, cuando el destinatario está introduciendo un mensaje usando un teclado 4a, no se le sugieren solamente palabras, sino asimismo frases ya utilizadas por el mismo. La sugerencia se muestra en la pantalla del primer aparato 1a.
Resulta evidente que todo lo que se ha mostrado en referencia al primer aparato 1a, se puede aplicar asimismo para el segundo aparato 1b, en caso de que los usuarios tanto del primer como del segundo aparato 1a, 1b deseen iniciar una conversación telefónica, pero ninguno de ellos desee hablar.
Dada la dualidad del escenario 10, el llamante puede ser el primer usuario del primer aparato 1a y el destinatario puede ser el segundo usuario del segundo aparato 1b y viceversa.
Por lo tanto, el segundo aparato 1b puede comprender todos los elementos descritos para el primer aparato 1a, a saber, asimismo un aparato de inyección de texto a voz y un módulo de inyección de mensajes de voz según se ha descrito anteriormente.
Debe apreciarse que el aparato de acuerdo con la presente invención se puede implementar a través de un producto de ordenador el cual se puede cargar en una memoria del primer y/o del segundo aparato 1a, 1b y que comprende partes de código de software adaptadas para implementar el método usando hardware existente.
Debe indicarse asimismo que, debido al creciente poder de cálculo de los microprocesadores usados actualmente en los teléfonos móviles y a los avances logrados por el software relacionado tanto con la traducción de texto a voz como con el reconocimiento de habla, todas las características del aparato descrito anteriormente pueden incluirse en teléfonos móviles como los correspondientes de uso común. Una primera ventaja del aparato y del método de acuerdo con la presente invención es que supera los inconvenientes de la técnica anterior.
Una segunda ventaja del aparato y del método de acuerdo con la presente invención es la sustitución de la voz del destinatario de una llamada telefónica, cuando el mismo decide que resulta inapropiado hablar, por algo que es lo más similar dentro de lo posible a una conversación normal cuando el destinatario de una llamada telefónica responde hablando con el llamante.
Una tercera ventaja del aparato y del método de acuerdo con la presente invención es que se ayuda al destinatario de una llamada telefónica a responder a dicha llamada sin hablar, e introduciendo, en cambio, datos en el aparato de una manera muy rápida.
El aparato y el método para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar, pueden estar sujetos a muchas variaciones posibles sin apartarse de la idea inventiva.
Por lo tanto, puede apreciarse fácilmente que la presente invención no se limita a un aparato y un método para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar, sino que pueden introducirse muchas modificaciones, mejoras o sustituciones de partes y elementos equivalentes sin apartarse de la idea inventiva, según se especifica claramente en las reivindicaciones siguientes.

Claims (13)

REIVINDICACIONES
1. Aparato (1a; 1b) para responder a una llamada telefónica cuando un destinatario de dicha llamada telefónica decide que resulta inapropiado hablar, comprendiendo dicho aparato (1a; 1b):
- unos medios de control, en particular una tecla (3a; 3b), para enviar una orden dedicada que abre una conversación de voz con un llamante, para poner dicho aparato (1a; 1b) en un modo de mensaje y responder así a dicha llamada telefónica;
- un micrófono (5a; 5b) que se silencia después de enviar dicha orden dedicada para el periodo completo durante el cual dicho aparato (1a; 1b) se mantiene en dicho modo de mensaje;
- un dispositivo de auricular (7a; 7b) para escuchar a dicho llamante;
- un módulo de inyección de mensaje de voz (9) para enviar un mensaje de voz de alerta a dicho llamante, diciendo dicho mensaje de voz de alerta que dicho destinatario no está hablando, sino que ha sido sustituido por dicho aparato de inyección de texto a voz (20),
- comprendiendo, dichos medios de control, un teclado (4a; 4b), que está adaptado para la escritura de un mensaje de texto por dicho destinatario de dicho aparato (1a; 1b);
- un aparato de inyección de texto a voz (20) que comprende un aparato de traducción de texto a voz (11) y una base de datos (13) para sintetizar dicho mensaje de texto en un mensaje de habla y transmitir dicho mensaje de habla a dicho llamante durante dicha conversación de voz,
caracterizado por el hecho de que dicho aparato de traducción de texto a voz (11) está adaptado para reconocer una voz de dicho destinatario durante una conversación y para distinguir, palabra por palabra, las palabras que está pronunciando dicho destinatario; estando adaptado dicho aparato de inyección de texto a voz (20) para almacenar dichas palabras reconocidas que han sido utilizadas por dicho destinatario durante una conversación, y para sustituir dichas palabras reconocidas y almacenadas en lugar de las palabras de voz sintetizada realizadas sobre la base de una voz de hombre o mujer predefinida.
2. Aparato (1a; 1b) según la reivindicación 1, en el que dicho módulo inyector de mensaje de voz (9) está adaptado para analizar una conversación de voz en curso y para detectar periodos de silencio de dicho llamante, durante los cuales se inyecta dicho mensaje de habla en dicha conversación de voz.
3. Aparato (1a; 1b) según la reivindicación 1, en el que dicho aparato (1a; 1b) está adaptado para identificar y extraer palabras de texto a partir de dicha base de datos (13) considerando las letras individuales de una palabra que está introduciendo dicho destinatario en dichos medios de control, en particular dicho teclado (4a; 4b), y está adaptado para sugerir a dicho destinatario la palabra completa antes de que se introduzca completamente.
4. Aparato (1a; 1b) según una o más de las reivindicaciones anteriores, en el que dicho aparato de traducción de texto a voz (11) está adaptado para almacenar todos los mensajes de texto pasados en dicha base de datos (13), convertidos en dichos mensajes de habla, y para sugerir frases completas a dicho destinatario cuando ya se han utilizado por lo menos dos palabras consecutivas en dichos mensajes de texto pasados.
5. Aparato (1a; 1b) según una o más de las reivindicaciones anteriores, en el que dicho aparato de traducción de texto a voz (11) está adaptado para sintetizar dicho mensaje de habla sobre la base de dicha voz de hombre o mujer predefinida, seleccionable a partir de un usuario a través de un sistema de menús de dicho aparato (1a; 1b).
6. Método para responder a una llamada telefónica a través de un aparato (1a; 1b) cuando un destinatario de dicha llamada telefónica decide que resulta inapropiado hablar, comprendiendo dicho método las etapas siguientes:
- enviar una orden dedicada a través de unos medios de control, en particular a través de la selección de una tecla dedicada (3a; 3b) en dicho aparato (1a; 1b), abrir una conversación de voz con un llamante, poner dicho aparato (1a; 1b) en un modo de mensaje y responder así a dicha llamada telefónica;
- producir, por parte de dicha orden dedicada, el silenciamiento de señales provenientes de un micrófono (5a; 5b) de dicho aparato (1a; 1b) para el periodo completo durante el cual dicho aparato (1a; 1b) se mantiene en dicho modo de mensaje;
- escuchar a dicho llamante a través de un dispositivo de auricular (7a; 7b);
- enviar, a través de un módulo de inyección de mensaje de voz (9), un mensaje de voz de alerta a dicho llamante, diciendo dicho mensaje de voz de alerta que dicho destinatario no está hablando, sino que ha sido sustituido por un aparato de inyección de texto a voz (20);
- escribir, a través de un teclado (4a; 4b) de los medios de control, por dicho destinatario un mensaje de texto como respuesta a preguntas planteadas por dicho llamante; y
- sintetizar dicho mensaje de texto en un mensaje de habla a través de un aparato de traducción de texto a voz (11) que utiliza una base de datos (13), y transmitir dicho mensaje de habla a dicho llamante durante dicha conversación de voz a través de dicho aparato de inyección de texto a voz (20); comprendiendo además dicho método las etapas de:
- reconocer, a través de dicho aparato de traducción de texto a voz (11), una voz de dicho destinatario durante una conversación y distinguir, palabra por palabra, palabras que está pronunciando dicho destinatario; - almacenar, a través de dicho aparato de inyección de texto a voz (20), dichas palabras reconocidas que han sido utilizadas por dicho destinatario durante una conversación que no se produjo en dicho modo de mensaje; y
- sustituir dichas palabras reconocidas y almacenadas en dicho aparato de inyección de texto a voz (20) en lugar de las palabras de voz sintetizada realizadas sobre la base de una voz predefinida de hombre o mujer.
7. Método según la reivindicación 6, en el que la etapa de almacenar palabras es validada por un usuario de dicho aparato (1a; 1b) o
en el que dicha etapa de reconocer una voz de dicho destinatario cuando dicho aparato (1a; 1b) no se encuentra en dicho modo de mensaje se activa por dicho usuario.
8. Método según la reivindicación 6, en el que dicho método comprende además la etapa de analizar una conversación de voz en curso y detectar periodos de silencio de dicho llamante, durante los cuales se inyecta dicho mensaje de habla en dicha conversación de voz a través de dicho módulo inyector de mensaje de voz (9).
9. Método según una o más de las reivindicaciones anteriores, comprendiendo además dicho método la etapa de identificar y extraer palabras de texto, utilizadas para crear dicho mensaje de habla, a partir de dicha base de datos (13) considerando letras individuales de una palabra que está introduciendo dicho destinatario, y sugerir a dicho destinatario la palabra completa antes de que la misma se introduzca completamente.
10. Método según una o más de las reivindicaciones anteriores, comprendiendo además dicho método la etapa de almacenar todos los mensajes de texto pasados, convertidos en dichos mensajes de habla, en dicha base de datos (13) a través de dicho aparato de traducción de texto a voz (11), y sugerir frases completas a dicho destinatario cuando ya han sido utilizadas por lo menos dos palabras consecutivas en dichos mensajes de texto pasados.
11. Método según una o más de las reivindicaciones anteriores, comprendiendo además dicho método la etapa de sintetizar dicho mensaje de habla sobre la base de dicha voz predefinida de hombre o mujer, seleccionable a partir de dicho usuario a través de un sistema de menús de dicho aparato (1a; 1b).
12. Método según una o más de las reivindicaciones anteriores, en el que dicho mensaje de texto utiliza un formato similar a un mensaje de servicio de mensajes cortos, SMS, o de servicio de mensajería instantánea, IM.
13. Producto de ordenador que puede cargarse en una memoria de dicho aparato (1a; 1b), que comprende unas partes de código de software adaptadas para implementar el método según una o más de las reivindicaciones 6 a 12.
ES13721550T 2013-05-02 2013-05-02 Aparato para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar y método relacionado Active ES2786079T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2013/059083 WO2014177209A1 (en) 2013-05-02 2013-05-02 An apparatus for answering a phone call when a recipient of the phone call decides that it is inappropriate to talk, and related method

Publications (1)

Publication Number Publication Date
ES2786079T3 true ES2786079T3 (es) 2020-10-08

Family

ID=48366310

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13721550T Active ES2786079T3 (es) 2013-05-02 2013-05-02 Aparato para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar y método relacionado

Country Status (7)

Country Link
US (1) US9924012B2 (es)
EP (1) EP2992666B1 (es)
JP (1) JP6165321B2 (es)
KR (1) KR102038827B1 (es)
CN (1) CN105210355B (es)
ES (1) ES2786079T3 (es)
WO (1) WO2014177209A1 (es)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10560573B2 (en) * 2015-12-21 2020-02-11 Saronikos Trading And Services, Unipessoal Lda Apparatus and method for managing communications
CN106060272A (zh) * 2016-07-12 2016-10-26 魏喜国 以智能手机为载体的双语即时翻译装置
US11170757B2 (en) 2016-09-30 2021-11-09 T-Mobile Usa, Inc. Systems and methods for improved call handling
CN107071328B (zh) * 2016-12-16 2019-12-03 维沃移动通信有限公司 一种视频通话处理方法及移动终端
WO2019005233A1 (en) 2017-06-30 2019-01-03 Google Llc METHODS, SYSTEMS, AND MEDIA FOR CONNECTING AN IOT DEVICE TO A CALL
WO2019005227A1 (en) * 2017-06-30 2019-01-03 Google Llc METHODS, SYSTEMS AND MEDIA FOR VOICE CALL OPERATIONS
CN107404432A (zh) * 2017-09-02 2017-11-28 刘兴丹 一种结合多种网路群发信息的方法、装置
CN109698877A (zh) * 2017-10-24 2019-04-30 华为终端(东莞)有限公司 语音通信方法和语音通信装置
CN108965600B (zh) * 2018-07-24 2021-05-04 Oppo(重庆)智能科技有限公司 语音拾取方法及相关产品
WO2020130498A1 (en) 2018-12-12 2020-06-25 Samsung Electronics Co., Ltd. A command based interactive system and a method thereof
RU2719659C1 (ru) * 2019-01-10 2020-04-21 Общество с ограниченной ответственностью "Центр речевых технологий" (ООО "ЦРТ") Устройство для регистрации и управления вводом речевой информации
CN110602328B (zh) * 2019-09-30 2021-10-22 联想(北京)有限公司 处理方法及处理装置
US11019207B1 (en) * 2019-11-07 2021-05-25 Hithink Royalflush Information Network Co., Ltd. Systems and methods for smart dialogue communication

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3750768T2 (de) 1986-04-16 1995-05-11 Call It Co Rechnergesteuertes Kommunikationssystem.
JPS6354855A (ja) 1986-08-26 1988-03-09 Oki Electric Ind Co Ltd 留守番電話機
JPH0774843A (ja) 1993-09-01 1995-03-17 Omron Corp 通信端末装置
JP3165585B2 (ja) * 1994-05-13 2001-05-14 シャープ株式会社 情報処理装置
ATE347156T1 (de) * 1998-10-14 2006-12-15 Gary J Morris Gefahrenmeldeanlage mit stimmenalarm
JP2000134298A (ja) 1998-10-21 2000-05-12 Kazuo Ishikawa 文字入力装置
US6438524B1 (en) * 1999-11-23 2002-08-20 Qualcomm, Incorporated Method and apparatus for a voice controlled foreign language translation device
US7106852B1 (en) * 2000-09-08 2006-09-12 Fuji Xerox Co., Ltd. Telephone accessory for generating conversation utterances to a remote listener in response to a quiet selection
US7083342B2 (en) * 2001-12-21 2006-08-01 Griffin Jason T Keyboard arrangement
GB2408170B (en) 2002-06-07 2005-10-26 Hewlett Packard Development Co Telephone communication with silent response feature
GB0213021D0 (en) * 2002-06-07 2002-07-17 Hewlett Packard Co Telephone communication with silent response feature
JP2004129174A (ja) 2002-08-06 2004-04-22 Ricoh Co Ltd 情報通信装置、情報通信プログラム、及び記録媒体
EP1465393A1 (en) * 2003-04-01 2004-10-06 Silent Communication Ltd. Apparatus and method for silent communication using pre-recorded audible messages
KR100846410B1 (ko) * 2003-12-31 2008-07-16 리서치 인 모션 리미티드 키보드 배열
FI20055717A0 (fi) * 2005-12-30 2005-12-30 Nokia Corp Koodinmuunnosmenetelmä matkaviestinjärjestelmässä
JP2008072425A (ja) 2006-09-14 2008-03-27 Interfuncs Co Ltd 携帯電話機用通話制御装置
JP3165585U (ja) 2010-11-11 2011-01-27 有限会社オフィス結アジア 音声合成装置
JP2012205223A (ja) * 2011-03-28 2012-10-22 Sanyo Electric Co Ltd 通信装置
EP2536176B1 (en) * 2011-06-16 2016-09-21 Alcatel Lucent Text-to-speech injection apparatus for telecommunication system

Also Published As

Publication number Publication date
KR102038827B1 (ko) 2019-10-31
WO2014177209A1 (en) 2014-11-06
EP2992666B1 (en) 2020-02-26
US9924012B2 (en) 2018-03-20
US20160065711A1 (en) 2016-03-03
CN105210355A (zh) 2015-12-30
CN105210355B (zh) 2019-03-22
KR20160005075A (ko) 2016-01-13
JP2016524365A (ja) 2016-08-12
JP6165321B2 (ja) 2017-07-19
EP2992666A1 (en) 2016-03-09

Similar Documents

Publication Publication Date Title
ES2786079T3 (es) Aparato para responder a una llamada telefónica cuando un destinatario de la llamada telefónica decide que resulta inapropiado hablar y método relacionado
KR102582517B1 (ko) 공유된 음성 작동 디바이스상의 호출 핸들링
US8351581B2 (en) Systems and methods for intelligent call transcription
CN102117614B (zh) 个性化文本语音合成和个性化语音特征提取
US7974392B2 (en) System and method for personalized text-to-voice synthesis
KR100819928B1 (ko) 휴대 단말기의 음성 인식장치 및 그 방법
US20170085506A1 (en) System and method of bidirectional transcripts for voice/text messaging
BR112019026006A2 (pt) Sistema para comunicação multimodal assíncrona e método de comunicação multimodal assíncrona
KR20090085376A (ko) 문자 메시지의 음성 합성을 이용한 서비스 방법 및 장치
US20090196405A1 (en) Ivr to sms text messenger
US8229086B2 (en) Apparatus, system and method for providing silently selectable audible communication
CA2539649C (en) System and method for personalized text-to-voice synthesis
JP4852584B2 (ja) 禁止語発信防止方法、禁止語発信防止電話、禁止語発信防止サーバ
US20080096587A1 (en) Telephone for Sending Voice and Text Messages
EP2913822B1 (en) Speaker recognition
JPWO2015083741A1 (ja) 中継装置、表示装置および通信システム
JP2015100054A (ja) 音声通信システム、音声通信方法及びプログラム
KR20160097406A (ko) 실시간 통번역 통화서비스 시스템 및 그 제공방법
JP2013257428A (ja) 音声認識装置
KR102496398B1 (ko) 사용자 디바이스에 페어링되어 음성-텍스트를 변환하는 장치 및 그 방법
JP2005123869A (ja) 通話内容書き起こしシステムおよび通話内容書き起こし方法
KR20000018938A (ko) 휴대용 전화기의 통화 방법
KR20090037293A (ko) 이동통신단말기의 수신문자별 음성출력장치 및 방법
KR20060023770A (ko) 보호 대상자 중심의 통화 서비스 제공 시스템 및 그 방법