ES2960291T3 - Procedimiento y sistema para controlar y/o comunicarse con un electrodoméstico por medio de comandos de voz y presentaciones de texto - Google Patents

Procedimiento y sistema para controlar y/o comunicarse con un electrodoméstico por medio de comandos de voz y presentaciones de texto Download PDF

Info

Publication number
ES2960291T3
ES2960291T3 ES20197172T ES20197172T ES2960291T3 ES 2960291 T3 ES2960291 T3 ES 2960291T3 ES 20197172 T ES20197172 T ES 20197172T ES 20197172 T ES20197172 T ES 20197172T ES 2960291 T3 ES2960291 T3 ES 2960291T3
Authority
ES
Spain
Prior art keywords
query
request
processing means
appliance
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20197172T
Other languages
English (en)
Inventor
Leonardo Sergi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Candy SpA
Original Assignee
Candy SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Candy SpA filed Critical Candy SpA
Application granted granted Critical
Publication of ES2960291T3 publication Critical patent/ES2960291T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • DTEXTILES; PAPER
    • D06TREATMENT OF TEXTILES OR THE LIKE; LAUNDERING; FLEXIBLE MATERIALS NOT OTHERWISE PROVIDED FOR
    • D06FLAUNDERING, DRYING, IRONING, PRESSING OR FOLDING TEXTILE ARTICLES
    • D06F34/00Details of control systems for washing machines, washer-dryers or laundry dryers
    • D06F34/04Signal transfer or data transmission arrangements
    • D06F34/05Signal transfer or data transmission arrangements for wireless communication between components, e.g. for remote monitoring or control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Selective Calling Equipment (AREA)

Abstract

Se describe un método para controlar y/o comunicarse con un electrodoméstico 100 mediante comando de voz y proporcionar visualización de texto. Tal método comprende las etapas de recibir una señal de voz acústica SV, correspondiente a una frase de consulta y/o solicitud de voz pronunciada por un usuario y generar una primera señal eléctrica correspondiente SE representativa de la señal de voz acústica SV, mediante medios de recepción de voz 2 integrados. en el electrodoméstico 100. El método proporciona así generar una señal eléctrica de consulta y/o solicitud SR, representativa de la señal de voz acústica SV, mediante el primer medio de procesamiento 3 integrado en el electrodoméstico 10 conectado operativamente a dicho medio de recepción de voz 2; y de transmitir la señal eléctrica SR de consulta y/o solicitud antes mencionada a segundos medios de procesamiento 4. El método proporciona entonces las siguientes etapas mediante los segundos medios de procesamiento 4: procesar la consulta y/o solicitud de señal eléctrica SR antes mencionada; generar una primera cadena de caracteres de texto C1 correspondiente a la consulta y/o solicitud del usuario identificada en la etapa de procesamiento; determinar una respuesta que se proporcionará al usuario, basándose en la consulta y/o solicitud del usuario identificado; y generar una segunda cadena de caracteres de texto C2 correspondiente a la respuesta determinada por el segundo medio de procesamiento 4. Finalmente, el método comprende las etapas de transmitir la primera cadena de caracteres de texto C1 y la segunda cadena de caracteres de texto C2 al primer medio de procesamiento 3 del electrodoméstico; y de mostrar tanto la primera cadena de caracteres de texto C1 como la segunda cadena de caracteres de texto C2 por medio de una interfaz visual 5 comprendida en el electrodoméstico 100, de modo que el usuario pueda leer tanto la consulta como/o solicitud del usuario, tal como se identifica por el segundos medios de procesamiento 4, y la respuesta determinada por los segundos medios de procesamiento 4. Se describe además un sistema correspondiente para controlar y/o comunicarse con un electrodoméstico mediante comando de voz y proporcionar visualización de texto, y un electrodoméstico equipado con las funciones antes mencionadas.

Description

DESCRIPCIÓN
Procedimiento y sistema para controlar y/o comunicarse con un electrodoméstico por medio de comandos de voz y presentaciones de texto
Antecedentes tecnológicos de la invención
Campo de aplicación
La presente invención se refiere, en general, al campo técnico del control por voz de electrodomésticos. En particular, la invención se refiere a un procedimiento y un sistema para controlar un electrodoméstico y/o comunicarse con él por medio de comandos de voz y proporcionar presentación de texto.
Descripción de la técnica anterior
En el campo técnico de los electrodomésticos equipados con una interfaz de usuario avanzada, son conocidas muchas soluciones que permiten al usuario controlar el aparato y/o comunicarse con él por medio de comandos de voz, por ejemplo, a partir de los documentos US 2017/004828 A1 y EP 3413 304 A2.
Típicamente, la comunicación por voz se activa por medio de una palabra clave o una palabra de activación. Una vez activada, la comunicación por voz permite al usuario interactuar con el aparato, por ejemplo, para proporcionar comandos, por medio de entradas de voz del usuario, que se reconocen apropiadamente por diversas tecnologías de reconocimiento de voz posibles, conocidas en sí mismas.
Sin embargo, el reconocimiento de voz, aunque se basa en una tecnología actualmente muy desarrollada, no garantiza de determinada manera que un comando o una petición se interprete correctamente, especialmente en presencia de entradas de voz articuladas que no se limitan a palabras de comando predeterminadas. Por este motivo, normalmente se permite al usuario comprobar la respuesta proporcionada por el sistema de control en base a la entrada de voz.
No obstante, en el campo técnico considerado, se siente fuertemente la necesidad de mejorar las garantías de exactitud del comando por medio de entrada de voz, y en particular, proporcionar al usuario retroalimentación sobre si la entrada de voz, por ejemplo, una petición, o un comando o una pregunta se interpretó correctamente. En otras palabras, la mejora constante de las técnicas de reconocimiento de voz no reemplaza la necesidad de que el usuario tenga retroalimentación sobre la correcta interpretación del comando o petición de voz. Dicho requisito no se cumple totalmente por las soluciones conocidas hasta la fecha.
Sumario de la invención
El objetivo de la presente invención es proporcionar un procedimiento para controlar y/o comunicarse con un electrodoméstico por medio de comando de voz, que permita solucionar, al menos en parte, las desventajas descritas anteriormente con referencia a la técnica anterior y responder a las necesidades mencionadas anteriormente, en particular, sentidas en el sector técnico considerado. Un objetivo de este tipo se logra por un procedimiento de acuerdo con la reivindicación 1.
Otros modos de realización de un procedimiento de este tipo se definen en las reivindicaciones 2-9.
Otro objetivo de la presente invención es proporcionar un sistema para controlar y/o comunicarse con un electrodoméstico por medio de comando de voz que puede implementar el procedimiento mencionado anteriormente. Un sistema de este tipo se define en la reivindicación 10.
Otros modos de realización del sistema se definen en las reivindicaciones 11-14.
La presente invención se refiere además a un electrodoméstico que se puede controlar por medio de comando de voz de acuerdo con el procedimiento mencionado anteriormente. Un electrodoméstico de este tipo se define en la reivindicación 15.
Breve descripción de los dibujos
Otros rasgos característicos y ventajas del procedimiento y sistema de acuerdo con la invención resultarán evidentes a partir de la siguiente descripción que ilustra modos de realización preferentes, dados a modo de ejemplos indicativos, no limitantes, con referencia a la figura adjunta, en la que:
- las figuras 1 y 2 ilustran, por medio de respectivos diagramas de bloques simplificados, un sistema para controlar y/o comunicarse con un electrodoméstico por comando de voz, de acuerdo con dos modos de realización respectivos de acuerdo con la invención;
- la figura 3 ilustra un ejemplo de presentación de texto proporcionado en un modo de realización del sistema y el procedimiento de acuerdo con la invención;
- la figura 4 muestra un modo de realización de un electrodoméstico de acuerdo con la invención.
Descripción detallada
Con referencia a la figura 1, se describe un procedimiento para controlar y/o comunicarse con un electrodoméstico 100 por comando de voz y presentación de texto.
Un procedimiento de este tipo comprende las etapas de recibir una señal de voz acústica SV, correspondiente a una frase de consulta y/o petición de voz expresada (es decir, pronunciada) por un usuario y generar una correspondiente primera señal eléctrica SE representativa de la señal de voz acústica SV, por medios de recepción de voz 2 integrados en el electrodoméstico 100.
A continuación, el procedimiento proporciona generar una señal eléctrica de consulta y/o petición SR, en base a la primera señal eléctrica SE recibida anteriormente, representativa de la señal de voz acústica SV, por los primeros medios de procesamiento 3 integrado en el electrodoméstico 100 conectado de forma funcional a los medios de recepción de voz 2 mencionados anteriormente. A continuación, el procedimiento proporciona transmitir dicha señal eléctrica de consulta y/o petición SR a los segundos medios de procesamiento 4.
A continuación, el procedimiento comprende la etapa de procesar la señal eléctrica de consulta y/o petición SR mencionada anteriormente, por los segundos medios de procesamiento 4, para identificar una consulta y/o petición de usuario.
Una consulta y/o petición de usuario de este tipo y, por tanto, la intención del usuario, también se pueden definir en el campo técnico aquí considerado por el término"expresión".
A continuación, el procedimiento proporciona las siguientes etapas por los segundos medios de procesamiento 4: generar una primera cadena de caracteres de texto C1 correspondiente a la consulta y/o petición de usuario identificada en la etapa de procesamiento; determinar una respuesta que se va a proporcionar al usuario, en base a la consulta y/o petición de usuario identificada; y generar una segunda cadena de caracteres de texto C2 correspondiente a la respuesta determinada por los segundos medios de procesamiento 4.
Finalmente, el procedimiento comprende las etapas de transmitir la primera cadena de caracteres de texto C1 y la segunda cadena de caracteres de texto C2 a los primeros medios de procesamiento 3 del electrodoméstico; y de presentar tanto la primera cadena de caracteres de texto C1 como la segunda cadena de caracteres de texto C2 por medio de una interfaz visual 5 comprendida en el electrodoméstico 100, de modo que el usuario pueda leer tanto la consulta y/o petición de usuario, como se identifica por los segundos medios de procesamiento 4, como la respuesta determinada por los segundos medios de procesamiento 4.
A continuación se muestran de nuevo otros modos de realización del procedimiento con referencia a la figura 2.
De acuerdo con un modo de realización, antes de la etapa de recibir una señal de voz SV, el procedimiento comprende las etapas de recibir una palabra de activación PA expresada por el usuario, generar una respectiva señal eléctrica de palabra de activación SA, por los medios de recepción de voz 2 integrados en el electrodoméstico, y reconocer la palabra de activación por los primeros medios de procesamiento 3.
En el caso de un resultado positivo del reconocimiento de palabra de activación, el procedimiento proporciona ejecutar la etapa mencionada anteriormente de recibir una señal de voz acústica SV correspondiente a una frase de consulta y/o petición de voz y las siguientes etapas descritas anteriormente.
Dicha secuencia de etapas se ilustra esquemáticamente en la figura 2, indicando la etapa de recibir la palabra de activación como etapa "A" y la etapa sucesiva de recibir la señal de voz acústica correspondiente a una consulta y/o frase de petición como etapa "B".
De acuerdo con un modo de realización del procedimiento, la etapa de generar una señal eléctrica SR de consulta y/o petición comprende generar una señal SR de transmisión de audio de consulta y/o petición respectiva, representativa de la señal de voz acústica SV. La forma de transmisión de audio puede ser conveniente para la transmisión y de fácil recepción por los segundos medios de procesamiento 4.
De acuerdo con una opción de implementación del procedimiento, la etapa mencionada anteriormente de generar una primera cadena de caracteres de texto C1 comprende generar una cadena de texto que corresponde exactamente a la frase expresada por el usuario, como se identifica por los segundos medios de procesamiento 4.
De acuerdo con un modo de realización del procedimiento, la etapa mencionada anteriormente de procesar la señal eléctrica de consulta y/o petición SR comprende reconocer si la consulta y/o petición está abierta o cerrada.
Una consulta y/o petición se reconoce como cerrada si corresponde a una determinada consulta y/o petición, de modo que los segundos medios de procesamiento 4 pueden proporcionar una respuesta única predeterminada relacionada con la consulta y/o petición, en base a información y/o estados del electrodoméstico que son accesibles a los segundos medios de procesamiento 4.
Una consulta y/o petición se reconoce como abierta en todos los casos en que dicha consulta y/o petición no esté reconocida como cerrada.
De acuerdo con una opción de implementación del procedimiento, si la consulta y/o petición se reconoce como cerrada, la etapa de identificar la consulta y/o petición de usuario comprende identificar la consulta y/o petición cerrada reconocida como una consulta y/o petición de usuario.
En este caso, la etapa de determinar una respuesta que se va a proporcionar al usuario comprende determinar dicha respuesta única predeterminada en relación con la consulta y/o petición cerrada como una respuesta.
De acuerdo con una opción de implementación del procedimiento, si la consulta y/o petición se reconoce como abierta, la etapa de identificar la consulta y/o petición del usuario comprende interpretar la consulta y/o petición abierta como una consulta y/o petición parcial.
En este caso, el procedimiento comprende las etapas adicionales de determinar y enviar una respuesta provisional que comprende una petición de aclaraciones adicionales al usuario; establecer un modo de espera, diseñado para recibir una frase de voz adicional para completar la petición y/o consulta por el usuario; y generar simultáneamente y a continuación transmitir al usuario una primera cadena de caracteres de texto C1 correspondiente a la consulta y/o petición parcial.
De acuerdo con otras posibles variantes de implementación, si una petición se reconoce como abierta, el procedimiento proporciona identificar una consulta y/o petición estándar, considerada similar a la petición abierta, a partir de una pluralidad de consultas y/o peticiones estándar almacenadas, de acuerdo con criterios de similitud predefinidos, e identificar la consulta y/o petición estándar identificada como la consulta y/o petición de usuario.
De acuerdo con un modo de realización del procedimiento, la etapa de procesar la señal eléctrica de consulta y/o petición de usuario SR, para identificar una consulta y/o petición de usuario comprende interpretar la consulta y/o petición de usuario como un comando y/o acción de control y/o pregunta.
En este caso, el procedimiento comprende además las siguientes etapas.
Si la consulta y/o petición de usuario se interpreta como un comando, el procedimiento proporciona transmitir una señal de comando, correspondiente al comando, a los primeros medios de procesamiento 3 del electrodoméstico, por los segundos medios de procesamiento 4.
Si la consulta y/o petición de usuario se interpreta como una acción de control, el procedimiento proporciona consultar, por los segundos medios de procesamiento 4, medios de almacenamiento 6 en los que se almacena periódicamente el estado del electrodoméstico 100, para definir la acción que se va a implementar y el modo de ejecución.
Si la consulta y/o petición de usuario se interpreta como una pregunta pertinente, de modo que los segundos medios de procesamiento 4 puedan proporcionar una respuesta única, generar dicha respuesta única a la pregunta, por los segundos medios de procesamiento 4.
Si la consulta y/o petición de usuario se interpreta como una pregunta no pertinente, de modo que los segundos medios de procesamiento 4 no pueden proporcionar una respuesta única, el procedimiento proporciona generar una respuesta provisional para una petición de información adicional, por los segundos medios de procesamiento 4.
De acuerdo con un modo de realización del procedimiento, la etapa de reconocer la palabra de activación PA, por los primeros medios de procesamiento 3, y la etapa de procesar la señal eléctrica de consulta y/o petición SR, por los segundos medios de procesamiento 4, comprenden ejecutar al menos un algoritmo y/o procedimiento de reconocimiento de voz.
De acuerdo con diferentes opciones posibles de implementación, el algoritmo y/o procedimiento de reconocimiento de voz se elige de varios tipos posibles de algoritmos y/o procedimiento de reconocimiento de habla que son conocidos en sí mismos.
De acuerdo con una opción de implementación, se usan procedimientos en base a técnicas computacionales de aprendizaje automático.
De acuerdo con un modo de realización del procedimiento, la etapa de generar una primera cadena de caracteres de texto C1 y la etapa de generar una segunda cadena de caracteres de texto C2 comprenden ejecutar al menos un algoritmo y/o procedimiento de transformación de un comando de voz en texto.
De acuerdo con varias posibles opciones de implementación, el algoritmo y/o procedimiento de transformación de un comando de voz en texto se elige de diversos tipos posibles de algoritmos y/o procedimientos de transformación de un comando de voz en texto conocidos en sí mismos.
De acuerdo con una opción de implementación, se usan procedimientos en base a técnicas computacionales de aprendizaje automático para transformar un texto en un comando de voz.
De acuerdo con un modo de realización del procedimiento (mostrado, por ejemplo, en la figura 3), la etapa de presentar la primera cadena de caracteres de caracteres de texto y la segunda cadena de caracteres de texto comprende presentar la primera cadena de caracteres de caracteres de texto C1 y la segunda cadena de caracteres de texto C2 como ventana emergente, en una pantalla 5 comprendida en el electrodoméstico.
De acuerdo con un modo de realización, el procedimiento comprende, después de la etapa de determinar una respuesta al comando y/o acción de control, las etapas adicionales de generar una señal de respuesta de audio SAR, correspondiente a la respuesta determinada por los segundos medios de procesamiento 4; a continuación, transmitir la señal de respuesta de audio SAR mencionada anteriormente a los primeros medios de procesamiento 3 del electrodoméstico; finalmente, reproducir la señal de respuesta de audio SAR para generar una salida de respuesta de voz por los medios de generación de salida de voz 7 comprendidos en el electrodoméstico.
Con referencia a la figura 1, se describe un sistema 1 para controlar y/o interactuar con un electrodoméstico 100 por comando de voz y proporcionar presentación de texto.
Dicho sistema 1 comprende medios de recepción de voz 2 integrados en el electrodoméstico 100, primeros medios de procesamiento 3 integrados en el electrodoméstico 100, una interfaz visual 5 comprendida en el electrodoméstico 100 y, además, segundos medios de procesamiento 4.
Los medios de recepción de voz 2 integrados en el electrodoméstico 100 están configurados para recibir una señal de voz acústica SV, correspondiente a una frase de consulta y/o petición de voz expresada por el usuario, y transformarla en una correspondiente primera señal eléctrica SE representativa de la señal de voz acústica SV.
Los primeros medios de procesamiento integrados 3 del electrodoméstico 100 están conectados de forma funcional a los medios de recepción de voz 2 mencionados anteriormente para recibir la primera señal eléctrica SE mencionada anteriormente.
Los primeros medios de procesamiento 3 están configurados para generar una señal eléctrica de consulta y/o petición SR en base a la primera señal eléctrica SE mencionada anteriormente, representativa de la señal de voz acústica SV.
Los segundos medios de procesamiento 4 están conectados de forma funcional a los primeros medios de procesamiento 3.
Los segundos medios de procesamiento 4 están configurados para recibir la señal eléctrica de consulta y/o petición SR desde los primeros medios de procesamiento 3, y procesar dicha señal eléctrica de consulta y/o petición SR, para identificar una consulta y/o petición de usuario; los segundos medios de procesamiento 4 están configurados además para generar una primera cadena de caracteres de texto C1 correspondiente a la consulta y/o petición de usuario identificada en la etapa de procesamiento, determinar una respuesta que se va a proporcionar al usuario, en base a la consulta y/o petición de usuario identificada y generar una segunda cadena de caracteres de texto C2 correspondiente a la respuesta determinada; y transmitir la primera cadena de caracteres de texto C1 y la segunda cadena de caracteres de texto C2 mencionadas anteriormente a los primeros medios de procesamiento 2 del electrodoméstico.
La interfaz visual 5 comprendida en el electrodoméstico 100 está conectada de forma funcional a los primeros medios de procesamiento 3 mencionados anteriormente.
La interfaz visual 5 está configurada para presentar la primera cadena de caracteres de texto C1 mencionada anteriormente y la segunda cadena de caracteres de texto C2 de modo que el usuario pueda leer tanto la consulta y/o petición de usuario, como se identifica por los segundos medios de procesamiento 4, como la respuesta determinada por los segundos medios de procesamiento 4.
Las figuras 1 y 2 describen otros modos de realización del sistema 1.
De acuerdo con un modo de realización del sistema, los medios de recepción de voz 2 están configurados además para recibir una palabra de activación PA expresada por un usuario y generar una respectiva señal eléctrica de palabra de activación SA.
Los primeros medios de procesamiento 3 están configurados además para reconocer la palabra de activación, y en caso de un resultado positivo del reconocimiento de palabra de activación, proceder a ejecutar la etapa mencionada anteriormente de generar una señal eléctrica de consulta y/o petición SR.
De acuerdo con un modo de realización del sistema, los primeros medios de procesamiento 3 están configurados además para generar una señal de transmisión de audio de consulta y/o petición SR, representativa de la señal de voz acústica SV, como la señal eléctrica de consulta y/o petición SR.
De acuerdo con diferentes modos de realización posibles del sistema, los primeros medios de procesamiento 3 y los segundos medios de procesamiento 4 están configurados además para ejecutar un procedimiento de acuerdo con cualquiera de los modos de realización ilustrados anteriormente.
De acuerdo con un modo de realización del sistema, la interfaz visual 5 comprende una pantalla 5 integrada en el electrodoméstico, y configurada para presentar la primera cadena de caracteres de texto C1 y la segunda cadena de caracteres de texto C2 en forma de ventanas emergentes (por ejemplo, como se muestra en la figura 3).
De acuerdo con un ejemplo de implementación, la pantalla 5 mencionada anteriormente comprende una pantalla de cristal líquido u otro tipo de pantalla conocida en sí misma, ya proporcionada en el aparato o bien añadida a él para proporcionar la función de interfaz visual.
De acuerdo con una opción de implementación, la interfaz visual 5 está configurada para presentar un símbolo que indica la etapa de escuchar o esperar para escuchar la entrada de voz por el usuario (como se muestra en la parte superior de la figura 3) o para presentar las ventanas emergentes que contienen la pregunta y la respuesta (como se muestra en la parte inferior de la figura 3).
De acuerdo con un modo de realización del sistema, los segundos medios de procesamiento 4 están configurados además para generar una señal de respuesta de transmisión de audio sA r , correspondiente a la respuesta determinada, y para transmitir dicha señal de respuesta de transmisión de audio SAR a los primeros medios de procesamiento 2.
En este caso, el sistema 1 comprende además medios de generación de salida de voz 7, integrados en el electrodoméstico 100 y configurados para reproducir la señal de respuesta de transmisión de audio SAR para generar una salida de respuesta de voz.
De acuerdo con una opción de implementación, los medios de recepción de voz 2 comprenden uno o más micrófonos.
De acuerdo con una opción de implementación, los medios de generación de salida de voz 7 comprenden un altavoz u otros medios de reproducción de sonido 7 para proporcionar la respuesta de audio.
De acuerdo con una opción de implementación, los primeros medios de procesamiento 3 comprenden uno o más circuitos de procesamiento electrónico y/o uno o más procesadores electrónicos.
De acuerdo con una opción de implementación, el sistema 1 comprende además medios de recepción/transmisión 8 configurados para transmitir dicha señal eléctrica de consulta o petición SR.
De acuerdo con una opción de implementación, los medios de transmisión (es decir, el transceptor) 8 también están configurados para recibir la primera cadena de caracteres de texto C1 y la segunda cadena de caracteres de texto C2 y/o para recibir la señal de respuesta de audio SAR mencionada anteriormente.
De acuerdo con un modo de realización del sistema 1, los medios de recepción de voz 2, los primeros medios de procesamiento 3 y los medios de transmisión 8 mencionados anteriormente están integrados en un módulo de reconocimiento de voz 30 incorporado en el electrodoméstico 100.
De acuerdo con un modo de realización del sistema 1, los segundos medios de procesamiento 4 comprenden uno o más circuitos de procesamiento electrónico y/o uno o más procesadores electrónicos, dispuestos de forma remota con respecto al electrodoméstico 100.
En dicho caso, el sistema 1 comprende además medios de telecomunicación 9 configurados para conectar los medios de transmisión 8 del electrodoméstico a los segundos medios de procesamiento 4.
De acuerdo con una opción de implementación, los segundos medios de procesamiento 4 están implementados en una infraestructura de nube 20.
De acuerdo con una opción de implementación, los medios de telecomunicación 9 comprenden medios de comunicación inalámbrica, un enrutador y una infraestructura de telecomunicaciones para la infraestructura de nube 20.
Con referencia a las figuras 1,2 y 4, se describe ahora un electrodoméstico 100 de acuerdo con la invención. El electrodoméstico 100 comprende una primera parte 10 de un sistema 1 que comprende al menos los medios de recepción de voz 2 mencionados anteriormente, los primeros medios de procesamiento 3 y la interfaz visual 5 (de acuerdo con una cualquiera de las opciones de implementación descritas anteriormente).
El electrodoméstico 100 está conectado de forma funcional a una segunda parte 20 de un sistema 1 que comprende al menos los segundos medios de procesamiento 4 mencionados anteriormente (de acuerdo con cualquiera de las opciones de implementación descritas anteriormente).
En el ejemplo mostrado en la figura 4, el electrodoméstico es una lavadora. La figura 4 muestra la interfaz visual, es decir, la pantalla 5, el módulo de reconocimiento de voz 30 y los medios de reproducción de sonido 7.
Vale la pena señalar que el objetivo de la presente invención se logra totalmente por el procedimiento y sistema ilustrados anteriormente en virtud de los rasgos característicos funcionales y estructurales de la misma. En efecto, el procedimiento y sistema para controlar y/o comunicarse con un electrodoméstico, descritos anteriormente, pueden proporcionar al usuario una presentación textual, en forma de un texto emergente, tanto de la consulta y/o petición de usuario como de la respuesta procesada por el sistema de control.
Por lo tanto, dicho rasgo característico proporciona al usuario retroalimentación precisa sobre cómo el sistema de control controlado por voz interpretó la petición y/o consulta, es decir, la expresión del usuario, permitiéndole al usuario controlar totalmente la situación.
Dichas propiedades y capacidades del procedimiento y sistema de acuerdo con la invención son en particular útiles en presencia de entradas de voz articuladas, y no se limitan a palabras de comando predefinidas. Un experto en la técnica puede realizar cambios y adaptaciones al procedimiento y sistema descritos anteriormente o puede reemplazar elementos por otros que sean funcionalmente equivalentes para satisfacer necesidades contingentes sin apartarse del alcance de protección de las reivindicaciones adjuntas. Todos los rasgos característicos descritos anteriormente como pertenecientes a un posible modo de realización se pueden implementar independientemente de los otros modos de realización descritos.

Claims (1)

  1. REIVINDICACIONES
    Un procedimiento para controlar y/o comunicarse con un electrodoméstico (100) por medio de un comando de voz y proporcionar presentación de texto, que comprende las etapas de:
    - recibir una señal de voz acústica (SV), correspondiente a una frase de consulta y/o petición de voz pronunciada por un usuario, y generar una primera señal eléctrica (SE) correspondiente representativa de la señal de voz acústica (SV), por medios de recepción de voz (2) integrados en el electrodoméstico (100);
    - generar una señal eléctrica de consulta y/o petición (SR), en base a dicha primera señal eléctrica (SE) recibida, representativa de la señal de voz acústica (SV), por primeros medios de procesamiento (3) integrados en el electrodoméstico (10) y conectarse de forma funcional a dichos medios de recepción de voz (2);
    - transmitir dicha señal eléctrica de consulta y/o petición (SR) a segundos medios de procesamiento (4);
    - procesar dicha señal eléctrica de consulta y/o petición (SR), por los segundos medios de procesamiento (4), para identificar una consulta y/o petición de usuario;
    - generar una primera cadena de caracteres de texto (C1) correspondiente a la consulta y/o petición de usuario identificada en la etapa de procesamiento, por los segundos medios de procesamiento;
    - determinar una respuesta que se va a proporcionar al usuario, en base a la consulta y/o petición de usuario identificada por los segundos medios de procesamiento (4);
    - generar una segunda cadena de caracteres de texto (C2) correspondiente a la respuesta determinada por los segundos medios de procesamiento (4);
    - transmitir dicha primera cadena de caracteres de texto (C1) y dicha segunda cadena de caracteres de texto (C2) a los primeros medios de procesamiento (3) del electrodoméstico;
    - presentar tanto la primera cadena de caracteres de texto (C1) como la segunda cadena de caracteres de texto (C2) por medio de una interfaz visual (5) incluida en el electrodoméstico (100), de modo que el usuario pueda leer tanto la consulta y/o petición de usuario, como se identifica por los segundos medios de procesamiento (4), como la respuesta determinada por los segundos medios de procesamiento (4);
    en el que dicha etapa de procesar la señal eléctrica de consulta y/o petición (SR) comprende reconocer si la consulta y/o petición está abierta o cerrada,
    en el que una consulta y/o petición se reconoce como cerrada si corresponde a una consulta y/o petición determinada, de modo que los segundos medios de procesamiento (4) pueden proporcionar una respuesta única predeterminada en relación con la consulta y/o petición en base a información y/o estados del electrodoméstico que son accesibles a los segundos medios de procesamiento (4),
    y en el que una consulta y/o petición se reconoce como abierta en todos los casos en los que dicha consulta y/o petición no esté reconocida como cerrada.
    Un procedimiento de acuerdo con la reivindicación 1, que comprende, antes de dicha etapa de recibir una señal de voz acústica (SV), las etapas de:
    - recibir una palabra de activación (PA) pronunciada por el usuario, y generar una respectiva señal eléctrica de palabra de activación (SA), por dichos medios de recepción de voz (2) integrados en el electrodoméstico;
    - llevar a cabo un reconocimiento de la palabra de activación (PA) por dichos primeros medios de procesamiento (3);
    - en el caso de un resultado positivo del reconocimiento de palabra de activación, llevar a cabo dicha etapa de recibir una señal de voz acústica (SV) correspondiente a una frase de consulta y/o petición de voz y las siguientes etapas como se define en la reivindicación 1.
    Un procedimiento de acuerdo con la reivindicación 1 o la reivindicación 2, en el que la etapa de generar una señal eléctrica de consulta y/o petición (SR) comprende:
    - generar una respectiva señal de transmisión de audio de consulta y/o petición (SR), representativa de la señal de voz acústica (SV).
    Un procedimiento de acuerdo con una cualquiera de las reivindicaciones precedentes, en el que dicha etapa de generar una primera cadena de caracteres de texto (C1) comprende generar una cadena de texto que corresponde exactamente a la frase pronunciada por el usuario, como se identifica por los segundos medios de procesamiento (4).
    Un procedimiento de acuerdo con la reivindicación 1, en el que:
    si la consulta y/o petición está cerrada:
    - la etapa de identificar la consulta y/o petición de usuario comprende identificar, como consulta y/o petición de usuario, la consulta y/o petición cerrada reconocida;
    - la etapa de determinar una respuesta que se va a proporcionar al usuario comprende determinar, como respuesta, dicha respuesta única predeterminada en relación con la consulta y/o petición cerrada;
    si la consulta y/o petición está abierta:
    - la etapa de identificar la consulta y/o petición de usuario comprende interpretar la consulta y/o petición abierta como una consulta y/o petición parcial,
    y el procedimiento comprende las etapas adicionales de:
    - determinar y enviar una respuesta provisional al usuario, que comprende una petición de aclaraciones adicionales;
    - establecer un modo de espera, diseñado para recibir una frase de voz adicional para completar la petición y/o consulta por el usuario;
    - generar simultáneamente y a continuación transmitir al usuario una primera cadena de caracteres de texto (C1) correspondiente a la consulta y/o petición parcial.
    Un procedimiento de acuerdo con una cualquiera de las reivindicaciones precedentes, en el que la etapa de procesar la señal eléctrica de consulta y/o petición (SR), para identificar una consulta y/o petición de usuario comprende:
    - interpretar la consulta y/o petición de usuario como un comando y/o una acción de control y/o una pregunta;
    y en el que el procedimiento comprende además las etapas de:
    si la consulta y/o petición de usuario se interpreta como un comando, transmitir una señal de comando correspondiente al comando a los primeros medios de procesamiento (3) del electrodoméstico por los segundos medios de procesamiento (4);
    si la consulta y/o petición de usuario se interpreta como una acción (4), medios de almacenamiento (6) en los que se almacena periódicamente el estado del electrodoméstico (100), para definir la acción que se va a implementar y el modo de ejecución;
    si la consulta y/o petición de usuario se interpreta como una pregunta pertinente, de modo que los segundos medios de procesamiento (4) puedan proporcionar una respuesta única, generar dicha respuesta única a la pregunta, por los segundos medios de procesamiento (4);
    si la consulta y/o petición de usuario se interpreta como una pregunta no pertinente, de modo que los segundos medios de procesamiento (4) no pueden proporcionar una respuesta única, generar una respuesta provisional para una petición de información adicional, por los segundos medios de procesamiento (4).
    Un procedimiento de acuerdo con la reivindicación 2, en el que la etapa de llevar a cabo un reconocimiento de la palabra de activación, por los primeros medios de procesamiento (3), y la etapa de procesar la señal eléctrica de consulta y/o petición (SR), por los segundos medios de procesamiento (4), comprenden realizar al menos un algoritmo y/o procedimiento de reconocimiento de voz, y/o en el que:
    la etapa de generar una primera cadena de caracteres de texto (C1) y la etapa de generar una segunda cadena de caracteres de texto (C2) comprenden realizar al menos un algoritmo y/o procedimiento para transformar un comando de voz en texto.
    8. Un procedimiento de acuerdo con una cualquiera de las reivindicaciones precedentes, en el que la etapa de presentar la primera cadena de caracteres de texto y la segunda cadena de caracteres de texto comprende:
    presentar la primera cadena de caracteres de texto (C1) y la segunda cadena de caracteres de texto (C2) como ventanas emergentes, en una pantalla (5) incluida en el electrodoméstico.
    9. Un procedimiento de acuerdo con una cualquiera de las reivindicaciones precedentes, que comprende, después de la etapa de determinar una respuesta al comando y/o acción de control, las etapas adicionales de:
    - generar una señal de respuesta de audio (SAR), correspondiente a la respuesta determinada por los segundos medios de procesamiento (4);
    - transmitir dicha señal de respuesta de audio (SAR) a los primeros medios de procesamiento (3) del electrodoméstico;
    - reproducir la señal de respuesta de audio (SAR) para generar una salida de respuesta de voz por medios de generación de salida de voz (7) incluidos en el electrodoméstico.
    10. Un sistema (1) para controlar y/o interactuar con un electrodoméstico (100) por medio de control por voz y proporcionar presentación de texto, que comprende:
    - medios de recepción de voz (2) integrados en el electrodoméstico (100), configurados para recibir una señal de voz acústica (SV), correspondiente a una frase de consulta y/o petición de voz pronunciada por el usuario, y transformarla en una correspondiente primera señal eléctrica (SE) representativa de la señal de voz acústica (SV);
    - primeros medios de procesamiento (3) integrados en el electrodoméstico (100) y conectados de forma funcional a dichos medios de recepción de voz (2) para recibir dicha primera señal eléctrica (SE), estando configurados dichos primeros medios de procesamiento (3) para:
    generar una señal eléctrica de consulta y/o petición (SR) en base a dicha primera señal eléctrica (SE), representativa de la señal de voz acústica (SV);
    - segundos medios de procesamiento (4), conectados de forma operativa a dichos primeros medios de procesamiento (3), estando configurados dichos segundos medios de procesamiento (4) para: recibir, desde los primeros medios de procesamiento (3), dicha señal eléctrica de consulta y/o petición (SR);
    procesar dicha señal eléctrica de consulta y/o petición (SR), para identificar una consulta y/o petición de usuario, en el que dicha etapa de procesar la señal eléctrica de consulta y/o petición (SR) comprende reconocer si la consulta y/o petición está abierta o cerrada, en el que una consulta y/o petición se reconoce como cerrada si corresponde a una consulta y/o petición determinada, de modo que los segundos medios de procesamiento (4) pueden proporcionar una respuesta única predeterminada en relación con la consulta y/o petición, en base a información y/o estados del electrodoméstico que son accesibles a los segundos medios de procesamiento (4), y en el que una consulta y/o petición se reconoce como abierta en todos los casos en los que dicha consulta y/o petición no esté reconocida como cerrada;
    generar una primera cadena de caracteres de texto (C1) correspondiente a la consulta y/o petición de usuario identificada en la etapa de procesamiento;
    determinar una respuesta que se va a proporcionar al usuario, en base a la consulta y/o petición de usuario identificada, y generar una segunda cadena de caracteres de texto (C2) correspondiente a la respuesta determinada;
    - transmitir dicha primera cadena de caracteres de texto (C1) y dicha segunda cadena de caracteres de texto (C2) a los primeros medios de procesamiento (2) del electrodoméstico;
    - una interfaz visual (5) incluida en el electrodoméstico (100), conectada de forma funcional a dichos primeros medios de procesamiento (3), estando configurada dicha interfaz visual (5) para presentar dicha primera cadena de caracteres de texto (C1) y segunda cadena de caracteres de texto (C2), de modo que el usuario pueda leer tanto la consulta y/o petición de usuario, como se identifica por los segundos medios de procesamiento (4), como la respuesta determinada por los segundos medios de procesamiento (4).
    11. Un sistema (1) de acuerdo con la reivindicación 10, en el que los primeros medios de procesamiento (3) y los segundos medios de procesamiento (4) están configurados además para llevar a cabo un procedimiento de acuerdo con cualquiera de las reivindicaciones 2-9.
    12. Un sistema (1) de acuerdo con una cualquiera de las reivindicaciones 10-11, en el que la interfaz visual (5) comprende una pantalla (5) integrada en el electrodoméstico configurada para presentar la primera cadena de caracteres de texto (C1) y la segunda cadena de caracteres de texto (C2) en forma de ventanas emergentes, y en el que los segundos medios de procesamiento (4) están configurados además para generar una señal de respuesta de transmisión de audio (SAR), correspondiente a la respuesta determinada, y transmitir dicha señal de respuesta de transmisión de audio (SAR) a los primeros medios de procesamiento (2); en el que el sistema (1) comprende además medios de generación de salida de voz (7), integrados en el electrodoméstico (100) y configurados para reproducir la señal de respuesta de transmisión de audio (SAR) para generar una salida de respuesta de voz.
    13. Un sistema de acuerdo con una cualquiera de las reivindicaciones 10-12, en el que:
    - los medios de recepción de voz (2) comprenden uno o más micrófonos;
    - los primeros medios de procesamiento (3) comprenden uno o más circuitos de procesamiento electrónicos, y/o uno o más procesadores electrónicos;
    y en el que el sistema (1) comprende además medios transceptores (8) configurados para transmitir dicha señal eléctrica de consulta o petición (SR), en el que dichos medios de recepción de voz (2), dichos primeros medios de procesamiento (3) y dichos medios de transmisión (8) están integrados en un módulo de reconocimiento de voz (30) incorporado en el electrodoméstico (100).
    14. Un sistema (1) de acuerdo con una cualquiera de las reivindicaciones 10-13, en el que los segundos medios de procesamiento (4) comprenden uno o más circuitos de procesamiento electrónicos, y/o uno o más procesadores electrónicos, dispuestos de forma remota con respecto al electrodoméstico (100),
    y en el que el sistema (1) comprende además medios de telecomunicación (9) configurados para conectar los medios de transmisión (8) del electrodoméstico a los segundos medios de procesamiento (4), en el que los segundos medios de procesamiento (4) se proporcionan en una infraestructura de nube (20), y en el que los medios de telecomunicación (9) comprenden medios de comunicación inalámbrica, un enrutador y una infraestructura de telecomunicaciones hacia la infraestructura de nube (20).
    15. Un electrodoméstico (100) que comprende una primera parte (10) de un sistema (1) de acuerdo con una cualquiera de las reivindicaciones 10-14, que comprende al menos dichos medios de recepción de voz (2), primeros medios de procesamiento (3) y una interfaz visual (5),
    estando dicho electrodoméstico (100) conectado de forma funcional a una segunda parte (20) de un sistema (1) de acuerdo con una cualquiera de las reivindicaciones 10-14, que comprende al menos dichos segundos medios de procesamiento (4).
ES20197172T 2019-09-23 2020-09-21 Procedimiento y sistema para controlar y/o comunicarse con un electrodoméstico por medio de comandos de voz y presentaciones de texto Active ES2960291T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT102019000017000A IT201900017000A1 (it) 2019-09-23 2019-09-23 Metodo e sistema per controllare e/o comunicare con un elettrodomestico mediante comandi vocali e visualizzazioni testuali

Publications (1)

Publication Number Publication Date
ES2960291T3 true ES2960291T3 (es) 2024-03-04

Family

ID=69469016

Family Applications (1)

Application Number Title Priority Date Filing Date
ES20197172T Active ES2960291T3 (es) 2019-09-23 2020-09-21 Procedimiento y sistema para controlar y/o comunicarse con un electrodoméstico por medio de comandos de voz y presentaciones de texto

Country Status (3)

Country Link
EP (1) EP3796310B1 (es)
ES (1) ES2960291T3 (es)
IT (1) IT201900017000A1 (es)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102188090B1 (ko) * 2013-12-11 2020-12-04 엘지전자 주식회사 스마트 가전제품, 그 작동방법 및 스마트 가전제품을 이용한 음성인식 시스템
KR102112565B1 (ko) * 2017-05-19 2020-05-19 엘지전자 주식회사 홈 어플라이언스 및 음성 인식 서버 시스템의 동작 방법

Also Published As

Publication number Publication date
IT201900017000A1 (it) 2021-03-23
EP3796310B1 (en) 2023-08-16
EP3796310A1 (en) 2021-03-24

Similar Documents

Publication Publication Date Title
US10803869B2 (en) Voice enablement and disablement of speech processing functionality
CN108829235B (zh) 语音数据处理方法和支持该方法的电子设备
US6584439B1 (en) Method and apparatus for controlling voice controlled devices
KR102205371B1 (ko) 개별화된 핫워드 검출 모델들
WO2020065840A1 (ja) コンピュータシステム、音声認識方法及びプログラム
JP6570651B2 (ja) 音声対話装置および音声対話方法
US20210065711A1 (en) Temporary account association with voice-enabled devices
US12021684B1 (en) Device configuration by natural language processing system
US20030093281A1 (en) Method and apparatus for machine to machine communication using speech
US9368107B2 (en) Permitting automated speech command discovery via manual event to command mapping
US20020193989A1 (en) Method and apparatus for identifying voice controlled devices
US20190378500A1 (en) Temporary account association with voice-enabled devices
US20150006147A1 (en) Speech Recognition Systems Having Diverse Language Support
US11687526B1 (en) Identifying user content
KR20120093597A (ko) 음성 인식으로 애플리케이션의 실행 가능한 이동통신 단말 장치 및 방법
CN109754795B (zh) 接近感知语音代理
WO2016157782A1 (ja) 音声認識システム、音声認識装置、音声認識方法、および制御プログラム
US20160027435A1 (en) Method for training an automatic speech recognition system
JP2011253543A (ja) 通訳端末及び通訳端末間の相互通信を用いた通訳方法
ES2960291T3 (es) Procedimiento y sistema para controlar y/o comunicarse con un electrodoméstico por medio de comandos de voz y presentaciones de texto
US20180350360A1 (en) Provide non-obtrusive output
CN107545895B (zh) 信息处理方法和电子设备
Lopez et al. An aging-focused heuristic evaluation of home automation controls
WO2021091063A1 (ko) 전자장치 및 그 제어방법
EP3776300A1 (en) Temporary account association with voice-enabled devices