ES2965720T3

ES2965720T3 - Sugerencias de frases clave basadas en el historial para el control por voz de un sistema domótico

Info

Publication number: ES2965720T3
Application number: ES16782362T
Authority: ES
Inventors: Nicholas J Cipollo; Ryan E Kitson; George T Katsiris
Original assignee: Savant Systems Inc
Current assignee: Savant Systems Inc
Priority date: 2015-10-05
Filing date: 2016-10-04
Publication date: 2024-04-16
Anticipated expiration: 2036-10-04
Also published as: CN107615377B; JP6808643B2; IL255244B2; JP2018531404A; AU2016335982B2; WO2017062340A1; CA2983051A1; AU2016335982A1; US20170097618A1; EP3360130B1; KR102691850B1; IL255244B1; US10018977B2; IL255244A0; KR20180064328A; CN107615377A; EP3360130A1

Abstract

En una realización, se proporcionan sugerencias de frases clave basadas en historial para el control por voz de un sistema de automatización del hogar. Un controlador de host construye una base de datos histórica que mantiene un historial de eventos, indicando cada evento uno o más servicios activados, una o más escenas activadas o uno o más tipos de contenido multimedia presentado por el sistema de automatización del hogar. Un proceso de predicciones en el controlador principal selecciona un subconjunto de los eventos de la base de datos histórica en función de una condición actual del sistema de automatización del hogar para producir un conjunto de datos de predicción. Un proceso gramatical en un control remoto o dispositivo móvil selecciona una o más intenciones de una lista utilizada por un motor de reconocimiento de voz, según el conjunto de datos de predicción. Cada intención incluye una frase clave combinada con una acción. Un proceso de interfaz de usuario (UI) de voz sugiere frases clave de una o más intenciones seleccionadas en una UI de control de voz en el control remoto o dispositivo móvil. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Sugerencias de frases clave basadas en el historial para el control por voz de un sistema domótico

ANTECEDENTES

Campo técnico

La presente divulgación se refiere en general a sistemas de automatización del hogar y más específicamente al control por voz de sistemas de automatización del hogar.

Información de contexto

Los sistemas de domótica son cada vez más populares tanto en edificios residenciales como comerciales. Dichos sistemas pueden ser capaces de controlar, intercambiar datos e interactuar de otro modo con una amplia variedad de dispositivos, incluidos dispositivos de iluminación, dispositivos de seguridad, dispositivos de audio/vídeo (A/V), dispositivos de calefacción, ventilación y refrigeración (HVAC) y/o u otro tipo de dispositivos. Tradicionalmente, los sistemas de automatización del hogar han proporcionado varios tipos de control centrado en botones o basado en pantalla táctil. Más recientemente, ha habido intentos de proporcionar control por voz. Sin embargo, varias limitaciones del control por voz han obstaculizado su adopción generalizada en los sistemas de automatización del hogar, convirtiéndolo más en una curiosidad que en un reemplazo directo del control centrado en botones o basado en pantalla táctil.

Un problema con el control por voz es que los usuarios a menudo no están seguros de qué decirle al sistema de automatización del hogar para producir el resultado deseado. Muchos sistemas de reconocimiento de voz están configurados para comprender solo un número limitado de frases clave (un léxico de frases clave), cada una de las cuales está asignada para controlar acciones. Para desencadenar una acción, el usuario debe decir una de las fases clave del léxico. A los usuarios se les pueden enseñar inicialmente frases clave a través de un manual de usuario, un tutorial u otro tipo de materiales de capacitación. Sin embargo, con el tiempo pueden olvidar las frases clave de determinadas acciones deseadas y frustrarse cuando no pueden hacer que el sistema domótico responda de la manera deseada. En un intento por solucionar este problema, algunos sistemas de automatización del hogar están configurados para proporcionar una lista bajo demanda de todas las frases clave. Sin embargo, la visualización de todo el léxico a menudo abruma al usuario, enterrando información relevante para sus deseos actuales entre una lista de otras frases clave que son en gran medida irrelevantes para lo que están intentando hacer actualmente.

La publicación:

RASHIDI, P. ET. AL: "Keeping the Resident in the Loop: Adapting the Smart Home to the User", IEEE TRANSACTIONS ON SYSTEMS; MAN AND CYBERNETICS. PART A: SYSTEM AND HUMANS, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 39, n.° 5, 1. Septiembre de 2009 (01-09-2009), páginas 949, 959, XP011344768, ISSN: 1083-4427, DOI:10.1 109/TSMCA.2009.2025137 describe un sistema de hogar inteligente adaptativo que utiliza técnicas de aprendizaje automático para descubrir patrones en las actividades diarias de los residentes y generar políticas de automatización que imiten estos patrones. El sistema puede adaptar sus patrones en función de la retroalimentación implícita o explícita residente y puede actualizar automáticamente su modelo para reflejar los cambios.

El documento US 2015/0254057 A1 divulga un sistema para sugerir comandos de voz para controlar la interacción del usuario con el sistema informático. Se selecciona una sugerencia de comando de voz correspondiente a un comando de voz seleccionado y se presenta a través de una pantalla para usuarios individuales.

En consecuencia, existe la necesidad de técnicas mejoradas para implementar el control por voz en un sistema de automatización del hogar.

SUMARIO

El problema se resuelve mediante el objeto de las reivindicaciones independientes.

Se proporcionan técnicas de ejemplo para mejorar el control por voz en un sistema de automatización del hogar proporcionando sugerencias de frases clave basadas en historial en una interfaz de usuario (UI) de control por voz. Dichas sugerencias de frases clave pueden indicar al usuario información sobre la entrada de voz que puede ser apropiada dado el patrón de uso histórico del usuario. Las sugerencias de frases clave pueden ser de número limitado, para no abrumar al usuario con grandes cantidades de información.

En una realización de ejemplo, el software de registro de actividad del anfitrión en un controlador de anfitrión crea una base de datos histórica que mantiene eventos que han ocurrido en el sistema de automatización del hogar. Cada evento indica la hora y uno o más servicios activados, una o más escenas activadas, o uno o más tipos de contenido multimedia presentado y opcionalmente otra información histórica. Un proceso de predicciones en un controlador principal del sistema de automatización del hogar selecciona un subconjunto de los eventos de la base de datos del historial basándose en una comparación del tiempo asociado de cada evento con ventanas de tiempo que abarcan un tiempo presente, seleccionando para producir un conjunto de datos de predicción puntuada. La puntuación de los eventos en el conjunto de datos de predicción puntuada se determina, al menos en parte, en función de la duración de las ventanas de tiempo, donde una ventana de tiempo más corta provoca una puntuación más alta que una ventana de tiempo más larga. El proceso de predicciones selecciona eventos en la base de datos histórica que ocurrieron en una ventana de tiempo que abarca la hora actual del día en un mismo día de la semana como el día actual de la semana. El software de sugerencia de voz en un control remoto o dispositivo móvil selecciona una o más intenciones de una lista de intenciones basándose en el conjunto de datos de predicción, en donde cada intención es una estructura de datos que incluye una frase clave reconocida por un motor de reconocimiento de voz emparejado con una acción realizada en el sistema domótico en respuesta a la frase clave. El software de sugerencias de voz muestra una interfaz de usuario de control de voz en una pantalla del control remoto o dispositivo móvil que presenta una o más frases clave de una o más intenciones seleccionadas como una o más sugerencias de frases clave. En respuesta a dicho mensaje, el usuario puede pronunciar una frase clave. Dada esta entrada de voz del usuario, un motor de reconocimiento de voz en el control remoto o dispositivo móvil puede comparar la entrada de voz con frases clave de la lista de intenciones para encontrar una intención coincidente y desencadenar la acción asociada con la intención coincidente.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

La descripción siguiente se refiere a los dibujos adjuntos, de los cuales:

La figura 1 es un diagrama de bloques de un ejemplo de arquitectura de un sistema de automatización del hogar operable para controlar dispositivos alrededor de una estructura;

La figura 2 es un diagrama de bloques que muestra un software de anfitrión de ejemplo, incluido un software de registro de actividad del anfitrión, que puede mantener un registro de la actividad histórica en un sistema de automatización del hogar como eventos en una base de datos histórica;

La figura 3 es un diagrama de bloques que muestra una aplicación de ejemplo, que incluye un motor de reconocimiento de voz, que puede ejecutarse en un control remoto o dispositivo móvil;

La figura 4 es un listado de ejemplo de frases clave de una lista de ejemplo de intenciones que pueden construirse dinámicamente;

La figura 5 es un diagrama de bloques de un software de sugerencia de voz de ejemplo de una aplicación y un proceso de predicciones del software anfitrión;

La figura 6 es una captura de pantalla de un ejemplo de interfaz de usuario de control por voz que puede visualizarse en un control remoto o dispositivo móvil; y

La figura 7 es un diagrama de flujo de una secuencia de etapas que pueden implementarse para proporcionar sugerencias de frases clave basadas en el historial.

DESCRIPCIÓN DETALLADA

Definiciones

Tal como se utiliza en el presente documento, el término "sistema de automatización del hogar" debe interpretarse de manera amplia para abarcar varios tipos de control del hogar, "hogar inteligente" y/o sistemas de control de dispositivos que pueden controlar dispositivos (por ejemplo, dispositivos de iluminación, dispositivos de seguridad, dispositivos A/V, dispositivos HVAC, cerraduras electrónicas y/u otros tipos de dispositivos) dentro de una estructura, como una vivienda residencial o un edificio comercial. Un sistema de automatización del hogar puede controlar una variedad de diferentes tipos de dispositivos, o dispositivos de solo un tipo particular (por ejemplo, solo dispositivos de iluminación, solo dispositivos A/V, etc.).

Tal como se utiliza en el presente documento, el término "dispositivo móvil" se refiere a un dispositivo electrónico que ejecuta un sistema operativo de propósito general y está adaptado para ser transportado por una persona. Dispositivos como teléfonos inteligentes y tabletas deben considerarse dispositivos móviles. Los ordenadores de escritorio, servidores u otros dispositivos informáticos principalmente estacionarios generalmente no deben considerarse dispositivos móviles.

Como se usa en el presente documento, el término "servicio" se refiere a una actividad ofrecida por un sistema de automatización del hogar que implica interacciones entre uno o más dispositivos del sistema de automatización del hogar. Un servicio puede, aunque no es necesario, definir una lista de comandos y comentarios de estado aplicables a la actividad.

Tal como se utiliza en el presente documento, el término "escena" se refiere a un conjunto de instrucciones que, cuando se activan, controlan uno o más dispositivos de un sistema domótico de una manera predefinida. Se puede definir una escena, aunque no es necesario, durante la configuración inicial del sistema de automatización del hogar.

Tal como se utiliza en el presente documento, el término "contenido multimedia" se refiere a audio y/o vídeo grabado, difundido y/o en reproducción contínua. El contenido multimedia puede incluir una estación de televisión por cable o satélite, una estación de transmisión o transmisión de radio, películas o programas de televisión almacenados, música almacenada y similares.

Tal como se utiliza en el presente documento, el término "intención" se refiere a una estructura de datos que es capaz de almacenar una relación entre una frase clave reconocida por un motor de reconocimiento de voz y una acción realizada en respuesta a esa frase clave.

Un ejemplo de sistema de automatización del hogar

La figura 1 es un diagrama de bloques de una arquitectura de ejemplo 100 de un sistema de automatización del hogar operable para controlar dispositivos alrededor de una estructura (por ejemplo, una vivienda residencial o un edificio comercial). En el núcleo del sistema hay un controlador principal 110 acoplado a una red de área local (LAN) doméstica (por ejemplo, una red Wi-Fi) 150. El controlador de anfitrión puede incluir componentes de hardware tales como un procesador, una memoria y un dispositivo de almacenamiento, que colectivamente almacenan y ejecutan software de anfitrión 111 configurado para monitorear el control de las operaciones de los dispositivos 112-122, así como para proporcionar interpretación de UI, administración del sistema y monitoreo, sincronización con servicios en la nube 180 y dispositivos móviles 160, registro de actividad, predicción de actividad y otros tipos de funcionalidad.

El controlador principal 110 puede mantener en su dispositivo de almacenamiento una base de datos local 130 que almacena información de configuración que incluye servicios para los que está configurado el sistema de automatización del hogar, contenido de usuario tal como escenas que están configuradas para un usuario del sistema de automatización del hogar, contenido multimedia asociado con un usuario del sistema de automatización del hogar (por ejemplo, favoritos), información del estado del sistema que indica una condición actual del sistema de automatización del hogar, así como otros tipos de datos. La base de datos local 130 mantiene además un registro de la actividad histórica en el sistema de automatización del hogar. Se puede hacer referencia a dicha porción de la base de datos local como base de datos histórica 132. Debe entenderse que, en ciertas realizaciones alternativas, la base de datos histórica 132 puede ser una base de datos separada, en lugar de una parte de la base de datos local 130, y puede mantenerse en el dispositivo de almacenamiento del controlador principal 110, mediante servicios en la nube 180, o en otra parte.

Los dispositivos 112-122 del sistema de automatización del hogar pueden incluir dispositivos de iluminación 112, tales como controladores de iluminación, módulos de lámpara, módulos de atenuación, interruptores, teclados, controladores de ventilador y similares; dispositivos de seguridad 114, tales como monitores/cámaras domésticas, sensores de movimiento, sensores de atención sanitaria en el hogar, controladores relacionados y similares; dispositivos de audio 116 y dispositivos de vídeo 118 (colectivamente dispositivos A/V), tales como controladores de dispositivos A/V, emisores de infrarrojos (IR), matrices de conmutación, servidores de medios, amplificadores de audio, decodificadores de cable y similares; cerraduras electrónicas para puertas 120 y otros tipos de dispositivos accionados por motor o relé; dispositivos HVAC 122, tales como termostatos; así como otro tipo de dispositivos.

Dependiendo de la implementación, las capacidades de comunicación de los dispositivos 112-122 del sistema domótico pueden variar. Por ejemplo, al menos algunos de los dispositivos pueden incluir una interfaz LAN para permitirles comunicarse con el controlador principal 110 y otros dispositivos a través de la LAN doméstica 150. Del mismo modo, es posible que otros dispositivos solo tengan puertos o transceptores para comunicación por cable o inalámbrica punto a punto (por ejemplo, puertos RS-232, transceptores de infrarrojos (IR), puertos de control de relés, puertos de entrada/salida de uso general (GPIO), etc.) y comunicarse con el controlador principal 110 y otros dispositivos usando dichos puertos. Además, algunos dispositivos pueden incluir una interfaz LAN (por ejemplo, una interfaz Wi-Fi), pero no estar configurados para comunicarse con el controlador principal 110 directamente a través de la LAN doméstica 150, sino que se comunican primero con los servicios en la nube 180 a través de Internet 170 e infraestructura de terceros 190. Debe entenderse que si bien los dispositivos HVAC 122 se muestran en la figura 1 como un ejemplo de un tipo de dispositivo que puede comunicarse de esta manera, otros tipos de dispositivos 112 122 pueden usar alternativamente este procedimiento de comunicación, y viceversa.

Un usuario puede controlar el sistema de automatización del hogar usando un control remoto 140 que se comunica con el controlador principal 110 a través de la LAN interna 150 (por ejemplo, a través de Wi-Fi) o directamente con el controlador principal 110 (por ejemplo, a través de IR o señales de radiofrecuencia RF). El control remoto 140 puede incluir componentes de hardware tales como un procesador, una memoria y un dispositivo de almacenamiento, que almacenan y ejecutan software (por ejemplo, una aplicación (app)) configurado para interactuar con el controlador anfitrión 110 y los servicios en la nube 180, generar y mostrar una interfaz de usuario de control de automatización del hogar (incluida una interfaz de usuario de control de voz) y reconocer la entrada de voz del usuario (por ejemplo, usando un motor de reconocimiento de voz), entre otras funciones. El control remoto 140 puede incluir además una pantalla de visualización (por ejemplo, una pantalla táctil) para mostrar una UI de control de automatización del hogar (que incluye una UI de control de voz) y un micrófono para recibir la entrada de voz del usuario, entre otros componentes.

Un usuario puede controlar además el sistema de automatización del hogar usando un dispositivo móvil 160 que se comunica con el controlador principal 110a través de la LAN doméstica 150 o usando una conexión de datos móviles a Internet 170. El dispositivo móvil 160 puede incluir componentes de hardware tales como un procesador, una memoria y un dispositivo de almacenamiento, que almacenan y ejecutan una aplicación 162 (por ejemplo, una aplicación móvil) configurada para interactuar con el controlador anfitrión 110 y/o servicios en la nube 180, generar y mostrar una UI de control de automatización del hogar (incluyendo una UI de control de voz), y reconocer la entrada de voz del usuario (por ejemplo, usando un motor de reconocimiento de voz), entre otras funciones. El dispositivo móvil 160 puede incluir además una pantalla de visualización (por ejemplo, una pantalla táctil) para mostrar la UI de control de automatización del hogar (incluida la UI de control de voz) y un micrófono para recibir la entrada de voz del usuario, entre otros componentes.

El controlador de anfitrión 110 y el dispositivo móvil 160 pueden comunicarse a través de Internet 170 con los servicios de nube 180 y las interfaces de programa de aplicación (API) del anfitrión 182 y las API móviles 184. Los servicios en la nube 180 pueden proporcionar acceso remoto al control de automatización del hogar, una copia de seguridad persistente de la base de datos del hogar 130 (almacenando datos en una base de datos de configuración 186), interfaces a infraestructura de terceros (a través de adaptadores de terceros 188), perfiles de usuario y seguimiento de uso (almacenando datos en la base de datos de usuarios 189), un mecanismo para actualizaciones inalámbricas, informes de fallos del anfitrión y gestión de licencias, entre otras funciones.

Grabación de actividad

La figura 2 es un diagrama de bloques que muestra un software de anfitrión 111 de ejemplo, incluido el software de registro de actividad del anfitrión 200, que puede mantener un registro de actividad histórica en un sistema de automatización del hogar como eventos en una base de datos de historial 132. El software 200 puede incluir un proceso de actividad 210 que recibe masajes a través de comunicación entre procesos (IPC) desde otro software (por ejemplo, en el controlador principal 110) con respecto a servicios activados, escenas activadas, contenido multimedia presentado por el sistema de automatización del hogar y similares. El proceso de actividad 210 puede pasar estos mensajes a un proceso enrutador de mensajes 220. El proceso de actividad 210 puede recibir del proceso enrutador de mensajes 220 respuestas a solicitudes relacionadas con la actividad en el sistema de automatización del hogar. El proceso de actividad 210 puede pasar estas respuestas a otro software, como un proceso de predicciones, como se analiza más adelante.

El proceso de enrutador de mensajes 220 realiza varias funciones que incluyen transformar mensajes del proceso de actividad 210 en eventos 230, enrutar eventos 230 a interfaces de grabadora 250 y enrutar respuestas a solicitudes de regreso al proceso de actividad 210. Los eventos 230 son objetos que mantienen información que describe la actividad histórica en el sistema de automatización del hogar, incluidos servicios activados, escenas activadas, tipos de contenido multimedia presentado y similares. Cada evento 230 puede incluir una propiedad de usuario que indica el usuario que desencadenó el evento, una propiedad de tipo que describe el tipo de evento, una clave de grupo que agrupa tipos similares de eventos, una propiedad de servicio que describe un servicio activado (o es nulo si el evento no involucra un servicio), una propiedad de tiempo que indica la hora en que ocurrió el evento (incluido el día de la semana y la hora del día) y una propiedad de argumentos que almacena información adicional.

Las solicitudes 240 son objetos que representan consultas de datos de procesos de cliente con respecto a la actividad en el sistema de automatización del hogar que pueden estar disponibles en los registradores 260-270. Un proceso de cliente que puede emitir una solicitud 240 es un proceso de predicciones, como se analiza con más detalle a continuación.

Las interfaces del registrador 250 pueden proporcionar interfaces para procesos del registrador, tales como un proceso de alimentación 260 y un proceso de historial 270, que aceptan eventos 230 y solicitudes 240, entre otros usos. El proceso de alimentación 260 puede generar una alimentación de actividad que proporciona un breve historial de eventos 230 en el sistema de automatización del hogar y lo pasa a los servicios en la nube 180. El proceso de historial 270 puede almacenar eventos 230 en la base de datos de historial 132, registrando propiedades que incluyen usuario, tipo, clave de grupo, servicio, hora y argumentos.

Control de voz

Como se analizó anteriormente, el sistema de automatización del hogar puede controlarse por voz de manera que, en respuesta a la entrada de voz, se active una acción de interfaz de usuario correspondiente. Dicho control de voz puede implementarse mediante un motor de reconocimiento de voz que está configurado para reconocer un número limitado de frases clave, cada una de las cuales está asociada con una acción en el sistema de automatización del hogar (por ejemplo, activar un servicio, activar una escena, presentar contenido multimedia, etc.).

La figura 3 es un diagrama de bloques que muestra una aplicación de ejemplo 162, que incluye un motor de reconocimiento de voz 300, que puede ejecutarse en un control remoto 140 o dispositivo móvil 160. El motor de reconocimiento de voz 300 puede incluir un proceso gramatical 310 que realiza una variedad de funciones diferentes. Una función del proceso gramatical 310 puede ser construir una lista de intenciones 320 (por ejemplo, estructurada como una tabla de búsqueda de intenciones). Cada intención incluye una frase clave que es reconocida por el motor de reconocimiento de voz junto con una acción realizada por el sistema domótico en respuesta a la frase clave. Las acciones pueden incluir acciones de UI 370 que controlan uno o más aspectos de la UI de control del sistema de automatización del hogar, y acciones del sistema 380 que controlan servicios, escenas, contenido multimedia u otras operaciones del sistema de automatización del hogar. La lista de intenciones 320 se puede construir dinámicamente usando datos obtenidos de la base de datos local 130. Los datos pueden incluir información de configuración 330, tal como indicaciones de servicios para los que está configurado el sistema de automatización del hogar; contenido de usuario 340, tal como escenas definidas en el sistema de automatización del hogar o contenido multimedia (por ejemplo, favoritos) asociado con un usuario; y estado del sistema 350, tales como indicaciones de servicios activos. El edificio dinámico puede adaptarse a la identidad del usuario actual y a una habitación de la estructura en la que se encuentra el usuario (por ejemplo, basándose en una ubicación determinada dinámicamente del control remoto 140 o dispositivo móvil 160 como en una habitación particular o una vinculación del control remoto 140 o dispositivo móvil 160 a una habitación particular). El edificio dinámico puede agregar intenciones a la lista que son relevantes para la información de configuración actual 330, contenido de usuario 340, estado del sistema 350, usuario y habitación, mientras omite intenciones que son inaplicables (por ejemplo, intenciones para servicios que no están actualmente configurados en la habitación, para escenas que no están definidas en la habitación, para contenido de usuario que no es favorito del usuario actual, para condiciones de funcionamiento distintas al estado actual del sistema, etc.). El proceso gramatical 310 puede monitorear continuamente la información de configuración 330, el contenido del usuario 340, el estado del sistema 350, el usuario y la habitación, y reconstruir la lista de intenciones según sea necesario. Para mejorar la eficiencia, sólo se pueden reconstruir aquellas porciones de la lista de intenciones que se ven afectadas por un cambio (por ejemplo, una actualización parcial).

Otra función que puede realizar el proceso gramatical 310 es validar las frases clave de las intenciones para garantizar que sean reconocibles por un proceso reconocedor 360. Las intenciones cuyas frases clave no estén validadas pueden eliminarse de la lista de intenciones. Una vez validado, el proceso gramatical 310 puede enviar las intenciones al proceso reconocedor 360. El proceso de reconocimiento 360 puede comparar la entrada de voz (por ejemplo, recibida<a través de un micrófono del control remoto 140 o del dispositivo móvil>160<) con frases clave de la lista de intenciones>y desencadenar la acción correspondiente tras una coincidencia.

Aún más, como se analiza con más detalle a continuación, el proceso gramatical 310 también puede desempeñar un papel en la selección de intenciones cuyas frases clave se mostrarán como sugerencias de frases clave en una interfaz de usuario de control de voz.

La figura 4 es un listado de ejemplo de frases clave 400 de una lista de ejemplo de intenciones que pueden construirse dinámicamente. Las intenciones se pueden clasificar en varias categorías, incluidas intenciones de servicio, intenciones de escena, intenciones favoritas, intenciones de comando e intenciones de navegación. Las intenciones de servicio pueden limitarse a una habitación, incluidas palabras clave combinadas con acciones que afectan un servicio en la habitación. La frase clave de intenciones de servicio puede tener el formato"Servicio",donde el nombre del servicio se proporciona solo (por ejemplo, "Apple TV", "Blueray", "Cable", etc.) o como "VerServicio",donde el nombre del servicio está precedido por el comando "Ver" (por ejemplo, "Ver Apple TV", "Ver Blueray", "Ver Cable", etc.). Estas frases clave pueden estar asociadas con acciones que activan una versión de audio/video del servicio. La frase clave de intenciones de servicio también puede tener el formato "EscucharServicio",donde el nombre del servicio está precedido por el comando "Escuchar" (por ejemplo, "Escuchar Apple TV Live", "Escuchar CD", "Escuchar radio", etc.). Estas frases clave pueden estar asociadas con acciones que activan una versión del servicio de solo audio (si está disponible).

Las intenciones de escena pueden incluir palabras clave combinadas con acciones que activan, programan o no programan una escena para un usuario actual. Las intenciones de la escena pueden limitarse a un usuario actual, incluidas palabras clave combinadas con acciones que afectan una escena asociada con el usuario. La frase clave de intenciones de escena puede tener el formato"Escena",donde el nombre de la escena se proporciona solo (por ejemplo, "Cena", "Buenas noches", "Tiempo de juego", etc.). Estas frases clave pueden estar asociadas con acciones que activan una escena. La frase clave de las intenciones de la escena también puede tener el formato "ProgramarEscena",donde el nombre de la escena está precedido por el comando "Programar" (por ejemplo, "Programar cena", "Programar buenas noches", "Programar hora de reproducción", etc.). Estas frases clave pueden estar asociadas a acciones que activen el cronograma de la escena si así se ha configurado. Además, la frase clave de las intenciones de la escena también puede tener el formato"Escenasin programar", donde el nombre de la escena va precedido del comando "Desprogramar". Estas frases clave pueden estar asociadas con acciones que desactivan el cronograma de una escena si está activa.

Las intenciones favoritas pueden incluir palabras clave combinadas con acciones que presenten uno o más tipos de contenido multimedia seleccionado por un usuario actual. Las intenciones favoritas pueden aplicarse tanto aun usuario actual como a una habitación, incluidas palabras clave combinadas con acciones que afectan el contenido multimedia presente en la habitación y asociado con el usuario. Las acciones de intenciones favoritas pueden primero activar un servicio y luego configurar un canal o seleccionar un archivo multimedia o transmisión utilizada con ese servicio. La frase clave de intenciones favoritas puede tener el formato"Servicio",donde el nombre del servicio se proporciona solo (por ejemplo, "ABC", "CBS", "CNN", etc.) o "VerServicio",donde el nombre del servicio está precedido por el comando "Ver" (por ejemplo, "Ver ABC", "Ver CBS", "Ver CNN", etc.). Estas frases clave pueden estar asociadas con acciones que activan una versión de audio/vídeo del servicio configurada en el canal correspondiente (o utilizando un archivo multimedia o secuencia correspondiente). La frase clave de intenciones favoritas también puede tener el formato "EscucharServicio",donde el nombre del servicio va precedido del comando "Escuchar". Estas frases clave pueden estar asociadas con acciones que activan una versión de solo audio del servicio (si está disponible) configurada en el canal correspondiente (o utilizando un archivo multimedia o secuencia correspondiente).

Las intenciones de los comandos pueden incluir palabras clave combinadas con acciones que envían un único comando que puede estar relacionado con un estado actual del sistema domótico (es decir, un contexto). Las intenciones de comando pueden limitarse a una habitación. La frase clave de las intenciones de los comandos puede ser de una lista predefinida de comandos, incluyendo frases clave como "Más brillante" o "Atenuador" que se combinan con acciones que aumentan o disminuyen el nivel de luz en la habitación o, por ejemplo, incluyendo frases clave como "Tengo calor" o "Tengo frío" que se combinan con acciones que disminuyen o aumentan la temperatura en la habitación.

Las intenciones de navegación pueden incluir palabras clave combinadas con acciones que proporcionan atajos de navegación en una interfaz de usuario de control de automatización del hogar. Las intenciones de navegación pueden variar en ámbito, algunas siendo globales mientras que otras dependen de un servicio o habitación activo. Un ejemplo de intención de navegación puede incluir la frase clave "Teclado" combinada con una acción para cambiar a una pantalla de teclado de un servicio actualmente activo (si está disponible) en la interfaz de usuario de control de automatización del hogar. Otro ejemplo de intención de navegación puede incluir la frase clave "Capturar" combinada con una acción para cambiar a una pantalla de captura de escena en la interfaz de usuario de control de automatización del hogar.

Debe entenderse que se pueden proporcionar una amplia variedad de otros tipos de intenciones en el sistema domótico.

Sugerencias de frases clave basadas en el historial

Según la invención, la base de datos histórica 132 y la lista de intenciones 320 se aprovechan para producir sugerencias de frases clave que probablemente sean útiles para el usuario dado el patrón de uso histórico del usuario. Estas sugerencias de frases clave basadas en el historial se muestran en una interfaz de usuario de control de voz en el control remoto 140 o dispositivo móvil 160 para avisar al usuario sobre la entrada de voz que puede producir un resultado deseado.

La figura 5 es un diagrama de bloques de un software de sugerencia de voz 500 de ejemplo de una aplicación 162 y un proceso de predicciones 510 del software anfitrión 111. Inicialmente, el proceso de predicciones 510 puede emitir una o más solicitudes al proceso de actividad 210 para determinar (basándose en la base de datos histórica 132) una frecuencia de varios tipos de eventos cuando el sistema de automatización del hogar estaba en una condición similar a su condición actual. Dicha similitud puede basarse en el tiempo (por ejemplo, tanto la hora del día como el día de la semana), de modo que las solicitudes busquen la frecuencia de eventos en un mismo día de la semana como el día actual de la semana, en una ventana de tiempo que abarca un hora actual del día en cualquier día de la semana, en una ventana de tiempo que abarca la hora actual del día en un mismo día de la semana, o en base a algún otro criterio relacionado con el tiempo. El proceso de predicciones 510 puede aplicar puntuación a los resultados devueltos en respuesta a las solicitudes. La puntuación se basa en la duración de la ventana de tiempo utilizada para seleccionar los eventos, donde una ventana de tiempo más corta genera una puntuación más alta que una ventana de tiempo más larga. Además, la puntuación se puede ajustar según el tipo de evento, y los tipos de eventos que indican una acción del usuario más específica reciben puntuaciones más altas que los eventos que indican una acción del usuario menos específica. Los resultados puntuados pueden luego proporcionarse como un conjunto de datos de predicción al software de sugerencia de voz 500 en el control remoto 140 o dispositivo móvil 160.

El software de sugerencias de voz 500 puede incluir una API de comunicación 520 utilizada para interactuar con el controlador de anfitrión 110, que pasa el conjunto de datos de predicción a un proceso de sugerencias 530. El proceso de sugerencias 530 toma el conjunto de datos de predicción y lo procesa en una forma útil para el proceso gramatical 310, por ejemplo, seleccionando un número predeterminado de eventos más frecuentes. Tal procesamiento puede transformar el conjunto de datos de predicción en una forma que pueda asociarse fácilmente con intenciones de una lista de intenciones 320. El conjunto de datos de predicción procesado y la lista de intenciones 320 se proporcionan al proceso gramatical 310 que asocia eventos del conjunto de datos de predicción con intenciones de la lista 320, para seleccionar intenciones. Luego, al menos las frases clave de dichas intenciones seleccionadas se proporcionan a un proceso de interfaz de usuario de voz 540. El proceso de UI de voz 540 muestra las frases clave de las intenciones seleccionadas como sugerencias de frases clave en una UI de control de voz en una pantalla de visualización del control remoto 140 o dispositivo móvil 160.

La figura 6 es una captura de pantalla de un ejemplo de control por voz UI 600 que puede mostrarse en el control remoto 140 o en el dispositivo móvil 160. Las sugerencias de frases clave 610 pueden visualizarse en un listado en conexión con una indicación al usuario para que las pruebe como entrada de voz. En algunas implementaciones, la UI 600 de control por voz puede mostrarse en una pantalla táctil del control remoto 140 o del dispositivo móvil 160, y las sugerencias de frases clave también pueden servir como botones seleccionables. Tocar un botón puede considerarse equivalente a pronunciar la frase clave y desencadenar la acción correspondiente de la intención.

Recapitulación y conclusiones

La figura 7 es un diagrama de flujo de una secuencia de etapas que pueden implementarse para proporcionar sugerencias de frases clave basadas en el historial. La secuencia de etapas 700 proporciona un resumen de alto nivel de varias operaciones analizadas anteriormente, pero omite ciertos detalles para ilustrar mejor el flujo general de operaciones. En la etapa 710, el software de registro de actividad del anfitrión 200 en el controlador del anfitrión 110 (específicamente, el registrador de historial 270 que trabaja junto con el proceso de actividad 210 y el proceso de enrutador de mensajes 220) construye la base de datos de historial 132 que mantiene los eventos que han ocurrido. Cada evento indica uno o más servicios activados, una o más escenas activadas o uno o más tipos de contenido multimedia presentado. En la etapa 720, el proceso de predicciones 510 en el controlador principal 110 (trabajando junto con el proceso de actividad 210), selecciona un subconjunto de los eventos de la base de datos de historial 132 basándose en un tiempo presente del sistema de automatización del hogar para producir un conjunto de datos de predicción. En la etapa 730, el software de sugerencias de voz 500 en el control remoto 140 o dispositivo móvil 160 (específicamente, el proceso de sugerencias 530 y el proceso de gramática 310), basándose en el conjunto de datos de predicción, selecciona una o más intenciones de una lista de intenciones, en donde cada intención incluye una frase clave reconocida por el motor de reconocimiento de voz 300 emparejada con una acción realizada en respuesta a la frase clave. En la etapa 740, el software de sugerencia de voz 500 (específicamente, el proceso de UI de voz 540) muestra una UI de control de voz 600 en una pantalla de visualización del control remoto 140 o dispositivo móvil 160 que presenta las frases clave de una o más intenciones seleccionadas como sugerencias de frases clave 610. Finalmente, en la etapa 750, en respuesta a la entrada de voz del usuario, el motor de reconocimiento de voz 300 en el control remoto 140 o dispositivo móvil 160 (específicamente, el proceso de reconocimiento 360) puede comparar la entrada de voz con las frases clave de la lista de intenciones para encontrar una intención coincidente y desencadenar la acción asociada con la intención coincidente.

Debe entenderse que se pueden realizar diversas adaptaciones y modificaciones a la secuencia de etapas analizada anteriormente y a otras porciones de la divulgación proporcionada anteriormente. Si bien las realizaciones proporcionadas anteriormente implican un sistema de automatización del hogar que incluye una variedad de diferentes tipos de dispositivos, tales como dispositivos de iluminación, dispositivos de seguridad, dispositivos A/V, cerraduras electrónicas, dispositivos HVAC, etc., se debe recordar que las presentes técnicas se puede adaptar para su uso con tipos más limitados de sistemas de automatización del hogar. Por ejemplo, las técnicas pueden usarse con un sistema de automatización del hogar que proporciona solo control de iluminación (es decir, un sistema de control de iluminación), un sistema de automatización del hogar que proporciona solo control de A/V (es decir, un sistema de control de A/V), etc. .

Además, si bien la divulgación proporcionada anteriormente sugiere que se pueden ejecutar varios procesos de software en dispositivos particulares (tales como en el controlador 110 de anfitrión, el control 140 remoto o el dispositivo 160 móvil, etc.), se debe entender que los procesos de software se pueden ejecutar en diferentes dispositivos de hardware, incluso en hardware basado en la nube como parte de los servicios en la nube 180.

Además, si bien se describe anteriormente que las sugerencias de frases clave basadas en el historial pueden basarse en un historial de eventos que han ocurrido en el propio sistema de automatización del hogar, se debe entender que pueden considerarse también los eventos que han ocurrido en otros sistemas de automatización del hogar. Por ejemplo, los servicios en la nube 180 pueden agregar eventos de una pluralidad de sistemas de automatización del hogar y se puede aplicar un algoritmo de predicción a este conjunto de eventos combinado para formar sugerencias de frases clave. Al considerar una base de usuarios más grande, varios patrones de uso que pueden no ser discernibles en el caso de un solo sistema de automatización del hogar pueden volverse estadísticamente significativos.

Además, debe entenderse que al menos algunas de las funciones sugeridas anteriormente para implementarse en software pueden implementarse en hardware. En general, la funcionalidad puede implementarse en software, hardware o varias combinaciones de los mismos. Las implementaciones de software pueden incluir instrucciones ejecutables en dispositivos electrónicos (por ejemplo, instrucciones ejecutables por ordenador) almacenadas en un medio no transitorio legible por dispositivo electrónico (por ejemplo, un medio no transitorio legible por ordenador), tal como una memoria volátil o persistente, un disco duro, un disco compacto (CD) u otro medio tangible. Las implementaciones de hardware pueden incluir circuitos lógicos, circuitos integrados de aplicaciones específicas y/u otros tipos de componentes de hardware. Además, las implementaciones combinadas de software/hardware pueden incluir tanto instrucciones ejecutables en dispositivos electrónicos almacenadas en un medio no transitorio legible por dispositivos electrónicos, como uno o más componentes de hardware, por ejemplo, procesadores, memorias, etc. Debe entenderse que las realizaciones anteriores deben tomarse únicamente a modo de ejemplo.

Claims

REIVINDICACIONES

1. Un procedimiento para proporcionar sugerencias de frases clave basadas en historial para el control por voz de un sistema de automatización del hogar, que comprende

construir una base de datos histórica (132) en un dispositivo de almacenamiento que mantiene eventos que han ocurrido en el sistema domótico, cada evento asociado con un tiempo e indicando uno o más servicios activados, una o más escenas activadas o uno o más tipos de contenido multimedia presentado por el sistema domótico; seleccionar un subconjunto de los eventos de la base de datos de historial basándose en una comparación del tiempo asociado de cada evento con una ventana de tiempo que abarca un tiempo presente, la selección para producir un conjunto de datos de predicción puntuados, en el que la puntuación de eventos en el conjunto de datos de predicción puntuados se determina, al menos en parte, basándose en una duración de la ventana de tiempo, con una ventana de tiempo más corta provocando una puntuación más alta que una ventana de tiempo más larga, en donde la hora actual incluye una hora actual del día y un día actual de la semana y la comparación determina eventos en la base de datos histórica que ocurrieron en una ventana de tiempo que abarca la hora actual del día en un mismo día de la semana como el día actual de la semana;

basado en el conjunto de datos de predicción puntuado, seleccionando una o más intenciones de una lista de intenciones, en donde cada intención es una estructura de datos que incluye una frase clave reconocida por un motor de reconocimiento de voz (300) emparejada con una acción realizada en respuesta a la frase clave ; y mostrar, a un usuario actual en una interfaz de usuario en un control remoto (140) o dispositivo móvil (160) del sistema de automatización del hogar, una o más frases clave de la una o más intenciones seleccionadas como una o más sugerencias de frases clave.

2. El procedimiento de la reivindicación 1, en el que la selección comprende además determinar una frecuencia de diferentes tipos de eventos y la puntuación del evento en el conjunto de datos de predicción puntuado se determina además basándose, al menos en parte, en la frecuencia.

3. El procedimiento de la reivindicación 1, que comprende además: generar dinámicamente la lista de intenciones basándose en al menos una de la información de configuración para el sistema de automatización del hogar, el contenido del usuario definido en el sistema de automatización del hogar o un estado del sistema del sistema de automatización del hogar.

4. El procedimiento de la reivindicación 1, que comprende además: generar dinámicamente la lista de intenciones en función del usuario actual o de una habitación que se está controlando.

5. El procedimiento de la reivindicación 1, en el que la lista de intenciones incluye una o más intenciones de servicio cuya acción, cuando se realiza, activa uno o más servicios dentro de una habitación.

6. El procedimiento de la reivindicación 1, en el que la lista de intenciones incluye una o más intenciones de escenas cuya acción cuando se realiza activa una o más escenas.

7. El procedimiento de la reivindicación 1, en el que la lista de intenciones incluye una o más intenciones favoritas cuya acción, cuando se realiza, presenta uno o más tipos de contenido multimedia asociado con el usuario actual.

8. El procedimiento de la reivindicación 1, que comprende, además:

recibir, en el motor de reconocimiento de voz, entrada de voz desde un micrófono del control remoto o dispositivo móvil;

comparar, mediante el motor de reconocimiento de voz, la entrada de voz con una o más frases clave de la lista de intenciones para encontrar una intención coincidente; y

desencadenar la acción asociada con la intención coincidente.

9. El procedimiento de la reivindicación 8, en el que la acción es una acción del sistema que activa uno o más servicios, activa una o más escenas, o presenta uno o más tipos de contenido multimedia en el sistema de automatización del hogar, o una interfaz de usuario UI, acción que controla uno o más aspectos de una interfaz de usuario de control de un sistema domótico.

10. Un sistema de automatización del hogar configurado para proporcionar sugerencias de frases clave basadas en historial para control por voz, que comprende:

un controlador principal (110) que está acoplado y configurado para controlar uno o más dispositivos de audio/vídeo, A/V, dispositivos de iluminación, calefacción, ventilación y refrigeración, HVAC, dispositivos o dispositivos de seguridad (112-122) dentro de una estructura para proporcionar automatización del hogar, el controlador anfitrión incluye

software de registro de actividad del anfitrión (200) configurado para construir una base de datos histórica (132) que mantiene eventos que han ocurrido en la estructura, cada evento asociado con un tiempo e indicando uno o más servicios activados, una o más escenas activadas o uno o más tipos del contenido multimedia presentado, y

un proceso de predicciones (510) configurado para seleccionar un subconjunto de los eventos de la base de datos de historial en base a una comparación del tiempo asociado de cada evento con una ventana de tiempo que abarca el tiempo presente, el proceso de predicción (510) para producir una predicción puntuada conjunto de datos, en el que la puntuación de eventos en el conjunto de datos de predicción puntuada se determina, al menos en parte, en función de la duración de la ventana de tiempo, provocando una ventana de tiempo más corta una puntuación más alta que una ventana de tiempo más larga, en el que el tiempo presente incluye una hora actual del día y un día actual de la semana y la comparación determina eventos en la base de datos histórica que ocurrieron en una ventana de tiempo que abarca la hora actual del día en un mismo día de la semana como el día actual de la semana; y

un control remoto (140) o dispositivo móvil (160) en comunicación con el controlador principal a través de una red, incluyendo el control remoto o dispositivo móvil

un motor de reconocimiento de voz (300), y

software de sugerencia de voz (500) configurado para, basándose en el conjunto de datos de predicción puntuado, seleccionar una o más intenciones de una lista de intenciones, en el que cada intención es una estructura de datos que incluye una frase clave reconocida por el motor de reconocimiento de voz emparejada con una acción realizada en respuesta a la frase clave, y para mostrar en una pantalla del control remoto o dispositivo móvil a un usuario actual del sistema de automatización del hogar una o más frases clave de una o más intenciones seleccionadas como sugerencias de frases clave.

11. El sistema de automatización del hogar de la reivindicación 10, en el que el software de sugerencia de voz incluye un proceso gramatical que está configurado para generar dinámicamente la lista de intenciones basándose en al menos una de la información de configuración para el sistema de automatización del hogar, el contenido del usuario definido en el sistema de automatización del hogar o un estado del sistema del sistema domótico.

12. El sistema de automatización del hogar de la reivindicación 10, en el que el software de sugerencia de voz incluye un proceso gramatical (310) que está configurado para generar dinámicamente la lista de intenciones en función del usuario actual o de una habitación que se está controlando.

13. El sistema de automatización del hogar de la reivindicación 10, en el que el motor de reconocimiento de voz incluye un proceso de reconocimiento (360) que está configurado para recibir entrada de voz desde un micrófono del control remoto o dispositivo móvil, comparar la entrada de voz con una o más frases clave de la lista de intenciones para encontrar una intención coincidente y desencadenar la acción asociada con la intención coincidente.