CN112673367A

CN112673367A - 用于预测用户意图的电子设备和方法

Info

Publication number: CN112673367A
Application number: CN201880097284.7A
Authority: CN
Inventors: 卡洛林娜·塔鲁·卡特里娜·索敏恩
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2018-10-31
Filing date: 2018-10-31
Publication date: 2021-04-16
Also published as: US11874876B2; WO2020088759A1; US20200394228A1

Abstract

本发明涉及一种用于预测用户意图的电子设备和对应的方法。所述电子设备(100)用于向所述用户(600)提出问题，并根据先前的预测意图和所述用户(600)对所述问题的响应预测所述用户(600)的意图。由此，改进了对所述用户(600)的所述意图的预测。此外，本发明还涉及一种计算机程序。

Description

用于预测用户意图的电子设备和方法

技术领域

本发明涉及一种用于预测用户意图的电子设备和对应的方法。此外，本发明还涉及一种计算机程序。

背景技术

所谓的虚拟助理是本领域中已知的，可以从多个供应商获得。虚拟助理的示例有谷歌的Google助理、苹果的Siri、亚马逊的Alexa和微软的Cortana。虚拟助理可以看作一种能够为用户(即，使用虚拟助理的个人或人员)执行不同任务和服务的软件代理。通常，虚拟助理以软件形式安装在电子设备中。在这方面，电子设备明显的非限制性示例是智能手机和个人计算机。

用户与虚拟助理交互时所使用的典型用户界面是麦克风、触摸屏显示器和专用物理按键。虚拟助理提供的服务的示例为展示信息、播放音乐、播放视频、控制聊天功能、阅读电子邮件等。虚拟助理提供的任务和服务类型正在不断增加。

传统的虚拟助理接收用户的命令并相应地行动。例如，用户命令“播放音乐”，虚拟助理就启动音乐播放器。用户命令“播放电影”，虚拟助理就启动视频播放器。用户也可以通过提问来询问虚拟助理。

发明内容

本发明实施例的目的是提供一种解决方案，用来减少或解决传统方案的缺点和问题。

上述和其它目的是通过独立权利要求的主题来实现的。在从属权利要求中可以找到本发明的其它有利实施例。

根据本发明的第一方面，通过一种电子设备实现上述和其它目的，其中，所述电子设备用于：根据与所述用户关联的上下文信息预测所述用户的至少一个第一意图；根据所述用户的所述第一意图确定问题；向所述用户提出所述问题；接收所述用户对所述问题的响应；根据所述用户的所述第一意图和所述用户对所述问题的所述响应，预测所述用户的至少一个第二意图。

在本发明中，“用户”可以理解为是指通过虚拟助理或用于执行本发明实施例的任何其它合适的软件应用等直接或间接使用电子设备的个人或人员。更具体地，用户可以是对电子设备所确定的问题做出响应的个人或人员。

在本文中，“上下文信息”可以是电子设备能够获得的与用户关联的任何信息。上下文信息的非限制性示例是与时间、位置、传感器信息(如来自加速器、陀螺仪、气压计、接近传感器等)以及活动(如走路、跑步、驾驶、乘公交、谈话、阅读等)相关的信息。上下文信息可以由电子设备自身直接获得，也可以提供给电子设备。例如，上下文信息可以由云推送给电子设备。

根据所述第一方面的电子设备的优点在于，与传统方案产生的预测意图相比，用户的预测意图得到改进。通过向用户提出问题并接收用户对问题的响应，可以改进用户的上下文。利用改进的上下文，还可以改进用户的预测意图(在本文中表示为第二意图)。通过了解用户的意图，例如，可以将相关的建议信息和/或相关的建议动作提供和呈现给用户。此外，由于电子设备通过提出问题来发起与用户的交互，因此用户不需要主动行动来发起与电子设备的交互，如按下按钮或在麦克风中讲话。

因此，电子设备的一种示例性实现方式为实现虚拟助理。其它非限制性应用包括车辆的驾驶辅助以及用于控制其它设备和机器的控制系统。

还需要说明的是，根据所述第一方面的电子设备可以用于迭代实现本文提出的电子设备与用户之间的问题/响应算法。在这种情况下，可以预测一个或多个第二意图，并根据一个或多个预测的第二意图确定第二问题。所述电子设备向用户提出所述第二问题，并且接收和处理对所述第二问题的第二响应，以预测一个或多个第三意图。可以执行该迭代算法，直到预测到用户的正确意图。

根据所述第一方面，在电子设备的一种实现方式中，所述电子设备还用于：根据所述用户的所述第二意图确定建议动作；将所述建议动作提供给所述用户。

该实现方式意味着向用户提供根据所述第二意图确定的建议动作。

该实现方式的优点在于，向用户提供相关动作的条件是所述第二意图是正确的。因此，用户不需要执行提供建议动作的动作。

根据所述第一方面，在电子设备的一种实现方式中，所述电子设备还用于：根据所述用户的所述第二意图确定建议信息；将所述建议信息提供给所述用户。

该实现方式意味着向用户提供根据所述第二意图确定的建议信息。因此，用户不需要执行提供建议信息的动作。

该实现方式的优点在于，向用户呈现相关信息的条件是所述第二意图是正确的。

根据所述第一方面，在电子设备的一种实现方式中，所述电子设备还用于：根据与所述用户关联的上下文信息预测所述用户的单个第一意图；预测所述用户的所述第二意图等于所述用户的所述单个第一意图。

该实现方式的优点在于，所述第一意图是正确的。

根据所述第一方面，在电子设备的一种实现方式中，所述电子设备还用于：根据与所述用户关联的上下文信息预测所述用户的多个第一意图；预测所述用户的所述第二意图等于所述用户的所述多个第一意图中所述用户的单个第一意图。

该实现方式的优点在于，所述第二意图限于第一意图的集合。

根据所述第一方面，在电子设备的一种实现方式中，所述问题为封闭式问题。

该实现方式的优点在于，这种形式的问题易于用户理解。此外，对问题的响应也很简单，因为仅仅对问题进行肯定或否定响应就足以使用户与电子设备通信。因此，与传统方案相比，可用性大大提高。

根据所述第一方面，在电子设备的一种实现方式中，对所述封闭式问题的响应是肯定的或否定的。

肯定或否定响应可以以多种不同的方式表示。在一个非限制性示例中，肯定或否定响应用语义含义为是或否的语音来表示。肯定或否定响应也可以用用户的移动来表示，例如，用户点头解释为肯定，摇头解释为否定。肯定或否定响应也可以分别表示为触摸“是”按钮或“否”按钮。

该实现方式的优点在于，用户提供其响应非常简单。此外，当用户希望不引起注意时，用户对问题的响应可以非常不显眼，例如，这在公共环境中是有利的。此外，由于电子设备仅需要识别对问题的响应是肯定还是否定响应，因此可以使电子设备中的处理较为简单。

根据所述第一方面，在电子设备的一种实现方式中，根据与所述用户关联的所述上下文信息预测所述用户的至少一个第一意图包括：组合对应与所述用户关联的多个上下文信息的多个稀疏向量，以获得组合稀疏向量；根据所述组合稀疏向量的随机索引预测所述第一意图。

该实现方式的优点在于，提供了用于预测第一意图的便捷方案。该方案实现简单，功耗低。

根据所述第一方面，在电子设备的一种实现方式中，与所述用户关联的所述上下文信息包括时间上下文信息和空间上下文信息。

该实现方式的优点在于，时间上下文信息和空间上下文信息都被认为正确地确定用户的上下文，从而改进用户意图的预测。此外，使用空间上下文信息和时间上下文信息的优点是预测任务的重复模式，例如，每天在同一时间在同一地点执行特定任务，以及预测构成任务序列的任务与相关子任务，例如，先执行任务1，再执行任务2，再执行任务3，以此类推。有些任务完全独立于地点或时间(即，空间上下文)，而是取决于先前执行的任务。

根据所述第一方面，在电子设备的一种实现方式中，根据所述用户的所述第一意图确定所述问题包括：根据所述用户的所述第一意图，在多个预定义问题中选择所述问题。

该实现方式的优点在于，通过使用预定义问题，可以快速地进行选择。此外，不使用预定义问题将需要非常复杂的AI技术，而这些技术目前并不存在。

根据所述第一方面，在电子设备的一种实现方式中，向所述用户提出所述问题包括：使用输出用户界面将所述问题输出给所述用户。

许多不同的输出用户界面可以结合本发明的实施例使用。非限制性示例为扬声器、显示器和触觉装置。在使用语音的情况下，可以使用语音合成器以语音形式向用户提出问题。

根据所述第一方面，在电子设备的一种实现方式中，接收所述用户对所述问题的所述响应包括：使用输入用户界面检测所述用户的输入；将所述用户的所述输入转换为对所述问题的所述响应。

许多不同的输入用户界面可以结合本发明的实施例使用。非限制性示例为麦克风、照相机、显示器和触觉装置。在使用语音的情况下，语音识别可以由语音识别引擎完成。

根据所述第一方面，在电子设备的一种实现方式中，所述用户的所述第一意图和所述用户的所述第二意图为所述用户的动作或所述用户的需求。

根据本发明的第二方面，通过一种用于电子设备的方法实现上述和其它目的，其中，所述方法包括：根据与所述用户关联的上下文信息预测所述用户的至少一个第一意图；根据所述用户的所述第一意图确定问题；向所述用户提出所述问题；接收所述用户对所述问题的响应；根据所述用户的所述第一意图和所述用户对所述问题的所述响应，预测所述用户的至少一个第二意图。

根据所述第二方面的方法可以扩展为与根据所述第一方面的电子设备的实现方式对应的实现方式。因此，所述方法的一种实现方式包括所述电子设备的对应实现方式的一个或多个特征。

根据所述第二方面的方法的优点与根据所述第一方面的电子设备的对应实现方式的优点相同。

本发明还涉及一种计算机程序，其特征在于，当程序代码由至少一个处理器运行时，所述至少一个处理器执行根据本发明实施例的任何方法。此外，本发明还涉及一种计算机程序产品，包括计算机可读介质和所述计算机程序，其中，所述计算机程序包括在所述计算机可读介质中，并且包括组中的以下一个或多个：只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、闪存、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)和硬盘驱动器。

本发明实施例的其它应用和优点从以下详细描述中显而易见。

附图说明

附图意在阐明和阐释本发明的各项实施例，其中：

图1示出了本发明实施例提供的电子设备；

图2示出了本发明实施例提供的用于电子设备的方法的流程图；

图3示出了本发明实施例提供的电子设备的一个示例性应用；

图4示出了本发明实施例提供的电子设备的另一示例性应用；

图5示出了无线通信系统；

图6为信令图，示出了本发明实施例提供的电子设备与所述电子设备的用户之间的交互；

图7示出了本发明实施例的图。

具体实施方式

为了改进传统虚拟助理的功能，人们已经认识到，一个重要方面是，预测用户意图以提供正确的信息，或根据用户意图执行正确的动作。在本文中，正确信息或正确动作的一种含义可以理解为，呈现的信息或执行的动作与用户意图相匹配。

传统虚拟助理的缺点在于，预测与用户意图不匹配。这是因为用户行为部分是随机的，难以预测。例如，当用户接近公交站点时，对公交时刻表的预测可能是正确的，但用户的意图可能不是乘公交出行。而是，用户可能在公交站点等待乘坐汽车。

通常，传统的虚拟助理不能正确理解与用户关联的上下文信息，因此不能正确了解用户的意图。换句话说，传统的虚拟助理不理解用户的意图，而仅仅依赖于用户所说的话，没有理解或预测用户接下来可能做什么或用户接下来的需求可能是什么。

因此，为了解决现有传统方案的缺点，并且为了扩增用户的上下文，需要根据用户的反馈对用户的意图进行准确预测。由此，改进用户的上下文使得预测得到改进。另一方面，传统的虚拟助理在以下方面是被动的：它们不会启动与用户的对话，并且即使用户实际上需要虚拟助理的帮助，用户也不急于启动与虚拟助理的对话。

因此，本发明实施例涉及一种能够向用户提出问题以发起与用户的交互的电子设备及对应方法。在向用户提出问题之后，接收用户对问题的响应，并且该响应可用于增强对用户意图的预测。本发明的此类实施例的示例在图1和图2中示出，并在以下公开内容中描述。

本发明提供的用户的改进预测的一种应用或实现方式是虚拟助理应用。通过进行正确的或改进的预测，虚拟助理可以提供正确的信息和/或执行正确的动作。然而，本文所公开的用户的预测意图的应用不限于此，并且用户意图的预测可以在需要或可以通过此类预测作为其处理中的输入来改进的所有系统和设备中使用或实现。此类系统和设备的非限制性示例为汽车和卡车中的车辆驾驶辅助，以及用于控制起重机和相关工具(如旋转器和倾斜旋转器)的控制系统。

图1示出了本发明实施例提供的电子设备100。在图1所示的实施例中，电子设备100包括处理器102、存储器104、输出用户界面108和输入用户界面110。处理器102通过本领域已知的通信装置108与存储器104、输出用户界面108和输入用户界面110耦合。输出用户界面108用于向用户600输出信息/数据，而输入用户界面110用于接收来自用户600的输入。在本发明中，电子设备100用于执行某些动作可以理解为指电子设备100包括用于执行所述动作的合适装置，如处理器102和存储器104。

根据本发明的实施例，电子设备100用于根据与用户600关联的上下文信息预测用户600的至少一个第一意图。电子设备100用于根据用户600的第一意图确定问题并向用户600提出问题。电子设备100还用于：接收用户600对问题的响应；根据用户600的第一意图和用户600对问题的响应，预测用户600的至少一个第二意图。

图2示出了可以在电子设备100(如图1所示的电子设备)中执行的对应方法200的流程图。方法200包括：根据与用户600关联的上下文信息预测202用户600的至少一个第一意图。方法200包括：根据用户600的第一意图确定204问题。方法200包括：向用户600提出206问题。方法200包括：接收208用户600对所述问题的响应。方法200包括：根据用户600的第一意图和用户600对所述问题的响应，预测210用户600的至少一个第二意图。

根据本发明的实施例，用户600的第一意图和用户600的第二意图为用户600的动作或用户600的需求。通过了解用户600的动作或需求，电子设备100可以提供相关信息和/或执行相关任务。

在本文中，电子设备100可以是独立设备或其它设备的一部分。图3示出了客户端设备300包括本发明实施例提供的电子设备100的示例。在该示例性实施例中，客户端设备300还包括收发器304，所述收发器304通过通信装置308与电子设备100耦合。收发器还与天线或天线阵列310耦合，这意味着客户端设备300用于无线通信。例如，客户端设备300可以是3GPP系统(如长期演进(long term evolution，LTE)和新空口(new radio，NR))中所谓的移动设备或用户设备(user equipment，UE)。

图4示出了移动设备形式的客户端设备300的非限制性示例。移动设备容纳至少一个处理器、至少一个显示设备112和至少一个通信装置。移动设备还包括可通信地连接到显示设备112的输入装置，例如呈键盘114的形式。移动设备还包括输出装置，例如呈扬声器116的形式。移动设备可以是手机、平板电脑、移动PC、智能手机、独立移动设备或任何其它合适的通信设备。图4中还示出，移动设备与耳机150可通信地耦合，耳机150包括用于电子设备100与用户600之间交互的输出装置(扬声器)和输入装置(麦克风)。

在本发明的一个实施例中，电子设备100可以访问用户600在移动设备上执行的一切动作，并且可以使用该信息来预测用户600的意图。因此，所述信息可以构成与用户600关联的上下文信息的一部分。

此外，图5示出了无线通信系统500，该无线通信系统500包括用于在无线通信系统500中操作的客户端设备300和网络接入节点400。为了简单起见，图5所示的无线通信系统500仅包括一个客户端设备300和一个网络接入节点400。然而，无线通信系统500可以包括任意数量的客户端设备300和任意数量的网络接入节点400，而不偏离本发明的范围。在无线通信系统500中，客户端设备300和网络接入节点400用于根据如LTE和5G NR等任何合适的通信标准彼此交互。

此外，图6示出了本发明实施例提供的电子设备100与电子设备100的用户600之间的交互图。

在图6的步骤I中，电子设备100根据与用户600关联的上下文信息预测用户600的至少一个第一意图。这可以通过多种不同的方式来执行。在一个实施例中，预测第一意图涉及：组合对应与用户600关联的多个上下文信息的多个稀疏向量，以获得组合稀疏向量。随后，根据先前获得的组合稀疏向量的随机索引来预测第一意图。根据本发明的实施例，与用户600关联的上下文信息至少包括时间上下文信息和空间上下文信息。然而，可以使用其它上下文信息来预测用户600的意图。上下文信息可以从传感器、GPS、加速度计、照相机、麦克风等导出。关于如何预测第一意图以及上下文信息的内容的更多细节在以下公开内容中描述。

此外，在图6的步骤I中，电子设备100还根据用户600的一个或多个预测的第一意图确定问题。可以通过根据用户600的第一意图，在多个预定义问题中选择问题来确定问题。因此，电子设备100可以具有可以存储在电子设备100的存储器中的预定义和预先训练的意图集合。

根据本发明的一个实施例，电子设备100生成的问题为封闭式问题。与所谓的开放式问题相比，封闭式问题的响应或回答仅限于是或否。换句话说，响应只能是肯定的或否定的。下文给出了根据用户600的第一意图生成的问题示例：

·第一意图：用户600迷路-对应的问题Q：您迷路了吗？

·第一意图：用户600要去公交站点-对应的问题Q：您要去公交站点吗？

·第一意图：用户600要回家-对应的问题Q：您要回家了吗？

·第一意图：用户600要去工作-对应的问题Q：您要去工作了吗？

·第一意图：用户600需要一辆出租车-对应的问题问：您需要一辆出租车吗？

·第一意图：用户600想要手机处于静音模式-对应的问题Q：您希望手机处于静音模式吗？

·第一意图：用户600想要设置唤醒呼叫-对应的问题Q：您要设置唤醒呼叫吗？

·第一意图：用户600想要打开家用取暖器-对应的问题Q：您要打开家用取暖器吗？

·第一意图：用户600想要关闭家用取暖器-对应的问题Q：您要关闭家用取暖器吗？

在图6的步骤II中，电子设备100向用户600提出所确定的问题。电子设备100可以通过使用本领域已知的输出用户界面120将问题输出给用户600来提出问题。自然，输出格式必须被用户600理解。因此，输出格式应该呈人类能够理解的形式。输出用户界面的非限制性示例为扬声器、显示器和触觉装置。在使用语音的情况下，可以使用语音合成器以语音形式向用户600提出问题。

在图6的步骤III中，用户600在接收到问题后对电子设备100提供的问题给出响应。在问题为封闭式问题的情况下，用户600以肯定或否定形式给出对封闭式问题的响应。在非限制性示例中，例如，用户600可以在麦克风中说“是”(肯定)或“否”(否定)，在照相机前点头(肯定)或摇头(否定)，在触摸屏上点击“是”按钮(肯定)或“否”按钮(否定)，触摸物理“是”按钮(肯定)或物理“否”按钮(否定)等。

在图6的步骤IV中，用户600向电子设备100做出响应。响应可以通过使用本领域已知的输入用户界面122来提供。因此，电子设备100通过输入用户界面122来检测用户600的输入。随后，将输入转换成电子设备100能够理解的机器格式。从而将用户600的输入转换为对问题的响应。输入用户界面的非限制性示例为麦克风、照相机、显示器和触觉装置。在用户600使用语音的情况下，语音识别可以通过包括在电子设备100中的语音识别引擎完成。在本发明的一个实施例中，将问题和对应的答复馈送到学习系统中，该学习系统随着时间推移理解用户600的动作和需求，使得电子设备100可以改进预测。

在图6的步骤V中，电子设备100在接收到对问题的响应后，根据第一预测意图和用户600的响应预测用户600的第二意图。通常有两种主要情况，这在下文进行描述。

在第一种情况下，在步骤I中电子设备100已经预测用户600的单个第一意图。这意味着，如果对问题的响应是肯定的，则用户600的第二意图将等于用户600的单个第一意图。如果响应是否定的，则电子设备100必须确定新的第一意图。

在第二种情况下，在步骤I中电子设备100已经预测用户600的多个第一意图。这意味着，根据用户600的响应，用户600的第二意图可以等于用户600的多个第一意图中用户600的单个第一意图。根据第一预测意图、对问题的响应和问题本身来确定第二意图等于第一意图。为了正确匹配，可以向用户提出一系列问题。对于每个响应，可以放弃一个或多个第一意图。因此，可以使用交互算法来找到正确的第二意图。

在图6的步骤VI中，本发明实施例提供的电子设备100根据用户600的第二预测意图确定建议动作和/或建议信息。

在图6的步骤VII中，电子设备100向用户600提供建议动作和/或建议信息。在这方面，可以使用前文提及的输出用户界面120。

在以下公开内容中，更详细地描述与用户600关联的上下文信息。此外，进一步阐述如何根据与用户600关联的所述上下文信息来预测用户600的第一意图和第二意图的方面。

电子设备100预测用户600接下来可能想做什么，即预测用户600的意图。人类行为通常可分为频繁动作/任务、周期性动作和随机动作。因此，人类行为永远无法完全预测，需要向用户600询问一个或多个问题，以确定用户600的意图。否则，可能向用户600提供错误信息或可能由应用(如虚拟助理)执行错误动作，这会使用户600恼火。因此，人类行为是不可预测的，错误率会很高，并且将存在多个预测意图，有一个以上的意图可能是潜在意图，但是用户600只选择一个。

此外，当使用用户600的上下文信息进行预测并且上下文信息越向后时，结果将会产生更多的潜在预测分支。因为向后每一步且仅向后几步的可用预测分支就可能产生数千个预测，并且只有一个预测符合用户600的意图。因此，重要的是电子设备100不仅作出有根据的推测作为预测，而且通过提出问题来跟上用户600。例如，公司副总裁的人事秘书无法读取其经理的心思。因此，为了安排副总裁的日程安排，除了要熟悉副总裁的兴趣、典型的喜好、行为等等之外，还需要提出问题。类似地，电子设备100可以像人工秘书一样工作，因此应该了解用户600行为、来往、日程等。然而，与人类秘书一样，电子设备100事先并不了解用户600的意图。因此，当电子设备100不确定用户600的意图时，电子设备100会提出问题以更好地理解用户600的实际意图。

另一方面，传统的虚拟助理在以下方面是被动的：它们仅对由用户600制定的问题作出反应，而不主动对用户提出问题。因此，传统的虚拟助理常常无法向用户600提供正确的答案，因为在不理解用户600的上下文的情况下理解人类语言是困难的，甚至不可能。因此，本文提出使用与用户600关联的上下文信息来预测用户600的意图。上下文信息的一个示例通过以下词集合给出：

·charger://connect

·ringerMode://normal

·flat://on

·wifiNetwork://ssid/ThereGate_000547

·timeOfDay://NOON

·wifiNetwork://ssid/testi

·timezone://EET

·appNavigated://com.android.settings/com.android.settings.UsbSettings

·wifiNetwork://ssid/AndroidAPks

·wifiNetwork://ssid/HWFBCPE

·wifiNetwork://ssid/AndroidAP

·appNavigated://com.android.settings/com.android.settings.Settings$DevelopmentSettingsActivity

·timestamp://2013-08-20T12:14:17

·timestamp://2013-08-20T12:14:16

·wifiNetwork://ssid/KallenGate

·dayOfWeek://TUESDAY

·wifiNetwork://ssid/sipulinet

·month://August

·wifiNetwork://ssid/jmkn4

·wifiNetwork://ssid/Mobile Pirates

·wifi://connected/AndroidAPks

·appStarted://com.android.settings/null

·wifiNetwork://ssid/helsinkidemo

·wifiNetwork://ssid/matetuuba

·utc://2013-08-20T09:14:17

·utc://2013-08-20T09:14:16

·wifiNetwork://ssid/ThereGate_000297

·charger://connected

·wifiNetwork://ssid/wlanaccessv2.0

·wifiNetwork://ssid/everest

·wifiNetwork://ssid/VogueAp

·wifiNetwork://ssid/There_Guest

·network://Saunalahti

保存稀疏向量的数据结构可以以索引值格式存在于存储器中。这些数据结构也可以作为正常稠密阵列(如稠密向量)进行存储，但是这样一来，由于每个向量将存储其所有索引，因此内存消耗会更高。在计算效率与内存消耗之间存在折衷。与依赖映射数据结构的数据结构相比，稠密阵列可以更快地计算(尤其是在使用GPU计算时)，以产生索引值对，但是当向量稀疏且不稠密(饱和)时，索引值对消耗的内存更少，并且在它们稀疏时迭代更快(即，占用例如10000空间的少数索引，而不是占用一个数字的所有索引)。保存随机索引矩阵的数据结构如下：词与对应向量之间的索引值对，其中，向量为向量索引与值之间的索引值对。示例向量：23，–65 614，64 1570，64 1976，–64 2295，–65 2301，64 2893，–64 3307，65 3501，–64 3554，–64 3577，64 3590，64 3774，–64 4815，64 5042，–64 5954，64 6187，64 6443，–64 7795，64 7858，–64。

与用户600关联的上下文信息可以是空间上下文信息和时间上下文信息。空间上下文信息与用户600周围的内容相关。空间上下文信息的示例为：位置、时间、传感器输入麦克风、照相机、环境光传感器、接近传感器、传感器中枢移动分类：静止、走路、跑步、汽车内、公交内、火车内等。

空间上下文信息可用于预测用户600动作的周期性发生。例如，如果用户600每次去电影院都在电影院将手机转为静音，则电子设备100将在一段时间后了解用户600希望在电影院将手机保持静音。然而，室内导航往往不准确，无法准确获知例如在购物中心里的位置。因此，无论用户是在超市还是在电影院，电子设备100的位置可以理解为是相同的。因此，电子设备100不确定是否需要将手机设置为静音模式。因为如果电子设备100因为已经预测到用户600去了与超市在同一建筑物内和同一区域内的电影院，而在没有询问用户600的情况下自动将手机转为静音模式，则当用户600在超市时会非常恼火。因此，重要的是在操作之前询问用户600是否希望将手机转为静音。

时间上下文信息与当前时间实例(通常表示为“现在”)之前发生的事情有关。时间上下文为构成任务的一系列活动。例如，为了呼叫兽医，用户600使用浏览器访问网页，复制手机号码，将其粘贴到电话中并打电话。这是一系列任务，其中，呼叫的时序时间上下文是浏览器，因此，呈现浏览器并复制手机号码将实现预测，即用户600将要打电话。

在用户600执行的事情中，还存在频率形式的上下文信息，这些事情在顺序上没有特定时间或特定地点，而只是随机发生的频繁任务。在预测中使用频率分量，从而提高预测质量。因此，通常，用户600接下来可能会做多件潜在事情，理念是电子设备100以尽可能简单的方式向用户600提出问题，以获得可用于作出预测的关于用户600的信息。

电子设备100可以询问地点的名称，因为电子设备100可能没有关于地点的信息。因此，电子设备100可能会问“这是什么地方？”。例如，用户600可能回答“电影院”，电子设备100便了解用户600在电影院中，因此将手机转成静音模式。或者，用户600可能回答“购物”，电子设备100了解当用户600在购物时，不打开手机的静音模式。地点可与区域标识(identity，ID)关联，以用于区域管理，从而跟踪用户600的位置。在区域管理中，世界经量化为区域。每个位置被划分为具有唯一区域ID的区域。区域可以基于网格或进行动态创建。路径检测器跟踪用户600在区域中行进的路径。区域管理器除了处理区域管理之外，还处理路径管理。可以从行进的位置和区域的地图中生成路径。各地点之间的位置作为路径进行跟踪。这些位置可以存储在数据库中。路径的异常检测器(用户偏离已知路径时跟踪)。位置跟踪器，用于注意激活了正常路径，但发生了偏差。这会使电子设备100启动以询问用户600将去哪里。

电子设备100使用预测来预测用户600的潜在动作(如执行任务)和未来的空间上下文(如地点)。预测用户600意图的一种方式是结合使用所谓的随机索引方法与上下文信息。因此，根据本发明的实施例，在已预测用户600的多于一个第一意图的情况下，执行以下操作：

1.使用随机索引矩阵进行预测以确定用户600的第一意图。

2.对随机索引矩阵进行预测，以确定未来的空间上下文。

3.通过测量当前事件向量的余弦距离，即当前上下文的向量之和，对随机索引矩阵的所有向量进行预测。随机索引矩阵的每一行对应一个词。随机索引矩阵的向量可以有成千上万个列。这些列表示预测与行对应的词的上下文。每一行是预测与该行对应的词的向量。

4.当进行预测时，挑选与当前上下文向量相比最佳的匹配行并添加到按行的余弦相似度排序的有序列表中。

5.通常存在多个可能预测，但只有与用户600的意图相匹配的预测是正确的。在预测多个第一意图的情况下：

I.采纳最佳预测，并用自然语言生成等将这些预测格式化为问题。然后，例如，通过语音合成使用户600试听该问题。

II.电子设备100在提出问题后等待对问题的响应。

III.以简单语言格式(如封闭式问题)生成问题，例如：

a.预测器预测潜在的未来空间上下文为“在公交中”，并且从工作地点到家庭的路径为最佳预测之一。

b.自然语言生成问句“您要乘坐公交吗？”

c.用户600回答“是”。

d.如果电子设备100不确定目的地，则它将询问另一个问题，但是由于电子设备100已经预测了从工作地点到家庭的路径，因此不需要询问另一个问题。

e.电子设备100连接公交时刻表服务，获得从当前地址到家庭地址的路线的时刻表。

f.然后，电子设备100记住公交路线，并建议用户600乘坐特定公交，并告知用户在公交到达之前需要等待多少分钟。

电子设备100将上下文信息结合或组合在一起，产生上下文理解和活动预测，并生成问题。通过将表示上下文信息的多个稀疏向量求和，可以将上下文信息结合或组合在一起。向量作为单个向量的组合是空间上下文信息的集合。对稀疏向量求和的示例：

-向量1：000000100000000101010000000000000000110000000000001100000

-向量2：100010000000000000010000000001000000000000000010000000000

-向量N：000000000000000100000000000000001000000000100000000000000

-和向量：100010100000000201020000000001001000110000100010001100000

可以对稀疏向量求和，而不会产生不良影响，因为即使各索引之间可能发生冲突，一件“事”仍由10000(或更大的)空间中的20个索引表示，在两件“事”之间的向量距离即使有冲突仍十分巨大。

组合的和向量为用于事件预测和学习的上下文向量。该向量可以作为输入发送到神经网络系统，或者可以与上文提及的随机索引算法一起使用，该随机索引算法的准确度较低，但计算的复杂度更低。使用随机索引进行预测可以如下描述：

·将上下文信息转换为uri编码词。例如，区域管理器将GPS位置变为区域id，例如zone://_37_140951_76690。时间12:38:47会变成：hour://12minute://30。活动会变成例如appActivity://com.huawei.musicplayer/play/resume_playing或例如appLaunched://com.reittiopas.reittiopasApp。

·这些路径也是活动，用路径id指定。区域管理器将跟踪路径，并为经常出现的路径分配路径id。路径将预测目标区域。

·将表示为uri编码词的上下文信息和活动收集在一起以形成词袋。

·按以下方式将词袋转换为稀疏向量：

o为词袋中的每个词分配词稀疏向量的唯一ID。

o每个事件(词袋)通过附加向量来标识，这有助于将词袋追溯到事件。

o建立词到稀疏向量的词汇表，当词汇表中已经存在这些词和稀疏向量时，使用词与稀疏向量之间的旧映射。

o每个稀疏向量通过使用0与10000(或N，取决于向量的长度)之间的随机索引集合来随机生成。每个词由20个随机选择的索引表示。系统为随机散列系统。

·然后，使用稀疏向量利用随机索引进行预测，并将稀疏向量作为人工神经网络的输入和输出，用于完成推理。

·电子设备100也在线学习事件。将通过上述方式产生的事件向量添加到矩阵中表示生成事件向量的词袋中词的所有行中。

·通过简单向量相加来完成学习。学习算法可以遵循任何传统算法。

上述余弦相似度为内积空间的两个非零向量之间相似度的度量，所述内积空间用于测量两个非零向量之间的角余弦。0的余弦为1，任何其它角度的余弦小于1。因此，这是对方向而不是大小的判断：方向相同的两个向量的余弦相似度为1，呈90度的两个向量的相似度为0，在直径上相反的两个向量的相似度为–1，与大小无关。余弦相似度特别用于正空间，在正空间中，结果限定在[0，1]中。在这种情况下，如果单位向量平行，则它们“相似度最高”；如果它们正交，即垂直，则它们“相似度最低”。这与余弦类似，当段夹零角时，余弦为1(最大值)；当段垂直时，为0(不相关)。

图7示出了本发明另一实施例的图。图7中的方框示出了：用户600、麦克风802、文本转语音实体804、操作系统(operating system，OS)806、上下文信息实体808、虚拟助理人工智能(artificial intelligence，AI)810、模型实体812和网络/互联网814。在图7中执行以下步骤：

-902：用户600执行触发动作，由OS 806检测到。该动作可以通过使用本领域已知的合适传感器等来检测。

-904：所述动作触发OS 806将检测到的动作输出给虚拟助理AI 810。

-906：助理AI 810向上下文信息实体808请求与检测到的动作相关的上下文信息。

-908：上下文信息实体808响应请求，将与检测到的动作相关的上下文信息发送给助理AI 810。例如，这可以涉及时间信息、空间信息和先前动作。

-910：助理AI 810选择所述上下文信息和动作的一个或多个实例。

-912：助理AI 810将所述上下文信息和动作的所选一个或多个实例输出给模型实体812。

-914：模型实体812使用所述上下文信息和动作的所选一个或多个实例来确定用户600的多个第一意图。

-916：模型实体812通过网络/互联网查询关于一个或多个第一意图的信息。此外，也可以查询内部数据库。

-918：模型实体812从网络/互联网接收关于多个第一意图的信息。

-920：模型实体812根据所述信息、网络/互联网和上下文信息，从所述多个第一意图中选择一个第一意图。

-922：模型实体812根据所选的第一意图生成问题。

-924：将机器格式的问题发送给文本转语音实体804。

-926：文本转语音实体804将问题从机器格式转换为呈现给用户600的语音。

-928：用户600在麦克风802中回答语音形式的问题。

-930：将语音信号发送给OS 806进行处理。

-932：OS 806将语音信号中的语音转换为机器格式和/或文本格式。可以将文本格式呈现给用户600。

-934：将对问题的响应的文本格式发送给助理AI 810。

-936：助理AI 810根据文本格式的响应和用户600的所选第一意图预测用户的第二意图。例如，第二意图可以是要提供给用户600的动作和/或信息。

-938：助理AI 810通过网络/互联网查询与预测的第二意图相关的信息。

-940：助理AI 810从网络/互联网获取关于与第二意图相关的信息的响应。

-942：助理AI 810向OS 806发送指令，指示是否执行动作，例如“启动音乐播放器”、“播放音乐”等。

-944：如果需要呈现信息，则虚拟助理AI 810生成文本格式的信息。

-946：虚拟助理AI 810将文本格式的信息输出给文本转语音实体804。

-948：文本转语音实体804将文本格式的信息转换为语音并将该语音提供给用户600。

为了更深入地理解本发明，本文呈现了四个示例性实施例，说明根据本发明的问题响应算法。

示例1：

周二晚上，用户600正在走向芬兰罗霍拉赫蒂的公交站。根据先前的经验，可以预测用户600可能会乘坐公交并且可能对公交时刻表感兴趣。然而，这次用户600不准备乘坐公交，而是从公交站等待乘坐出租车。电子设备100与用户600之间的交互过程如下：

·电子设备100预测用户不确定是否会乘坐公交。

·电子设备100通过语音合成向用户600提出问题：您要乘坐公交吗？电子设备100提出问题是因为电子设备100不知道答案，并且如果它依赖预测，将给出误导信息。

·用户600回答问题：不。

·电子设备100得出结论，用户600不准备乘坐公交，因此不向用户600提供公交时刻表。

示例2：

周二晚上，用户600正在走向芬兰罗霍拉赫蒂的公交站。根据先前的经验和上下文信息，电子设备100预测用户600可能会乘坐公交并且可能对公交时刻表感兴趣。然而，情况并非总是如此，电子设备100并不确定。然而，这次用户600确实要乘坐公交。电子设备100与用户600之间的交互过程如下：

·电子设备100预测用户600的下一个动作可能是乘坐公交。

·电子设备100通过语音合成向用户600提出问题：您要乘坐公交吗？

·用户600回答问题：是。

·电子设备100预测用户600在此时前往该特定公交站时是准备回家，并在显示器上或以语音形式向用户600呈现信息：160K路公交1分钟后到达车站，如果您要赶公交的话请快点。

示例3：

用户600驾车经过赫尔辛基，但偏离正常路线，并驶向用户600以前从未行驶的街道。电子设备100注意到驾驶模式中的异常，使用所行驶正常路径的关联记忆来比较当前路径与旧路径。电子设备100与用户600之间的交互过程如下：

·电子设备100注意到用户600的驾驶模式中的异常。

·电子设备100通过语音合成向用户600提出问题：您迷路了吗？

·用户600回答问题：是。

·电子设备100根据对语音合成的响应向用户600提出新的问题：需要帮助您回到已知路线吗？

·用户600回答问题：是。

·因此，电子设备100知道用户600迷路了，绕道不是故意的。电子设备100使用GPS程序给出已知路径中最近的位置作为目的地点，并利用导航程序启动导航。

·用户600从导航程序获得指令并返回熟悉的路径。

·当用户600返回已知路径时，电子设备100知道任务已经完成。

示例4：

名为哈里的用户600正开车经过艾斯堡，下班回家。用户600收到老板的紧急邮件：哈里，你把钱包忘在办公室了，你能回来取吗，我会到门口把它交给你。请给我回电！电子设备100注意到该电子邮件，还注意到该电子邮件是哈里的老板发来的。电子设备100与用户600之间的交互过程如下：

·电子设备100通知用户600哈里，他的老板给他发送了电子邮件，并询问用户600：您要阅读电子邮件吗？

·用户600回答问题：是。

·电子设备100访问电子邮件数据库并获取电子邮件的文本内容，然后将电子邮件发送给文本转语音引擎，从而通过语音合成为用户600读取电子邮件。

·电子设备100从电子邮件文本中高度确信地注意到发件人上下文是哈里的老板，老板希望哈里给他/她打电话。

·电子设备100从用户600的通讯录中找到老板的手机号码。

·电子设备100询问用户600：你要给老板打电话吗？

·用户600回答问题：是。

·电子设备100通过从通讯录中获取的手机号码呼叫老板。

·用户600哈里与老板进行了通话，然后按照约定直接行驶到办公室的前面，从老板那里拿到了忘记的钱包。

如前所述，根据实施例，可以将电子设备100包括在客户端设备300中。本文中的客户端设备300可以表示为用户装备、用户设备(User Equipment，UE)、移动台、物联网(internet of things，IoT)设备、传感器设备、无线终端和/或移动终端，能够在无线通信系统(有时也称为蜂窝无线系统)中进行无线通信。UE还可以称为具有无线能力的移动手机、蜂窝手机、计算机平板电脑或膝上型计算机。例如，上下文中的UE可以是便携式、袖珍存储式、手持式、计算机组成的或车载移动设备，其能够通过无线接入网络与另一实体(如另一个接收器或服务器)通信语音和/或数据。UE可以是台站(Station，STA)，其为包含到无线介质(Wireless Medium，WM)的、符合IEEE 802.11的媒体接入控制(Media AccessControl，MAC)和物理层(Physical Layer，PHY)接口的任何设备。UE还可以用于在3GPP相关的LTE和LTE-Advanced中、在WiMAX及其演进中，以及在如新空口等第五代无线技术中进行通信。

本文中的网络接入节点400还可以表示为无线网络接入节点、接入网络接入节点、接入点或基站(例如无线基站(Radio Base Station，RBS))，在某些网络中，根据使用的技术和术语，所述基站可以称为发射器、“gNB”、“gNodeB”、“eNB”、“eNodeB”、“NodeB”或“B节点”。根据传输功率以及小区大小，无线网络接入节点可以具有不同类别，例如宏eNodeB、家庭eNodeB或迷你基站。所述无线网络接入节点可以是台站(Station，STA)，其为包含到无线介质(Wireless Medium，WM)的、符合IEEE 802.11的媒体接入控制(Media AccessControl，MAC)和物理层(Physical Layer，PHY)接口的任何设备。所述无线网络接入节点也可以是与第五代(fifth generation，5G)无线系统对应的基站。

另外，根据本发明实施例的任意方法可以在具有编码模块的计算机程序中实现，当处理装置运行该计算机程序时，处理装置执行方法步骤。计算机程序包括在计算机程序产品的计算机可读介质之中。计算机可读介质基本可以包括任意存储器，如只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、闪存、电可擦可编程只读存储器(Electrically Erasable PROM，EEPROM)以及硬盘驱动器。

此外，技术人员认识到，客户端设备300和网络接入节点400的实施例包括用于执行解决方案的功能、装置、单元、元件等形式的必要通信能力。其它此类装置、单元、元件和功能的示例为：处理器、存储器、缓冲器、控制逻辑、编码器、解码器、速率匹配器、解速率匹配器、映射单元、乘法器、决策单元、选择单元、开关、交织器、解交织器、调制器、解调器、输入、输出、天线、放大器、接收器单元、发射器单元、DSP、MSD、TCM编码器、TCM解码器、电源单元、电源馈线、通信接口、通信协议等，它们适当地布置在一起以执行解决方案。

特别地，例如，电子设备100和网络接入节点300的一个或多个处理器可以包括中央处理单元(Central Processing Unit，CPU)、处理单元、处理电路、处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、微处理器，或其它可以解释和执行指令的处理逻辑的一个或多个实例。表述“处理器”因此可表示包括多个处理电路的处理电路，所述多个处理电路如以上列举项中的任何、一些或所有项。所述处理电路还可执行用于输入、输出以及处理数据的数据处理功能，所述数据处理功能包括数据缓冲和设备控制功能，如呼叫处理控制、用户界面控制等。

最后，应了解，本发明并不局限于上述实施例，而且涉及并且并入所附独立权利要求书的范围内的所有实施例。

Claims

1.一种用于预测用户(600)意图的电子设备(100)，其特征在于，所述电子设备(100)用于：

根据与所述用户(600)关联的上下文信息预测所述用户(600)的至少一个第一意图；

根据所述用户(600)的所述第一意图确定问题；

向所述用户(600)提出所述问题；

接收所述用户(600)对所述问题的响应；

根据所述用户(600)的所述第一意图和所述用户(600)对所述问题的所述响应，预测所述用户(600)的至少一个第二意图。

2.根据权利要求1所述的电子设备(100)，其特征在于，用于：

根据所述用户(600)的所述第二意图确定建议动作；

将所述建议动作提供给所述用户(600)。

3.根据权利要求1或2所述的电子设备(100)，其特征在于，用于：

根据所述用户(600)的所述第二意图确定建议信息；

将所述建议信息提供给所述用户(600)。

4.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，用于：

根据与所述用户(600)关联的上下文信息预测所述用户(600)的单个第一意图；

预测所述用户(600)的所述第二意图等于所述用户(600)的所述单个第一意图。

5.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，用于：

根据与所述用户(600)关联的上下文信息预测所述用户(600)的多个第一意图；

预测所述用户(600)的所述第二意图等于所述用户(600)的所述多个第一意图中所述用户(600)的单个第一意图。

6.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，所述问题为封闭式问题。

7.根据权利要求6所述的电子设备(100)，其特征在于，对所述封闭式问题的响应是肯定的或否定的。

8.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，所述设备用于根据与所述用户(600)关联的所述上下文信息，通过以下方式预测所述用户(600)的至少一个第一意图：

组合对应与所述用户(600)关联的多个上下文信息的多个稀疏向量，以获得组合稀疏向量；

根据所述组合稀疏向量的随机索引预测所述第一意图。

9.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，与所述用户(600)关联的所述上下文信息包括时间上下文信息和空间上下文信息。

10.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，所述设备用于根据所述用户(600)的所述第一意图，通过以下方式确定所述问题：

根据所述用户(600)的所述第一意图，在多个预定义问题中选择所述问题。

11.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，所述设备用于通过以下方式向所述用户(600)提出所述问题：

使用输出用户界面(120)将所述问题输出给所述用户(600)。

12.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，接收所述用户(600)对所述问题的所述响应包括：

使用输入用户界面(122)检测所述用户(600)的输入；

将所述用户(600)的所述输入转换为对所述问题的所述响应。

13.根据前述权利要求中任一项所述的电子设备(100)，其特征在于，所述用户(600)的所述第一意图和所述用户(600)的所述第二意图为所述用户(600)的动作或所述用户(600)的需求。

14.一种用于预测用户(600)意图的方法(200)，其特征在于，所述方法(200)包括：

根据与所述用户(600)关联的上下文信息预测(202)所述用户(600)的至少一个第一意图；

根据所述用户(600)的所述第一意图确定(204)问题；

向所述用户(600)提出(206)所述问题；

接收(208)所述用户(600)对所述问题的响应；

根据所述用户(600)的所述第一意图和所述用户(600)对所述问题的所述响应，预测(210)所述用户(600)的至少一个第二意图。

15.一种具有程序代码的计算机程序，其特征在于，当所述计算机程序在计算机中运行时，所述程序代码用于执行根据权利要求14所述的方法。