CN116670667A

CN116670667A - Ai系统中的接入认证

Info

Publication number: CN116670667A
Application number: CN202180071406.7A
Authority: CN
Inventors: S·克瓦特拉; C·J·哈迪; S·K·拉克什特; G·考尔
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2020-11-05
Filing date: 2021-10-19
Publication date: 2023-08-29
Also published as: US20220138296A1; GB2616139B; GB202306189D0; US11687633B2; JP2023551089A; GB2616139A; DE112021005050T5; WO2022095686A1

Abstract

人工智能系统中的访问认证包括用第一用户的人工智能语音响应系统(AIVRS)电子地感知第二用户的物理存在。语音请求由第一用户的AIVRS生成并被传送到第二用户，请求访问由第二用户的AIVRS存储的知识语料库。基于第二用户的语音响应，第一用户的AIVRS实例化与第二用户的AIVRS的电子通信会话。会话是经由与第二用户的便携式设备的电子通信连接发起的。由第一用户的AIVRS从第二用户的AIVRS检索知识库的选择的部分，该部分是基于语音响应来选择的。响应于由第一用户的AIVRS基于选择的部分解释的语音提示，发起一个或多个IoT设备的动作。

Description

AI系统中的接入认证

背景技术

本公开涉及基于计算机的数据交换，并且更具体地涉及被赋予人工智能的计算机系统之间的安全数据访问和交换。

据估计，超过一百万的美国家庭具有自动化系统，并且安装在美国家庭的智能设备的数量预计很快将超过5000万。智能设备被赋予人工智能(AI)并且可以根据用户的特定意图和偏好来操作。用户的意图和偏好是智能设备可以使用机器学习获取的知识库(knowledge corpus)的一部分。智能设备越来越多地彼此通信并且经由互联网或其他数据通信网络协调集成功能，从而形成物联网(IoT)。

发明内容

在一个或多个实施例中，一种方法包括用第一用户的人工智能(AI)语音响应系统以电子方式感知第二用户的物理存在。该方法包括：传送由第一用户的AI语音响应系统生成的语音请求，该语音请求请求访问由第二用户的AI语音响应系统电子地存储的知识库；以及从第二用户接收语音响应。该方法包括：由第一用户的AI语音响应系统基于该语音响应实例化与第二用户的AI语音响应系统的电子通信会话，该电子通信会话由第一用户的AI语音响应系统经由与第二用户的便携式设备的电子通信连接发起。该方法包括由第一用户的AI语音响应系统通过数据通信网络从第二用户的AI语音响应系统检索选择的知识库的部分，知识库的选择的部分是基于第二用户对第一用户的AI语音响应系统传送的语音请求的语音响应来选择的。该方法包括响应于由第一用户的AI语音响应系统基于知识库的选择的部分解释的语音提示，发起一个或多个IoT设备的动作。

在一个或多个实施例中，一种系统包括第一用户的人工智能(AI)语音响应系统，其可操作地与被配置为发起操作的处理器耦合。操作包括电子地感知第二用户的物理存在。操作包括传送访问由第二用户的AI语音响应系统以电子方式存储的知识库的语音请求并从第二用户接收语音响应。该操作包括通过第一用户的AI语音响应系统与第二用户的AI语音响应系统基于语音响应实例化电子通信会话，该电子通信会话经由与第二用户的便携式设备的电子通信连接发起。该操作包括经由数据通信网络从第二用户的AI语音响应系统检索知识库的选择的部分，知识库的选择的部分是基于第二用户对请求的语音响应来选择的。该操作包括响应于由第一用户的AI语音响应系统基于知识库的选择的部分解释的语音提示而发起一个或多个IoT设备的动作。

在一个或多个实施例中，计算机程序产品包括其上存储有指令的一个或多个计算机可读存储介质。指令可由可操作地耦合到第一用户的人工智能(AI)语音响应系统的处理器执行以发起操作。操作包括电子地感知第二用户的物理存在。操作包括传送访问由第二用户的人工智能(AI)语音响应系统电子地存储的知识库的语音请求并从第二用户接收语音响应。包括通过第一用户的语音响应系统与第二用户的AI语音响应系统基于语音响应实例化电子通信会话，该电子通信会话经由与第二用户的便携式设备的电子通信连接发起。操作包括经由数据通信网络从第二用户的AI语音响应系统检索知识库的选择的部分，知识库的选择的部分是基于第二用户对请求的语音响应来选择的。操作包括响应于由第一用户的AI语音响应系统基于知识库的选择的部分解释的语音提示而发起一个或多个IoT设备的动作。

提供本发明内容部分仅仅是为了引入某些概念，而不是为了识别要求保护的主题的任何关键或基本特征。从附图和以下详细描述中，创造性安排的其他特征将变得清晰。

附图简要说明

在附图中以举例的方式展示了创造性安排。然而，附图不应被解释为将创造性安排仅限于所示的特定实现。在参考以下详细说明并参照附图时，不同方面和优点将变得清晰。

图1描述了根据实施例的AI语音响应系统可操作的示例性计算环境，智能虚拟协助被赋予安全地访问远程存储的知识库的能力。

图2是根据实施例的利用一个AI语音响应系统安全地访问由另一个AI语音响应系统生成的知识库的方法的流程图。

图3示出了根据实施例的云计算环境。

图4示出了根据实施例的抽象模型层。

图5示出了根据实施例的云计算节点。

图6示出了根据实施例的示例便携式设备。

具体实施方式

虽然本公开以限定新颖特征的权利要求结束，但相信通过结合附图考虑描述，将更好地理解本公开中所描述的各种特征。提供本公开所述的过程、机器、制造及其任何变型以用于说明的目的。本公开中所描述的具体结构和功能细节不应被解释为限制，而是仅作为权利要求的基础和作为教导本领域技术人员以不同方式采用实际上任何适当详细结构中所描述的特征的代表性基础。进一步，本公开中使用的术语和短语并不旨在是限制性的，而是提供对所描述的特征的可理解的描述。

范围从个体设备到集成在IoT中的多个设备的不同类型的自动化系统和设备日益被赋予AI。例如，智能虚拟助理和聊天机器人实现自然语言理解(NLU)以创建人机界面，通过该人机界面，可以从人类话语中机器地确定语言结构和含义。

AI语音响应系统依赖于知识库来识别和执行语音、文本和/或语音至文本提示和命令，用于控制语音使能AI系统和用于对信息查询做出响应。如本文所定义的，“知识库”是包括词、短语和句子的集合的数据结构，其语法和语义表达个体的意图和偏好。意图和偏好分别对应于用于使设备执行动作的口头(语音或文本)命令以及用于设备执行动作的优选方式。例如，诸如“以比尔喜欢的方式给他准备一杯咖啡”的口头话语包括命令“自动咖啡机准备一杯咖啡”以及偏好“根据比尔的喜欢(例如，浓烈的、具有奶油的、并且没有糖)准备咖啡”。AI语音响应系统通过使用机器学习从过去的使用中“学习”构建知识库以识别说话者并理解话语的语法和语义，该AI语音响应系统可以通过根据比尔的偏好设置自动咖啡机的参数来对命令做出响应。

如本文所定义的，“人工智能语音响应系统(artificial intelligence voiceresponse system，AIVRS)”是提供NLU计算机-人类接口的任何系统，通过该NLU计算机-人类接口，基于用于选择、创建和/或修改用于控制自动化设备或系统的数据的人类话语来机器确定语言结构和含义，并且该NLU计算机-人类接口使用机器学习来从处理用户话语、监测用户活动的实例以及创建设备或系统的对应的使用历史或模式中学习设备或系统用户的意图和偏好。例如，AIVRS可以在基于云的服务器上执行的软件中实现。例如，在基于云的服务器上执行的AIVRS可通过经由数据通信网络(例如，互联网)连接到智能扬声器来与用户交互。智能扬声器可以包括扬声器和虚拟助理或聊天机器人，以促进与AIVRS的用户的口头交互。

不同用户将具有不同的语音特性，使用不同的话语，并且具有不同的活动模式，并且因此具有不同的知识库。特定知识库通常对应于特定个体。出于隐私和/或数据安全的原因，对特定用户的知识库的访问可限于特定个体。虽然这保护隐私并提供安全性，但是这种限制可限制用户使用他人的AIVRS的能力，因为通常阻止其他人的AIVRS访问先前用户的知识库。在没有这样的访问的情况下，另一用户的AIVRS不知道用户的意图和偏好，并且不能识别用户的命令或提示。例如，考虑个人访问朋友的家或同事的办公室的场景。朋友或同事可邀请该个人使用该朋友或同事的AIVRS来控制例如智能家里或办公室IoT设备，这是基于该个人的关于诸如环境温度、照明、背景音乐、或由自动咖啡机准备的咖啡中的糖量等事项的个人选择。在没有访问个人的知识库的情况下，个人不能利用朋友或同事的AIVRS来控制这些自动化功能中的任何功能。

本文公开的系统、方法和计算机程序产品的方面是实例化多个AIVRS之间的通信会话，以便于动态地向另一用户的AIVRS提供用户的知识库的选择的部分。知识库的选择的部分的提供使得第一用户的AIVRS能够捕获由第二用户的AIVRS学习的意图和偏好，并且能够响应于第二用户的提示和命令，同时保持第二用户的知识库的安全性。

在一种安排中，第一用户的AIVRS识别命令从第二用户发出或与第二用户有关，并且AIVRS不拥有关于第二用户的知识库以实现命令。因此，第一用户的AIVRS试图通过接合由第二用户携带或佩戴的附近的便携式设备(例如，智能电话、智能手表)来获得用于实现命令的知识库(或其相关部分)。如果第一用户的AIVRS确定需要许可并且从第二用户获得许可，则第一用户的AIVRS与第二用户的AIVRS实例化通信会话以获得对由第二用户的AIVRS生成的知识库的选择的部分的访问。第一用户的AIVRS可经由数据通信网络上的链路来实例化通信会话。

本文描述的安排涉及计算机技术，并提供对现有计算机技术的改进。该安排通过使AIVRS能够代表更广的用户群有效地起作用来改进计算机技术。通过减少通信开销(例如，所需的消息交换)来进一步改进计算机技术，以促进AIVRS获取知识库以代表更宽泛的用户群来操作。进一步的改进是知识库的相关部分的交换，同时保持更广泛的用户群的隐私以及对应于更广泛的用户群的知识库的安全性。

参考以下附图更详细地描述本公开中所描述的实施例的进一步方面。为了说明的简单和清晰的目的，图中所示的元件不一定按比例绘制。例如，为了清楚起见，一些元件的尺寸可能相对于其他元件被放大。此外，在认为适当的情况下，附图标记在附图中重复以指示对应的、类似的或类似的特征。

图1示出了示例计算环境100。计算环境100说明性地包括AIVRS 102和AVIRS 104。AIVRS 102和AVIRS 104各自可以在单独的计算机系统和/或单独的计算节点(未示出)中实现，诸如计算节点500(图5)。因此，每个计算节点可包括例如基于云的服务器。AIVRS 102和AIVRS 104两者说明性地以软件实施，软件可存储在存储器中且可在一个或一个以上计算机系统(例如，计算节点500的计算机系统512)的一个或一个以上处理器上执行。说明性地，AIVRS 102可操作地耦合到语音接口106。在一些实施例中，语音接口106是智能扬声器，该智能扬声器包括用于处理人机交互和用于控制经由有线或无线连接(例如，Wi-Fi、蓝牙)通信地耦合至语音接口106的IoT设备(未明确示出)的扬声器和集成虚拟助理。通过由语音接口106捕获并由AIVRS 102基于由AIVRS 102创建以对应于用户的知识库108识别的不同语音提示和命令来实现IoT设备的控制。知识库108说明性地存储在计算机系统的存储器上，该计算机系统与AIVRS 102在其上执行的计算机系统相同或操作地耦合到该计算机系统。

AIVRS 102可驻留在远离语音接口106的计算机节点(例如，基于云的服务器)上，并且IoT设备可操作地耦合到语音接口106，并且通过语音接口106耦合到AIVRS 102。在其他实施例中，AIVRS 102、语音接口106和知识库108可以集成在单个设备中，所述单个设备在处理能力、存储器存储等方面具有足够的计算资源以支持每个资源。语音接口106和连接的IoT设备可位于例如对应于知识库108的用户的智能的家里或办公室中。在其中AIVRS102和语音接口106彼此远离定位的某些实施例中，AIVRS 102可以经由数据通信网络110可操作地耦合到语音接口106。数据通信网络110可以是并且通常是互联网。数据通信网络110可以是或包括广域网(WAN)、局域网(LAN)或这些和/或其他类型的网络的组合，并且可以包括有线、无线、光纤和/或其他连接。

AIVRS 102提供自然语言理解(NLU)，通过该自然语言理解，可以从由语音接口106接收的人类话语中机器确定语言结构和含义。由语音接口106接收的语音命令和提示可被用来选择、创建、和修改电子存储器存储的数据以控制不同自动化系统和IoT设备(例如，电器、气候控制器、照明系统、娱乐系统、能量监视器)。语音接口106可响应于语音输入提供语音输出，语音输出还基于由AIVRS 102提供的NLU确定的语音输入的语言结构和含义来生成。

AIVRS 102基于用户对不同自动化系统或IoT设备的使用历史或模式，使用机器学习来迭代地构建对应于用户的知识库108。AIVRS 102将知识库存储为存储在电子存储器中的数据。对应于用户的电子存储器存储数据由与用户相关联的账户和/或其他凭证来标识。可基于用户对自动化系统和IoT设备的使用模式来为不同用户创建不同的知识库，该知识库作为数据存储在基于云的或其他服务器的电子存储器中。通过AIVRS使用基于语音的识别和验证来确定用户的唯一标识。在构建知识库108同时或之前，AIVRS 102使用机器学习来学习以基于用户的唯一语音特性(例如，声学信号模式)来识别知识库108所对应的用户。响应于作为人类话语而发出的命令或提示，AIVRS 102(其他AI语音响应系统也是如此)识别发出命令或提示的语音的用户。

AIVRS 102包括知识库访问器模块(knowledge corpus accessor module，KCAM)112。KCAM 112说明性地以在其中实现AIVRS 102的计算节点的计算机系统的一个或多个处理器上执行的软件来实现。在其他实施例中，KCAM 112可以在远离AIVRS 102但与AIVRS102可操作地耦合的计算机系统中实现。在其他实施例中，KCAM 112可以在专用电路或软件和电路的组合中实现。

在操作上，结合AIVRS 102的其他特征，KCAM 112使得用户能够参与与AIVRS 102的语音交互，尽管AIVRS尚未构建对应于该用户的知识语料库。虽然AIVRS 102不具有对应于将使AVIRS 102能够识别和实施用户的语音命令的用户的知识库，但是存在对应于用户的知识语料库114——虽然由AIVRS 104构造并且与AIVRS 104一起操作，其与AVIRS 102分离。AIVRS 104可在远离AIVRS 102的不同计算节点(例如，基于云的服务器)的不同计算机系统上操作，但即使在相同计算机系统(例如，基于云的服务器)上操作，AIVRS 104也不同于AIVRS 102。与AIVRS 102结合操作的KCAM 112使得用户能够通过经由AIVRS 104访问知识库114的选择的部分并将选择的部分提供给AVIRS 102同时保持知识库114的安全性来参与与AIVRS 102的语音交互。

KCAM 112检测AIVRS 102没有存储知识库的用户的物理存在。可根据以下详细描述的一个或多个过程来检测用户的物理存在。KCAM 112通过使AIVRS 102生成访问与该用户对应的单独存储的知识库的语音请求来响应于检测到用户的物理存在。AVIRS 102通过语音接口106将语音请求传达给用户。如果用户经由AIVRS 102通过语音接口106接收的语音提示以许可肯定地响应，则KCAM 112使AIVRS 102通过实例化与另一AIVRS的电子通信会话来访问适当的知识库。例如，在KCAM 112的指导下，AIVRS 102与包含知识语料库114的AVIRS 104实例化电子通信会话。

AVIRS 102可以经由与AIVRS 102没有为其存储知识库的用户的便携式设备116的电子通信连接发起电子通信会话。便携式设备116可以是由用户携带(例如，智能电话)或穿戴(例如，智能手表)的任何设备。便携式设备116可包括示例便携式设备600(图6)的一个或多个组件。电子通信连接可以包括语音接口106和用户的便携式设备116之间的无线连接118，通过该无线连接，口述到便携式设备中用于传送到AIVRS 104的第二用户的授权被无线地传送到便携式设备116。电子通信连接不需要主要是对等的。电子通信连接可以包括由AIVRS 104生成的授权，并且例如响应于第二用户说出到便携式设备116中的授权，通过数据通信网络110(例如，互联网)传送到AIVRS 102。授权向AIVRS 102提供用于实例化电子通信会话的信息(例如，IP地址)。

基于由语音接口106接收的授予访问知识库114的许可的用户语音响应，AVIRS102经由数据通信网络110从AIVRS 104检索知识库114的选择的部分。已经由AIVRS 104构造的知识库114对应于用户，并且由AIVRS 102接收的选择的部分可以是基于用户对请求的语音响应而选择的部分，KCAM 112使得AIVRS 102生成并通过语音接口106传达。

通过向知识库114的选择的部分授予许可，用户可使用由AIVRS 102基于从AIVRS104获取的知识库114的选择的部分而识别的话语来命令由AIVRS 102控制的自动化系统和IoT设备。

在涉及相同环境(例如，智能家里或办公室)中的两个个体的场景中，包括可由AIVRS 102识别的语音命令控制的IoT设备，例如，知识库108可能已经机器学习成识别仅由一个用户发出的命令。AIVRS 102可以对应于第一用户，并且已经通过机器学习来构建知识库108以识别第一用户的语音和提示，可以不识别第二用户的语音和提示。第一用户例如可以是常规(和合法的)用户，诸如智能家庭的所有者(或家庭成员)或智能办公室的占用者，其中AIVRS 102通过识别来自知识库108的电子存储数据的语音命令来控制IoT设备。

第二用户(例如，比尔)可以是访问环境(例如，智能家或办公室)的第一用户(例如，埃布尔)的访客或同事，其中IoT设备(例如，自动咖啡机)由AIVRS 102进行话音控制。如果第一用户(埃布尔)用语音提示唤醒AIVRS 102并且发出命令“根据比尔的偏好为比尔准备一杯咖啡”，则只有当AIVRS 102能够访问包括第二用户(比尔)的咖啡偏好的知识库时，AIVRS 102才可以接纳该命令。如果AIVRS 102不能接纳该命令，KCAM 112可以指导AIVRS102生成通过语音接口106传达的、陈述“对不起，我不知道比尔的咖啡偏好”的语音输出，并且发起用于访问能够对该命令进行有效响应的适当知识库的过程。

在操作上，KCAM 112可以指示AIVRS 102感知第二用户的存在，并且KCAM 112可以确定对应于第二用户的知识库是否作为数据电子地存储在AIVRS 102可访问的电子存储器中。如果是，则AIVRS 102可以根据电子存储的数据(包括对应于第二用户的知识库)，接纳根据第二用户的意图和偏好的命令。否则，KCAM 112使AIVRS 102生成请求，请求访问由不同AIVRS生成并存储并且对应于第二用户的知识库。

在某些实施例中，在访问知识库114的选择的部分时，基于经由第二用户的语音响应给出的许可的上下文，AIVRS 102访问数据(例如，意图和偏好)以创建用于执行给定操作(例如，自动咖啡准备)的本体图树(ontology graph tree)。如KCAM 112所指示的，通过最初获得用于资源认证的上下文数据以及通过提示AIVRS 104用于访问，本体图树或其他知识图可由AIVRS102创建。AIVRS 102可以从AIVRS 104提取知识库114的选择的部分并电子存储(至少暂时地)选择的部分。AIVRS 102可以基于所访问的知识库114的部分来创建对应于第二用户的使用模式。在某些实施例中，AIVRS 102实现用于识别使用模式和意图和偏好的深度学习神经网络。例如，AIVRS 102可实现双向LSTM(可用于时间序列或数据序列(例如，句子中的词)中的离散步骤之间的依赖性的统计学学习的前向和后向递归神经网络的组合)。双向LSTM可与推理跳(reasoning hop)一起使用以包括模式历史并确定第二用户的上下文数据。

第二用户在给出访问单独存储的知识库114的权限时可以发出具有访问权限的命令。生成知识库114的AIVRS 104基于语音识别识别第二用户并且分析第二用户的语音命令。基于语音命令，与知识库114相关联的AIVRS 104识别通过执行自然语言处理而授予对其的访问的选择的部分。已经获得对选择的部分的访问的AIVRS 102可以构建包含在选择的部分中的模式历史和意图和偏好等，从而使得AIVRS 102能够响应第二用户的一个或多个语音命令(例如，“以我喜欢我的咖啡的方式给我准备咖啡”)和/或关于第二用户的第一用户的一个或多个语音命令(例如，“以比尔喜欢他的咖啡的方式给他准备咖啡”)。

在不同的实施例中，KCAM 112可以用不同方式感测第二用户的物理存在。例如，如上所述，AIVRS 102已经为其创建知识库的第一用户可以发出引用AIVRS 102没有为其创建知识库的第二用户的命令。KCAM 112使用自然语言处理可以确定该“引用”是针对与当前存储的知识库不相关联的姓名(例如，“比尔”)并且可以发起已经描述的知识库访问过程。

在其他实施例中，KCAM 112可以基于语音识别来区分AIVRS 102已经为其创建知识库的第一用户的语音和没有知识库可供AIVRS 102使用的个人(第二用户)的语音。在其他实施例中，AIVRS 102可操作地与一个或多个IoT相机耦合。基于应用于一个或多个IoT相机所捕捉的面部图像的面部识别，KCAM 112可在第一用户和第二用户之间进行区分，第一用户的面部图像对应于AIVRS 102已经为其创建知识库的某人，第二用户的面部图像是AIVRS 102先前尚未与之交互的某人的。

在不同场景中的任意场景中，KCAM 112可以响应于感测到AIVRS 102没有对其访问现有知识库的用户的存在而发起已经描述的知识库访问过程。例如，在基于面部识别来感测存在的实施例中，KCAM 112可以被配置成用于使用机器对机器通信协议经由代表性状态转移应用程序接口(representational state transfer application programinterface，REST API)与一个或多个IoT相机交互，以便使用快速卷积神经网络(快速CNN)确定视觉上下文数据。KCAM 112最初基于经由快速CNN获得用于资源认证的上下文数据并且生成提取单独存储的知识库(例如，知识库114)的选择的部分并存储(至少暂时地)对应用户的选择的意图和偏好的提示，指导AIVRS 102创建知识图。KCAM 112可指导AIVRS 102基于双向-LSTM模型的迭代应用创建模式历史，该模式历史与推理跳跃一起使用以包括对应用户的模式历史，以及基于此的意图和偏好，用于使用选择的部分响应语音命令。

可选地，一旦AIVRS 102已经被授予访问远程定位的知识库的许可，用户授予许可可以另外用语音命令授权AIVRS 102存储(例如，在基于云的服务器上)选择的部分以供后续会话中使用。通过语音命令授予许可的用户可以具体地指定可以存储哪些部分以及存储多长时间。例如，用户可以指定AIVRS 102永久可访问用户的咖啡冲泡偏好，但是在指定时间(例如，两小时)内丢弃某些其他意图和偏好。在默认模式中，没有从用户授予初始访问接收到保留提示(或其他语音命令)时，AIVRS 102在经过预定时间间隔(例如，24小时)之后丢弃知识库的检索到的选择的部分。

在某些实施例中，KCAM 112仅在首先确定感测到其存在的用户不与已存储的知识库相关联之后指导AIVRS 102发起知识库访问请求的生成和传送。由此，对于先前已经授权AIVRS 102许可来存储知识库的选择的部分的用户，不需要在AIVRS 102和另一AIVRS之间实例化新的通信会话来访问远程存储的知识库。在其他实施例中，用户不需要授权对知识语料库的选择的部分的存储，而是可以允许AIVRS 102存储用于实例化通信会话和获得对知识库的访问的活动许可(但是仅在选择性的基础上)。可以响应于AIVRS 102寻求对其访问远程定位的知识库的用户的语音命令来发起每个会话。语音命令可指定在每个单独的会话中对知识库的不同部分的选择。

例如，在关于第二用户的任何上述场景中，已授权AIVRS 102对知识库114的访问的第二用户可以另外指定：在后续会话中，AIVRS 102可以再次访问知识库，但仅响应于新语音提示并且仅仅关于在每个新提示中指定的选择的部分。因此，在后一会话中，第二用户可以发出新提示，该新提示准许AIVRS102访问第二用户的咖啡冲泡偏好，以使AIVRS 102响应于语音命令用于控制自动咖啡机。在后一会话中，第二用户可以语音准许AIVRS 102再次访问知识库114，但仅关于与第二用户的音乐偏好有关的选择的部分，以使AIVRS 102能够响应于第二用户的新语音命令用于控制娱乐系统。然而，在任何一种情况下，AIVRS 102是否具有存储相应偏好(咖啡或音乐偏好)超过短时间的许可，以促进实时或近实时的交互。

在一些实施例中，KCAM 112还可以为第一用户(即，定期地(并且合法地)与AIVRS102交互并且AIVRS为其创建知识库108的用户)并入某些安全特征。在一种安排中，第一用户可以指定AIVRS 102从不对第二用户的某些指定的语音命令作出响应，而不管第二用户授予访问第二用户自己的知识库的许可。例如，除了响应于第一用户的语音命令，可以阻止AIVRS 102改变或脱离安全系统(例如，经由单独的语音命令)。此外，KCAM 112可以使第一用户能够创建信任圈。信任圈指定(例如，基于语音和/或面部识别)身份和AIVRS 102可基于谁发声命令来对其作出响应的特定命令。信任圈可以可选地是分层结构，由此允许不同等级的用户发出不同类型的语音命令。例如，提供对他们自己的知识库的访问的拜访朋友可以具有比仅仅熟人(例如，第二层级)更宽的命令纬度(例如，第一层级)。

在一些实施例中，KCAM 112可以在感知AIVRS 102不具有现有知识库的用户的存在之前搜索可公开访问的知识库或其部分。KCAM 112可以响应于指示AIVRS 102不具有现有知识库的个人的未来存在的数据来发起搜索。例如，KCAM 112可以被配置成用于间歇地(例如，每天)搜索IoT日历系统。通过搜索IoT日历系统或与第一用户相关联的其他数据源，KCAM 112可以获得AIVRS 102不具有现有知识库的第二用户被预期在第一用户的IoT设备的操作附近(例如，在智能的家或办公室内)的数据(例如，日期和时间)。KCAM 112可以在搜索第二用户的公共可访问的意图和偏好时搜索例如第一用户的一个或多个数据库(例如，关于与第二用户的先前相遇的计算机注释)或与第二用户的名称相关联的公共可访问的站点(例如，社交网络站点、相关联的专业或商业组织网站)。

日历系统或与第一用户相关联的其他数据源可指示第二用户的将来存在的性质。例如，日历可以指定第一用户在社交上或在商业上与第二用户见面。KCAM 112可以发起对可公开访问的知识库的搜索，以识别第二用户的关于咖啡和/或环境温度的意图和偏好，如KCAM 112合理预期的那些意图和偏好是在第二用户可允许提供给AIVRS 102的语音命令之中。当作为主人的第一用户邀请第二用户关于咖啡或温度的语音命令时，可以由AIVRS 102存储意图和偏好，以对第二用户的语音命令做出响应，该语音命令表达对由自动咖啡机做出的咖啡和/或中央空调系统的温度设置的偏好。

可选地，在没有从公共可用的知识库获得信息的情况下，KCAM 112可以提示AIVRS102生成并向第二用户(例如，经由蜂窝电话或数据通信网络116)传达文本或其他电子消息，例如请求对第二用户的AIVRS(例如，AIVRS 104)的知识库的预先访问的电子邮件。预先访问使得AIVRS 102能够存储第二用户的意图和偏好，以便在语音接口106的操作附近的第一和第二用户之间的即将到来的交互期间使用。

图2是根据一个实施例的由一个AIVRS安全地访问由另一个AIVRS生成的知识库的方法200的流程图。如参考图1所描述的，方法200可以由包括与第一用户的AIVRS可操作地耦合或集成在其中的KCAM的系统来执行。在框202处，系统利用第一用户的AIVRS电子地感知第二用户的物理存在。

在框204处，系统传送由第一用户的AIVRS生成的请求访问由第二用户的AIVRS电子地存储的知识库的语音请求。该系统可从第二用户接收语音响应。第二用户的语音响应可准许访问由第二用户的AIVRS电子地存储的知识库。

在框206处，基于语音响应，系统利用第一用户的AIVRS实例化与第二用户的AIVRS的电子通信会话。电子通信会话可以由第一用户的AIVRS经由与第二用户的便携式设备的电子通信连接发起。便携式设备可以是，例如，由第二用户携带或佩戴的智能电话、智能手表、或其他此类设备。第一用户的AIVRS与便携式设备之间的电子通信连接可包括第一用户的AIVRS的语音接口与便携式设备之间的无线连接。可以向语音接口无线传送第二用户对便携式设备说出的用于传送给第二用户的AIVR的授权。电子通信连接可以包括例如由便携式设备通过数据通信网络(例如，互联网)传送到第二用户的AIVRS和第一用户的AIVRS的授权。授权向第一用户的AIVRS提供用于实例化电子通信会话所需的网络信息(例如，IP地址)。

在框208处，系统由第一用户的AIVRS经由数据通信网络从第二用户的AIVRS检索知识库的选择的部分。基于第二用户对第一用户的AIVRS传送的语音请求的语音响应来选择知识库的选择的部分。

在框210处，该系统响应于语音命令(或其他语音提示)来发起一个或多个IoT设备的一个或多个动作。语音命令可由第二用户发出，或由第一用户引用(提及)第二用户而发出。语音命令由第一用户的AIVRS基于知识库的选择的部分来解释。

在一些实施例中，系统响应于由第一用户的AIVRS搜索电子存储器存储的数据并且确定电子存储器存储的数据缺少电子存储的先前许可、以及知识库的选择的部分而传送语音请求。系统响应于确定电子存储器存储的数据包括电子存储的先前许可并且接收到对访问知识库的请求的响应而经由数据通信网络检索知识库的选择的部分。响应于确定电子存储器存储的数据已经包括知识库的选择的部分，系统避免经由数据通信网络检索选择的部分。

在一些实施例中，系统通过用第一用户的AIVRS识别第一用户的语音提示以及用第一用户的AIVRS识别对第二用户的引用来感知第二用户，第二用户的身份先前不为第一用户的AIVRS所知。附加地或可替代地，在某些实施例中，该系统通过基于由操作地耦合到第一用户的AIVRS的IoT相机捕捉的图像来执行第二用户的视觉识别来感知第二用户。

在一些实施例中，系统可以使用第一用户的AIVRS来获取第二用户信息，以从通信地耦合到第一用户的AIVRS的第一用户的设备捕获数据。数据可对应于第一用户的AIVRS可用于对第二用户的语音命令做出响应的第二用户的意图和偏好(例如，咖啡冲泡偏好)。例如，第一用户的设备可以是其中存储第一用户和第二用户之间的电子邮件交换的计算机，其中第二用户描述第二用户偏好咖啡的方式。或者，例如，第一用户的设备可以是智能电话，其中存储文本消息，其中第二用户描述喜爱的音乐种类。第一用户的AIVRS可以使用该数据来为第二用户构建其自己的知识库，第一用户的AIVRS可以使用该数据来对请求自动咖啡机为第二用户准备咖啡的语音命令或来自第二用户的请求娱乐系统播放音乐的语音命令做出响应。

系统可以丢弃由第一用户的AIVRS接收的第二用户的知识库的选择的部分。如果预定时间间隔过去，系统没有从第二用户接收到保留提示，系统可以自动丢弃选择的部分。如果第二用户希望第一用户的AIVRS电子地存储选择的部分，则第二用户可以语音指定用于电子地存储选择的部分的持续时间的命令。

应明确注意，虽然本公开包括关于云计算的详细描述，但是本文所陈述的教导的实现不限于云计算环境。相反，本发明的实施例能够结合现在已知的或以后开发的任何其他类型的计算环境来实现。

云计算是服务交付的模型，用于使得能够方便地、按需地网络访问可配置计算资源(例如，网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池，所述可配置计算资源可以以最小的管理努力或与所述服务的提供者的交互来快速供应和释放。该云模型可以包括至少五个特性、至少三个服务模型和至少四个部署模型。

特性如下：

按需自助服务：云消费者可以单方面地根据需要自动地提供计算能力，诸如服务器时间和网络存储，而不需要与服务的提供者的人工交互。

广泛的网络接入：能力可通过网络获得并且通过标准机制接入，该标准机制促进异构瘦客户机平台或厚客户机平台(例如，移动电话、膝上型计算机和PDA)的使用。

资源池：提供者的计算资源被池化以使用多租户模型来服务于多个消费者，其中不同的物理和虚拟资源根据需要动态地指派和重新指派。存在位置独立性的感觉，因为消费者通常不具有对所提供的资源的确切位置的控制或了解，但可能能够以较高抽象级别(例如，国家、州或数据中心)指定位置。

快速弹性：能够快速和弹性地提供能力，在一些情况下自动地快速缩小和快速释放以快速放大。对于消费者而言，可用于供应的能力通常显得不受限制并且可以在任何时间以任何数量购买。

测量的服务：云系统通过在适合于服务类型(例如，存储、处理、带宽和活动用户账户)的某个抽象级别处利用计量能力来自动控制和优化资源使用。可以监视、控制和报告资源使用，为所利用的服务的提供者和消费者提供透明度。

服务模型如下：

软件即服务(SaaS)：提供给消费者的能力是使用在云基础设施上运行的提供者的应用。可通过诸如web浏览器(例如，基于web的电子邮件)之类的瘦客户端接口从不同客户端设备访问应用。消费者不管理或控制包括网络、服务器、操作系统、存储或甚至单独的应用能力的底层云基础设施，可能的例外是有限的用户特定应用配置设置。

平台即服务(PaaS)：提供给消费者的能力是将消费者创建的或获取的使用由提供商支持的编程语言和工具创建的应用部署到云基础设施上。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施，但是对所部署的应用和可能的应用托管环境配置具有控制。

基础设施即服务(IaaS)：提供给消费者的能力是提供处理、存储、网络和消费者能够部署和运行任意软件的其他基本计算资源，软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施，而是具有对操作系统、存储、所部署的应用的控制以及对所选联网组件(例如，主机防火墙)的可能受限的控制。

部署模型如下：

私有云：云基础架构仅为组织运作。它可以由组织或第三方管理，并且可以存在于场所内或场所外。

社区云：云基础架构被若干组织共享并支持共享了关注(例如，任务、安全要求、策略、和合规性考虑)的特定社区。它可以由组织或第三方管理，并且可以存在于场所内或场所外。

公共云：使云基础架构对公众或大型行业组可用，并且由出售云服务的组织拥有。

混合云：云基础架构是两个或更多个云(私有、社区或公共)的组合，这些云保持唯一实体但通过使数据和应用能够移植的标准化或专有技术(例如，云突发以用于云之间的负载平衡)绑定在一起。

云计算环境是面向服务的，集中于无状态、低耦合、模块化和语义互操作性。云计算的核心是包括互连节点网络的基础设施。

现在参见图3，描述了说明性云计算环境300。如图所示，云计算环境300包括云消费者使用的本地计算设备可以与其通信的一个或多个云计算节点310，本地计算设备诸如个人数字助理(PDA)或蜂窝电话340a、台式计算机340b、膝上型计算机340c和/或汽车计算机系统340n。计算节点310可彼此通信。它们可以物理地或虚拟地分组(未示出)在一个或多个网络中，诸如如上所述的私有云、社区云、公共云或混合云、或其组合。这允许云计算环境300提供基础架构、平台和/或软件作为云消费者不需要为其维护本地计算设备上的资源的服务。应当理解，图3中所示的计算设备340a-n的类型仅旨在是说明性的，并且计算节点310和云计算环境300可以通过任何类型的网络和/或网络可寻址连接(例如，使用网络浏览器)与任何类型的计算机化设备通信。

现在参考图4，示出了由云计算环境300(图3)提供的一组功能抽象层。应提前理解，图4中所示的组件、层和功能仅旨在是说明性的，并且本发明的实施例不限于此。如所描述，提供以下层和对应功能：

硬件和软件层460包括硬件和软件组件。硬件组件的示例包括主机461；基于RISC(精简指令集计算机)架构的服务器462；服务器463；刀片服务器464；存储设备465；以及网络和网络组件466。在一些实施例中，软件组件包括网络应用服务器软件467和数据库软件468。

虚拟化层470提供抽象层，从该抽象层可以提供虚拟实体的以下示例：虚拟服务器471；虚拟存储472；虚拟网络473，包括虚拟专用网络；虚拟应用和操作系统474；以及虚拟客户端475。

在一个示例中，管理层480可提供如下所述的功能。资源供应481提供用于在云计算环境内执行任务的计算资源和其他资源的动态采购。计量和定价482在云计算环境内利用资源时提供成本跟踪，并为这些资源的消费开账单或发票。在一个示例中，这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证，以及为数据和其他资源提供保护。用户门户483为消费者和系统管理员提供对云计算环境的访问。服务水平管理484提供云计算资源分配和管理，使得满足所需的服务水平。服务水平协议(SLA)规划和履行485提供根据SLA预期未来需求的云计算资源的预安排和采购。

工作负载层490提供可以利用云计算环境的功能的示例。可以从该层提供的工作负荷和功能的示例包括：地图和导航491；软件开发和生命周期管理492；虚拟教室教育递送493；数据分析处理494；交易处理495；以及AIVRS 496，其中集成了KCMA或与KCMA操作地耦合。

图5示出了计算节点500的实例的示意图。在一个或多个实施例中，计算节点500是合适的云计算节点的示例。计算节点500不旨在对本文所述的本发明的实施例的使用或功能的范围提出任何限制。计算节点500能够执行本公开中所描述的任何功能。

计算节点500包括计算机系统512，其可与许多其他通用或专用计算系统环境或配置一起操作。适于与计算机系统512一起使用的众所周知的计算系统、环境和/或配置的示例包括但不限于个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机系统、大型计算机系统和包括以上系统或设备中的任一个的分布式云计算环境等。

计算机系统512可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般上下文中描述。一般而言，程序模块可包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、逻辑、数据结构等。计算机系统512可以在分布式云计算环境中实践，其中任务由通过通信网络链接的远程处理设备执行。在分布式云计算环境中，程序模块可以位于包括存储器存储设备的本地和远程计算机系统存储介质中。

如图5所示，计算机系统512以通用计算设备的形式示出。计算机系统512的组件可以包括但不限于一个或多个处理器516、存储器528和将包括存储器528的不同系统组件耦合到处理器516的总线518。如本文所定义的，“处理器”是指被配置为执行指令的至少一个硬件电路。硬件电路可以是集成电路。处理器的示例包括但不限于中央处理单元(CPU)、阵列处理器、矢量处理器、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、专用集成电路(ASIC)、可编程逻辑电路和控制器。

由处理器执行计算机程序的指令包括执行或运行程序。如本文所定义的，“运行”和“执行”包括由处理器根据一个或多个机器可读指令执行的一系列动作或事件。如本文所定义的，“运行”和“执行”是指处理器主动执行动作或事件。术语运行(run)、运行(running)、执行(execute)和执行(executing)在本文中同义地使用。

总线518表示若干类型的总线结构中的任何一种中的一个或多个，包括存储器总线或存储器控制器、外围总线、加速图形端口、以及使用各种总线架构中的任一种的处理器或局部总线。仅作为示例而非限制，此类架构包括工业标准架构(ISA)总线、微通道架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)局部总线、外围组件互连(PCI)总线和PCI Express(PCIe)总线。

计算机系统512通常包括各种计算机系统可读介质。这样的介质可以是可由计算机系统512访问的任何可用介质，并且可以包括易失性和非易失性介质、可移动和不可移动介质。

存储器528可包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)530和/或高速缓冲存储器532。计算机系统512可以进一步包括其他可移动/不可移动、易失性/非易失性计算机系统存储介质。举例来讲，存储系统534可以被提供用于从不可移除的非易失性磁性介质和/或固态驱动器(未示出，并且通常被称为“硬盘驱动器”)进行读取和写入。尽管未示出，可以提供用于从可移动非易失性磁盘(例如，“软盘”)读取或向其写入的磁盘驱动器，以及用于从可移动非易失性光盘(如CD-ROM、DVD-ROM或其他光学介质)读取或向其写入的光盘驱动器。在这样的情况下，每一个可以通过一个或多个数据介质接口连接到总线518。如以下将进一步描绘和描述的，存储器528可以包括具有被配置成用于执行本发明的实施例的功能的一组(例如，至少一个)程序模块的至少一个程序产品。

具有一组(至少一个)程序模块542的程序/实用程序540以及操作系统、一个或多个应用程序、其他程序模块和程序数据可以通过示例而非限制的方式存储在存储器528中。操作系统、一个或多个应用程序、其他程序模块和程序数据中的每一个或它们的一些组合可以包括网络环境的实现方式。程序模块542通常执行如在此所描述的本发明的实施例的功能和/或方法。例如，程序模块中的一个或多个可以包括AIVRS 596、其部分，其中，KCMA被集成到或操作地耦合到AIVRS 596。

程序/实用程序540可由处理器516执行。程序/实用程序540和由计算机系统512使用、生成和/或操作的任何数据项是当由计算机系统512使用时赋予功能的功能数据结构。如在本公开内所定义的，“数据结构”是数据模型的数据在物理存储器内的组织的物理实现。照此，数据结构由存储器中的特定电或磁结构元件形成。数据结构对存储在存储器中的数据施加物理组织，如由使用处理器执行的应用程序所使用的。

计算机系统512还可以与一个或多个外部设备514通信，例如键盘、定点设备、显示器524等；使用户能够与计算机系统512交互的一个或多个设备；和/或使计算机系统512能够与一个或多个其他计算设备通信的任何设备(例如，网卡、调制解调器等)。这样的通信可经由输入/输出(I/O)接口522发生。而且，计算机系统512可经由网络适配器520与诸如局域网(LAN)、通用广域网(WAN)和/或公共网络(例如，互联网)的一个或多个网络通信。如图所示，网络适配器520通过总线518与计算机系统512的其他部件通信。应当理解，虽然未示出，但是其他硬件和/或软件组件可以与计算机系统512结合使用。示例包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器和数据归档存储系统等。

虽然计算节点500用于示出云计算节点的实例，但应当理解，使用与结合图5描述的架构相同或相似的架构的计算机系统可用于非云计算实现中以执行本文描述的不同操作。就这一点而言，本文描述的举例实施例不旨在限于云计算环境。计算节点500是数据处理系统的示例。如在此定义的，“数据处理系统”是指被配置成用于处理数据的一个或多个硬件系统，每个硬件系统包括被编程为启动操作的至少一个处理器和存储器。

计算节点500是计算机硬件的示例。根据所实现的设备和/或系统的特定类型，计算节点500可包括比图5中示出的更少的组件或未示出的额外组件。所包括的特定操作系统和/或应用可根据设备和/或系统类型而改变，所包括的I/O设备的类型也可改变。进一步，说明性组件中的一者或一者以上可并入到另一组件中或以其他方式形成另一组件的一部分。例如，处理器可以包括至少一些存储器。

计算节点500也是服务器的示例。如本文所定义的，“服务器”是指被配置为与一个或多个其他数据处理系统共享服务的数据处理系统。如本文所定义的，“客户端设备”是指从服务器请求共享服务的数据处理系统，并且用户直接与该数据处理系统交互。客户端设备的实例包括但不限于工作站、台式计算机、计算机终端、移动计算机、膝上型计算机、上网本计算机、平板计算机、智能电话、个人数字助理、智能手表、智能眼镜、游戏设备、机顶盒、智能电视等。在一个或多个实施例中，在此描述的不同用户设备可以是客户端设备。网络基础设施(如路由器、防火墙、交换机、接入点等)不是客户端设备，因为在此定义了术语“客户端设备”。

图6示出了根据本公开中描述的一个或多个实施例的示例便携式设备600。便携式设备600可以包括存储器602、一个或多个处理器604(例如，图像处理器、数字信号处理器、数据处理器)、以及接口电路606。

在一个方面，存储器602、(一个或多个)处理器604和/或接口电路606被实现为单独的组件。在另一方面，存储器602、(一个或多个)处理器604和/或接口电路606被集成在一个或多个集成电路中。便携式设备600的不同组件可以例如通过一个或多个通信总线或信号线(例如，互连和/或电线)耦合。在一个方面，存储器602可以经由存储器接口(未示出)耦合到接口电路606。

传感器、设备、子系统和/或输入/输出(I/O)设备可以耦合至接口电路606以促进本文中所描述的功能和/或操作，包括传感器数据的生成。不同传感器、设备、子系统和/或I/O设备可以直接或通过一个或多个中间I/O控制器(未示出)耦合到接口电路606。

例如，位置传感器610、光传感器612和接近传感器614可以耦合到接口电路606以分别促进便携式设备600的定向、照明和接近功能。位置传感器610(例如，GPS接收器和/或处理器)可以连接到接口电路606以提供地理定位传感器数据。电子磁力计618(例如，集成电路芯片)可以连接到接口电路606以提供传感器数据，该传感器数据可以用于确定磁北的方向以用于定向导航的目的。加速度计620可以连接至接口电路606以提供传感器数据，该传感器数据可以用于确定设备的三维移动速度和方向的变化。高度计622(例如，集成电路)可连接到接口电路606以提供可用于确定高度的传感器数据。语音记录器624可以连接到接口电路606以存储记录的话语。

相机子系统626可耦合至光学传感器628。光学传感器628可使用多种技术中的任一者来实施。光学传感器628的实例包括电荷耦合器件(CCD)、互补金属氧化物半导体(CMOS)光学传感器等。相机子系统626和光学传感器628可以用于促进相机功能，如记录图像和/或视频剪辑(以下称为“图像数据”)。在一个方面中，图像数据是传感器数据的子集。

可通过一个或多个无线通信子系统630促进通信功能。(一个或多个)无线通信子系统630可以包括射频接收器和发射器、光学(例如，红外)接收器和发射器等。无线通信子系统630的特定设计和实现可取决于所实现的便携式设备600的特定类型和/或便携式设备600旨在在其上操作的通信网络。

出于说明的目的，无线通信子系统630可被设计成在一个或多个移动网络(例如，GSM、GPRS、EDGE)、可包括WiMax网络的Wi-Fi网络、短距离无线网络(例如，蓝牙网络)、和/或上述各项的任何组合上操作。(一个或多个)无线通信子系统630可以实现托管协议，使得便携式设备600可以被配置为其他无线设备的基站。

音频子系统632可耦合到扬声器634和麦克风636以促进启用语音的功能，诸如语音识别、语音复制、数字记录、音频处理和电话功能。音频子系统632能够生成音频类型传感器数据。在一个或多个实施例中，麦克风636可以被用作呼吸器传感器。

I/O设备638可耦接至接口电路606。I/O设备638的示例包括例如显示设备、触敏显示设备、跟踪板、键盘、定点设备、通信端口(例如，USB端口)、网络适配器、按钮或其他物理控件等。触敏设备(诸如显示屏和/或垫)被配置成使用各种触敏技术中的任何技术来检测接触、移动、接触中断等。示例触敏技术包括例如电容、电阻、红外和表面声波技术、其他接近传感器阵列或用于确定与触敏设备的一个或多个接触点的其他元件等。I/O设备638中的一个或多个可适于控制便携式设备600的传感器、子系统和此类的功能。

便携式设备600进一步包括电源640。电源640能够向便携式设备600的各种元件提供电力。在一个实施例中，电源640实现为一个或多个电池。电池可以使用多种不同电池技术中的任何一种来实现，无论是一次性的(例如，可替换的)还是可再充电的。在另一实施例中，电源640被配置为从外部源获得电力并且向便携式设备600的元件提供电力(例如，DC电力)。在可再充电电池的情况下，电源640还可以包括当耦合到外部电源时能够对电池或多个电池充电的电路。

存储器602可以包括随机存取存储器(例如，易失性存储器)和/或非易失性存储器，诸如一个或多个磁盘存储设备、一个或多个光学存储设备、闪存等。存储器602可以存储操作系统652，诸如LINUX、UNIX、移动操作系统、嵌入式操作系统等。操作系统652可以包括用于处理系统服务和用于执行硬件相关任务的指令。

存储器602可以存储额外的程序代码654。其他程序代码654的示例可以包括用于促进与一个或多个额外的设备、一个或多个计算机和/或一个或多个服务器通信的指令；用于促进传感器相关功能；电话相关功能；电子消息相关功能；Web浏览相关功能；媒体处理相关功能；GPS和导航相关功能；安全功能；相机相关功能，包括网络相机和/或Web视频功能；等等。程序代码可包含用于在便携式设备中实施智能虚拟助理(intelligent virtualassistant，IVA)的程序代码，IVA是在处理器604上执行的IVA程序代码656中实施的。IVA可与例如在远程基于云的服务器上执行的AIVRS交互。存储器602还可存储一个或多个其他应用662。

出于说明而非限制的目的，提供所描述的不同类型的指令和/或程序代码。程序代码可以被实现为单独的软件程序、过程或模块。存储器602可以包括附加指令或更少指令。此外，便携式设备600的不同功能可以在硬件和/或软件中实现，包括在一个或多个信号处理和/或专用集成电路中实现。

存储在存储器602内的程序代码和由便携式设备600使用、生成和/或操作的任何数据是当被用作设备的一部分时向设备赋予功能的功能数据结构。功能数据结构的其他实例包括例如传感器数据、经由用户输入获得的数据、经由查询外部数据源获得的数据、基线信息等。术语“数据结构”是指数据模型的数据在物理存储器内的组织的物理实现方式。照此，数据结构由存储器内的特定电或磁结构元件形成。数据结构对存储在存储器中由处理器使用的数据施加物理组织。

在某些实施例中，参考便携式设备600描述的各种传感器和/或子系统中的一个或多个可以是通过有线或无线连接耦接到或通信地链接到便携式设备600的单独的设备。例如，位置传感器610、光传感器612、接近传感器614、陀螺仪616、磁力计618、加速度计620、高度计622、录音机624、相机子系统626、音频子系统632等中的一者或一者以上(或全部)可实施为通过I/O设备638和/或无线通信子系统630操作地耦合到便携式设备600的单独系统或子系统。

根据实施的系统的具体类型，便携式设备600可包括比图6中所示的部件更少的部件或者包括除了图6中所示的部件以外的额外部件。此外，所包括的特定操作系统和/或应用和/或其他程序代码还可以根据系统类型而变化。此外，说明性组件中的一个或多个可以被合并到另一个组件中或以其他方式形成另一个组件的一部分。例如，处理器可以包括至少一些存储器。

便携式设备600被提供用于说明而非限制的目的。被配置为执行本文所述的操作的设备和/或系统可具有与图6中所示的不同的架构。该架构可为便携式设备600的简化版本，且可包含处理器和存储指令的存储器。该架构可包括如本文所描述的一个或多个传感器。便携式设备600或类似系统可以使用设备的不同传感器或耦合到其的传感器来收集数据。然而，应理解，便携式设备600可包含较少传感器或其他额外传感器。在本公开中，由传感器生成的数据被称为“传感器数据”。

便携式设备600的示例实现包括例如能够感测和处理传感器检测信号和数据的智能电话或其他移动设备或电话、可穿戴计算设备(例如，智能手表)、专用医疗设备或其他合适的手持式、可穿戴或舒适地可承载的电子设备。应当理解，各实施例可被部署为独立设备或部署为分布式客户机-服务器联网系统中的多个设备。例如，在某些实施例中，智能手表可以可操作地耦合到移动设备(例如，智能电话)。移动设备可以被配置为或可以不被配置为与远程服务器和/或计算机系统交互。

本文中使用的术语仅用于描述具体实施方式的目的，而并非旨在进行限制。尽管如此，现在将呈现贯穿本文档应用的若干定义。

如本文中的定义，除非上下文另有明确指示，否则单数形式“一个(a)”、“一种(an)”和“该(the)”也包括复数形式。

如本文所定义的，“另一个”是指至少第二个或更多个。

如在此所定义的，“至少一个”、“一个或多个”、以及“和/或”是开放式表达，它们在操作中既是结合的也是分离的，除非另外明确地陈述。例如，表述“A、B和C中的至少一个”、“A、B或C中的至少一个”、“A、B和C中的一个或多个”、“A、B或C中的一个或多个”、以及“A、B和/或C”中的每一个表示单独的A、单独的B、单独的C、A和B、A和C、B和C、或A、B和C。

如本文所定义的，“自动地”指没有用户干预。

如本文所定义的，“包括(includes)”、“包括(including)”、“包括(comprises)”和/或“包括(comprising)”指定所陈述的特征、整体、步骤、操作、元件和/或部件的存在，但不排除一个或多个其他特征、整体、步骤、操作、元件、部件和/或其组合的存在或添加。

如在此定义的，取决于上下文，“如果(if)”是指“响应于(in response to)”或“响应于(responsive to)”。因此，取决于上下文，短语“如果确定”可被解释为意指“响应于确定(in response to determining)”或“响应于确定(responsive to determining)”。同样地，取决于上下文，短语“如果检测到[所陈述的条件或事件]”可以被解释为意指“在检测到[所陈述的条件或事件]”或“响应于检测到[所陈述的条件或事件](in response todetecting[the stated condition or event])”或“响应于检测到[所陈述的条件或事件](responsive to detecting[the stated condition or event])”。

如在此定义的，“一个实施例”、“实施例”、“在一个或多个实施例中”、“在具体实施例中”、或类似语言是指结合该实施例所描述的特定特征、结构、或特性包括在本披露内所描述的至少一个实施例中。因此，贯穿本公开的上述短语和/或类似语言的出现可以但不一定全部指代相同的实施例。

如本文所定义的，短语“响应于(in response to)”和“响应于(responsive to)”是指容易地响应于动作或事件或对动作或事件做出反应。因此，如果“响应于(in responseto)”或“响应于(responsive to)”第一动作而执行第二动作，则在第一动作的发生与第二动作的发生之间存在因果关系。短语“响应于(in response to)”和“响应于(responsiveto)”指示因果关系。

如本文所定义的，“实时”是指用户或系统感测为对于要做出的特定过程或确定足够即时的处理响应性水平，或者使得处理器能够跟上某些外部过程的处理响应性水平。

如本文所定义的，“基本上”意味着不必精确地达到所列举的特性、参数或值，而是偏差或变化(包括例如容差、测量误差、测量精度限制和本领域技术人员已知的其他因素)可以以不排除特性旨在提供的效果的量出现。

如本文所定义的，“用户”、“个体”和“访客”各自指人类。

在本文中可使用术语第一、第二等来描述各种元件。这些元件不应受这些术语限制，因为除非另外陈述或上下文另外清楚地指示，这些术语仅用于将一个元件与另一个元件区分开。

本发明可以是任何可能的技术细节集成度的系统、方法和/或计算机程序产品。计算机程序产品可包括其上具有用于使处理器执行本发明的各方面的计算机可读程序指令的计算机可读存储介质。

计算机可读存储介质可为可保留和存储供指令执行装置使用的指令的有形装置。计算机可读存储介质可以是，例如但不限于，电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备、或者上述的任意合适的组合。计算机可读存储媒质的更具体示例的非穷尽列表包括以下各项：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式紧凑盘只读存储器(CD-ROM)、数字通用盘(DVD)、记忆棒、软盘、诸如具有记录在其上的指令的穿孔卡或槽中的凸出结构之类的机械编码设备、以及上述各项的任何合适的组合。如本文所使用的计算机可读存储介质不应被解释为暂时性信号本身，例如无线电波或其他自由传播的电磁波、通过波导或其他传输媒体传播的电磁波(例如，穿过光纤电缆的光脉冲)或通过电线发射的电信号。

本文中所描述的计算机可读程序指令可以经由网络(例如，互联网、局域网、广域网和/或无线网络)从计算机可读存储介质下载到相应的计算/处理设备，或者下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口接收来自网络的计算机可读程序指令，并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。

用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路的配置数据、或以一种或多种程序设计语言的任何组合编写的源代码或目标代码，这些程序设计语言包括面向对象的程序设计语言(诸如Smalltalk、C++等)和过程程序设计语言(诸如“C”程序设计语言或类似程序设计语言)。计算机可读程序指令可以完全地在用户计算机上执行、部分在用户计算机上执行、作为独立软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或服务器上执行。在后一种情况下，远程计算机可通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接至用户计算机，或者可连接至外部计算机(例如，使用互联网服务提供商通过互联网)。在一些实施例中，包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来使电子电路个性化来执行计算机可读程序指令，以便执行本发明的各方面。

下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可被提供给计算机或其他可编程数据处理装置的处理器以产生机器，使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现在流程图和/或框图的或多个框中指定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置、和/或其他设备以特定方式工作，从而，其中存储有指令的计算机可读存储介质包括包含实现流程图和/或框图中的或多个方框中规定的功能/动作的方面的指令的制造品。

也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上，使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤，以产生计算机实现的处理，使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图中的或多个方框中规定的功能/动作。

附图中的流程图和框图示出了根据本发明的不同实施例的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。对此，流程图或框图中的每个框可表示指令的模块、段或部分，其包括用于实现指定的逻辑功能的一个或多个可执行指令。在一些备选实现中，框中标注的功能可以不按照图中标注的顺序发生。例如，连续示出的两个方框实际上可以作为一个步骤完成，同时、基本上同时、以部分或完全时间上重叠的方式执行，或者方框有时可以以相反的顺序执行，这取决于所涉及的功能。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作或执行专用硬件与计算机指令的组合的专用的基于硬件的系统来实现。

已经出于说明的目的呈现了本发明的各个实施例的描述，并且这些描述并非旨在是详尽的或限于所披露的实施例。在不脱离所描述的实施例的范围的情况下，许多修改和变化对于本领域普通技术人员来说是显而易见的。这里使用的术语被选择来最好地解释实施例的原理、实际应用或对在市场中找到的技术的技术改进，或者使得本领域普通技术人员能够理解这里公开的实施例。

Claims

1.一种计算机实现的方法，包括：

使用第一用户的人工智能(AI)语音响应系统以电子方式感知第二用户的物理存在；

传送由所述第一用户的AI语音响应系统生成的语音请求，所述语音请求请求对由所述第二用户的AI语音响应系统电子地存储的知识库的访问，并且从所述第二用户接收语音响应；

基于所述语音响应，由所述第一用户的AI语音响应系统实例化与所述第二用户的AI语音响应系统的电子通信会话，所述电子通信会话由所述第一用户的AI语音响应系统经由与所述第二用户的便携式设备的电子通信连接发起；

经由数据通信网络从所述第二用户的AI语音响应系统检索由所述第一用户的AI语音响应系统选择的所述知识库的部分，所述知识库的选择的部分是基于所述第二用户对由所述第一用户的AI语音响应系统传送的所述语音请求的语音响应来选择的；以及

响应于由所述第一用户的AI语音响应系统基于所述知识库的选择的部分解释的语音提示，发起一个或多个IoT设备的动作。

2.根据权利要求1所述的方法，其中响应于由所述第一用户的AI语音响应系统检索电子存储器存储的数据并且确定所述电子存储器存储的数据缺少电子地存储的先前许可和所述知识库的选择的部分来执行所述传送。

3.根据权利要求1所述的方法，进一步包括：

响应于确定所述电子存储器存储的数据包括电子地存储的先前许可，经由所述数据通信网络执行检索所述知识库的选择的部分；以及

响应于确定所述电子存储器存储的数据包括所述知识库的选择的部分，避免经由所述数据通信网络检索所述选择的部分。

4.根据权利要求1所述的方法，其中，所述感知包括通过所述第一用户的AI语音响应系统识别第一用户的语音提示，并且通过所述第一用户的AI语音响应系统识别对所述第二用户的引用。

5.根据权利要求1所述的方法，其中，所述感知包括基于由操作地耦合到所述第一用户的AI语音响应系统的IoT相机捕捉的图像来执行所述第二用户的视觉识别。

6.根据权利要求1所述的方法，进一步包括由所述第一用户的AI语音响应系统基于所述第一用户的AI语音响应系统从通信耦合到所述第一用户的AI语音响应系统的所述第一用户的设备获取的数据来获取第二用户信息。

7.根据权利要求1所述的方法，其中，在没有从所述第二用户接收保持提示时，所述第一用户的AI语音响应系统在经过预定时间间隔之后丢弃所述知识库的检索的选择的部分。

8.一种系统，包括：

第一用户的人工智能(AI)语音响应系统，其与被配置为发起操作的处理器操作地耦接，所述操作包括：

电子地感知第二用户的物理存在；

传送访问由所述第二用户的AI语音响应系统电子地存储的知识库的语音请求并从所述第二用户接收语音响应；

基于所述语音响应，通过所述第一用户的AI语音响应系统实例化与所述第二用户的AI语音响应系统的电子通信会话，所述电子通信会话经由与所述第二用户的便携式设备的电子通信连接发起；

经由数据通信网络从所述第二用户的AI语音响应系统检索所述知识库的选择的部分，所述知识库的选择的部分是基于所述第二用户对所述请求的语音响应而选择的；以及

9.根据权利要求8所述的系统，其中响应于搜索电子存储器存储的数据并且确定所述电子存储器存储的数据缺少电子地存储的先前许可和所述知识库的选择的部分来执行所述传送。

10.根据权利要求8所述的系统，其中所述处理器被配置成发起进一步的操作，包括：

11.根据权利要求8所述的系统，其中所述感知包括识别第一用户语音提示并且在所述语音提示内识别对所述第二用户的引用。

12.根据权利要求8所述的系统，其中所述感知包括基于操作地耦合到所述系统的相机所获取的图像来执行所述第二用户的视觉识别。

13.根据权利要求8所述的系统，其中所述处理器被配置为发起进一步的操作，包括基于由通信地耦合到所述系统的第一用户的设备捕获的数据来获取第二用户信息。

14.一种计算机程序产品，所述计算机程序产品包括：

一个或多个计算机可读存储介质以及存储在所述一个或多个计算机可读存储介质上的程序指令，所述程序指令可由处理器执行以使所述处理器发起操作，所述操作包括：

电子地感知第二用户的物理存在；

经由数据通信网络从所述第二用户的AI语音响应系统检索所述知识库的选择的部分，所述知识库的选择地部分是基于所述第二用户对所述请求的语音响应而选择的；以及

15.根据权利要求14所述的计算机程序产品，其中响应于搜索电子存储器存储的数据并且确定所述电子存储器存储的数据缺少电子地存储的先前许可和所述知识库的选择的部分来执行所述传送。

16.根据权利要求14所述的计算机程序产品，其中所述程序指令可由所述处理器执行以致使所述处理器发起操作，所述操作进一步包括：

响应于确定所述电子存储器存储的数据包括电子地存储的先前许可，经由所述数据通信网络执行所述检索所述知识库的选择的部分；以及

17.根据权利要求14所述的计算机程序产品，其中所述感知包括识别第一用户语音提示并且在所述语音提示内识别对所述第二用户的引用。

18.根据权利要求14所述的计算机程序产品，其中，所述感知包括基于由操作地耦合到另一用户的AI语音响应系统的相机所获取的图像来执行所述第二用户的视觉识别。

19.权利要求14的计算机程序产品，其中，所述程序指令可由所述处理器执行以使所述处理器进发起操作，所述操作进一步包括：基于由通信地耦合到所述第一用户的AI语音响应系统的第一用户设备获取的数据来获取第二用户信息。

20.根据权利要求14所述的计算机程序产品，其中所述程序指令可由所述处理器执行以使所述处理器发起操作，所述操作进一步包括：在没有从所述第二用户接收保持提示时，在经过预定时间间隔之后丢弃所述知识库的检索的选择的部分。