CN109830232A

CN109830232A - 人机交互方法、装置和存储介质

Info

Publication number: CN109830232A
Application number: CN201910028866.6A
Authority: CN
Inventors: 常超; 聂双喜
Original assignee: Beijing Orion Star Technology Co Ltd
Current assignee: Beijing Orion Star Technology Co Ltd
Priority date: 2019-01-11
Filing date: 2019-01-11
Publication date: 2019-05-31

Abstract

本申请公开了一种人机交互方法、装置和存储介质，涉及人机交互领域。本申请中，引入了指令词闲聊功能。让用户进行人机交互时需要携带该指令词，这样，若确定该语音信息中包括指令词，则能够确定该语音信息是针对智能设备发出的，从而使智能设备对该语音信息进行响应。由此，使智能设备具有分辨接收到的语音是针对自己的还是外人的能力，而不会针对每条接收到的语音都作出响应，避免乱插话、哇哇乱叫的同时，还能够因为减少不必要的响应节约处理资源和电能。

Description

人机交互方法、装置和存储介质

技术领域

本申请涉及人机交互技术领域，尤其涉及人机交互方法、装置和存储介质。

背景技术

人机交互时，智能设备会不断的采集外界语音信号，并对采集到的语音信号进行响应。由于智能设备在人机交互时无法分辨接收到的语音信息是针对自己的还是旁人的，智能设备会出现乱插话、哇哇乱叫的情况。如在嘈杂的环境中，自然人之间的对话被智能设备接收后，智能设备会无端插话。这种情况，不仅导致用户体验差，也会由于在不适宜的情况下乱插话，哇哇乱叫浪费处理资源和电能。

发明内容

本申请实施例提供一种人机交互系统、方法、装置和存储介质，用于解决现有技术中在人机交互时智能设备会乱插话的问题。

本申请实施例提供一种人机交互方法，包括：

获取到智能设备采集的语音信息；

若所述语音信息中包含预设的指令词，确定对所述语音信息进行响应。

本申请实施例还提供一种人机交互装置，所述装置包括：

获取模块，用于获取到智能设备采集的语音信息；

处理模块，用于若所述语音信息中包含预设的指令词，确定对所述语音信息进行响应。

本申请另一实施例还提供了一种计算装置，包括至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请实施例提供的任一人机交互方法。

本申请另一实施例还提供了一种计算机存储介质，其中，所述计算机存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行本申请实施例中的任一人机交互方法。

本申请中，在引入了指令词闲聊功能。让用户进行人机交互时需要携带该指令词，这样，若确定该语音信息中包括指令词，则能够确定该语音信息是针对智能设备发出的，从而使智能设备对该语音信息进行响应。由此，使智能设备具有分辨接收到的语音是针对自己的还是外人的能力，而不会针对每条接收到的语音都作出响应，避免乱插话、哇哇乱叫的同时，还能够因为减少不必要的响应节约处理资源和电能。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例中的人机交互方法的应用场景示意图；

图2为本申请实施例中的人机交互方法的流程示意图；

图3为本申请实施例中的人机交互方法的操作界面示意图之一；

图4为本申请实施例中的人机交互方法的操作界面示意图之二；

图5为本申请实施例中的人机交互方法的操作界面示意图之三；

图6为本申请实施例中的人机交互方法的操作界面示意图之四；

图7为本申请实施例中的人机交互装置的结构示意图；

图8为本申请实施例提供的计算装置的结构示意图。

具体实施方式

为了能够更加准确的进行人机交互达到节约处理资源和电能的目的，本申请实施例中提供一种人机交互方法、装置和存储介质。为了更好的理解本申请实施例提供的技术方案，这里对该方案的涉及的名词和基本原理做下简单说明：

人机交互：在智能设备(智能音箱、智能电视、智能手机、机器人等)被唤醒后，可进入人机交互模式。在该模式下用户可以和智能设备自由闲聊，也可以向智能设备发出指令等。在一个人机交互实施例中，用户唤醒智能设备后，用户通过语音与智能设备进行交互，智能设备采集到用户的语音信息后，上报至服务器，由服务器对语音信息进行识别和解析处理，并确定该语音信息对应的响应信息，将响应信息反馈至智能设备，由智能设备输出响应信息。

指令词：在开启了指令词闲聊功能后，在与智能设备进行语音交互时，用户需要使用的词，例如将“机器人您好”这个词配置为指令词，则用户每次与智能设备进行语音交互时，所发出的语音信息中若包含了“机器人您好”，则认为用户有明显交互意图，则控制智能设备输出该语音信息对应的响应信息；若用户所发出的语音信息中未包含“机器人您好”，则认为用户无明显交互意图，则控制智能设备不对该语音信息进行响应。

规则外白名单：该名单中包含了人机交互时不需要指令词也能够得到智能设备反馈的意图。该名单中包含的意图可以由智能设备的提供商配置(如新增，修改，删除等)，也可以由购买智能设备的企业用户自行配置(如新增，修改，删除等)。关于规则外白名单的详细内容将在后文中描述，这里暂不赘述。

用户引导语料：用于引导交互用户如何进行人机交互的语料，例如，“Hi，和我说话前请加上**词哦，这样就能和我聊天了”。其中“**”是指令词。用户引导语料可以由智能设备的提供商配置(如新增，修改，删除等)，也可以由购买智能设备的用户自行配置(如新增，修改，删除等)。关于用户引导语料的详细内容，将在后文中说明，这里暂不赘述。

本申请实施例中，针对智能设备在人机交互时乱插话的现象，提供了解决方案。本申请实施例中，在人机交互时引入了指令词闲聊功能。让交互用户进行人机交互时携带该指令词，这样，在确定智能设备接收到语音信息中包括指令词时够确定该语音信息是针对智能设备发出的，从而能够控制智能设备对该语音信息进行响应。由此，对于和智能设备交互的用户而言，智能设备是具有分辨接收到的语音是针对自己的还是外人的能力，而不会针对每条接收到的语音都作出响应，避免乱插话、哇哇乱叫，提高了用户体验。同时，还能够因为减少不必要的响应节约处理资源和电能。

如图1所示，为本申请实施例中提供的人机交互场景示意图。在该场景中包括机器人11、云端服务器12和多个用户，如用户13、用户14和用户15，在该场景下，除了用户与机器人之间的交互，还有可能存在用户与用户之间的交互。在人机交互时，若未开启指令词闲聊功能，控制机器人对采集到的语音信息进行响应，响应的语音信息包括用户与机器人交互时的语音信息和用户与用户交互时的语音信息。若开启指令词闲聊功能，控制机器人只对包含指令词的语音信息进行响应。如图1所示，若用户13和14面对面进行交谈时，若机器人11采集到用户13和用户14之间的对话的语音信息，则将该语音信息上传给云端服务器12进行处理。但由于自然对话时，不会带上机器人11的指令词，云端服务器12确定不需要对该语音信息进行响应，所以机器人11不会对接收到的语音信息进行响应。故此不会出现机器人在用户13和14对话时乱插话、乱叫的现象。而这时靠近机器人11的用户15如果说“小豹，您好，您今天忙不忙？”，机器人11将该语音信息上传给云端服务器12，云端服务器12分析处理后确定该语音信息中包括指令词“小豹您好”，进而控制机器人11对用户15的语音信息进行响应，例如控制机器人11输出“您好，我今天不忙，我们可以聊天或者我帮您办理一些事情”的响应语音。这样，机器人11就像自然人一样在合适的时机进行交互。

需要说明的是，本申请实施例中对语音信息进行处理以及确定是否需要响应的操作可以由服务器执行，也可以由具备分析处理能力的智能设备(如智能设备的控制器)执行，也可以部分由智能设备(如智能设备的控制器)执行部分后再交由云端服务器执行，本申请对此并不限定。

下面结合附图对本申请实施例提供的人机交互方法做进一步说明。如图2所示，为该方法的流程示意图，包括以下步骤：

步骤201：获取到智能设备采集的语音信息。

实施时，智能设备被唤醒后，控制智能设备实时采集周围语音信息。

步骤202：若所述语音信息中包含预设的指令词，确定对所述语音信息进行响应。

实施时，指令词配置时，可以配置一个指令词，也可以配置多个指令词，当配置了多个指令词时，若语音信息中包含任意一个指令词，则确定对所述语音信息进行响应。

具体实施时，在获取到智能设备采集到的语音信号后，可以先通过ASR(AutomaticSpeech Recognition，语音识别技术)将语音信息转换成文本信息，然后在文本信息中查找是否有指令词。

当然需要说明的是，具体实施时，为了方便操作，包含的指令词最好是对话的前缀或后缀。较佳的、为便于智能设备能够首先确定是否有指令词而后在对收到的语音信息执行后续的操作，指令词应为对话的前缀。当为前缀时在对所述语音信息进行语音识别，得到所述语音信息对应的文本信息后，若所述文本信息中包含预设的指令词，且所述指令词位于所述文本信息的前缀位置，则确定对所述语音信息进行响应。

为了便于不同业务需要的企业使用智能设备，本申请实施例中可以对智能设备对应的指令词进行配置，具体如下：

接收到第二配置指令；根据所述第二配置指令，确定需要进行指令词配置的智能设备；根据所述第二配置指令，对所确定的智能设备对应的指令词进行配置。

具体实施中，指令词的配置可以针对设备级别生效，也可以针对企业级别生效。例如，可以仅针对一个智能设备单独进行指令词的配置，也可以对同一企业下的部分或全部智能设备进行相同的配置，具体可以根据实际需要或应用场景进行选择，本申请实施例中不做限定。

具体实施中，第二配置指令中可以包括设备标识，则本次指令词配置只对该设备标识对应的智能设备生效。第二配置指令中也可以包括企业标识，则本次指令词配置对该企业标识对应的所有智能设备生效。当然，第二配置指令中可以不包括智能设备标识，则本次指令词配置对所有智能设备生效。

此外，需要说明的是对指令词的配置可以是新增指令词、修改已有的指令词或删除已有的指令词等配置，本申请实施例中不对配置的具体实现进行限定。

如图3所示，智能设备的企业用户(即管理员)可以自行设置指令词，并选择使用哪些指令词。配置指令词时，人机交互可采用的指令词可以是一种，也可以是多种。在图3所示的操作界面中，企业用户可以输入指令词，并通过“+”来增加自定义的指令词。通过右侧的选择栏来选择要使用的指令词，选择的结果在界面下方会显示出来。当然，还可以选择配置的指令词生效的智能设备(图中未示出)。

进一步的，交互时每句话都必须使用指令词，也会给交互用户带来一定的麻烦，为了便于激发交互用户的人机交互意图和提高交互用户的交互体验，本申请实施例中，还配置了特殊语义场景，在该场景下，交互用户无需发出指令词也能够得到智能设备的响应。具体实施时，若所述语音信息中不包含预设的指令词，但所述语音信息的意图识别结果包含预设的意图白名单中的任一意图，确定对所述语音信息进行响应。

需要说明的是，本申请实施例中不对确定是否包含指令词，和确定语音信息的意图识别结果是否包含预设的意图白名单中的操作的先后顺序进行限定，两个操作可以同时执行，也可以分先后执行。例如，先确定是否包含指令词，而后在不包含指令词的前提下，再确定语音信息的意图识别结果是否包含在预设的意图白名单中，进而确定是否对该语音信息进行响应。再例如，也可以先确定意图识别结果是否包含在预设的意图白名单中，若不包含在白名单中，再确定是否包含指令词；进一步的，若包含指令词，则确定进行响应，若不包含指令词，则确定不进行响应；若确定意图识别结果包含在预设的意图白名单中则可以确定进行响应。

进一步的，意图白名单可以根据实际业务需求或应用场景等进行配置。本申请中给出两种实施例对意图白名单进行说明，并非对意图白名单的具体实现形式进行限定。一种意图白名单是规则外白名单，另一种意图白名单是用户教育白名单，实施时，可以两种白名单一起使用也可以单独使用。其中：

A、关于规则外白名单

交互用户的query(询问)可以分为封闭问句和开放问句。一般封闭问句的答案是唯一的可确定的。例如交互用户询问“今天北京天气如何？”，针对这样的封闭问句，因为能够唯一获取到北京的某个时间的天气，所以能够进行唯一的准确的响应。

开放问句的答案是不确定的。如交互用户对智能设备说：“你今天高兴吗？”，“你今天忙吗？”，这样的问句，即闲聊，是没有唯一的确定答案的。

无论开放问句还是封闭问句，本申请中都可以配置规则外白名单。为了减少该名单的配置工作量，可以主要针对开放问句进行设置。为了保证智能设备的回复率，该名单的每个意图都有对应的响应信息。所以在确定对所述语音信息进行响应后，会根据所述语音信息的语义解析结果，获取所述语音信息对应的响应信息；控制所述智能设备输出所述响应信息。

下面给出规则外白名单的一个具体实施例，规则外白名单中可包括以下意图中的至少一类：

1)、问候类意图、例如上午好、中午好、下午好、晚上好、您好、你好等。

2)、问询类意图，例如是询问智能设备能够执行什么功能的意图，该意图可以为“你会干什么”。意图识别时会将文本信息“你会干啥？”、“你能干啥？”、“你具有什么功能”都解析成“你会干什么”这一类意图。

3)、感谢类意图、例如，文本信息“谢谢你”、“多谢”、“非常感谢”都识别为该类意图。

4)、告别类意图，例如可以将文本信息“拜拜”、“再见”、“下次见”、“回头见”、“有机会再合作”等都识别成该类意图。

5)、要求执行计算功能的意图，如计算器。

6)、企业用户自定义意图。为了满足不同应用需求，企业用户可以自定义意图并配置相应的响应信息。如图4所示，企业用户可以输入一些自定义的意图，然后并配置相应的响应信息。

当然，规则外白名单在配置时，可以为企业用户提供一个意图列表，供企业用户从该列表中选择自己需要使用的意图。也可以为企业用户提供一个接口，以使企业用户可以输入自定义的意图，自定义的意图能够使得企业用户根据自己的需求进行扩展。

当采用人工智能技术识别意图时，往往需要构建模型和训练模型，使模型具有识别该意图的功能。所以本申请实施例中，还可以为企业用户提供接入识别意图的模型的接口以便于企业用户导入新的意图后，对模型进行训练，以使模型能够识别该新的意图，并能确定出包含该新的意图的语音信号对应的响应信息，或者通过该接口导入已经训练好的模型。

当然，需要说明的是，以上是采用汉语进行列举说明，具体实施时不仅限于汉语语种，其他语种的处理流程类似，此处不再一一举例说明。

B、用户教育白名单

该名单是为了引导交互用户正确使用智能设备进行人机交互而设立的。目的是告知可能存在交互意图的交互用户在人机交互时需要使用指令词进行交互。

在对该意图的语音信息进行响应时，每个意图也有对应的响应信息。当指令词可以如前所述进行个性化配置时或者指令词可以有多个时，本申请实施例中引入用户引导语料，在对接收到的语音信息进行响应时，首先获取预设的用户引导语料；然后根据所述用户引导语料和所述指令词，进行语音合成，得到引导音频数据；之后控制所述智能设备输出所述引导音频数据。这样，引导音频数据中包含指令词，以便于交互用户得知人机交互时哪些词是必须使用的。例如，引导音频数据为“Hi，您好，在和我说话前请加上小豹，就可以和我对话了”这样，不熟悉智能设备的交互用户能够了解到交互时需要在说话前加上“小豹”这个词。

本申请实施例中可提供如下的一些用户引导语料，其中标点符号{}表示指令词：

"我猜你是想跟我聊天，对我说话前加上{}就可以了！比如{}",

"想跟我聊天吗？对我说话前加上{}我就知道啦，比如{}",

"你是在跟我聊天吗？说话前加上{}，这样就好咯，比如{}",

"如果想跟我聊天，请在说话前加上{}，比如{}",

"想跟我聊天吗？对我说话前加上{}我就知道啦，比如{}",

"这里有点吵，说话前加上{}我就知道是和我聊天啦，比如{}",

"这里有点吵，对我说话前加上{}，这样就好咯，比如{}"。

具体实施时，可以配置多条用户引导语料，使用时可以随机选择一条用户引导语料；也可以采用轮询方式，选择一条用户引导语料；也可以根据环境选择用户引导语料，例如环境噪声分贝高于预设分贝时，可以采用以“这里有点吵”开头的用户引导语料进行响应。当有多条用户引导语料时，能够避免用户引导语料过于单一，让听众容易乏味的感觉。

具体实施时，用户引导语料可以由智能设备的提供商设置，也可以由购买智能设备的企业用户根据自己的业务需求配置。当用户引导语料可配置时，本申请实施例中通过以下方案实现对用户引导语料的配置，如可以接收到第二配置指令；然后根据所述第二配置指令，确定需要进行指令词配置的智能设备；根据所述第二配置指令，对所确定的智能设备对应的指令词进行配置。其中，用户引导语料的配置可以针对设备级别生效，也可以针对企业级别生效。例如，可以仅针对一个智能设备单独进行用户引导语料的配置，也可以对同一企业下的部分或全部智能设备进行相同的配置，具体可以根据实际需要或应用场景进行选择，本申请实施例中不做限定。

具体实施中，第一配置指令中可以包括设备标识，则本次用户引导语料配置只对该设备标识对应的智能设备生效。第一配置指令中也可以包括企业标识，则本次用户引导语料配置对该企业标识对应的所有智能设备生效。当然，第一配置指令中可以不包括智能设备标识，则本次用户引导语料配置对所有智能设备生效。

此外，需要说明的是对用户引导语料的配置可以是新增用户引导语料、修改已有的用户引导语料、或删除已有的用户引导语料等配置，本申请实施例中不对配置的具体实现进行限定。

需要说明的是，用户引导语料在配置时，可以为企业用户提供一个用户引导语料列表，供企业用户从该列表中选择自己需要使用的用户引导语料。也可以为企业用户提供一个接口，以使企业用户可以输入自定义的用户引导语料，自定义的用户引导语料能够使得企业用户根据自己的需求进行扩展。

在一个可能的实施例中，可以提供如图5所示的界面进行用户引导语料的配置。首先可以选择用户教育白名单中的意图，然后针对该意图输入自定义的用户引导语料。当然，具体实施时，可以不选择意图，而是所有意图对应使用同一用户引导语料，图5仅是举例说明，并不用于限定本申请实施例。

相应的，本申请实施例中所述用户教育白名单中可包括以下意图中的至少一类，当然具体实施时该名单中的意图同样可以根据企业用户需求配置，本申请对此并不限定：

1)、查姓名意图，例如可以包括罗伯特、史密斯、约翰、王某某等这样的姓名

2)、问年龄意图

3)、问性别意图

4)、问生日意图

5)、问身高意图

6)、问星座意图

7)、问血型意图

8)、问种族意图

9)、问生肖意图

10)、问爱好意图、例如语义分析结果的意图是表达个人喜好，包括：某某喜欢、某某乐意做*事情等。

11)、问婚姻状况意图

12)、问工作相关信息意图，例如包括：消防员、会计等

14)、询问姓名意图

15)、询问家属信息意图，例如语义解析结果为表示询问你爸爸是谁、你爸爸妈妈是谁、你有爸爸吗、你有妈妈吗、你妈妈是谁、你有兄弟姐妹吗等这样的识别结果，都归类为询问家属信息意图。

16)、询问朋友信息意图，例如将文本信息“你有女朋友吗？”识别为该类意图。

17)、请求模仿动物叫声意图，例如将文本信息“请问狗如何叫”、“猫如何叫”等识别为该类意图。

18)、请求帮助信息意图，例如可以包括能不能、会不会，帮我、介绍等。交互用户可以发出“能不能帮我算一下数”，“会不会办理银行卡”等语音信息，会将这样的语音信息识别为该类意图。

19)、询问颜值描述信息意图。由于人机交互时交互用户和智能设备可以非常生活化的交互，可以将交互用户发出的“***帅不帅/漂不漂亮”等语音信息识别为该类意图。

需要说明的是，用户教育白名单在配置时，可以为企业用户提供一个意图列表，供企业用户从该列表中选择自己需要使用的意图。也可以为企业用户提供一个接口，以使企业用户可以输入自定义的意图，自定义的意图能够使得企业用户根据自己的需求对智能设备进行扩展。

基于上述任一实施例，人机交互时一对一(一人对一智能设备)的场景比较多，所以人机交互时，指令词闲聊功能是否启用可以由企业用户根据实际需求来定。故此，本申请实施例中，可以配置指令词闲聊功能开启和关闭开关，在开启指令词闲聊功能时交互用户在人机交互时需要携带指令词，前述的意图白名单处于启用状态。在关闭指令词闲聊功能时，交互用户在人机交互时不需要携带指令词，前述的意图白名单处于停用状态。

实施时，在获取到智能设备采集的语音信息之前，可以先确定所述智能设备的指令词闲聊功能是否处于启动状态，若处于关闭状态，则在接收到语音信息后进行语音信息的正常处理流程，即一旦接收到语音信息(无论该语音信息是否是针对智能设备的)都会进行响应；若处于开启状态，则若语音信息中包含预设的指令词，或者识别的意图在意图白名单中才确定对语音信息进行响应。

类似的，指令词闲聊功能的开关控制可以针对设备级别生效，也可以针对企业级别生效。例如，可以仅针对一个智能设备单独配置指令词闲聊功能是否开启，也可以对同一企业下的部分或全部智能设备进行相同的配置，具体可以根据实际需要或应用场景进行选择，本申请实施例中不做限定。

例如，若接收到用于指示开启所述指令词闲聊功能的开启指令；则可以根据所述开启指令，确定需要开启所述指令词闲聊功能的智能设备；然后控制所述智能设备输出表示所述指令词闲聊功能已开启的提醒信息。例如，在设备级别的情况下，企业用户可以对设备1说“开启设备1的指令词闲聊功能”，智能设备接收到该语音信息后将其发送给云端服务器，云端服务器即可根据该语音信息确定为接收到开启指令，而后开启智能设备1的指令词闲聊功能，而后控制智能设备1输出“智能设备1的指令词闲聊功能已开启，和我说话前请加**”的播报语音，其中**为指令词。企业用户还可以对智能设备4说“开启1、2、3设备的指令词闲聊功能”，智能设备接收到该语音信息后可以上报连接智能设备的云端服务器，然后由云端服务器控制名称为1、2、3的智能设备开启指令词闲聊功能。在开启后，智能设备4可以回复“指令词闲聊功能已经开启了，对智能设备1、2、3说话前需要加**”，其中**为指令词。也就是说开启指令中可以包括受控制的智能设备的标识信息，以便于云端服务器确定控制哪些智能设备的指令词闲聊功能开启。此外，企业用户可以通过任何一台智能设备实现对该智能设备或之外的智能设备的指令词闲聊功能的控制。

基于上述任一实施例，在开启了指令词闲聊功能之后，还可以根据实际需求关闭该指令词闲聊功能，具体如下：

若接收到用于指示关闭所述指令词闲聊功能的关闭指令；则可以根据所述关闭指令，确定需要关闭所述指令词闲聊功能的智能设备；然后控制所述智能设备输出表示所述指令词闲聊功能已关闭的提醒信息。

例如，在设备级别生效的情况下，企业用户可以说“关闭指令词闲聊功能”，智能设备接收到该语音信息后上传给云端服务器，若云端服务器确定出该语音信息为关闭指令，而后关闭相应智能设备的指令词闲聊功能。针对企业级别，企业用户可以对智能设备5说“关闭1、2、3设备的指令词闲聊功能”，智能设备接收到该语音信息后可以上报连接智能设备的云端服务器，然后由云端服务器控制名称为1、2、3的智能设备关闭指令词闲聊功能。在关闭后，智能设备5可以回复“智能设备1、2、3的指令词闲聊功能已经关闭了，说话时不加**也可以和智能设备1、2、3对话啦”。

具体实施时，嘈杂的环境下智能设备容易乱插话，而相对安静的环境，人们往往是对着智能设备一对一对话的。所以，嘈杂的环境可以优选开启指令词闲聊功能，而安静的环境可以优选关闭指令词闲聊功能。如图6所示的操作界面可以用来来开启或关闭指令词闲聊功能。

需要说明的是，除了上述开启/关闭指令词闲聊功能的方式外，还可以采用其他方式，例如，通过智能设备端配置的开启/关闭指令词闲聊功能的按钮，实现对该智能设备的指令词闲聊功能的开启和关闭。又如，通过企业后台配置该企业下的智能设备的指令词闲聊功能的开启和关闭。本发明实施例中不对开启/关闭指令词闲聊功能的实现方式进行限定。

基于相同的发明构思，本申请实施例还提供一种人机交互装置，如图7所示，包括：

获取模块701，用于获取到智能设备采集的语音信息；

处理模块702，用于若所述语音信息中包含预设的指令词，确定对所述语音信息进行响应。

进一步的，所述处理模块还用于若所述语音信息中不包含预设的指令词，但所述语音信息的意图识别结果包含预设的意图白名单中的任一意图，确定对所述语音信息进行响应。

进一步的，所述意图白名单为预设的规则外白名单，所述处理模块还用于确定对所述语音信息进行响应之后，根据所述语音信息的语义解析结果，获取所述语音信息对应的响应信息；控制所述智能设备输出所述响应信息。

进一步的，所述意图白名单为预设的用户教育白名单，所述处理模块还用于确定对所述语音信息进行响应之后，获取预设的用户引导语料；根据所述用户引导语料和所述指令词，进行语音合成，得到引导音频数据；控制所述智能设备输出所述引导音频数据。

进一步的，所述装置还包括：

第一接收模块，用于接收第一配置指令；

第一确定模块，用于根据所述第一配置指令，确定需要进行引导语料配置的智能设备；

语料配置模块，用于根据所述第一配置指令，对所确定的智能设备对应的引导语料进行配置。

进一步的，所述装置还包括：

第二接收模块，用于接收到第二配置指令；

第二确定模块，用于根据所述第二配置指令，确定需要进行指令词配置的智能设备；

指令词配置模块，用于根据所述第二配置指令，对所确定的智能设备对应的指令词进行配置。

进一步的，在获取到智能设备采集的语音信息之前，所述装置还包括：

启动状态确定模块，用于确定所述智能设备的指令词闲聊功能处于启动状态。

进一步的，所述装置还包括：

关闭指令接收模块，用于接收到用于指示关闭所述指令词闲聊功能的关闭指令；

第三确定模块，用于根据所述关闭指令，确定需要关闭所述指令词闲聊功能的智能设备；

控制模块，用于控制所述智能设备输出表示所述指令词闲聊功能已关闭的提醒信息。

进一步的，所述处理模块用于：

对所述语音信息进行语音识别，得到所述语音信息对应的文本信息；

若所述文本信息中包含预设的指令词，且所述指令词位于所述文本信息的前缀位置，则确定对所述语音信息进行响应。

在介绍了本申请示例性实施方式的人机交互方法、装置之后，接下来，介绍根据本申请的另一示例性实施方式的计算装置。

所属技术领域的技术人员能够理解，本申请的各个方面可以实现为系统、方法或程序产品。因此，本申请的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施方式中，根据本申请的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中，存储器存储有程序代码，当程序代码被处理器执行时，使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的人机交互方法中的步骤。例如，处理器可以执行方法实施例中的各步骤。

下面参照图8来描述根据本申请的这种实施方式的计算装置130。图8显示的计算装置130仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。本申请中的计算装置130可以配置在智能设备侧，也可以配置在服务器侧，本申请中不对此进行限定。

如图8所示，计算装置130以通用计算装置的形式表现。计算装置130的组件可以包括但不限于：上述至少一个处理器131、上述至少一个存储器132、连接不同系统组件(包括存储器132和处理器131)的总线133。

总线133表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储器132可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)1321和/或高速缓存存储器1322，还可以进一步包括只读存储器(ROM)1323。

存储器132还可以包括具有一组(至少一个)程序模块1324的程序/实用工具1325，这样的程序模块1324包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

计算装置130也可以与一个或多个外部设备134(例如键盘、指向设备等)通信，还可与一个或者多个使得用户能与计算装置130交互的设备通信，和/或与使得该计算装置130能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口135进行。并且，计算装置130还可以通过网络适配器136与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器136通过总线133与用于计算装置130的其它模块通信。应当理解，尽管图中未示出，可以结合计算装置130使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

在一些可能的实施方式中，本申请提供的人机交互方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在计算机设备上运行时，程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的人机交互方法中的步骤，例如，计算机设备可以执行如图2中所示的步骤201-202。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本申请的实施方式的用于人机交互的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在计算装置上运行。然而，本申请的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算装置上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中，远程计算装置可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算装置，或者，可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本申请方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种人机交互方法，其特征在于，所述方法包括：

获取到智能设备采集的语音信息；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

若所述语音信息中不包含预设的指令词，但所述语音信息的意图识别结果包含预设的意图白名单中的任一意图，确定对所述语音信息进行响应。

3.根据权利要求2所述的方法，其特征在于，所述意图白名单为预设的规则外白名单，确定对所述语音信息进行响应之后，还包括：

根据所述语音信息的语义解析结果，获取所述语音信息对应的响应信息；

控制所述智能设备输出所述响应信息。

4.根据权利要求2所述的方法，其特征在于，所述意图白名单为预设的用户教育白名单，确定对所述语音信息进行响应之后，所述方法还包括：

获取预设的用户引导语料；

根据所述用户引导语料和所述指令词，进行语音合成，得到引导音频数据；

控制所述智能设备输出所述引导音频数据。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

接收第一配置指令；

根据所述第一配置指令，确定需要进行引导语料配置的智能设备；

根据所述第一配置指令，对所确定的智能设备对应的引导语料进行配置。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收到第二配置指令；

根据所述第二配置指令，确定需要进行指令词配置的智能设备；

根据所述第二配置指令，对所确定的智能设备对应的指令词进行配置。

7.根据权利要求1-6中任一所述的方法，其特征在于，在获取到智能设备采集的语音信息之前，所述方法还包括：

确定所述智能设备的指令词闲聊功能处于启动状态。

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

接收到用于指示关闭所述指令词闲聊功能的关闭指令；

根据所述关闭指令，确定需要关闭所述指令词闲聊功能的智能设备；

控制所述智能设备输出表示所述指令词闲聊功能已关闭的提醒信息。

9.根据权利要求1所述的方法，其特征在于，所述若所述语音信息中包含预设的指令词，确定对所述语音信息进行响应包括：

10.一种人机交互装置，其特征在于，所述装置包括：

获取模块，用于获取到智能设备采集的语音信息；