CN116415590A

CN116415590A - 基于多轮次问询的意图识别方法及装置

Info

Publication number: CN116415590A
Application number: CN202111675913.XA
Authority: CN
Inventors: 陈小平; 穆峰
Original assignee: Yunmi Internet Technology Guangdong Co Ltd
Current assignee: Yunmi Internet Technology Guangdong Co Ltd
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2023-07-11

Abstract

本发明公开了一种基于多轮次问询的意图识别方法及装置，该方法包括：当接收到由智能设备采集到的目标用户的第一语音信息时，判断能否根据第一语音信息确定目标用户的用户意图；当判断结果为否时，向目标用户输出第一语音信息对应的问询语句；根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图；根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作。可见，实施本发明能够与用户进行多轮次问询交互从而确定用户的实际意图，减少因语音信息缺少关键信息而无法准确识别用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，从而减少错误控制智能设备的情况发生，提高用户使用体验。

Description

基于多轮次问询的意图识别方法及装置

技术领域

本发明涉及语义识别技术领域，尤其涉及一种基于多轮次问询的意图识别方法及装置。

背景技术

在实际生活中，随着科技的发展和经济水平的上升，人们愈发追求生活和工作的便捷性，因此，利用语音信息控制智能设备也成为人们日常生活和工作中常见的一种智能设备控制方式。

当前，主要通过对采集到的语音信息进行语义识别，得到用户的意图，再根据用户的意图实现对智能设备的控制。然而，实践发现，由于用户的用语习惯、认知能力等因素的影响，部分用户下达控制指令时输出的语音信息通常会缺少部分关键信息，导致无法根据语音信息准确地识别用户的意图，从而无法为用户准确地控制智能设备，降低了用户的使用体验。可见，如何提高根据语音信息识别用户意图的准确性，进而提高用户的使用体验显得尤为重要。

发明内容

本发明所要解决的技术问题在于，提供一种基于多轮次问询的意图识别方法及装置，能够有利于提高根据语音信息识别用户意图的准确性，进而能够提高用户的使用体验。

为了解决上述技术问题，本发明第一方面公开了一种基于多轮次问询的意图识别方法，所述方法包括：

当接收到由智能设备采集到的目标用户的第一语音信息时，判断能否根据所述第一语音信息确定所述目标用户的用户意图；

当判断结果为否时，向所述目标用户输出所述第一语音信息对应的问询语句；

根据所述第一语音信息和所述目标用户针对所述问询语句反馈的第二语音信息，确定所述目标用户的用户意图；

根据所述用户意图，控制所述用户意图对应的目标智能设备执行相匹配的操作。

作为一种可选的实施方式，在本发明第一方面中，当接收到由智能设备采集到的目标用户的第一语音信息时，在所述判断能否根据所述第一语音信息确定所述目标用户的用户意图之前，所述方法还包括：

针对所述第一语音信息进行语义分析，得到语义分析结果；

针对所述语义分析结果进行分词处理，得到所述语义分析结果包括的至少一个关键词；

根据预先确定出的语法结构模型，对所有所述关键词进行语法结构识别处理，得到语法结构识别结果，其中，所述语法结构识别结果包括每个所述关键词对应的第一词槽类型；

根据所有所述关键词，确定所述语义分析结果相匹配的意图语句模型以及所述意图语句模型所对应的所有第二词槽类型；

其中，所述判断能否根据所述第一语音信息确定所述目标用户的用户意图，包括：

判断由所有所述第一词槽类型组成的词槽类型集合是否与所有所述第二词槽类型相匹配；当判断出所述词槽类型集合与所有所述第二词槽类型不匹配时，确定无法根据所述第一语音信息确定所述目标用户的用户意图；

其中，所述判断由所有所述第一词槽类型组成的词槽类型集合是否与所有所述第二词槽类型相匹配，包括：

判断由所有所述第一词槽类型组成的词槽类型集合中是否包括所有所述第二词槽类型，当判断出所述词槽类型集合中未包括所有所述第二词槽类型时，确定所述词槽类型集合与所有所述第二词槽类型不匹配；或者，

判断由所有所述第一词槽类型组成的词槽类型集合中是否包括所有所述第二词槽类型中的所有关键词槽类型，当所述词槽类型集合中未包括所有所述关键词槽类型时，确定所述词槽类型集合与所有所述第二词槽类型不匹配。

作为一种可选的实施方式，在本发明第一方面中，当判断出无法根据所述第一语音信息确定所述目标用户的用户意图时，在所述向所述目标用户输出所述第一语音信息对应的问询语句之前，所述方法还包括：

将所有所述第二词槽类型中所述词槽类型集合未包括的第二词槽类型确定为待确认词槽类型，或者，将所有所述关键词槽类型中所述词槽类型集合未包括的关键词槽类型确定为待确认词槽类型；

根据预先确定出的所述第一语音信息对应的声纹信息，确定所述目标用户的用户信息；

基于预先确定出的对话模型和所述用户信息，生成所述待确认词槽类型匹配的问询语句，作为所述第一语音信息对应的问询语句；

基于所述用户信息和所述目标用户所处的空间区域，确定与所述目标用户相匹配的问询方式以及与所述问询方式相匹配的问询设备；

根据所述问询方式以及所述问询设备，判断是否需要对所述问询语句执行形式转换操作；

当判断出需要对所述问询语句执行所述形式转换操作时，将所述问询语句由文本形式转换成与所述问询方式和所述问询设备相匹配的目标形式，并触发执行所述的向所述目标用户输出所述第一语音信息对应的问询语句的操作；

当判断出不需要对所述问询语句执行所述形式转换操作时，触发执行所述的向所述目标用户输出所述第一语音信息对应的问询语句的操作；

其中，所述向所述目标用户输出所述第一语音信息对应的问询语句，包括：

当对所述问询语句执行了所述形式转换操作时，基于所述目标形式和所述问询设备，向所述目标用户输出所述第一语音信息对应的问询语句。

作为一种可选的实施方式，在本发明第一方面中，所述基于预先确定出的对话模型和所述用户信息，生成所述待确认词槽类型匹配的问询语句，作为所述第一语音信息对应的问询语句，包括：

根据所述用户信息确定所述目标用户的身份类型、所述目标用户匹配的语言类型，并确定与所述身份类型对应的理解能力和所述待确认词槽类型均匹配的问句类型；

基于预先确定出的对话模型、所述语言类型以及所述问句类型，生成所述待确认词槽类型匹配的问询语句，作为所述第一语音信息对应的问询语句；

其中，所述基于预先确定出的对话模型、所述语言类型以及所述问句类型，生成所述待确认词槽类型匹配的问询语句，作为所述第一语音信息对应的问询语句，包括：

当所述问句类型为是非疑问句类型或选择疑问句类型时，预测所述待确认词槽类型对应的所有可选答复关键词；

当所述问句类型为所述选择疑问句类型时，基于所述对话模型和所述语言类型，生成包括所有所述可选答复关键词且与所述待确认词槽类型相匹配的选择问询语句，作为所述第一语音信息对应的问询语句；

当所述问句类型为所述是非疑问句类型时，根据所述用户信息，从所有所述可选答复关键词中确定与所述目标用户匹配程度最高的目标答复关键词，并基于所述对话模型和所述语言类型，生成包括所述目标答复关键词且与所述待确认词槽类型相匹配的是非问询语句，作为所述第一语音信息对应的问询语句。

采集所述目标用户在输出所述第一语音信息时的身体活动图像信息；

根据所述身体活动图像信息，确定所述目标用户的身体关键点基于参照点的坐标值的动态变化集合，所述动态变化集合包括自所述目标用户开始输出所述第一语音信息至所述目标用户结束输出所述第一语音信息的时间段内每个采集时刻中所述身体关键点基于所述参照点的坐标值；

根据所述动态变化集合，判断所述身体关键点的移动距离是否大于等于预设距离；

当判断出所述移动距离大于等于所述预设距离时，根据所述动态变化集合，确定所述目标用户对应的肢体语言信息；

判断能否根据所述第一语音信息和所述肢体语言信息确定所述目标用户的用户意图，当判断结果为否时，触发执行所述的向所述目标用户输出所述第一语音信息对应的问询语句的操作。

作为一种可选的实施方式，在本发明第一方面中，在所述所述根据所述第一语音信息和所述目标用户针对所述问询语句反馈的第二语音信息，确定所述目标用户的用户意图之前，所述方法还包括：

确定所述第一语音信息对应的第一意图对象和所述目标用户针对所述问询语句反馈的第二语音信息对应的第二意图对象；

判断所述第一意图对象与所述第二意图对象是否相匹配；

当所述第一意图对象与所述第二意图对象相匹配时，触发执行所述的根据所述第一语音信息和所述目标用户针对所述问询语句反馈的第二语音信息，确定所述目标用户的用户意图的操作；

当所述第一意图对象与所述第二意图对象不匹配时，判断能否根据所述第二语音信息确定所述目标用户的第二用户意图；当判断出无法根据所述第二语音信息确定所述目标用户的第二用户意图时，向所述目标用户分别输出所述第一语音信息对应的问询语句和所述第二语音信息对应的问询语句。

作为一种可选的实施方式，在本发明第一方面中，在所述根据所述用户意图，控制所述用户意图对应的目标智能设备执行相匹配的操作之前，所述方法还包括：

确定能够执行所述用户意图相匹配的操作的目标智能设备；

当预先确定出的所述目标用户的身份类型为小孩类型时，判断所述目标用户是否具有使用所述目标智能设备的权限；

当判断出所述目标用户不具有使用所述目标智能设备的权限时，判断所述目标用户所在的空间区域内是否存在身份类型为成人类型的监护用户；

当判断出所述空间区域内存在所述监护用户时，向所述监护用户输出针对所述目标智能设备的权限问询语句，所述权限问询语句用于向所述监护用户询问是否允许所述目标用户使用所述目标智能设备；

根据所述监护用户针对所述权限问询语句反馈的语音信息判断所述监护用户是否允许所述目标用户使用所述目标智能设备；

当判断出所述监护用户允许所述目标用户使用所述目标智能设备时，触发执行所述的根据所述用户意图，控制所述用户意图对应的目标智能设备执行相匹配的操作的操作；

当判断出所述空间区域内不存在所述监护用户时，或者，当判断出所述监护用户不允许所述目标用户使用所述目标智能设备时，确定所述目标智能设备的设备类型；

判断所述空间区域内是否存在与所述设备类型匹配的玩具智能设备；

当所述空间区域内存在所述玩具智能设备时，根据所述用户意图，控制所述玩具智能设备执行相匹配的操作。

本发明第二方面公开了一种基于多轮次问询的意图识别装置，所述装置包括：

判断模块，用于当接收到由智能设备采集到的目标用户的第一语音信息时，判断能否根据所述第一语音信息确定所述目标用户的用户意图；

输出模块，用于当所述判断模块判断出无法根据所述第一语音信息确定所述目标用户的用户意图时，向所述目标用户输出所述第一语音信息对应的问询语句；

确定模块，用于根据所述第一语音信息和所述目标用户针对所述问询语句反馈的第二语音信息，确定所述目标用户的用户意图；

控制模块，用于根据所述用户意图，控制所述用户意图对应的目标智能设备执行相匹配的操作。

作为一种可选的实施方式，在本发明第二方面中，语义识别模块，用于当接收到由智能设备采集到的目标用户的第一语音信息时，在所述判断模块判断能否根据所述第一语音信息确定所述目标用户的用户意图之前，针对所述第一语音信息进行语义分析，得到语义分析结果；

分词模块，用于针对所述语义分析结果进行分词处理，得到所述语义分析结果包括的至少一个关键词；

语法识别模块，用于根据预先确定出的语法结构模型，对所有所述关键词进行语法结构识别处理，得到语法结构识别结果，其中，所述语法结构识别结果包括每个所述关键词对应的第一词槽类型；

所述确定模块，还用于根据所有所述关键词，确定所述语义分析结果相匹配的意图语句模型以及所述意图语句模型所对应的所有第二词槽类型；

其中，所述判断模块判断能否根据所述第一语音信息确定所述目标用户的用户意图的具体方式包括：

其中，所述判断模块判断由所有所述第一词槽类型组成的词槽类型集合是否与所有所述第二词槽类型相匹配的具体方式包括：

作为一种可选的实施方式，在本发明第二方面中，所述确定模块，还用于当所述判断模块判断出无法根据所述第一语音信息确定所述目标用户的用户意图时，在所述输出模块向所述目标用户输出所述第一语音信息对应的问询语句之前，将所有所述第二词槽类型中所述词槽类型集合未包括的第二词槽类型确定为待确认词槽类型，或者，将所有所述关键词槽类型中所述词槽类型集合未包括的关键词槽类型确定为待确认词槽类型；还用于根据预先确定出的所述第一语音信息对应的声纹信息，确定所述目标用户的用户信息；

以及，所述装置还包括：

语句生成模块，用于基于预先确定出的对话模型和所述用户信息，生成所述待确认词槽类型匹配的问询语句，作为所述第一语音信息对应的问询语句；

所述确定模块，还用于基于所述用户信息和所述目标用户所处的空间区域，确定与所述目标用户相匹配的问询方式以及与所述问询方式相匹配的问询设备；

所述判断模块，还用于根据所述问询方式以及所述问询设备，判断是否需要对所述问询语句执行形式转换操作，当判断出不需要对所述问询语句执行所述形式转换操作时，触发所述输出模块执行所述的向所述目标用户输出所述第一语音信息对应的问询语句的操作；

形式转换模块，用于当所述判断模块判断出需要对所述问询语句执行所述形式转换操作时，将所述问询语句由文本形式转换成与所述问询方式和所述问询设备相匹配的目标形式，并触发所述输出模块执行所述的向所述目标用户输出所述第一语音信息对应的问询语句的操作；

其中，所述输出模块向所述目标用户输出所述第一语音信息对应的问询语句的具体方式包括：

作为一种可选的实施方式，在本发明第二方面中，所述语句生成模块基于预先确定出的对话模型和所述用户信息，生成所述待确认词槽类型匹配的问询语句，作为所述第一语音信息对应的问询语句的具体方式包括：

其中，所述语句生成模块基于预先确定出的对话模型、所述语言类型以及所述问句类型，生成所述待确认词槽类型匹配的问询语句，作为所述第一语音信息对应的问询语句的具体方式包括：

作为一种可选的实施方式，在本发明第二方面中，所述装置还包括：

采集模块，用于当所述判断模块判断出无法根据所述第一语音信息确定所述目标用户的用户意图时，在所述输出模块向所述目标用户输出所述第一语音信息对应的问询语句之前，采集所述目标用户在输出所述第一语音信息时的身体活动图像信息；

所述确定模块，还用于根据所述身体活动图像信息，确定所述目标用户的身体关键点基于参照点的坐标值的动态变化集合，所述动态变化集合包括自所述目标用户开始输出所述第一语音信息至所述目标用户结束输出所述第一语音信息的时间段内每个采集时刻中所述身体关键点基于所述参照点的坐标值；

所述判断模块，还用于根据所述动态变化集合，判断所述身体关键点的移动距离是否大于等于预设距离；

所述确定模块，还用于当所述判断模块判断出所述移动距离大于等于所述预设距离时，根据所述动态变化集合，确定所述目标用户对应的肢体语言信息；

所述判断模块，还用于判断能否根据所述第一语音信息和所述肢体语言信息确定所述目标用户的用户意图，当判断结果为否时，触发所述输出模块执行所述的向所述目标用户输出所述第一语音信息对应的问询语句的操作。

作为一种可选的实施方式，在本发明第二方面中，所述确定模块，还用于在根据所述第一语音信息和所述目标用户针对所述问询语句反馈的第二语音信息，确定所述目标用户的用户意图之前，确定所述第一语音信息对应的第一意图对象和所述目标用户针对所述问询语句反馈的第二语音信息对应的第二意图对象；

所述判断模块，还用于判断所述第一意图对象与所述第二意图对象是否相匹配，当判断出所述第一意图对象与所述第二意图对象相匹配时，触发所述确定模块执行所述的根据所述第一语音信息和所述目标用户针对所述问询语句反馈的第二语音信息，确定所述目标用户的用户意图的操作；当判断出所述第一意图对象与所述第二意图对象不匹配时，判断能否根据所述第二语音信息确定所述目标用户的第二用户意图；

所述输出模块，还用于当所述判断模块判断出无法根据所述第二语音信息确定所述目标用户的第二用户意图时，向所述目标用户分别输出所述第一语音信息对应的问询语句和所述第二语音信息对应的问询语句。

作为一种可选的实施方式，在本发明第二方面中，所述确定模块，还用于在所述控制模块根据所述用户意图，控制所述用户意图对应的目标智能设备执行相匹配的操作之前，确定能够执行所述用户意图相匹配的操作的目标智能设备；

所述判断模块，还用于当预先确定出的所述目标用户的身份类型为小孩类型时，判断所述目标用户是否具有使用所述目标智能设备的权限；当判断出所述目标用户不具有使用所述目标智能设备的权限时，判断所述目标用户所在的空间区域内是否存在身份类型为成人类型的监护用户；

所述输出模块，还用于当所述判断模块判断出所述空间区域内存在所述监护用户时，向所述监护用户输出针对所述目标智能设备的权限问询语句，所述权限问询语句用于向所述监护用户询问是否允许所述目标用户使用所述目标智能设备；

所述判断模块，还用于根据所述监护用户针对所述权限问询语句反馈的语音信息判断所述监护用户是否允许所述目标用户使用所述目标智能设备，当判断出所述监护用户允许所述目标用户使用所述目标智能设备时，触发所述控制模块执行所述的根据所述用户意图，控制所述用户意图对应的目标智能设备执行相匹配的操作的操作；

所述确定模块，还用于当所述判断模块判断出所述空间区域内不存在所述监护用户时，或者，当所述判断模块判断出所述监护用户不允许所述目标用户使用所述目标智能设备时，确定所述目标智能设备的设备类型；

所述判断模块，还用于判断所述空间区域内是否存在与所述设备类型匹配的玩具智能设备；

所述控制模块，还用于当所述判断模块判断出所述空间区域内存在所述玩具智能设备时，根据所述用户意图，控制所述玩具智能设备执行相匹配的操作。

本发明第三方面公开了另一种基于多轮次问询的意图识别装置，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明第一方面公开的基于多轮次问询的意图识别方法。

本发明第四方面公开了一种计算机存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行本发明第一方面公开的基于多轮次问询的意图识别方法。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，当接收到由智能设备采集到的目标用户的第一语音信息时，判断能否根据第一语音信息确定目标用户的用户意图；当判断结果为否时，向目标用户输出第一语音信息对应的问询语句；根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图；根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作。可见，实施本发明能够在无法根据用户的语音信息确定用户意图时与用户进行多轮次问询交互从而确定用户的实际意图，减少因用户下达控制指令时输出的语音信息缺少关键信息而无法准确识别用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，从而减少错误控制智能设备的情况发生，进而提高用户使用体验。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种基于多轮次问询的意图识别方法的流程示意图；

图2是本发明实施例公开的另一种基于多轮次问询的意图识别方法的流程示意图；

图3是本发明实施例公开的一种基于多轮次问询的意图识别装置的结构示意图；

图4是本发明实施例公开的另一种基于多轮次问询的意图识别装置的结构示意图；

图5是本发明实施例公开的又一种基于多轮次问询的意图识别装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明公开了一种基于多轮次问询的意图识别方法及装置，能够在无法根据用户的语音信息确定用户意图时与用户进行多轮次问询交互从而确定用户的实际意图，减少因用户下达控制指令时输出的语音信息缺少关键信息而无法准确识别用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，从而减少错误控制智能设备的情况发生，进而提高用户使用体验。以下分别进行详细说明。

实施例一

请参阅图1，图1是本发明实施例公开的一种基于多轮次问询的意图识别方法的流程示意图。其中，图1所描述的基于多轮次问询的意图识别方法可以应用于智能设备的云控制端中，也可以应用于智能设备的本地控制端中，本发明实施例不做限定。如图1所示，该基于多轮次问询的意图识别方法可以包括以下操作：

101、当接收到由智能设备采集到的目标用户的第一语音信息时，判断能否根据第一语音信息确定目标用户的用户意图。

本发明实施例中，采集语音信息的智能设备可以包括任意具有语音采集功能的家居设备，如智能音箱等，也可以包括任意具有语音采集功能的便携式智能设备，如智能终端、智能手环、智能耳机、智能眼镜等，本发明实施例不做限定。目标用户的用户意图的意图信息需要包括用户对应的待执行的控制操作以及用于执行该控制操作的目标智能设备。

作为一种可选的实施方式，判断能否根据第一语音信息确定目标用户的用户意图，可以包括：

判断能否根据第一语音信息确定目标用户对应的待控制的目标智能设备以及目标用户对应的待执行的控制操作；

当判断出能够根据第一语音信息确定目标用户对应的待控制的目标智能设备以及目标用户对应的待执行的控制操作时，确定能够根据第一语音信息确定目标用户的用户意图；

当判断出无法根据第一语音信息确定目标用户对应的待控制的目标智能设备或者无法根据第一语音信息确定目标用户对应的待执行的控制操作时，判断能否根据第一语音信息以及目标用户的生活习惯和/或目标用户所在的空间区域内所有智能设备的工作状态确定目标用户对应的待控制的目标智能设备以及目标用户对应的待执行的控制操作；

当判断出能够根据第一语音信息以及目标用户的生活习惯和/或目标用户所在的空间区域内的所有智能设备的工作状态确定目标用户对应的待控制的目标智能设备以及目标用户对应的待执行的控制操作时，确定能够根据第一语音ixni确定目标用户的用户意图。

例如，第一语音信息“给我订张到北京的机票”中缺少时间信息，而目标用户的生活习惯表示用户经常提前一天订机票，则可以确定用户需要订一张第二天从用户所在地至北京的机票。

可见，实施该可选的实施方式能够结合用户的用户习惯以及智能设备当前的工作状态从而根据语音信息确定用户意图，提高了确定用户意图方式的多样性和灵活性，并提高了确定出的用户意图的准确性。

102、当步骤101的判断结果为否时，向目标用户输出第一语音信息对应的问询语句。

本发明实施例中，可以根据目标用户的用户信息、目标用户所处的场景选择问询语句对应的问询方式或问询设备，例如，当目标用户处于客厅时，可以通过客厅的电视机或音箱向用户输出基于语音形式的问询语句。可选的，向目标用户输出的第一语音信息对应的问询语句的数量可以为一个或多个，本发明实施例不做限定，进一步可选的，当需要向目标用户输出多个问询语句时，可以一次性向目标用户输出所有问询语句，也可以分批次向目标用户输出所有问询语句，本发明实施例不做限定。

作为一种可选的实施方式，向目标用户输出第一语音信息对应的问询语句，可以包括：

判断需要向目标用户输出的第一语音信息对应的所有问询语句的数量是否大于阈值数量；

当所有问询语句的数量大于阈值数量时，根据所有问询语句对应的问询范围，确定每个问询语句对应的问询顺序；

根据每个问询语句对应的问询顺序，将所有问询语句拆分成至少一个问询语句集合，每个问询语句集合包括的问询语句的数量不大于阈值数量；

根据每个问询语句对应的问询顺序，依次向目标用户输出每个问询语句集合中的问询语句。

在该可选的实施方式中，优选的，阈值数量可以为1。

可见，实施该可选的实施方式能够在需要向用户输出多个问询语句时，分批次向用户输出所有问询语句，从而更加人性化地与用户进行交互，减少因用户错误答复问询语句或遗漏答复问询语句而导致无法根据语音信息确定用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，并且提高了用户体验。

在该可选的实施方式中，可选的，当所有问询语句集合的数量大于1时，针对除第一个问询语句集合之外的其他问询语句集合，在向目标用户输出该问询语句集合中的问询语句之前，该方法还可以包括；

对于该问询语句集合中的每个问询语句，判断目标用户针对该问询语句集合的在前问询语句集合的答复语音信息中是否包括该问询语句对应的答复关键词；若不存在该问询语句对应的答复关键词，向目标用户输出该问询语句集合中的问询语句；若存在该问询语句对应的答复关键词，将该问询语句从该问询语句集合中删除，并判断该问询语句集合中是否存在其他问询语句；若存在其他问询语句，向目标用户输出该问询语句集合中的问询语句。

可见，实施该可选的实施方式还能够根据用户已答复的语音信息尽可能减少需要向用户输出的问询语句的数量，较少用户消耗的时间成本，提高根据用户语音信息确定用户意图的效率。

103、根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图。

其中，当向目标用户输出了第一语音信息的多个问询语句时，第二语音信息包括目标用户针对所有问询语句反馈的所有语音信息。

104、根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作。

本发明实施例中，目标智能设备可以包括任意可智能控制的智能设备，如智能家居设备、智能终端等，本发明实施例不做限定。其中，目标用户可以通过语音信息实现对目标智能设备的近程控制或远程控制，例如，目标用户可以在公司通过便携式智能终端输入语音信息从而对家里的智能设备进行控制操作。

可见，实施本发明实施例能够在无法根据用户的语音信息确定用户意图时与用户进行多轮次问询交互从而确定用户的实际意图，减少因用户下达控制指令时输出的语音信息缺少关键信息而无法准确识别用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，从而减少错误控制智能设备的情况发生，进而提高用户使用体验。

在一个可选的实施例中，当判断出无法根据第一语音信息确定目标用户的用户意图时，在向目标用户输出第一语音信息对应的问询语句之前，该方法还可以包括：

采集目标用户在输出第一语音信息时的身体活动图像信息；

根据身体活动图像信息，确定目标用户的身体关键点基于参照点的坐标值的动态变化集合，动态变化集合包括自目标用户开始输出第一语音信息至目标用户结束输出第一语音信息的时间段内每个采集时刻中身体关键点基于参照点的坐标值；

根据动态变化集合，判断身体关键点的移动距离是否大于等于预设距离；

当判断出移动距离大于等于预设距离时，根据动态变化集合，确定目标用户对应的肢体语言信息；

判断能否根据第一语音信息和肢体语言信息确定目标用户的用户意图，当判断结果为否时，触发执行上述的向目标用户输出第一语音信息对应的问询语句的操作。

在该可选的实施例中，可选的参照点可以包括目标用户开始输出第一语音信息时身体关键点的初始坐标点，也可以包括身体活动图像信息中的任意固定点，本可选的实施例不做限定。

可见，实施该可选的实施例能够在无法根据语音信息确定用户意图时结合用户的肢体语言确定用户意图，提高了确定用户意图的方式的多样性、灵活性、准确性和可靠性，并且，能够减少非必要的输出问询语句的操作，进而减少用户因下达控制指令而消耗的时间成本，提高根据识别用户意图的效率，并提高用户的使用体验。

在另一个可选的实施例中，在根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图之前，该方法还可以包括：

确定第一语音信息对应的第一意图对象和目标用户针对问询语句反馈的第二语音信息对应的第二意图对象；

判断第一意图对象与第二意图对象是否相匹配；

当第一意图对象与第二意图对象相匹配时，触发执行上述的根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图的操作；

当第一意图对象与第二意图对象不匹配时，判断能否根据第二语音信息确定目标用户的第二用户意图；当判断出无法根据第二语音信息确定目标用户的第二用户意图时，向目标用户分别输出第一语音信息对应的问询语句和第二语音信息对应的问询语句。

可见，实施该可选的实施例能够在接收到用户的多轮语音信息且不同语音信息的意图对象不同时再次与用户进行交互，从而提高根据语音信息确定用户意图的准确性和可靠性，减少错误执行或者遗漏执行用户意图对应的智能设备控制操作的情况发生，提高用户的使用体验。

在又一个可选的实施例中，在根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作之前，该方法还可以包括：

确定能够执行用户意图相匹配的操作的目标智能设备；

当预先确定出的目标用户的身份类型为小孩类型时，判断目标用户是否具有使用目标智能设备的权限；

当判断出目标用户不具有使用目标智能设备的权限时，判断目标用户所在的空间区域内是否存在身份类型为成人类型的监护用户；

当判断出空间区域内存在监护用户时，向监护用户输出针对目标智能设备的权限问询语句，权限问询语句用于向监护用户询问是否允许目标用户使用目标智能设备；

根据监护用户针对权限问询语句反馈的语音信息判断监护用户是否允许目标用户使用目标智能设备；

当判断出监护用户允许目标用户使用目标智能设备时，触发执行上述的根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作的操作；

当判断出空间区域内不存在监护用户时，或者，当判断出监护用户不允许目标用户使用目标智能设备时，确定目标智能设备的设备类型；

判断空间区域内是否存在与设备类型匹配的玩具智能设备；

当空间区域内存在玩具智能设备时，根据用户意图，控制玩具智能设备执行相匹配的操作。

在该可选的实施例中，可选的，当空间区域内存在玩具智能设备时，还可以控制玩具智能设备进入发光模式或者发声模式，以吸引目标用户的注意力。

可见，实施该可选的实施例还能够在用户为小孩时对其智能设备使用权限进行限制，确保用户在监护人的监护下使用智能设备或者让用户使用可替代的玩具智能设备，提高了智能设备控制的安全性和可靠性，有利于儿童的健康生活和学习。

实施例二

请参阅图2，图2是本发明实施例公开的另一种基于多轮次问询的意图识别方法的流程示意图。其中，图2所描述的基于多轮次问询的意图识别方法可以应用于智能设备的云控制端中，也可以应用于智能设备的本地控制端中，本发明实施例不做限定。如图2所示，该基于多轮次问询的意图识别方法可以包括以下操作：

201、当接收到由智能设备采集到的目标用户的第一语音信息时，针对第一语音信息进行语义分析，得到语义分析结果。

其中，语义分析结果包括语音信息对应的文本信息。

202、针对语义分析结果进行分词处理，得到语义分析结果包括的至少一个关键词。

其中，语义分析结果包括的关键词为可用于识别用户意图的关键词，例如，针对第一语音信息“我想睡觉，帮我打开空调”的语义分析结果进行分词处理后，从中提取到的关键词包括“睡觉”、“打开”、“空调”，从而可以识别到用户的意图包括打开卧室的空调，进一步，还可以识别到用户意图还包括将卧室温度调节至舒适睡眠温度。

需要说明的是，若第一语音信息对应的语言为表意文字语言，如汉语，则需要执行步骤202所描述的分词操作；若第一语音信息对应的语言为表音文字语言，如英语，则可以执行步骤202所描述的分词操作，也可以不执行步骤202所描述的操作，若执行步骤202所描述的分词操作，得到的关键词可以为包括至少一个单词的关键词组。

203、根据预先确定出的语法结构模型，对所有关键词进行语法结构识别处理，得到语法结构识别结果，其中，语法结构识别结果包括每个关键词对应的第一词槽类型。

其中，每个关键词对应的第一词槽类型可以包括时间类型、地点类型、操作类型、设备类型、情绪类型、状态类型、人员类型等，本发明实施例不做限定。

204、根据所有关键词，确定语义分析结果相匹配的意图语句模型以及意图语句模型所对应的所有第二词槽类型。

本发明实施例中，若语音信息对应的语法结构识别结果包括意图语句模型所对应的所有第二词槽类型，则可以根据语音信息准确且无歧义地确定目标用户的用户意图。

例如，第一语音信息“订一张从哈尔滨到北京的机票”包括的第一词槽类型包括操作类型“订机票”，数量类型“一张”，出发地类型“哈尔滨”，目的地类型“北京”，而该第一语音信息对应的语义分析结果相匹配的意图语句模型所对应的所有第二词槽类型中，除上述第一词槽类型之外，还应包括时间类型、航班类型、人员类型等，因此，无法根据第一语音信息确定目标用户的用户意图。

205、判断由所有第一词槽类型组成的词槽类型集合是否与所有第二词槽类型相匹配。

作为一种可选的实施方式，判断由所有第一词槽类型组成的词槽类型集合是否与所有第二词槽类型相匹配，可以包括：

判断由所有第一词槽类型组成的词槽类型集合中是否包括所有第二词槽类型，当判断出词槽类型集合中未包括所有第二词槽类型时，确定词槽类型集合与所有第二词槽类型不匹配；或者，

判断由所有第一词槽类型组成的词槽类型集合中是否包括所有第二词槽类型中的所有关键词槽类型，当词槽类型集合中未包括所有关键词槽类型时，确定词槽类型集合与所有第二词槽类型不匹配。

可见，实施该可选的实施方式能够提高判断能否根据语音信息确定用户意图的准确性和可靠性，从而提高与用户进行问询交互的准确性和可靠性。

206、当步骤205的判断结果为否时，向目标用户输出第一语音信息对应的问询语句。

207、根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图。

208、根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作。

本发明实施例中，针对步骤206-步骤208的其它描述，请参照实施例一中针对步骤102-步骤103的详细描述，本发明实施例不再赘述

可见，实施本发明实施例能够在无法根据用户的语音信息确定用户意图时与用户进行多轮次问询交互从而确定用户的实际意图，减少因用户下达控制指令时输出的语音信息缺少关键信息而无法准确识别用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，从而减少错误控制智能设备的情况发生，进而提高用户使用体验；此外，能够基于语义识别和意图语句模型判断能否根据语音信息确定用户意图，提高了判断能否根据语音信息确定用户意图的准确性和可靠性，从而提高与用户进行问询交互的准确性和可靠性。

将所有第二词槽类型中词槽类型集合未包括的第二词槽类型确定为待确认词槽类型，或者，将所有关键词槽类型中词槽类型集合未包括的关键词槽类型确定为待确认词槽类型；

根据预先确定出的第一语音信息对应的声纹信息，确定目标用户的用户信息；

基于预先确定出的对话模型和用户信息，生成待确认词槽类型匹配的问询语句，作为第一语音信息对应的问询语句；

基于用户信息和目标用户所处的空间区域，确定与目标用户相匹配的问询方式以及与问询方式相匹配的问询设备；

根据问询方式以及问询设备，判断是否需要对问询语句执行形式转换操作；

当判断出需要对问询语句执行形式转换操作时，将问询语句由文本形式转换成与问询方式和问询设备相匹配的目标形式，并触发执行上述的向目标用户输出第一语音信息对应的问询语句的操作；

当判断出不需要对问询语句执行形式转换操作时，触发执行上述的向目标用户输出第一语音信息对应的问询语句的操作；

其中，向目标用户输出第一语音信息对应的问询语句，可以包括：

当对问询语句执行了形式转换操作时，基于目标形式和问询设备，向目标用户输出第一语音信息对应的问询语句。

例如，当用户信息表示目标用户具有听力障碍时，可以判断目标用户所处的场景中是否存在包括显示功能的智能显示设备，若有智能显示设备，则将问询语句由文本形式转换成手语视频形式，并通过智能显示设备向目标用户输出便于用户理解的基于手语视频形式的问询语句。

可见，实施该可选的实施例能够根据用户信息和缺少的词槽类型生成问询语句，并根据用户信息和用户所处场景确定与用户匹配的问询方式，减少因问询语句或问询方式与用户不匹配而导致无法与用户进行交互的情况发生，从而更加人性化地与用户进行交互，提高了与用户进行问询交互的准确性和可靠性，从而提高了根据语音信息确定用户意图的准确性和可靠性。

在该可选的实施例中，作为一种可选的实施方式，基于预先确定出的对话模型和用户信息，生成待确认词槽类型匹配的问询语句，作为第一语音信息对应的问询语句，可以包括：

根据用户信息确定目标用户的身份类型、目标用户匹配的语言类型，并确定与身份类型对应的理解能力和待确认词槽类型均匹配的问句类型；

基于预先确定出的对话模型、语言类型以及问句类型，生成待确认词槽类型匹配的问询语句，作为第一语音信息对应的问询语句。

可见，实施该可选的实施方式能够根据用户信息生成与用户匹配的问询语句，以便于用户能够快速理解问询语句，从而提高人机交互的智能化和人性化，减少因用户无法理解问询语句而导致无法根据语音信息确定用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，进而提高了用户的使用体验。

在该可选的实施方式中，可选的，基于预先确定出的对话模型、语言类型以及问句类型，生成待确认词槽类型匹配的问询语句，作为第一语音信息对应的问询语句，可以包括：

当问句类型为是非疑问句类型或选择疑问句类型时，预测待确认词槽类型对应的所有可选答复关键词；

当问句类型为选择疑问句类型时，基于对话模型和语言类型，生成包括所有可选答复关键词且与待确认词槽类型相匹配的选择问询语句，作为第一语音信息对应的问询语句；

当问句类型为是非疑问句类型时，根据用户信息，从所有可选答复关键词中确定与目标用户匹配程度最高的目标答复关键词，并基于对话模型和语言类型，生成包括目标答复关键词且与待确认词槽类型相匹配的是非问询语句，作为第一语音信息对应的问询语句。

可见，实施该可选的实施例能够将预测的关键信息转换成问句输出以便于用户确认或者选择，有利于减少了用户因考虑针对问询语句的答复信息而消耗的时间成本，提高用户答复问询语句的效率和便捷性，进而提高用户的使用体验。

实施例三

请参阅图3，图3是本发明实施例公开的一种基于多轮次问询的意图识别装置的结构示意图。其中，图3所描述的基于多轮次问询的意图识别装置可以应用于智能设备的云控制端中，也可以应用于智能设备的本地控制端中，本发明实施例不做限定。如图3所示，该基于多轮次问询的意图识别装置可以包括：

判断模块301，用于当接收到由智能设备采集到的目标用户的第一语音信息时，判断能否根据第一语音信息确定目标用户的用户意图；

输出模块302，用于当判断模块301判断出无法根据第一语音信息确定目标用户的用户意图时，向目标用户输出第一语音信息对应的问询语句；

确定模块303，用于根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图；

控制模块304，用于根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作。

可见，实施图3所描述的装置能够在无法根据用户的语音信息确定用户意图时与用户进行多轮次问询交互从而确定用户的实际意图，减少因用户下达控制指令时输出的语音信息缺少关键信息而无法准确识别用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，从而减少错误控制智能设备的情况发生，进而提高用户使用体验。

在一个可选的实施例中，如图4所示，该装置还可以包括：

语义识别模块305，用于当接收到由智能设备采集到的目标用户的第一语音信息时，在判断模块301判断能否根据第一语音信息确定目标用户的用户意图之前，针对第一语音信息进行语义分析，得到语义分析结果；

分词模块306，用于针对语义分析结果进行分词处理，得到语义分析结果包括的至少一个关键词；

语法识别模块307，用于根据预先确定出的语法结构模型，对所有关键词进行语法结构识别处理，得到语法结构识别结果，其中，语法结构识别结果包括每个关键词对应的第一词槽类型；

确定模块303，还用于根据所有关键词，确定语义分析结果相匹配的意图语句模型以及意图语句模型所对应的所有第二词槽类型；

其中，判断模块301判断能否根据第一语音信息确定目标用户的用户意图的具体方式可以包括：

判断由所有第一词槽类型组成的词槽类型集合是否与所有第二词槽类型相匹配；当判断出词槽类型集合与所有第二词槽类型不匹配时，确定无法根据第一语音信息确定目标用户的用户意图；

其中，判断模块301判断由所有第一词槽类型组成的词槽类型集合是否与所有第二词槽类型相匹配的具体方式可以包括：

可见，实施图4所描述的装置能够基于语义识别和意图语句模型判断能否根据语音信息确定用户意图，提高了判断能否根据语音信息确定用户意图的准确性和可靠性，从而提高与用户进行问询交互的准确性和可靠性。

在另一个可选的实施例中，如图4所示，确定模块303，还用于当判断模块301判断出无法根据第一语音信息确定目标用户的用户意图时，在输出模块302向目标用户输出第一语音信息对应的问询语句之前，将所有第二词槽类型中词槽类型集合未包括的第二词槽类型确定为待确认词槽类型，或者，将所有关键词槽类型中词槽类型集合未包括的关键词槽类型确定为待确认词槽类型；还用于根据预先确定出的第一语音信息对应的声纹信息，确定目标用户的用户信息；

以及，该装置还可以包括：

语句生成模块308，用于基于预先确定出的对话模型和用户信息，生成待确认词槽类型匹配的问询语句，作为第一语音信息对应的问询语句；

确定模块303，还用于基于用户信息和目标用户所处的空间区域，确定与目标用户相匹配的问询方式以及与问询方式相匹配的问询设备；

判断模块301，还用于根据问询方式以及问询设备，判断是否需要对问询语句执行形式转换操作，当判断出不需要对问询语句执行形式转换操作时，触发输出模块302执行上述的向目标用户输出第一语音信息对应的问询语句的操作；

形式转换模块309，用于当判断模块301判断出需要对问询语句执行形式转换操作时，将问询语句由文本形式转换成与问询方式和问询设备相匹配的目标形式，并触发输出模块302执行上述的向目标用户输出第一语音信息对应的问询语句的操作；

其中，输出模块302向目标用户输出第一语音信息对应的问询语句的具体方式可以包括：

可见，实施图4所描述的装置还能够根据用户信息和缺少的词槽类型生成问询语句，并根据用户信息和用户所处场景确定与用户匹配的问询方式，减少因问询语句或问询方式与用户不匹配而导致无法与用户进行交互的情况发生，从而更加人性化地与用户进行交互，提高了与用户进行问询交互的准确性和可靠性，从而提高了根据语音信息确定用户意图的准确性和可靠性。

在又一个可选的实施例中，如图4所示，语句生成模块308基于预先确定出的对话模型和用户信息，生成待确认词槽类型匹配的问询语句，作为第一语音信息对应的问询语句的具体方式可以包括：

基于预先确定出的对话模型、语言类型以及问句类型，生成待确认词槽类型匹配的问询语句，作为第一语音信息对应的问询语句；

其中，语句生成模块308基于预先确定出的对话模型、语言类型以及问句类型，生成待确认词槽类型匹配的问询语句，作为第一语音信息对应的问询语句的具体方式可以包括：

可见，实施图4所描述的装置还能够根据用户信息生成与用户匹配的问询语句，以便于用户能够快速理解问询语句，从而提高人机交互的智能化和人性化，减少因用户无法理解问询语句而导致无法根据语音信息确定用户意图的情况发生，提高了根据语音信息确定用户意图的准确性和可靠性，将预测的关键信息转换成问句输出以便于用户确认或者选择，有利于减少了用户因考虑针对问询语句的答复信息而消耗的时间成本，提高用户答复问询语句的效率和便捷性，进而提高用户的使用体验。

在又一个可选的实施例中，如图4所示，该装置还可以包括：

采集模块310，用于当判断模块301判断出无法根据第一语音信息确定目标用户的用户意图时，在输出模块302向目标用户输出第一语音信息对应的问询语句之前，采集目标用户在输出第一语音信息时的身体活动图像信息；

确定模块303，还用于根据身体活动图像信息，确定目标用户的身体关键点基于参照点的坐标值的动态变化集合，动态变化集合包括自目标用户开始输出第一语音信息至目标用户结束输出第一语音信息的时间段内每个采集时刻中身体关键点基于参照点的坐标值；

判断模块301，还用于根据动态变化集合，判断身体关键点的移动距离是否大于等于预设距离；

确定模块303，还用于当判断模块301判断出移动距离大于等于预设距离时，根据动态变化集合，确定目标用户对应的肢体语言信息；

判断模块301，还用于判断能否根据第一语音信息和肢体语言信息确定目标用户的用户意图，当判断结果为否时，触发输出模块302执行上述的向目标用户输出第一语音信息对应的问询语句的操作。

可见，实施图4所描述的装置还能够在无法根据语音信息确定用户意图时结合用户的肢体语言确定用户意图，提高了确定用户意图的方式的多样性、灵活性、准确性和可靠性，并且，能够减少非必要的输出问询语句的操作，进而减少用户因下达控制指令而消耗的时间成本，提高根据识别用户意图的效率，并提高用户的使用体验。

在又一个可选的实施例中，如图4所示，确定模块303，还用于在根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图之前，确定第一语音信息对应的第一意图对象和目标用户针对问询语句反馈的第二语音信息对应的第二意图对象；

判断模块301，还用于判断第一意图对象与第二意图对象是否相匹配，当判断出第一意图对象与第二意图对象相匹配时，触发确定模块303执行上述的根据第一语音信息和目标用户针对问询语句反馈的第二语音信息，确定目标用户的用户意图的操作；当判断出第一意图对象与第二意图对象不匹配时，判断能否根据第二语音信息确定目标用户的第二用户意图；

输出模块302，还用于当判断模块301判断出无法根据第二语音信息确定目标用户的第二用户意图时，向目标用户分别输出第一语音信息对应的问询语句和第二语音信息对应的问询语句。

可见，实施图4所描述的装置还能够在接收到用户的多轮语音信息且不同语音信息的意图对象不同时再次与用户进行交互，从而提高根据语音信息确定用户意图的准确性和可靠性，减少错误执行或者遗漏执行用户意图对应的智能设备控制操作的情况发生，提高用户的使用体验。

在又一个可选的实施例中，如图4所示，确定模块303，还用于在控制模块304根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作之前，确定能够执行用户意图相匹配的操作的目标智能设备；

判断模块301，还用于当预先确定出的目标用户的身份类型为小孩类型时，判断目标用户是否具有使用目标智能设备的权限；当判断出目标用户不具有使用目标智能设备的权限时，判断目标用户所在的空间区域内是否存在身份类型为成人类型的监护用户；

输出模块302，还用于当判断模块301判断出空间区域内存在监护用户时，向监护用户输出针对目标智能设备的权限问询语句，权限问询语句用于向监护用户询问是否允许目标用户使用目标智能设备；

判断模块301，还用于根据监护用户针对权限问询语句反馈的语音信息判断监护用户是否允许目标用户使用目标智能设备，当判断出监护用户允许目标用户使用目标智能设备时，触发控制模块304执行上述的根据用户意图，控制用户意图对应的目标智能设备执行相匹配的操作的操作；

确定模块303，还用于当判断模块301判断出空间区域内不存在监护用户时，或者，当判断模块301判断出监护用户不允许目标用户使用目标智能设备时，确定目标智能设备的设备类型；

判断模块301，还用于判断空间区域内是否存在与设备类型匹配的玩具智能设备；

控制模块304，还用于当判断模块301判断出空间区域内存在玩具智能设备时，根据用户意图，控制玩具智能设备执行相匹配的操作。

可见，实施图4所描述的装置还能够在用户为小孩时对其智能设备使用权限进行限制，确保用户在监护人的监护下使用智能设备或者让用户使用可替代的玩具智能设备，提高了智能设备控制的安全性和可靠性，有利于儿童的健康生活和学习。

实施例四

请参阅图5，图5是本发明实施例公开的又一种基于多轮次问询的意图识别装置的结构示意图。如图5所示，该基于多轮次问询的意图识别装置可以包括：

存储有可执行程序代码的存储器401；

与存储器401耦合的处理器402；

处理器402调用存储器401中存储的可执行程序代码，执行本发明实施例一或本发明实施例二所描述的基于多轮次问询的意图识别方法中的步骤。

实施例五

本发明实施例公开了一种计算机存储介质，该计算机存储介质存储有计算机指令，该计算机指令被调用时，用于执行本发明实施例一或本发明实施例二所描述的基于多轮次问询的意图识别方法中的步骤。

实施例六

本发明实施例公开了一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可操作来使计算机执行实施例一或实施例二中所描述的基于多轮次问询的意图识别方法中的步骤。

以上所描述的装置实施例仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施例的具体描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory，EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是：本发明实施例公开的一种基于多轮次问询的意图识别方法及装置所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims

1.一种基于多轮次问询的意图识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于多轮次问询的意图识别方法，其特征在于，当接收到由智能设备采集到的目标用户的第一语音信息时，在所述判断能否根据所述第一语音信息确定所述目标用户的用户意图之前，所述方法还包括：

针对所述第一语音信息进行语义分析，得到语义分析结果；

3.根据权利要求2所述的基于多轮次问询的意图识别方法，其特征在于，当判断出无法根据所述第一语音信息确定所述目标用户的用户意图时，在所述向所述目标用户输出所述第一语音信息对应的问询语句之前，所述方法还包括：

4.根据权利要求3所述的基于多轮次问询的意图识别方法，其特征在于，所述基于预先确定出的对话模型和所述用户信息，生成所述待确认词槽类型匹配的问询语句，作为所述第一语音信息对应的问询语句，包括：

5.根据权利要求1-4中任一项所述的基于多轮次问询的意图识别方法，其特征在于，当判断出无法根据所述第一语音信息确定所述目标用户的用户意图时，在所述向所述目标用户输出所述第一语音信息对应的问询语句之前，所述方法还包括：

6.根据权利要求1-4中任一项所述的基于多轮次问询的意图识别方法，其特征在于，在所述所述根据所述第一语音信息和所述目标用户针对所述问询语句反馈的第二语音信息，确定所述目标用户的用户意图之前，所述方法还包括：

判断所述第一意图对象与所述第二意图对象是否相匹配；

7.根据权利要求1-4中任一项所述的基于多轮次问询的意图识别方法，其特征在于，在所述根据所述用户意图，控制所述用户意图对应的目标智能设备执行相匹配的操作之前，所述方法还包括：

确定能够执行所述用户意图相匹配的操作的目标智能设备；

8.一种基于多轮次问询的意图识别装置，其特征在于，所述装置包括：

9.一种基于多轮次问询的意图识别装置，其特征在于，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如权利要求1-7任一项所述的基于多轮次问询的意图识别方法。

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行如权利要求1-7任一项所述的基于多轮次问询的意图识别方法。