CN110415693A

CN110415693A - 一种基于智能语音产品语音交互场景的动态多轮交互方式

Info

Publication number: CN110415693A
Application number: CN201910634645.3A
Authority: CN
Inventors: 黄志明; 胡华涛; 罗金华; 王麟
Original assignee: Shenzhen Yihui Software Co Ltd
Current assignee: Shenzhen Yihui Software Co Ltd
Priority date: 2019-07-15
Filing date: 2019-07-15
Publication date: 2019-11-05

Abstract

本发明公开了一种基于智能语音产品语音交互场景的动态多轮交互方式，该方式包括激活多轮对话条件、各条件所进入的预设模式、以及对应模式内的意图集合；其中预设模式包含：拒绝模式和接受模式；当开始为接受模式时，开启该次多轮交互流程，进入下轮语音交互后，将对下轮语音交互自然语言处理结果进行裁定。本发明一种基于智能语音产品语音交互场景的动态多轮交互方式针对当前市场主流产品中多轮交互方案进行优化解决，在开启多轮对话的同时，对多轮交互过程中异常情况进行合理处理，使整个交互流程合理可控。

Description

一种基于智能语音产品语音交互场景的动态多轮交互方式

技术领域

本发明涉及语音交互领域，尤其是一种基于智能语音产品语音交互场景的动态多轮交互方式。

背景技术

在机器学习与大数据的驱动下，语音产品快速发展，越来越多的语音产品对用户提供了提供多轮交互能力，以解决用户在与智能语音助手交互时，需要多次使用唤醒词进行唤醒的问题。亚马逊于2018年3月为其智能语音助手Alexa添加了名为「后续模式」（Follow-Up Mode）的新技能，也正是用于解决这样的问题，通过后续模式，Alexa会在回复用户问题后保持唤醒状态等待5秒，看用户是否有其他问题；强行让Alexa重新进入待机状态可以使用「thank you」或「stop」这两个词来结束对话。

中国专利CN109635085A（智能交互流程的管理方法、对轮对话方法及装置）的技术方案是在用户对话满足节点的触发条件时，触发对应节点；根据所述节点设置的回复内容，生成针对用户对话的回复；根据所述节点设置的后续动作，在生成回复后跳转到多轮对话流程的其他节点。

现有技术在完成了语音多轮交互方案的配置，但是在实际场景中，自然语言处理的结果存在不稳定性，多轮对话节点存在被误触的可能，多轮对话触发后也存在误识别用户语音，自然语言处理后退出多轮对话。为了克服现有技术的缺陷，需要设计一种基于智能语音产品语音交互场景的动态多轮交互方式。

发明内容

为了克服现有技术中的缺陷，提供一种基于智能语音产品语音交互场景的动态多轮交互方式。

本发明通过下述方案实现：

一种基于智能语音产品语音交互场景的动态多轮交互方式，该方式包括激活多轮对话条件、各条件所进入的预设模式、以及对应模式内的意图集合；

其中预设模式包含：拒绝模式和接受模式；拒绝模式定义为下轮对话自然语言处理结果跟模式内意图集合有匹配，则判定该自然语言处理结果无效，智能语音终端重新开启拾音，等待下轮自然语言处理结果；当无匹配时，则判定当前结果有效，结束当前多轮对话；接受模式与拒绝模式的差异为模式内所配置的意图集合为结束当前多轮对话的意图集合，当进入接受模式，自然语言处理结果在集合内有匹配时，则结束当前多轮对话；

当开始为接受模式时，开启该次多轮交互流程为：

一、智能语音产品进行语音采集；

二、语音采集数据上传到云端处理，自然语言处理服务器对数据进行处理，将处理结果返回给客户端；

三、客户端收到处理结果，判定是否开启多轮交互，结果为是，进入配置的预设模式，预设下轮交互中目标意图集合；

四、开启下轮语音交互，并开始对下轮结果进行裁定；

进入下轮语音交互后，将对下轮语音交互自然语言处理结果进行裁定，具体步骤为：

一、根据自然语言处理服务器返回的结果，裁定该自然语言处理结果是否符合预期；

二、如果没在预期结果集中，播放引导提示语音，引导用户下次操作，重新开启拾音；如果在预期结果集中，将自然语言处理结果发送到实际应用中处理操作；

三、判断多轮交互是否继续。

本发明的有益效果为：

本发明一种基于智能语音产品语音交互场景的动态多轮交互方式针对当前市场主流产品中多轮交互方案进行优化解决，在开启多轮对话的同时，对多轮交互过程中异常情况进行合理处理，使整个交互流程合理可控。

具体实施方式

下面对本发明优选的实施例进一步说明：

如当激活多轮对话条件中包含“我想看电影”意图，预设模式为接受模式，模式内意图配置为选择电影意图时，用户发送“我想看电影”指令，智能语音终端接收后进行查询电影操作，查询完毕询问用户想看第几个，用户发送除选择电影意图指令外的其他指令时，智能语音终端将判定指令无效重复指引用户选择电影，要正确完成该轮交互，用户只需发送“第一个”、“第一部”等选择电影指令或“退出”等强制退出指令即可。

当开始为接受模式时，开启该次多轮交互流程为：

一、智能语音产品进行语音采集；

四、开启下轮语音交互，并开始对下轮结果进行裁定；

三、判断多轮交互是否继续。

在开启多轮交互后，下轮终端实际操作将与当前场景强关联，在实际应用中，如当用户想智能语音产品发送“我想看电影指令”时，语音产品返回多个影片序列供用户选择，此时多轮交互开启，用户下一轮指令应该是选择电影操作，将选择电影意图加入到预设结果集中，那么下一轮交互中，非该类结果返回到智能语音产品端时，智能语音产品将播放引导用户选择电影的语音提示，并重新开启拾音；另外将退出等结束当前交互意图也加入到预设结果集中，当用户想要退出本轮交互时，退出指令同样生效。

本申请的技术方案解决了在传统多轮交互中语音误识别而导致完整交互中断的情况，减少重复唤醒智能语音设备，减少重复语言指令，并减少了用户重复唤醒智能语音设备次数，提高了交互体验。

尽管已经对本发明的技术方案做了较为详细的阐述和列举，应当理解，对于本领域技术人员来说，对上述实施例做出修改或者采用等同的替代方案，这对本领域的技术人员而言是显而易见，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

Claims

1.一种基于智能语音产品语音交互场景的动态多轮交互方式，其特征在于，该方式包括激活多轮对话条件、各条件所进入的预设模式、以及对应模式内的意图集合；

当开始为接受模式时，开启该次多轮交互流程为：

一、智能语音产品进行语音采集；

四、开启下轮语音交互，并开始对下轮结果进行裁定；

三、判断多轮交互是否继续。