CN108984157B

CN108984157B - 用于语音对话平台的技能配置和调用方法及系统

Info

Publication number: CN108984157B
Application number: CN201810840843.0A
Authority: CN
Inventors: 王少蓉; 邹兴旺; 冯德聪
Original assignee: Sipic Technology Co Ltd
Current assignee: Sipic Technology Co Ltd
Priority date: 2018-07-27
Filing date: 2018-07-27
Publication date: 2022-01-11
Anticipated expiration: 2038-07-27
Also published as: CN108984157A

Abstract

本发明实施例提供一种用于语音对话平台的技能配置和调用方法。该方法包括：响应于开发者对技能创建按钮的操作，提供技能类型选择窗口；响应于开发者选择任务型技能，提供任务型技能的技能配置页面；响应于开发者对任务创建按钮的操作，提供新创建任务的意图编辑页面；响应于开发者在意图编辑页面的开发，更新新创建任务，以完成技能的配置。本发明实施例还提供一种用于语音对话平台的技能配置和调用系统。本发明实施例通过使用技能‑任务‑意图这样的层级结构，进行有序的划分，减轻了对话管理的难度，支持了多轮对话的任务。同时可以在不同技能中提取、导入指定的任务，从而降低开发的成本，提高开发的效率。

Description

用于语音对话平台的技能配置和调用方法及系统

技术领域

本发明涉及程序开发领域，尤其涉及一种用于语音对话平台的技能配置和调用方法及系统。

背景技术

随着人工智能的快速发展，各大公司都对人工智能语音方向进行了深入的研究，各大公司都逐渐推出了各自的语音对话平台，开发者在语音对话平台中可以根据自己的需求、自己的创意，向语音对话平台发布技能，进行调用。

技能类似于一个应用，通过语音对话完成一个或多个特定的功能，所述技能由一个或多个意图直接构成，在多轮对话中以明确意图的上下文意图来区分说法，从而进入相应的意图。

在实现本发明过程中，发明人发现相关技术中至少存在如下问题：

如果需要在技能-意图这样的层级结构里支持上下文信息的传递、支持多轮对话，那么会增加对话管理的难度。例如，意图A和意图B都在同一技能里，并且意图A和意图B都有相同的弱说法，当多轮对话中用户所说的弱说法同时命中了意图A和意图B时，那么就无法判断用户命中的具体是哪个意图，会引起歧义。

如果要在技能-意图这样的结构中解决这一问题，需要对技能做进一步的拆分，这样在操作中没有问题，但是这种方法的易用性非常的低，好比将支付宝中的余额、余额宝、交水电费、交话费…每个细小功能都单独拎出来做成一个APP，从流程上来说不会有问题，但是在将这些技能集合在产品中时，无法保证让个人开发者开发时，能够将这些零碎，但是领域强相关的技能都集合进一个产品中，使得这样技能的开发成本偏高，并且这样结构的技能对多轮对话的支持较弱。

发明内容

为了至少解决现有技术中语音对话平台的对话管理的难度大，技能开发成本高，多轮对话支持较弱的问题。

第一方面，本发明实施例提供一种用于语音对话平台的技能配置方法，包括：

响应于开发者对技能创建按钮的操作，提供技能类型选择窗口，其中，所述技能类型选择窗口至少包括：任务型技能；

响应于开发者选择所述任务型技能，提供所述任务型技能的技能配置页面，所述技能配置页面包括：任务创建按钮；

响应于开发者对任务创建按钮的操作，提供新创建任务的意图编辑页面；

响应于开发者在所述意图编辑页面的开发，更新所述新创建任务，以完成所述技能的配置。

第二方面，本发明实施例提供一种用于语音对话平台的技能调用方法，包括：

接收用户输入的第一语音数据，当所述第一语音数据命中技能内的第一意图时，向用户提供包含指定任务的反馈，其中，所述技能包含多个任务，所述多个任务具有相同的第二意图；

在技能中将所述第一意图与所述指定任务对应，接收用户输入的第二语音数据；

当所述第二语音数据命中所述指定任务内的第二意图时，向用户反馈。

第三方面，本发明实施例提供类型选择窗口提供程序模块，用于响应于开发者对技能创建按钮的操作，提供技能类型选择窗口，其中，所述技能类型选择窗口至少包括：任务型技能；

技能配置页面提供程序模块，用于响应于开发者选择所述任务型技能，提供所述任务型技能的技能配置页面，所述技能配置页面包括：任务创建按钮；

意图配置页面提供程序模块，用于响应于开发者对任务创建按钮的操作，提供新创建任务的意图编辑页面；

技能配置程序模块，用于响应于开发者在所述意图编辑页面的开发，更新所述新创建任务，以完成所述技能的配置。

第四方面，本发明实施例提供一种用于语音对话平台的技能调用系统，包括：

反馈程序模块，用于接收用户输入的第一语音数据，当所述第一语音数据命中技能内的第一意图时，向用户提供包含指定任务的反馈，其中，所述技能包含多个任务，所述多个任务具有相同的第二意图；

指定任务对应程序模块，用于在技能中将所述第一意图与所述指定任务对应，接收用户输入的第二语音数据；

技能调用程序模块，用于当所述第二语音数据命中所述指定任务内的第二意图时，向用户反馈。

第五方面，提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例的用于语音对话平台的技能配置和调用方法的步骤。

第六方面，本发明实施例提供一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现本发明任一实施例的用于语音对话平台的技能配置和调用方法的步骤。

本发明实施例的有益效果在于：通过使用技能-任务-意图这样的层级结构，每个任务都可以被视为是低度重合的细分领域，即任务是为了实现一个功能的一轮或者多轮对话，从而进行有序的划分，减轻了对话管理的难度。第一轮强说法进入某任务后，第二轮弱说法可以仅在该领域内跳转，从而实现了多轮对话。同时可以根据场景的需要，可以在不同技能中提取、导入指定的任务，从而降低开发的成本，提高开发的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种用于语音对话平台的技能配置方法的流程图；

图2是本发明一实施例提供的一种用于语音对话平台的技能调用方法的流程图；

图3是本发明一实施例提供的一种用于语音对话平台的技能配置系统的结构示意图；

图4是本发明一实施例提供的一种用于语音对话平台的技能调用系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示为本发明一实施例提供的一种用于语音对话平台的技能配置方法的流程图，包括如下步骤：

S11：响应于开发者对技能创建按钮的操作，提供技能类型选择窗口，其中，所述技能类型选择窗口至少包括：任务型技能；

S12：响应于开发者选择所述任务型技能，提供所述任务型技能的技能配置页面，所述技能配置页面包括：任务创建按钮；

S13：响应于开发者对任务创建按钮的操作，提供新创建任务的意图编辑页面；

S14：响应于开发者在所述意图编辑页面的开发，更新所述新创建任务，以完成所述技能的配置。

在本实施方式中，语音对话平台的技能主要由任务和词库两部分构成，其中，任务是技能的重要组成成分之一，是完成某一项功能的单轮对话或者多轮对话的合集。用户的每一轮对话，都可以认为是一个意图，用以实现用户的一个目的。

任务是由一个或者多个意图组成，开发者需要在创建意图之前梳理整个任务功能实现的过程，理清意图之前的逻辑关联，确保该功能可以完整实现。

对于步骤S11，语音对话平台响应于开发者在技能创建按钮的点击，提供技能类型选择窗口，来用于为开发者提供选择创建何种类型的技能，其中，所述技能类型选择窗口至少包括任务型技能，也包括其他类型的技能，所述技能类型开发者可以根据所创建技能的需求进行选择。

对于步骤S12，语音对话平台响应于开发者选择所述任务型技能，为开发者提供包括任务创建按钮的任务型技能配置的页面。

对于步骤S13，语音对话平台响应于开发者对任务创建按钮的点击，提供了新创建任务的意图编辑页面，其中所述意图编辑页面包括内置意图与自定义意图编辑模块，用户说法编辑模块、语义槽设定模块、选择控件模块、资源调用模块、对话回复模块等。

对于步骤S14，语音对话平台响应于开发者在意图编辑页面的开发，更新所述新创建的任务，以完成技能的配置。

作为一种实施方式，在本实施例中，所述方法还包括：

响应于任务的创建，所述技能配置页面还包括：已创建任务列表；

响应于开发者对已创建任务列表中任一任务的选择，提供所述已创建任务列表中被选择的任务的意图编辑页面；

响应于开发者在所述意图编辑页面的开发，更新所述被选择的任务，以完成所述技能的配置。

在本实施方式中，语音对话平台响应于任务的创建，所述语音对话平台的配置页面还包括：已创建任务列表；通过已创建任务列表来显示已经创建的任务信息。

语音对话平台响应于开发者对已创建任务列表中任一任务的选择，提供所述已创建任务列表中，被选择的任务的意图编辑页面。

语音对话平台响应于开发者在所述意图编辑页面的开发，更新所述被选择的任务，以完成所述技能的配置。

通过该实施方法可以看出，使用技能-任务-意图这样的层级结构，每个任务都可以被视为是单独的领域，即任务是为了实现一个功能的一轮或者多轮对话，从而进行有序的划分，减轻了对话管理的难度。确保多轮对话能准确进入预期领域，支持上下文信息的传递。

作为一种实施方式，在本实施例中，所述技能配置页面还包括：任务导入按钮；

响应于开发者对所述任务导入按钮的操作，提供任务导入界面，所述任务导入界面中包括用于选择导入任务文件路径的交互按键。

在本实施方式中，所述技能配置页面还包括任务导入按钮，例如，开发者在创建意图前梳理整个任务功能实现的过程，确保了需要哪些功能可以完整实现。例如：

场景：车载

技能A：车载导航

包含的任务：导航、设置常用地址、周边美食、查路况、查询限号

技能B：周边景点

包含的任务：周边景点

其中的每一个任务都是可以独立工作的。

假设，需要开拓音箱市场，需要给音箱做一些技能，那就可以从车载导航的技能A中提取出之前已经做好的查路况、查询限号的任务，就可以组成【出行指数】的技能；复制一个B技能，并把技能A中的周边美食任务提取出来，将其二者组合，就变成了符合音箱场景需求的【周边服务】的技能。这样，技能、任务都只开发了一次，但是根据场景的需要，可以自由组合，重复使用，无需再次开发。

通过该实施方法可以看出，根据场景的需要，可以在不同技能中提取、导入指定的任务，从而降低开发的成本，提高开发的效率。

如图2所示为本发明一实施例提供的一种用于语音对话平台的技能调用方法的流程图，包括如下步骤：

S21：接收用户输入的第一语音数据，当所述第一语音数据命中技能内的第一意图时，向用户提供包含指定任务的反馈，其中，所述技能包含多个任务，所述多个任务具有相同的第二意图；

S22：在技能中将所述第一意图与所述指定任务对应，接收用户输入的第二语音数据；

S23：当所述第二语音数据命中所述指定任务内的第二意图时，向用户反馈。

在本实施方式中，当开发者在语音对话平台将技能中任务配置好后进行发布、使用，配置在相应的设备中。

对于步骤S21，相应的设备接收用户输入的第一语音数据，当所述第一语音数据命中技能内的第一意图时，向用户提供包含指定任务的反馈，其中，所述技能包含多个任务，所述多个任务具有相同的第二意图；

对于步骤S22，在技能中将所述第一意图与所述指定任务对应，接收用户输入的第二语音数据；

例如所述相应的设备中搭载了导航的技能：导航。

任务A，导航

意图a：导航(例如：我要导航)

意图b：提供地名(例如：北京)

任务B，查路况

意图a：查路况(例如：我要查路况)

意图b：提供地名(例如：北京)

在交互中，用户输入第一语音数据：

User：我要导航(第一意图：命中了任务A)

相应的设备向用户提供包含指定任务的反馈：

Sys：导航去哪里

用户输入第二语音数据：

User：北京(第二意图：虽然在其他任务中具有相同的第二意图“北京”，但是此时指定任务A)

对于步骤S23，当所述第二语音数据命中任务A内的第二意图“北京”时，向用户反馈。这样“北京”只在任务A内跳转，不会在任务A、B之间跳转，所以语义上不会有歧义，而没有任务层级的结构可能就会产生歧义。

作为一种实施方式，在本实施例中，所述第一意图包括强说法集合，所述第二意图至少包括弱说法集合。

只有在第一意图为强说法的时候，才会进入相应的技能，确认对应的任务。进入了相应的技能对应的任务后，才能识别第二意图的弱说法。

通过该实施方法可以看出，通过使用技能-任务-意图这样的层级结构，来进行意图的判断，从而具体的判断用户的语音所命中的意图中对应的任务，避免产生歧义。

如图3所示为本发明一实施例提供的一种用于语音对话平台的技能配置系统的结构示意图，本实施例的技术方案可适用于对设备的用于语音对话平台的技能配置方法，该系统10 可执行上述任意实施例所述的用于语音对话平台的技能配置方法，并配置在终端中。

本实施例提供的一种用于语音对话平台的技能配置系统包括：类型选择窗口提供程序模块11，技能配置页面提供程序模块12，意图配置页面提供程序模块13和技能配置程序模块14。

其中，类型选择窗口提供程序模块11用于响应于开发者对技能创建按钮的操作，提供技能类型选择窗口，其中，所述技能类型选择窗口至少包括：任务型技能；技能配置页面提供程序模块12用于响应于开发者选择所述任务型技能，提供所述任务型技能的技能配置页面，所述技能配置页面包括：任务创建按钮；意图配置页面提供程序模块13用于响应于开发者对任务创建按钮的操作，提供新创建任务的意图编辑页面；技能配置程序模块14用于响应于开发者在所述意图编辑页面的开发，更新所述新创建任务，以完成所述技能的配置。

进一步地，所述技能配置页面提供程序模块还用于：响应于任务的创建，所述技能配置页面还包括：已创建任务列表；

意图配置页面提供程序模块，用于响应于开发者对已创建任务列表中任一任务的选择，提供所述已创建任务列表中被选择的任务的意图编辑页面；

技能配置程序模块，用于响应于开发者在所述意图编辑页面的开发，更新所述被选择的任务，以完成所述技能的配置。

进一步地，所述技能配置页面还包括：任务导入按钮；

如图4所示为本发明一实施例提供的一种用于语音对话平台的技能调用系统的结构示意图，本实施例的技术方案可适用于对设备的用于语音对话平台的技能调用方法，该系统20 可执行上述任意实施例所述的用于语音对话平台的技能调用方法，并配置在终端中。

本实施例提供的一种用于语音对话平台的技能调用系统包括：反馈程序模块21，指定任务对应程序模块22和技能调用程序模块23。

其中，反馈程序模块21用于接收用户输入的第一语音数据，当所述第一语音数据命中技能内的第一意图时，向用户提供包含指定任务的反馈，其中，所述技能包含多个任务，所述多个任务具有相同的第二意图；指定任务对应程序模块2 2用于在技能中将所述第一意图与所述指定任务对应，接收用户输入的第二语音数据；技能调用程序模块23用于当所述第二语音数据命中所述指定任务内的第二意图时，向用户反馈。

进一步地，所述第一意图包括强说法集合，所述第二意图至少包括弱说法集合。

本发明实施例还提供了一种非易失性计算机存储介质，计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述任意方法实施例中的用于语音对话平台的技能配置方法；

作为一种实施方式，本发明的非易失性计算机存储介质存储有计算机可执行指令，计算机可执行指令设置为：

本发明实施例还提供了一种非易失性计算机存储介质，计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述任意方法实施例中的用于语音对话平台的技能调用方法；

作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本发明实施例中的测试软件的方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中，当被处理器执行时，执行上述任意方法实施例中的用于语音对话平台的技能配置和调用方法。

非易失性计算机可读存储介质可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据测试软件的装置的使用所创建的数据等。此外，非易失性计算机可读存储介质可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至测试软件的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本发明实施例还提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例的用于语音对话平台的技能配置和调用方法的步骤。

本申请实施例的客户端以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC 设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)其他具有语音对话功能的电子装置。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”，不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种用于语音对话平台的技能配置方法，包括：

响应于开发者对技能创建按钮的操作，提供技能类型选择窗口，其中，所述技能类型选择窗口至少包括：任务型技能，其中，任务是完成某一项功能的单轮对话或者多轮对话的合集；

2.根据权利要求1所述的方法，其中，所述方法还包括：

3.根据权利要求1所述的方法，其中，所述技能配置页面还包括：任务导入按钮；

4.一种用于语音对话平台的技能调用方法，包括：

接收用户输入的第一语音数据，当所述第一语音数据命中技能内的第一意图时，向用户提供包含指定任务的反馈，其中，所述技能包含多个任务，所述多个任务具有相同的第二意图，其中，所述第一意图包括强说法集合，所述第二意图至少包括弱说法集合；

5.一种用于语音对话平台的技能配置系统，包括：

类型选择窗口提供程序模块，用于响应于开发者对技能创建按钮的操作，提供技能类型选择窗口，其中，所述技能类型选择窗口至少包括：任务型技能，其中，任务是完成某一项功能的单轮对话或者多轮对话的合集；

6.根据权利要求5所述的系统，其中，所述技能配置页面提供程序模块还用于：响应于任务的创建，所述技能配置页面还包括：已创建任务列表；

7.根据权利要求5所述的系统，其中，所述技能配置页面还包括：任务导入按钮；

8.一种用于语音对话平台的技能调用系统，包括：

反馈程序模块，用于接收用户输入的第一语音数据，当所述第一语音数据命中技能内的第一意图时，向用户提供包含指定任务的反馈，其中，所述技能包含多个任务，所述多个任务具有相同的第二意图，其中，所述第一意图包括强说法集合，所述第二意图至少包括弱说法集合；