CN109003605A

CN109003605A - 智能语音交互处理方法、装置、设备及存储介质

Info

Publication number: CN109003605A
Application number: CN201810709837.1A
Authority: CN
Inventors: 刘昆; 乔爽爽; 梁阳; 林湘粤; 慕鹏; 韩超; 朱名发; 郭江亮; 李旭; 刘俊; 李硕; 尹世明
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-07-02
Filing date: 2018-07-02
Publication date: 2018-12-14
Anticipated expiration: 2038-07-02
Also published as: CN109003605B

Abstract

本申请实施例提供一种智能语音交互处理方法、装置、设备及存储介质。本申请的智能语音交互处理方法，包括：获取用户输入的语音数据；对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽；确定与所述意图信息对应的服务会话；采用所述词槽对所述服务会话的词槽字段进行填充；确定填充后的所述服务会话是否完整；若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应。本申请实施例可以提升语音交互的智能性和亲和度，提升用户使用体验。

Description

智能语音交互处理方法、装置、设备及存储介质

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种智能语音交互处理方法、装置、设备及存储介质。

背景技术

智能服务机器人是一种以人工智能技术为基础的产品，通过对话的形式和使用者进行交互，该智能服务机器的后台服务器可以对接多种网络功能服务，从而在和使用者的交互过程中提供丰富的服务，包括天气查询、预订酒店、路线导航等等。

使用者的一次服务请求被智能服务机器人识别为一个意图，同时该意图附带有不同的词槽。例如，天气查询的功能服务的意图对应时间和地点两个词槽。当使用者输入“北京今天天气怎么样？”时，智能服务机器人将识别服务请求为天气查询请求，以及识别时间词槽的值为今天、地点词槽的值为北京，然后调用对应的后台功能服务查询天气并返回结果。与该智能服务机器人的交互通常是一种简单单轮方式，使用者通过输入的语音信号表达一个意图的服务请求，智能服务机器人识别并满足该意图，向使用者返回对应的服务响应，从而完成一轮会话。然后使用者再次输入语音信号表达另一种意图的服务请求时，需要重复上述过程。

由此可见，切换意图后，之前交互的记录不能生效，需要重新进行意图确认和词槽填充。在交互体验上不够自然、聪明。

发明内容

本申请实施例提供一种智能语音交互处理方法、装置、设备及存储介质，以提升语音交互的智能性和亲和度，提升用户使用体验。

第一方面，本申请实施例提供一种智能语音交互处理方法，包括：获取用户输入的语音数据。对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽。确定与所述意图信息对应的服务会话。采用所述词槽对所述服务会话的词槽字段进行填充。确定填充后的所述服务会话是否完整。若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应。

结合第一方面，在第一方面的一种可能的实现方式中，所述确定与所述意图信息对应的服务会话，包括：判断是否存在服务会话。若没有任何服务会话，则新建与所述意图信息对应的服务会话，并将所述新建的服务会话作为当前会话。若存在服务会话，则判断是否能够确定与所述意图信息对应的服务。若能够确定与所述意图信息对应的服务，则判断所述服务与当前会话所对应的服务是否一致。若一致，则确定所述当前会话为所述意图信息对应的服务会话。若不一致，则从全部会话列表中查找与所述意图信息和所述意图信息对应的服务匹配的服务会话。

结合第一方面或第一方面的一种可能的实现方式，在第一方面的另一种可能的实现方式中，所述判断所述服务与当前会话所对应的服务是否一致，包括：判断所述服务所对应的后台服务器标识与所述当前会话所对应的后台服务器标识是否一致。

结合第一方面或第一方面的任一种可能的实现方式，在第一方面的另一种可能的实现方式中，所述从全部会话列表中查找与所述意图信息和所述意图信息对应的服务匹配的服务会话，包括：若从全部会话列表中查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则确定查找到的服务会话为所述意图信息对应的服务会话，并将查找到的所述服务会话更新为当前会话。若从全部会话列表中未查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则新建与所述意图信息对应的服务会话，并将该新建的服务会话作为当前会话。

结合第一方面或第一方面的任一种可能的实现方式，在第一方面的另一种可能的实现方式中，所述采用所述词槽对所述服务会话的词槽字段进行填充，包括：从所述当前会话中获得已有意图字段的信息和词槽字段的信息。判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致。若一致，则采用所述语音数据中所包含的词槽填充所述当前会话中的剩余词槽字段。若不一致，采用所述语音数据中所包含的意图信息和词槽替换所述当前会话中的意图信息和词槽，并将剩余词槽的期望值清空。

结合第一方面或第一方面的任一种可能的实现方式，在第一方面的另一种可能的实现方式中，所述判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致之前，还包括：判断所述语音数据中所包含的意图信息是否明确。若明确，则执行所述判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致的步骤。若不明确，则判断所述当前会话中的意图字段是否为空。若为空，则发送提示信息或者请求后台服务器反馈响应。若不为空，则采用所述语音数据语义文本替换剩余词槽中的期望值。

结合第一方面或第一方面的任一种可能的实现方式，在第一方面的另一种可能的实现方式中，还包括：若不明确，且不能适配到所述当前会话中的任一词槽字段，则发送提示信息或者请求后台服务器反馈响应。

结合第一方面或第一方面的任一种可能的实现方式，在第一方面的另一种可能的实现方式中，所述方法还包括：若存在服务会话，则从语音数据中获取客户端标识，根据所述客户端标识定位所述当前会话。

第二方面，本申请实施例提供一种智能语音交互处理装置，包括：获取模块，用于获取用户输入的语音数据。分析模块，用于对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽。会话确定模块，用于确定与所述意图信息对应的服务会话。填充模块，用于采用所述词槽对所述服务会话的词槽字段进行填充。完整性确定模块，用于确定填充后的所述服务会话是否完整。发送模块，用于若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应。

结合第二方面，在第二方面的一种可能的实现方式中，所述会话确定模块用于：判断是否存在服务会话。若没有任何服务会话，则新建与所述意图信息对应的服务会话，并将所述新建的服务会话作为当前会话。若存在服务会话，则判断是否能够确定与所述意图信息对应的服务。若能够确定与所述意图信息对应的服务，则判断所述服务与当前会话所对应的服务是否一致。若一致，则确定所述当前会话为所述意图信息对应的服务会话。若不一致，则从全部会话列表中查找与所述意图信息和所述意图信息对应的服务匹配的服务会话。

结合第二方面或第二方面的一种可能的实现方式，在第二方面的另一种可能的实现方式中，所述会话确定模块用于：判断所述服务所对应的后台服务器标识与所述当前会话所对应的后台服务器标识是否一致。

结合第二方面或第二方面的任一种可能的实现方式，在第二方面的另一种可能的实现方式中，所述会话确定模块用于：若从全部会话列表中查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则确定查找到的服务会话为所述意图信息对应的服务会话，并将查找到的所述服务会话更新为当前会话。若从全部会话列表中未查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则新建与所述意图信息对应的服务会话，并将该新建的服务会话作为当前会话。

结合第二方面或第二方面的任一种可能的实现方式，在第二方面的另一种可能的实现方式中，所述填充模块用于：从所述当前会话中获得已有意图字段的信息和词槽字段的信息。判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致。若一致，则采用所述语音数据中所包含的词槽填充所述当前会话中的剩余词槽字段。若不一致，采用所述语音数据中所包含的意图信息和词槽替换所述当前会话中的意图信息和词槽，并将剩余词槽的期望值清空。

结合第二方面或第二方面的任一种可能的实现方式，在第二方面的另一种可能的实现方式中，所述填充模块还用于：判断所述语音数据中所包含的意图信息是否明确。若明确，则执行所述判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致的步骤。若不明确，则判断所述当前会话中的意图字段是否为空。若为空，则发送提示信息或者请求后台服务器反馈响应。若不为空，则采用所述语音数据语义文本替换剩余词槽中的期望值。

结合第二方面或第二方面的任一种可能的实现方式，在第二方面的另一种可能的实现方式中，所述发送模块还用于：若不明确，且不能适配到所述当前会话中的任一词槽字段，则发送提示信息或者请求后台服务器反馈响应。

结合第二方面或第二方面的任一种可能的实现方式，在第二方面的另一种可能的实现方式中，所述会话确定模块用于：若存在服务会话，则从语音数据中获取客户端标识，根据所述客户端标识定位所述当前会话。

第三方面，本申请实施例提供一种智能语音交互处理设备，包括：存储器和处理器；所述存储器用于指令，以使所述处理器执行所述指令，以实现如第一方面或第一方面的任一种可能的实现方式所述的智能语音交互处理方法。

第四方面，本申请实施例提供一种存储介质，其特征在于，包括：所述存储介质包括：指令，所述指令用于实现如第一方面或第一方面的任一种可能的实现方式所述的智能语音交互处理方法。

本申请实施例的智能语音交互处理方法、装置、设备及存储介质，通过获取用户输入的语音数据，对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽，采用所述词槽对所述服务会话的词槽字段进行填充，确定填充后的所述服务会话是否完整，若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应，在被填充完整之前均不会被清除或者释放，在被填充完整后向后台服务器发送服务请求，使得后台服务器向用户反馈服务响应，在向用户反馈服务响应后，可以清除该服务会话。从而实现即使用户输入的语音数据的意图信息发生变化，之前未响应的服务会话也不会被清除，可以响应用户输入的不同意图的服务请求，实现提升用户与该终端设备交互的智能度和亲和度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的本申请技术方案的一种应用场景图示意图；

图2为本申请一实施例提供的一种智能语音交互处理方法的流程图；

图3为本申请一实施例提供的服务会话以数据结构的形式进行存储的示意图；

图4为本申请一实施例提供的另一种智能语音交互处理方法的流程图；

图5为本申请一实施例提供的一种智能语音交互处理装置500的示意图；

图6为本申请一实施例提供的一种智能语音交互处理设备600的示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

图1为本申请一实施例提供的本申请技术方案的一种应用场景图示意图，如图1所示，终端设备可以获取用户输入的语音数据，该语音数据用于请求相应的功能服务，通过本申请的智能语音交互处理方法，可以使得后台服务器通过该终端设备向用户反馈服务响应，实现提升用户与该终端设备交互的智能度和亲和度。该终端设备可以是智能服务机器人。

图2为本申请一实施例提供的一种智能语音交互处理方法的流程图，本实施例的执行主体可以是智能语音交互处理装置，该装置可以是终端设备或终端设备的内部芯片，也可以是服务器或服务器的内部芯片，如图2所示，本实施例的方法可以包括：

步骤101、获取用户输入的语音数据。

该语音输入数据可以任意语句，例如该语音数据可以是“帮我预定北京到上海的机票”。

步骤102、对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽。

对该语句数据进行分析，可以得到该语音数据的意图(intent)信息和一个或多个词槽(slot)，以上述语音数据的举例做进一步举例说明，对该语音数据进行分析，得到的该语音数据的意图为订机票，词槽为起点(北京)、终点(上海)。

步骤103、确定与所述意图信息对应的服务会话。

具体的，根据意图信息可以确定该意图信息对应的服务会话(session)。服务会话表示一次用户调起某个后台服务(如票务、天气等)到结束的交互过程。服务会话中保存有与后台服务多轮交互上下文，通过多轮交互填充所需词槽和必要参数，使得后台服务可以满足用户的需求。该服务会话可以包括词槽字段，用于保存用户输入的语音数据的词槽。

步骤104、采用所述词槽对所述服务会话的词槽字段进行填充。

以上述语音数据的举例做进一步举例说明，将词槽为起点(北京)、终点(上海)填充至该服务会话的词槽字段。

步骤105、确定填充后的所述服务会话是否完整。

具体的，确定填充后的该服务会话中是否包括后台服务器响应该服务会话所需的所有参数。举例而言，意图信息为订机票的服务会话，填充后的服务会话需要包括三个词槽信息，分别为起点、终点和时间。以上述语音数据的举例做进一步举例说明，该语音数据缺少时间的词槽信息，该语音数据对应的填充后的服务会话不完整。

步骤106、若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应。

具体的，当填充后的服务会话完整时，向后台服务器发送该服务会话对应的服务请求，后台服务器根据携带完整信息的服务请求向用户反馈服务响应，以满足用户的需求。当填充后的服务会话不完整时，则可以向用户反馈提示信息，使得用户提供待填充的词槽信息。

以上述语音数据的举例做进一步举例说明，该语音数据缺少时间的词槽信息，该语音数据对应的填充后的服务会话不完整，可以向用户反馈“需要定哪一天的机票”。

本实施例的服务会话在被填充完整之前均不会被清除或者释放，在被填充完整后向后台服务器发送服务请求，使得后台服务器向用户反馈服务响应，在向用户反馈服务响应后，可以清除该服务会话。从而实现即使用户输入的语音数据的意图信息发生变化，之前未响应的服务会话也不会被清除，可以响应用户输入的不同意图的服务请求，实现提升用户与该终端设备交互的智能度和亲和度。

以上述语音数据的举例做进一步举例说明，在向用户反馈“需要定哪一天的机票”后，用户输入的语音数据为“查询近一周北京的天气”，该语音数据的意图信息为查询天气，该意图信息与上一语音数据的意图信息不同，则保留之前订机票的意图未满足的服务会话。

对上述服务会话的解释说明：

本申请的服务会话以数据结构的形式进行存储，具体的，定义两个类型的数据结构，分别称之为第一数据结构和第二数据结构。通过多个第一数据结构和一个第二数据结构对用户的多个服务会话的信息进行存储，其中，第一数据结构用于存储用户发起的一项服务会话从开始至结束的交互过程中的各项信息，该第一数据结构包括服务名称字段(bot_name)、意图字段(intent)、词槽字段(slots)、需要补充的词槽字段(expecting_slots)、以及上一个服务会话的指针字段(previous_session)，可选的，该第一数据结构还可以包括上下文参数字段(context)、需要补充的参数字段(expecting_context)、无效请求累计次数字段(invalid_req)以及创建时间字段(created_time)。该第一数据结构可以参见下述表1。第二数据结构用于指示端会话(ClientSession)，端会话包含了一个客户端发起的有限数目的、顺序进行的会话，也即是一个客户端依次发起了与多个后台服务器(天气、订票等)的交互请求，每个后台服务器的交互过程都记录在一个服务会话(第一数据结构)中，而该客户端所有的服务会话都顺序地保存在端会话结构(第二数据结构)中，该第二数据结构包括当前会话的指针字段(Current session)，可选的，还可以包括客户端标识字段(ClientID)。

表1第一数据结构

图3为本申请一实施例提供的服务会话以数据结构的形式进行存储的示意图，如图3所示，N个服务会话依次分别存储在一个第一数据结构中，分别为会话1、会话2、会话3……..会话N，N的取值为任意整数，其中，会话1的上一个服务会话的指针字段(previous_session)中的指针指向零值(NULL)，会话2的上一个服务会话的指针字段(previous_session)中的指针指向会话1，会话3的上一个服务会话的指针字段(previous_session)中的指针指向会话2，以此类推，会话N的上一个服务会话的指针字段(previous_session)中的指针指向会话N-1，第二数据结构(端会话)的当前会话的指针字段(Currentsession)指向会话N。

通过第一数据结构和第二数据结构实现支持多轮意图会话交互，在多个意图之间切换时交互更加符合人类的习惯，提升产品的智能度和亲和度。

下面采用几个具体的实施例，对图2所示方法实施例的技术方案进行详细说明。

图4为本申请一实施例提供的另一种智能语音交互处理方法的流程图，如图4所示，本实施例的方法可以包括：

步骤201、获取用户输入的语音数据。

步骤202、对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽。

其中，步骤201和步骤202的具体解释说明可以参见图2所示实施例的步骤101和步骤102，此处不再赘述。

步骤203、判断是否存在服务会话，若没有任何服务会话，则执行步骤204，若存在服务会话，则执行步骤205。

具体的，判断是否存在如图3所示的服务会话的第一数据结构。

步骤204、新建与所述意图信息对应的服务会话，并将所述新建的服务会话作为当前会话。

步骤205、判断是否能够确定与所述意图信息对应的服务，若能够确定与所述意图信息对应的服务，则执行步骤206，若否，则执行步骤209。

具体的，当已存在有如图3所示的服务会话的第一数据结构，则确定该语音数据的意图信息对应的服务，以通过下述步骤确定如图3所示的存储形式中是否存储该语音数据的意图信息对应的服务，即在接收到该语音数据时，确定在客户端之前发起的且意图未满足的会话中，是否存在相同意图信息的服务会话的第一数据结构。

步骤206、判断所述服务与当前会话所对应的服务是否一致，若一致，则执行步骤207，若不一致，则执行步骤208。

其中，上述步骤206的一种具体的可实现方式为：判断所述服务所对应的后台服务器标识与所述当前会话所对应的后台服务器标识是否一致。即对语音数据的服务对应的后台服务器标识和当前会话所对应的后台服务器标识进行匹配。以当前会话为如图3所示的会话N，即匹配该会话N的服务名称字段(bot_name)中的值。

需要说明的是，当前会话的确定方式可以是，根据该语音数据对应的客户端标识找到该客户端的第二数据结构，从第二数据结构的当前会话的指针字段(Currentsession)的指针定位到该当前会话。

步骤207、确定所述当前会话为所述意图信息对应的服务会话。

当该语音数据的服务与当前会话所对应的服务一致时，则通过步骤207确定当前会话为该语音数据对应的服务会话。

步骤208、从全部会话列表中查找与所述意图信息和所述意图信息对应的服务匹配的服务会话。

上述步骤208的一种具体的可实现方式为：若从全部会话列表中查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则确定查找到的服务会话为所述意图信息对应的服务会话，并将查找到的所述服务会话更新为当前会话；若从全部会话列表中未查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则新建与所述意图信息对应的服务会话，并将该新建的服务会话作为当前会话。

通过上述步骤207或步骤208可以完成定位当前会话，之后执行步骤209。

步骤209、从所述当前会话中获得已有意图字段的信息和词槽字段的信息。

步骤210、判断所述语音数据中所包含的意图信息是否明确，若明确，执行步骤211，若不明确，则执行步骤214。

步骤211、判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致，若一致，则执行步骤212，若不一致，则执行步骤213。

步骤212、采用所述语音数据中所包含的词槽填充所述当前会话中的剩余词槽字段。

步骤213、采用所述语音数据中所包含的意图信息和词槽替换所述当前会话中的意图信息和词槽，并将剩余词槽的期望值清空。

具体的，将语音数据中所包含的意图信息和词槽覆盖至当前会话的意图字段(intent)、词槽字段(slots)。并将需要补充的词槽字段(expecting_slots)清空。

步骤214、判断所述当前会话中的意图字段是否为空，若为空，则执行步骤215，若不为空，则执行步骤216。

步骤215、发送提示信息或者请求后台服务器反馈响应。

步骤216、采用所述语音数据语义文本替换剩余词槽中的期望值。

具体的，该语音数据的意图不明确且当前会话中的意图字段不为空，则通过正则匹配等方式将语音数据的语义文字替换到词槽字段(slots)、需要补充的词槽字段(expecting_slots)中的值。

步骤217、若不明确，且不能适配到所述当前会话中的任一词槽字段，则发送提示信息或者请求后台服务器反馈响应。

具体的，还可以将当前会话的无效请求累计次数字段(invalid_req)的值加1。

当任一会话的无效请求累计次数字段(invalid_req)的值大于预设阈值时，或存在时长超过预设值时，可以释放该会话的第一数据结构。

步骤218、确定当前会话是否完整。

步骤219、若完整，则向后台服务器发送服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应。

在返回服务响应后，将第二数据结构中的当前会话的指针字段(Currentsession)的指针调整为当前会话的前一个会话，并释放已返回服务响应的会话。

举例而言，用户在与本申请的智能语音交互处理装置进行交互的过程中，首先用户输入“帮我预定北京到上海的机票”，假设当前没有该用户的任何服务会话，则通过本申请实施例的上述步骤，可以新建一个如图3所示的会话1的第一数据结构和第二数据结构，其中，该第二数据结构的当前会话的指针字段(Current session)指向会话1，该会话1的服务名称字段(bot_name)为票务服务，该会话1的意图字段(intent)为订票，该会话1的词槽字段(slots)为起点(北京)和终点(上海)，该会话1的需要补充的词槽字段(expecting_slots)为时间。本申请的智能语音交互处理装置向用户反馈“需要预定哪一天的机票”，且保留该会话1的第一数据结构。用户输入“查询近一周北京的天气”，则通过本申请实施例的上述步骤，可以新建一个如图3所示的会话2的第一数据结构，该第二数据结构的当前会话的指针字段(Current session)指向会话2，该会话2的服务名称字段(bot_name)为天气服务，该会话2的意图字段(intent)为查询天气，该会话2的词槽字段(slots)为地点(北京)和时间(近一周)，该会话2的需要补充的词槽字段(expecting_slots)为空，该会话2的上一个服务会话的指针字段(previous_session)中的指针指向会话1，该会话2是完整的，则向提供天气服务的后台服务器发送服务请求，向用户反馈近一周的北京天气查询结果。之后释放该会话2所占用的存储空间，并将第二数据结构的上一个服务会话的指针字段(previous_session)中的指针指向会话1。之后，用户输入“那定明天的吧”，通过本申请实施例的上述方法可以将该“明天”作为会话1的需要补充的词槽，从而使得该会话1完整，向提供订票服务的后台服务器发送服务请求，以满足用户的订票意图的服务。

相较于现有技术的用户需要明确输入“帮我定明天到上海的机票”，本申请的上述实现方式更为自然、智能。

再举例而言，用户输入“天气怎么样？”(意图：询问天气)，本申请的智能语音交互处理装置反馈“您要问哪个城市？”(expecting_slots:city)，用户输入“北京。”(意图不明确，优先补充expecting_slots：city)，本申请的智能语音交互处理装置反馈“北京天气晴天”(答复)，用户输入“上海呢？”(意图不明确，无expecting_slots，替换slots:city)，本申请的智能语音交互处理装置反馈“上海天气晴天。”(答复)。

本实施例，通过获取用户输入的语音数据，对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽，采用所述词槽对所述服务会话的词槽字段进行填充，确定填充后的所述服务会话是否完整，若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应，在被填充完整之前均不会被清除或者释放，在被填充完整后向后台服务器发送服务请求，使得后台服务器向用户反馈服务响应，在向用户反馈服务响应后，可以清除该服务会话。从而实现即使用户输入的语音数据的意图信息发生变化，之前未响应的服务会话也不会被清除，可以响应用户输入的不同意图的服务请求，实现提升用户与该终端设备交互的智能度和亲和度。

图5为本申请一实施例提供的一种智能语音交互处理装置500的示意图，如图5所示，该装置包括：

获取模块501，用于获取用户输入的语音数据。

分析模块502，用于对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽。

会话确定模块503，用于确定与所述意图信息对应的服务会话。

填充模块504，用于采用所述词槽对所述服务会话的词槽字段进行填充。

完整性确定模块505，用于确定填充后的所述服务会话是否完整。

发送模块506，用于若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应。

可选的，所述会话确定模块503用于：判断是否存在服务会话；若没有任何服务会话，则新建与所述意图信息对应的服务会话，并将所述新建的服务会话作为当前会话；若存在服务会话，则判断是否能够确定与所述意图信息对应的服务；若能够确定与所述意图信息对应的服务，则判断所述服务与当前会话所对应的服务是否一致；若一致，则确定所述当前会话为所述意图信息对应的服务会话；若不一致，则从全部会话列表中查找与所述意图信息和所述意图信息对应的服务匹配的服务会话。

可选的，所述会话确定模块503用于：判断所述服务所对应的后台服务器标识与所述当前会话所对应的后台服务器标识是否一致。

可选的，所述会话确定模块503用于：若从全部会话列表中查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则确定查找到的服务会话为所述意图信息对应的服务会话，并将查找到的所述服务会话更新为当前会话；若从全部会话列表中未查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则新建与所述意图信息对应的服务会话，并将该新建的服务会话作为当前会话。

可选的，所述填充模块504用于：从所述当前会话中获得已有意图字段的信息和词槽字段的信息；判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致；若一致，则采用所述语音数据中所包含的词槽填充所述当前会话中的剩余词槽字段；若不一致，采用所述语音数据中所包含的意图信息和词槽替换所述当前会话中的意图信息和词槽，并将剩余词槽的期望值清空。

可选的，所述填充模块504还用于：判断所述语音数据中所包含的意图信息是否明确；若明确，则执行所述判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致的步骤；若不明确，则判断所述当前会话中的意图字段是否为空；若为空，则发送提示信息或者请求后台服务器反馈响应；若不为空，则采用所述语音数据语义文本替换剩余词槽中的期望值。

可选的，所述发送模块505还用于：若不明确，且不能适配到所述当前会话中的任一词槽字段，则发送提示信息或者请求后台服务器反馈响应。

可选的，所述会话确定模块503用于：若存在服务会话，则从语音数据中获取客户端标识，根据所述客户端标识定位所述当前会话。

本申请提供的智能语音交互处理装置可以用于执行上述的智能语音交互处理方法，其内容和效果在此不再赘述。

图6为本申请一实施例提供的一种智能语音交互处理设备600的示意图，如图6所示，该设备包括：存储器601、处理器602和收发器603。

存储器601用于指令，以使处理器602执行指令，以实现上述的智能语音交互处理方法。

收发器603用于与其他设备之间实现通信。

处理器602可以被一个或多个应用专用集成电路(Application SpecificIntegrated Circuit，ASIC)、数字信号处理器(Digital Signal Processor，DSP)、数字信号处理设备(Digital Signal Processing Device，DSPD)、可编程逻辑器件(ProgrammableLogic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、控制器、微控制器、微处理器或其他电子元件实现。

存储器601可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(Static Random Access Memory，SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)，可编程只读存储器(Programmable read-only memory，PROM)，只读存储器(Read-Only Memory，ROM)，磁存储器，快闪存储器，磁盘或光盘。

本申请提供的智能语音交互处理设备可以用于执行上述的智能语音交互处理方法，其内容和效果在此不再赘述。

本申请还提供一种存储介质，包括：存储介质包括：指令，指令用于实现上述的智能语音交互处理方法。其内容和效果在此不再赘述。

本申请提供一种计算机程序产品，该计算机程序产品包括指令，该指令用于实现上述的智能语音交互处理方法。其内容和效果在此不再赘述。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种智能语音交互处理方法，其特征在于，包括：

获取用户输入的语音数据；

对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽；

确定与所述意图信息对应的服务会话；

采用所述词槽对所述服务会话的词槽字段进行填充；

确定填充后的所述服务会话是否完整；

若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应。

2.根据权利要求1所述的方法，其特征在于，所述确定与所述意图信息对应的服务会话，包括：

判断是否存在服务会话；

若没有任何服务会话，则新建与所述意图信息对应的服务会话，并将所述新建的服务会话作为当前会话；

若存在服务会话，则判断是否能够确定与所述意图信息对应的服务；

若能够确定与所述意图信息对应的服务，则判断所述服务与当前会话所对应的服务是否一致；

若一致，则确定所述当前会话为所述意图信息对应的服务会话；

若不一致，则从全部会话列表中查找与所述意图信息和所述意图信息对应的服务匹配的服务会话。

3.根据权利要求2所述的方法，其特征在于，所述判断所述服务与当前会话所对应的服务是否一致，包括：

判断所述服务所对应的后台服务器标识与所述当前会话所对应的后台服务器标识是否一致。

4.根据权利要求2所述的方法，其特征在于，所述从全部会话列表中查找与所述意图信息和所述意图信息对应的服务匹配的服务会话，包括：

若从全部会话列表中查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则确定查找到的服务会话为所述意图信息对应的服务会话，并将查找到的所述服务会话更新为当前会话；

若从全部会话列表中未查找到与所述意图信息和所述意图信息对应的服务匹配的服务会话，则新建与所述意图信息对应的服务会话，并将该新建的服务会话作为当前会话。

5.根据权利要求2～4中任一项所述的方法，其特征在于，所述采用所述词槽对所述服务会话的词槽字段进行填充，包括：

从所述当前会话中获得已有意图字段的信息和词槽字段的信息；

判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致；

若一致，则采用所述语音数据中所包含的词槽填充所述当前会话中的剩余词槽字段；

若不一致，采用所述语音数据中所包含的意图信息和词槽替换所述当前会话中的意图信息和词槽，并将剩余词槽的期望值清空。

6.根据权利要求5所述的方法，其特征在于，所述判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致之前，还包括：

判断所述语音数据中所包含的意图信息是否明确；

若明确，则执行所述判断所述语音数据中所包含的意图信息与所述已有意图字段的信息是否一致的步骤；

若不明确，则判断所述当前会话中的意图字段是否为空；

若为空，则发送提示信息或者请求后台服务器反馈响应；

若不为空，则采用所述语音数据语义文本替换剩余词槽中的期望值。

7.根据权利要6所述的方法，其特征在于，还包括：

若不明确，且不能适配到所述当前会话中的任一词槽字段，则发送提示信息或者请求后台服务器反馈响应。

8.根据权利要求2～7任一项所述的方法，其特征在于，所述方法还包括：

若存在服务会话，则从语音数据中获取客户端标识，根据所述客户端标识定位所述当前会话。

9.一种智能语音交互处理装置，其特征在于，包括：

获取模块，用于获取用户输入的语音数据；

分析模块，用于对所述语音数据进行分析，得到所述语音数据中所包含的意图信息和词槽；

会话确定模块，用于确定与所述意图信息对应的服务会话；

填充模块，用于采用所述词槽对所述服务会话的词槽字段进行填充；

完整性确定模块，用于确定填充后的所述服务会话是否完整；

发送模块，用于若完整，则向后台服务器发送所述服务会话对应的服务请求，以使所述后台服务器向所述用户反馈与所述服务请求对应的服务响应。

10.根据权利要求9所述的装置，其特征在于，所述会话确定模块用于：

判断是否存在服务会话；

11.根据权利要求10所述的装置，其特征在于，所述会话确定模块用于：

12.根据权利要求10所述的装置，其特征在于，所述会话确定模块用于：

13.根据权利要求10～12中任一项所述的装置，其特征在于，所述填充模块用于：

14.根据权利要求13所述的装置，其特征在于，所述填充模块还用于：

判断所述语音数据中所包含的意图信息是否明确；

若不明确，则判断所述当前会话中的意图字段是否为空；

若为空，则发送提示信息或者请求后台服务器反馈响应；

15.根据权利要14所述的装置，其特征在于，所述发送模块还用于：

16.根据权利要求10～15任一项所述的装置，其特征在于，所述会话确定模块用于：

17.一种智能语音交互处理设备，其特征在于，包括：

存储器和处理器；

所述存储器用于指令，以使所述处理器执行所述指令，以实现如权利要求1～8任一项所述的智能语音交互处理方法。

18.一种存储介质，其特征在于，包括：所述存储介质包括：指令，所述指令用于实现如权利要求1～8任一项所述的智能语音交互处理方法。