CN112069830B

CN112069830B - 一种智能会话方法及装置

Info

Publication number: CN112069830B
Application number: CN202010812251.5A
Authority: CN
Inventors: 张坤; 饶孟良; 李放; 武楠
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-08-13
Filing date: 2020-08-13
Publication date: 2024-05-28
Anticipated expiration: 2040-08-13
Also published as: CN112069830A

Abstract

本发明公开了一种智能会话方法及装置；对用户发起当前轮的目标会话语音信息进行语义理解，得到目标会话语音信息的语义信息，语义信息包括意图信息；从会话逻辑结构中，确定意图信息对应的目标通用原子组件，其中，会话逻辑结构包括多个具有逻辑关系的组件层，组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数；识别目标通用原子组件的会话意图参数，确定目标会话语音信息对应的技能；基于技能与历史轮的历史会话语音信息，获取意图信息对应的意图响应信息；基于意图响应信息，输出目标会话语音信息的目标应答信息，其中，可以将目标应答信息存储到云服务器，以便后续信息的读取，本方案可以提高智能会话实现效率。

Description

一种智能会话方法及装置

技术领域

本申请涉及通信技术领域，具体涉及一种智能会话方法及装置。

背景技术

随着信息技术的飞速发展，人机对话已越来越常见，比如通过智能机器人与用户进行会话，可以解答用户提出的问题等。

在对相关技术的研究和实践过程中，本申请的发明人发现目前人机对话根据运营需要，对话场景变化时需要对对话流程进行修改，对话流程硬编码，编程不可复用，智能会话实现效率较低。

发明内容

本申请实施例提供一种智能会话方法及装置，可以通过将业务的多轮对话流程可以提高智能会话实现效率高。

本申请实施例提供了一种智能会话方法，包括：

对用户发起当前轮的目标会话语音信息进行语义理解，得到所述目标会话语音信息的语义信息，所述语义信息包括意图信息；

从会话逻辑结构中，确定所述意图信息对应的目标通用原子组件，其中，所述会话逻辑结构包括多个具有逻辑关系的组件层，所述组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数，所述通用原子组件为会话语句抽象出的组件；

识别所述目标通用原子组件的会话意图参数，确定所述目标会话语音信息对应的技能；

基于所述技能与历史轮的历史会话语音信息，获取所述意图信息对应的意图响应信息；

基于所述意图响应信息，输出所述目标会话语音信息的目标应答信息。

相应的，本申请实施例提供了一种智能会话装置，包括：

语义理解单元，用于对用户发起当前轮的目标会话语音信息进行语义理解，得到所述目标会话语音信息的语义信息，所述语义信息包括意图信息；

信息确定单元，用于从会话逻辑结构中，确定所述意图信息对应的目标通用原子组件，其中，所述会话逻辑结构包括多个具有逻辑关系的组件层，所述组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数，所述通用原子组件为会话语句抽象出的组件；

识别单元，用于识别所述目标通用原子组件的会话意图参数，确定所述目标会话语音信息对应的技能；

第一获取单元，用于基于所述技能与历史轮的历史会话语音信息，获取所述意图信息对应的意图响应信息；

第一输出单元，用于基于所述意图响应信息，输出所述目标会话语音信息的目标应答信息。

在一实施例中，所述信息确定单元，包括：

匹配子单元，用于将所述意图信息与所述会话逻辑结构中各通用原子组件的会话意图参数，进行匹配；

信息确定子单元，用于基于匹配结果，确定所述意图信息对应的目标通用原子组件。

在一实施例中，所述识别单元，包括：

参数类型确定子单元，用于确定所述会话意图参数对应的预设对话参数类型，所述预设对话参数类型指示各通用原子组件对应的技能类型；

技能确定子单元，用于根据所述预设对话参数类型，确定所述目标会话语音信息对应的技能。

在一实施例中，所述第一获取单元，包括：

意图信息确定子单元，用于根据所述意图信息与历史轮的历史会话语音信息，确定当前轮的会话意图信息；

获取子单元，用于基于所述会话意图信息，通过所述技能获取所述意图信息对应的意图响应信息。

在一实施例中，所述意图信息确定子单元还用于基于所述意图信息与历史轮的历史会话语音信息，生成对话指令；基于所述技能，向技能路由发送所述对话指令，以便所述技能路由将所述对话指令转发到相应的技能对话模块；接收所述技能路由返回的当前轮的会话意图信息。

在一实施例中，所述获取子单元还用于基于各通用原子组件与各技能之间的预设条件算子关系，计算所述会话意图信息对应的目标会话数据类型；基于所述目标会话数据类型，获取所述意图信息对应的意图响应信息。

在一实施例中，所述获取子单元还用于基于所述目标会话数据类型，从所述历史应答信息数据库中获取对应的目标会话数据，得到所述意图信息对应的意图响应信息。

在一实施例中，所述获取子单元还用于调用钩子函数，向所述钩子函数对应的会话容器实施例的业务逻辑层发送目标对话事件指令，所述目标对话事件指令包括所述目标会话数据类型；接收所述业务逻辑层基于所述目标对话事件指令，返回的所述目标会话数据类型对应的目标会话数据，得到所述意图信息对应的意图响应信息。

在一实施例中，智能会话装置，还包括：

第一统计单元，用于统计历史上各历史会话语音信息对应的历史应答信息，存储到所述技能对话模块的历史应答信息数据库。

在一实施例中，智能会话装置，还包括：

抽象单元，用于从会话流程的会话语句中抽象出通用原子组件，所述通用原子组件包括属性信息；

构建单元，用于按照所述属性信息，构建所述通用原子组件的会话逻辑结构。

在一实施例中，智能会话装置，还包括：

逻辑确定单元，用于当所述会话意图参数为预设的兜底参数时，确定所述兜底参数对应的兜底处理逻辑；

响应信息确定单元，用于按照预设兜底处理逻辑，确定所述意图信息对应的意图响应信息；

第二输出单元，用于基于所述意图响应信息，输出所述目标会话语音信息的目标应答信息。

在一实施例中，智能会话装置，还包括：

第二统计单元，用于统计在当前轮会话中，向所述用户发起会话的用户未应答次数；

第二获取单元，用于当所述用户未应答次数达到预设未应答次数时，基于与所述用户在历史上的多轮历史会话，获取下一轮会话对应的预设会话信息，所述下一轮会话为所述当前轮会话的下一轮会话；

会话发起单元，用于基于所述预设会话信息，向所述用户发起所述下一轮会话。

相应的，本申请实施例还提供了一种计算机设备，包括存储器，处理器及存储在储存器上并可在处理器上运行的计算机程序，其中，所述处理器执行本申请实施例任一提供的智能会话方法中的步骤。

相应的，本申请实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适用于处理器进行加载，以执行本申请实施例任一提供的智能会话方法中的步骤。

本申请实施例可以对用户发起当前轮的目标会话语音信息进行语义理解，得到所述目标会话语音信息的语义信息，所述语义信息包括意图信息；从会话逻辑结构中，确定所述意图信息对应的目标通用原子组件，其中，所述会话逻辑结构包括多个具有逻辑关系的组件层，所述组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数，所述通用原子组件为会话语句抽象出的组件；识别所述目标通用原子组件的会话意图参数，确定所述目标会话语音信息对应的技能；基于所述技能与历史轮的历史会话语音信息，获取所述意图信息对应的意图响应信息；基于所述意图响应信息，输出所述目标会话语音信息的目标应答信息。本方案可以通过将业务的多轮对话流程，抽象出通用对话原子组件，然后将通用对话原子组件构建成会话逻辑结构，在进行会话时，可以识别出会话语音信息的意图信息，然后基于构建的会话逻辑结构，路由到对应技能去处理该意图信息，最终输出会话信息的应答信息，并且设计基于事件触发的对话框架，可以提高智能会话实现效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的智能会话方法的场景示意图；

图2a是本申请实施例提供的智能会话方法的流程图；

图2b是本申请实施例提供的智能会话方法的多轮会话流程图；

图2c是本申请实施例提供的智能会话方法的多轮会话的详细流程图；

图2d是本申请实施例提供的智能会话方法的会话函数流程图；

图2e是本申请实施例提供的智能会话方法的会话函数整体框架图；

图3a是本申请实施例提供的智能会话方法的另一流程图；

图3b是本申请实施例提供的智能会话方法的另一多轮会话流程图；

图3c是本申请实施例提供的智能会话方法的会话逻辑结构构建示意图；

图4a是本申请实施例提供的智能会话方法的装置图；

图4b是本申请实施例提供的智能会话方法的另一装置图；

图4c是本申请实施例提供的智能会话方法的另一装置图；

图4d是本申请实施例提供的智能会话方法的另一装置图；

图5是本申请实施例提供的计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种智能会话方法、装置、计算机设备及存储介质。具体地，本申请实施例提供适用于计算机设备的智能会话装置。其中，该计算机设备可以为终端或服务器等设备，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

参考图1，以计算机设备为云服务器为例，该云服务器对用户发起当前轮的目标会话语音信息进行语义理解，得到目标会话语音信息的语义信息，语义信息包括意图信息；从会话逻辑结构中，确定意图信息对应的目标通用原子组件，其中，会话逻辑结构包括多个具有逻辑关系的组件层，组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数，通用原子组件为会话语句抽象出的组件；识别目标通用原子组件的会话意图参数，确定目标会话语音信息对应的技能；基于技能与历史轮的历史会话语音信息，获取意图信息对应的意图响应信息；基于意图响应信息，输出目标会话语音信息的目标应答信息。

其中，该意图信息对应的意图响应信息可以基于云平台技术进行获取，而云平台也称云计算平台，是指基于硬件资源和软件资源的服务，提供计算、网络和存储能力。本实施例中的云平台可以理解为基于上述云服务器构成的平台，该平台可以为用户提供各种需要的服务，例如为用户提供公司网站构建和运营服务等等，用户可以在该云平台上购买云服务器资源，例如存储资源和计算资源等等，用户可以基于购买的资源和云服务器提供的各种组件，完成各种任务。

云计算(cloud computing)是一种计算模式，它将计算任务分布在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费，本实施例中，目标账户的历史操作，可以是利用云服务器中分布式的服务器实现的，可以理解的是，目标账户的不同历史操作，可以是通过云服务器中的不同实体服务器实现，本实施例对此没有限制。

由以上可知，本申请实施例可以通过将业务的多轮对话流程，抽象出通用对话原子组件，然后将通用对话原子组件构建成会话逻辑结构，在进行会话时，可以识别出会话语音信息的意图信息，然后基于构建的会话逻辑结构，路由到对应技能去处理该意图信息，最终输出会话信息的应答信息，并且设计基于事件触发的对话框架，可以提高智能会话实现效率。

本实施例可以以下分别进行详细说明，需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本申请实施例提供一种智能会话方法，该方法可以由终端或服务器执行，也可以由终端和服务器共同执行；本申请实施例以智能会话方法由服务器执行为例来进行说明，具体的，由集成在服务器中的智能会话装置来执行。如图2a所示，该智能会话方法的具体流程可以如下：

201、对用户发起当前轮的目标会话语音信息进行语义理解，得到目标会话语音信息的语义信息，语义信息包括意图信息。

其中，对目标会话语音信息进行语义理解，可以为对目标会话语音信息的领域识别、意图识别、以及参数提取(其中，参数可以包括类型、标签等)，等，比如，识别到目标会话语音信息对应的领域为电台，意图为播放，类型为故事，标签为睡前，那么可以通过电台为用户播放睡前故事。

其中，意图信息为用户当前轮的目标会话语音信息所指示的会话目的信息，比如，通过意图信息可以知道，用户通过发起目标会话语音信息想要表达什么、想要做什么。

例如，目标会话语音信息为“帮我订一张周一从广州到深圳的高铁票”，这句话通过语义理解，得到的意图信息可以为“订高铁票”。

在一示例中，如图2b所示，在文旅、政务等行业，不仅包括简单对话中的一问一答，往往存在很多需要跟用户有复杂多轮对话的场景，这种复杂多轮对话主要有一下特点：

上下文依赖：要基于对话的上下文进行不同的节点跳转；

主动引导：当触发特定意图时，可以引导用户到某个新的意图。

其中，上下文指的是用户说话的语境，包含了上文的意图等信息，在多轮会话的场景下，如果用户当前的问法隐含一些上文提到的重复信息时，需要依赖上文的语境一起进行分析判断，比如，上文用户发起的会话语音信息为“深圳有哪些好玩的地方吗”，可以识别输出“深圳”的电影院数量，若用户继续发起“它还有哪些好吃的吗”，此时需要根据上文的意图、槽位等信息，对“最大的是哪家”进行分析判断，得到分析判断结果，将“它”认为是“深圳”。

例如，在图2b中，用户发起的目标会话语音信息为“给我介绍一下故宫”，简单会话场景下，对“给我介绍一下故宫”进行语义理解，得到语义信息之后，输出“故宫是明清两代的……”的回复信息之后就结束会话了，而复杂的多轮会话场景下，则是基于“给我介绍一下故宫”，回复了故宫的简介“故宫是明清两代的……”之后，可以引导到天气，即主动向用户发起会话，询问用户“要不要帮你查询一下故宫的天气”，同时，保证方案的灵活配置，保证快速运营。

202、从会话逻辑结构中，确定意图信息对应的目标通用原子组件，其中，会话逻辑结构包括多个具有逻辑关系的组件层，组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数，通用原子组件为会话语句抽象出的组件。

其中，会话逻辑结构为将多个通用原子组件按照预设的逻辑关系构建的结构，比如，可以采用流行图形结构化的方式，自行构建，分层罗列往下扩展。

在一示例中，会话逻辑结构可以为逻辑树，逻辑树的形态像一颗树，把已知问题化作树干，然后考虑哪些问题或者任务与已知问题有关，将这些问题或者子任务比作逻辑树的树枝，一个大的树干上还可以继续延伸出更小的树枝，逐步列出所有一直问题的相关联的问题。

在一实施例中，智能会话方法之前还包括：

从会话流程的会话语句中抽象出通用原子组件，通用原子组件包括属性信息；

按照属性信息，构建通用原子组件的会话逻辑结构。

其中，属性信息可以包括对话参数类型，指示各通用原子组件对应的技能类型，可以根据对话参数类型，构建通用原子组件的会话逻辑结构。

其中，可以在开始进行智能会话之前，从会话语句中抽象出通用原子组件来构建会话逻辑结构。

在一实施例中，属性信息包括会话意图参数，步骤“从会话逻辑结构中，确定意图信息对应的目标通用原子组件”，可以包括：

将意图信息与会话逻辑结构中各通用原子组件的会话意图参数，进行匹配；

基于匹配结果，确定意图信息对应的目标通用原子组件。

在一示例中，意图信息所指示的含义与会话意图参数所指示的含义相同或相近时，意图信息与会话意图参数相匹配，可以确定意图信息对应的目标通用原子组件。

203、识别目标通用原子组件的会话意图参数，确定目标会话语音信息对应的技能。

其中，技能类似于一个应用程序，可以通过语音会话完成一个或多个服务，并返回到用户体验，会话过程中，语音后面丰富的能力，都是依赖于一个个的技能，比如，音乐技能、古诗技能、电台技能等，每个技能可以包括语义和服务两部分，语义上可以包括该技能有哪些意图、槽位等配置信息，服务上可以包括服务地址和调用。

在一示例中，古诗技能包括“朗读古诗”、“查诗词”等意图，当接收到用户发起的“给我朗读一首诗人李白的静夜思”时，可以识别到朗读古诗的意图，同时向用户朗读李白的“静夜思”。

其中，会话意图参数可以用于指示对应的技能，还可以用于指示通用原子组件构建会话逻辑结构。

在一实施例中，步骤“识别目标通用原子组件的会话意图参数，确定目标会话语音信息对应的技能”，可以包括：

确定会话意图参数对应的预设对话参数类型，预设对话参数类型指示各通用原子组件对应的技能类型；

根据预设对话参数类型，确定目标会话语音信息对应的技能。

在一示例中，若预设会话参数类型指示目标通用原子组件对应的技能类型为音乐技能类型，则确定目标会话语音信息对应的技能为音乐技能。

在一示例中，如图2c所示，抽象成这样一颗业务树(即会话逻辑结构)之后，与对话管理的调用链中，形成一颗对话树，并且增加一个通用对话技能模块，来处理对话树下发的对话指令，等相关通用化的逻辑处理。这样以前开发一个业务，必须增加一个技能，以后所有的业务都走这个通用对话技能即可。

其中，图2c中的对话管理(Dialog managment)：对话状态跟踪(Dialog statetracking)+策略学习(policy learning)。对话状态跟踪(Dialog state tracking):上文状态+当前多个NLU(Natural Language Understanding，自然语言理解)结果+云服务器偏好配置+用户所处场景，对话状态的本质是一个记录着前序对话关键信息的数据结构，它决定着机器的下一个行为(action)。而对话状态追踪(DST)，顾名思义，则是负责维护对话状态的模块，上承自然语言理解(NLU)，下起对话策略学习(Policy Learning，PL)，是对话管理的核心组件之一。策略学习：当前状态下机器人的策略学习，最后得出机器人的具体action。

204、基于技能与历史轮的历史会话语音信息，获取意图信息对应的意图响应信息。

其中，意图响应信息为基于对目标会话语音信息进行语义理解，得到的意图信息之后，路由到对应的技能处理该意图信息返回的结果信息。

在一实施例中，步骤“基于技能与历史轮的历史会话语音信息，获取意图信息对应的意图响应信息”，包括：

根据意图信息与历史轮的历史会话语音信息，确定当前轮的会话意图信息；

基于会话意图信息，通过技能获取意图信息对应的意图响应信息。

在一示例中，若当前轮的会话意图信息为“播放周杰伦的音乐”，则路由到音乐技能处理该“播放周杰伦的音乐”，返回的处理结果为意图响应信息，基于音乐技能处理“播放周杰伦的音乐”获取了周杰伦的歌曲信息，可以基于获取的周杰伦的歌曲信息，向用户播放对应获取的周杰伦的歌曲。

在一实施例中，详细步骤“根据意图信息与历史轮的历史会话语音信息，确定当前轮的会话意图信息”，可以包括：

基于意图信息与历史轮的历史会话语音信息，生成对话指令；

基于技能，向技能路由发送对话指令，以便技能路由将对话指令转发到相应的技能对话模块；

接收技能路由返回的当前轮的会话意图信息。

在一示例中，如图2c所示，可以根据对目标会话语音信息进行语义理解，得到的意图信息，与历史会话语音信息的历史意图信息，确定当前轮的当前会话意图，然后路由到对应的技能做处理，比如，“播放周杰伦的音乐”，判断出是音乐的领域意图，就路由到音乐服务，去查询周杰伦的音乐做返回。

在一实施例中，详细步骤“基于会话意图信息，通过技能获取意图信息对应的意图响应信息”，可以包括：

基于各通用原子组件与各技能之间的预设条件算子关系，计算会话意图信息对应的目标会话数据类型；

基于目标会话数据类型，获取意图信息对应的意图响应信息。

其中，预设条件算子用于根据条件来计算要获取的数据类型，比如，参考图2c，基于向用户发送的“去过武汉？”，得到返回的“是”或者“否”之后，在通用对话技能模块，根据返回的条件“是”或者“否”，通过条件算子计算出要获取的的数据类型，比如，返回的条件为“是”的时候，通过计算出的数据类型，获取“安全起见，请主动在家隔离14天”的意图应答信息，若返回的条件为“否”，则通过计算出来的数据类型，获取下一轮会话的会话信息。

在一实施例中，智能会话方法还包括：

统计历史上各历史会话语音信息对应的历史应答信息，存储到技能对话模块的历史应答信息数据库；

基于目标会话数据类型，获取意图信息对应的意图响应信息，可以包括：

基于目标会话数据类型，从历史应答信息数据库中获取对应的目标会话数据，得到意图信息对应的意图响应信息。

在一示例中，会话中的问答是一种由问题和答案构成的简单技能，由多个问答对组成，每个问答对包括一组问题和一组回答，分别可以设置多个，可以把问题组与回答组的所有语料存储在技能对话模块的历史应答信息数据库中，在该历史应答信息数据库中可以包括历史上与多个用户进行会话的问答语料，分别存储到对应的问题组和回答组，当用户发起目标会话语音信息的问法与问题组中的任何一条近似匹配时，可以从回答组中随机挑选一条做回复。

其中，可以从问答组中确定时间最新的一条回答，或者用户满意度最高的一条回答做回复，还可以从问答组中选择其他的回答作为回复。

在一实施例中，详细步骤“基于目标会话数据类型，获取意图信息对应的意图响应信息”，可以包括：

调用钩子函数，向钩子函数对应的会话容器实施例的业务逻辑层发送目标对话事件指令，目标对话事件指令包括目标会话数据类型；

接收业务逻辑层基于目标对话事件指令，返回的目标会话数据类型对应的目标会话数据，得到意图信息对应的意图响应信息。

在一实施例中，对话可配置框架，难以覆盖全部业务，上述描述中的策略是，根据配置的条件，以及当前语义理解的信息，去查找话术的配置。比如city＝武汉，就返回“安全起见，请主动在家隔离14天”。

但在一些场景中，条件会实时调整，另外话术也不可配置，比如依赖空调的温度，所以可以开放第三方接口或函数级别的编程能力，业务自行编程定制。这种可编程能力，设计成函数级别的开放，函数逻辑可以hook(钩子函数)到对话链路中，如图2d，调用钩子函数，获取意图信息对应的意图应答信息，输出目标会话语音信息对应的目标应答信息。

其中，设计成函数级别的开放，设计成如下特性：

(1)函数hook机制：对外开放函数编程，函数逻辑可以hook到对话调用链路中；

(2)设计两种类型函数：系统函数、客户自定义函数，函数之间可以嵌套使用，包含在自定义函数当中。

(3)函数能够根据业务需求自动扩缩容，部署在函数级别的微型docker中。

(4)函数运行基于对话事件的SDK(软件开发工具包)框架，方便客户快速接入。

其中，整体框架图如图2e所示，基于FaaS(Function as a Service，函数即服务)的基于事件触发的SDK对话框架：

(1)客户自定义逻辑，都在Handler中进行编程，以<事件，Handler>对的形式并注册到Handler池中；

(2)对话平台通过对话事件与FaaSDocker实例进行交互；

FaaSDocker实例主进程会调用Event Dispatcher(事件分发器)，进行业务分发；

(3)业务分发器，根据触发的事件，调用业务Handler进行处理；

(4)最终返回业务Handler处理的结果，以控制下一步的对话流程。

比如，可以对会话容器实施例的业务逻辑层发送目标对话事件指令，业务逻辑层对接收到的对话事件指令进行解析，然后从业务handler池中对应的handler获取目标会话数据返回，得到意图信息对应的意图响应信息。

其中，Handler可以是用来结合线程的消息队列来发送、处理“Message对象”的工具。handler主要用于异步消息的处理：当发出一个消息之后，首先进入一个消息列队，发送消息的函数即刻返回，而另外一个部分在消息队列中逐一将消息取出，然后对消息进行处理。

其中，FaaS(Function as a Service，函数即服务)，指的是一部分逻辑由应用实现，但是跟传统架构不同在于，他们运行于无状态的容器中，可以由事件触发，短暂的，功能上FaaS就是不需要关心后台服务器或者应用服务，只需关心自己的代码即可的应用。

205、基于意图响应信息，输出目标会话语音信息的目标应答信息。

在一实施例中，可以将意图响应信息转化为语音信息或图像信息，得到目标会话语音信息的目标应答信息，输出目标应答信息。

在一实施例中，从会话逻辑结构中，确定意图信息对应的目标通用原子组件后，智能会话方法还包括：

当会话意图参数为预设的兜底参数时，确定兜底参数对应的兜底处理逻辑；

按照预设兜底处理逻辑，确定意图信息对应的意图响应信息；

基于意图响应信息，输出目标会话语音信息的目标应答信息。

在一实施例中，当用户发起的会话语音信息无法落入任何一个技能时，这个会话语音信息会进入到兜底处理逻辑，给出适当的回复，确保用户体验的完整性，所以兜底是为了保证端到端的完整性，给出的一套逻辑处理策略。比如，兜底可包括以下三种类型：

兜底百科：若会话语音信息是一个百科词条，则给出会话语音信息对应的百科简介；

闲聊：若会话语音信息是一句闲聊，则给出相关的聊天回复；

兜底搜索：若会话语音信息是一种搜索需求，则给出相关的网页搜索结果。

在一实施例中，智能会话方法还包括：

统计在当前轮会话中，向用户发起会话的用户未应答次数；

当用户未应答次数达到预设未应答次数时，基于与用户在历史上的多轮历史会话，获取下一轮会话对应的预设会话信息，下一轮会话为当前轮会话的下一轮会话；

基于预设会话信息，向用户发起下一轮会话。

本方案可以将主动对话框架、图形可配置化、函数式编程三种技术能力进行组合，解决复杂多轮会话能力开发成本过高的问题。达到的收益是解决话流程硬编码导致的运营变更成本高的问题，实现了一套复杂多轮会话可配置、可定制(接口/函数级编程)的方案，能够极其有效的提升对话的灵活性，以及降低运营成本。

由以上可知，本申请实施例可以通过将业务的多轮对话流程，抽象出通用对话原子组件，然后将通用对话原子组件构建成会话逻辑结构，在进行会话时，可以识别出会话语音信息的意图信息，然后基于构建的会话逻辑结构，路由到对应技能去处理该意图信息，最终输出会话信息的应答信息，并且设计基于事件触发的对话框架，可以提高智能会话实现的效率。

根据上述介绍的内容，下面将举例来进一步说明本申请的智能会话方法。参考图3a，一种智能会话方法，具体流程可以如下：

301、云服务器从会话流程的会话语句中抽象出通用原子组件，通用原子组件包括属性信息。

在一示例中，如图3b所示，可以抽象出图中会话语句的组件，作为如图3c所示的通用原子组件，其中，疫情收集就是会话启动、去过武汉就是询问参数、下一题就是意图引导，等等，可以将这6个抽象出来的通用原子组件，构建会话逻辑结构，通过将会话流程原子化，抽象出通用原子组件，构建会话逻辑结构，可以将图3c中的会话流程满足随时运营修改的能力。

302、云服务器按照属性信息，构建通用原子组件的会话逻辑结构。

在一示例中，属性信息可以包括会话意图参数，比如，如图3c所示，属性信息可以包括6个通用原子组件中的“对话启动”、“询问参数”、“话术查找”、“意图引导”、“答案选择”、以及“对话结束”等信息，构建通用原子组建的会话逻辑结构，可以根据“对话启动”、“询问参数”、“话术查找”、“意图引导”、“答案选择”、以及“对话结束”等信息所表示的意图逻辑进行构建。

303、云服务器接收用户发起的当前轮的目标会话语音信息。

在一示例中，用户向智能机器人、终端等设备发起会话，可以通过向智能机器人、终端等设备发送语音，然后由智能机器人将该语音发送到云服务器，由云服务器对该语音进行语义理解。

304、云服务器对目标会话语音信息进行语义理解，得到目标会话语音信息的语义信息，语义信息包括意图信息。

在一实施例中，意图信息可以包括槽位，槽位是一种变量，可以帮助语义从机器角度来理解用户的意图，每个槽位关联一个或多个实体库，技能下已有的槽位，可以被这个技能的其他意图直接引用，比如，“帮我订一张周六从广州到深圳的高铁票”的意图信息为“订高铁票”，这个意图信息包括的槽位为：“出发地：广州”、“目的地：深圳”、“出发时间：周一”，可以通过这三个槽位，理解用户的意图。

305、云服务器将意图信息与会话逻辑结构中各通用原子组件的会话意图参数，进行匹配，确定意图信息对应的目标通用原子组件。

在一示例中，还可以通过对历史轮的历史会话信息进行语义理解，辅助判断目标会话语音信息的意图信息，提高目标会话语音信息语义理解的准确性，当意图信息所指示的意图与会话意图参数所指示的意图相同或相近时，可以确定意图信息对应的目标通用原子组件。

306、云服务器识别目标通用原子组件的会话意图参数，确定目标会话语音信息对应的技能。

在一实施例中，会话意图参数可以包括用于指示通用原子组件对应技能的技能指示信息，当对目标通用原子组件的会话意图参数进行识别时，可以得到目标通用原子组件对应的技能指示信息，根据技能指示信息所指示的技能，可以确定目标会话语音信息对应的技能。

307、云服务器基于技能与历史轮的历史会话语音信息，获取意图信息对应的意图响应信息。

在一实施例中，用户进行多轮会话的场景中，对当前轮的会话语音信息进行语义理解时，还需要结合上文的意图信息，可以对历史会话语音信息进行语义理解，得到历史意图信息，辅助对当前轮的会话语音信息进行语义理解，得到当前轮的意图信息，提高意图信息的准确性，然后，可以通过对应的技能，去获取意图信息对应的意图响应信息，比如，意图信息为“播放周杰伦的音乐”，可以通过音乐技能，获取周杰伦的音乐，并进行播放。

308、云服务器基于意图响应信息，输出目标会话语音信息的目标应答信息。

在一实施例中，向用户输出目标应答信息之后，可以根据预先设置好的会话信息，引导用户进行下一轮的会话，获取需要收集的数据信息。

为了更好地实施以上方法，相应的，本申请实施例还提供一种智能会话装置，其中，该智能会话装置具体可以集成在服务器中，参考图4a，该智能会话装置可以包括语义理解单元401、信息确定单元402、识别单元403、第一获取单元404和第一输出单元405，如下：

(1)语义理解单元401；

语义理解单元401，用于对用户发起当前轮的目标会话语音信息进行语义理解，得到目标会话语音信息的语义信息，语义信息包括意图信息。

(2)信息确定单元402；

信息确定单元402，用于从会话逻辑结构中，确定意图信息对应的目标通用原子组件，其中，会话逻辑结构包括多个具有逻辑关系的组件层，组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数，通用原子组件为会话语句抽象出的组件。

在一实施例中，参考图4b，信息确定单元402，包括：

匹配子单元4021，用于将意图信息与会话逻辑结构中各通用原子组件的会话意图参数，进行匹配；

信息确定子单元4022，用于基于匹配结果，确定意图信息对应的目标通用原子组件。

(3)识别单元403；

识别单元403，用于识别目标通用原子组件的会话意图参数，确定目标会话语音信息对应的技能。

在一实施例中，参考图4c，识别单元403，包括：

参数类型确定子单元4031，用于确定会话意图参数对应的预设对话参数类型，预设对话参数类型指示各通用原子组件对应的技能类型；

技能确定子单元4032，用于根据预设对话参数类型，确定目标会话语音信息对应的技能。

(4)第一获取单元404；

第一获取单元404，用于基于技能与历史轮的历史会话语音信息，获取意图信息对应的意图响应信息。

在一实施例中，参考图4d，第一获取单元404，包括：

意图信息确定子单元4041，用于根据意图信息与历史轮的历史会话语音信息，确定当前轮的会话意图信息；

获取子单元4042，用于基于会话意图信息，通过技能获取意图信息对应的意图响应信息。

在一实施例中，意图信息确定子单元4041还用于基于意图信息与历史轮的历史会话语音信息，生成对话指令；基于技能，向技能路由发送对话指令，以便技能路由将对话指令转发到相应的技能对话模块；接收技能路由返回的当前轮的会话意图信息。

在一实施例中，获取子单元4042还用于基于各通用原子组件与各技能之间的预设条件算子关系，计算会话意图信息对应的目标会话数据类型；基于目标会话数据类型，获取意图信息对应的意图响应信息。

在一实施例中，获取子单元4042还用于基于目标会话数据类型，从历史应答信息数据库中获取对应的目标会话数据，得到意图信息对应的意图响应信息。

在一实施例中，获取子单元4042还用于调用钩子函数，向钩子函数对应的会话容器实施例的业务逻辑层发送目标对话事件指令，目标对话事件指令包括目标会话数据类型；接收业务逻辑层基于目标对话事件指令，返回的目标会话数据类型对应的目标会话数据，得到意图信息对应的意图响应信息。

(5)第一输出单元405；

第一输出单元405，用于基于意图响应信息，输出目标会话语音信息的目标应答信息。

在一实施例中，智能会话装置，还包括：

第一统计单元406，用于统计历史上各历史会话语音信息对应的历史应答信息，存储到技能对话模块的历史应答信息数据库。

在一实施例中，智能会话装置，还包括：

抽象单元407，用于从会话流程的会话语句中抽象出通用原子组件，通用原子组件包括属性信息；

构建单元408，用于按照属性信息，构建通用原子组件的会话逻辑结构。

在一实施例中，智能会话装置，还包括：

逻辑确定单元409，用于当会话意图参数为预设的兜底参数时，确定兜底参数对应的兜底处理逻辑；

响应信息确定单元410，用于按照预设兜底处理逻辑，确定意图信息对应的意图响应信息；

第二输出单元411，用于基于意图响应信息，输出目标会话语音信息的目标应答信息。

在一实施例中，智能会话装置，还包括：

第二统计单元412，用于统计在当前轮会话中，向用户发起会话的用户未应答次数；

第二获取单元413，用于当用户未应答次数达到预设未应答次数时，基于与用户在历史上的多轮历史会话，获取下一轮会话对应的预设会话信息，下一轮会话为当前轮会话的下一轮会话；

会话发起单元414，用于基于预设会话信息，向用户发起下一轮会话。

由以上可知，本申请实施例的智能会话装置的语义理解单元401对用户发起当前轮的目标会话语音信息进行语义理解，得到目标会话语音信息的语义信息，语义信息包括意图信息；然后，由信息确定单元402从会话逻辑结构中，确定意图信息对应的目标通用原子组件，其中，会话逻辑结构包括多个具有逻辑关系的组件层，组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数，通用原子组件为会话语句抽象出的组件；由识别单元403识别目标通用原子组件的会话意图参数，确定目标会话语音信息对应的技能；由第一获取单元404基于技能与历史轮的历史会话语音信息，获取意图信息对应的意图响应信息；由第一输出单元405基于意图响应信息，输出目标会话语音信息的目标应答信息。该方案可以通过将业务的多轮对话流程，抽象出通用对话原子组件，然后将通用对话原子组件构建成会话逻辑结构，在进行会话时，可以识别出会话语音信息的意图信息，然后基于构建的会话逻辑结构，路由到对应技能去处理该意图信息，最终输出会话信息的应答信息，并且设计基于事件触发的对话框架，可以提高智能会话实现的效率。

此外，本申请实施例还提供一种计算机设备，该计算机设备可以为终端或者服务器等设备，如图5所示，其示出了本申请实施例所涉及的计算机设备的结构示意图，具体来讲：

该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解，图5中示出的计算机设备结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器501是该计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分，通过运行或执行存储在存储器502内的软件程序和/或模块，以及调用存储在存储器502内的数据，执行计算机设备的各种功能和处理数据，从而对计算机设备进行整体检测。可选的，处理器501可包括一个或多个处理核心；优选的，处理器501可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器501中。

存储器502可用于存储软件程序以及模块，处理器501通过运行存储在存储器502的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器502可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器502还可以包括存储器控制器，以提供处理器501对存储器502的访问。

计算机设备还包括给各个部件供电的电源503，优选的，电源503可以通过电源管理系统与处理器501逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该计算机设备还可包括输入单元504，该输入单元504可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，计算机设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，计算机设备中的处理器501会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中，并由处理器501来运行存储在存储器502中的应用程序，从而实现各种功能，如下：

对用户发起当前轮的目标会话语音信息进行语义理解，得到目标会话语音信息的语义信息，语义信息包括意图信息；从会话逻辑结构中，确定意图信息对应的目标通用原子组件，其中，会话逻辑结构包括多个具有逻辑关系的组件层，组件层包括至少一个通用原子组件，每个通用原子组件对应一个会话意图参数，通用原子组件为会话语句抽象出的组件；识别目标通用原子组件的会话意图参数，确定目标会话语音信息对应的技能；基于技能与历史轮的历史会话语音信息，获取意图信息对应的意图响应信息；基于意图响应信息，输出目标会话语音信息的目标应答信息。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种智能会话方法中的步骤。例如，该指令可以执行如下步骤：

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种智能会话方法中的步骤，因此，可以实现本申请实施例所提供的任一种智能会话方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

其中，根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述发明内容和实施例中提供的智能会话方法。

以上对本申请实施例所提供的一种智能会话方法、装置、计算机设备及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本申请的限制。

Claims

1.一种智能会话方法，其特征在于，包括：

识别所述目标通用原子组件的会话意图参数，确定所述目标会话语音信息对应的技能，包括：确定会话意图参数对应的预设对话参数类型，预设对话参数类型指示各通用原子组件对应的技能类型；根据预设对话参数类型，确定目标会话语音信息对应的技能；

基于所述技能与历史轮的历史会话语音信息，获取所述意图信息对应的意图响应信息，包括：根据所述意图信息与历史轮的历史会话语音信息，确定当前轮的会话意图信息；基于所述会话意图信息，通过所述技能获取所述意图信息对应的意图响应信息；

2.根据权利要求1所述的方法，其特征在于，所述根据所述意图信息与历史轮的历史会话语音信息，确定当前轮的会话意图信息，包括：

基于所述意图信息与历史轮的历史会话语音信息，生成对话指令；

基于所述技能，向技能路由发送所述对话指令，以便所述技能路由将所述对话指令转发到相应的技能对话模块；

接收所述技能路由返回的当前轮的会话意图信息。

3.根据权利要求2所述的方法，其特征在于，所述基于所述会话意图信息，通过所述技能获取所述意图信息对应的意图响应信息，包括：

基于各通用原子组件与各技能之间的预设条件算子关系，计算所述会话意图信息对应的目标会话数据类型；

基于所述目标会话数据类型，获取所述意图信息对应的意图响应信息。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

统计历史上各历史会话语音信息对应的历史应答信息，存储到所述技能对话模块的历史应答信息数据库；

所述基于所述目标会话数据类型，获取所述意图信息对应的意图响应信息，包括：

基于所述目标会话数据类型，从所述历史应答信息数据库中获取对应的目标会话数据，得到所述意图信息对应的意图响应信息。

5.根据权利要求3所述的方法，其特征在于，所述基于所述目标会话数据类型，获取所述意图信息对应的意图响应信息，包括：

调用钩子函数，向所述钩子函数对应的会话容器实施例的业务逻辑层发送目标对话事件指令，所述目标对话事件指令包括所述目标会话数据类型；

接收所述业务逻辑层基于所述目标对话事件指令，返回的所述目标会话数据类型对应的目标会话数据，得到所述意图信息对应的意图响应信息。

6.根据权利要求1所述的方法，其特征在于，所述方法之前还包括：

从会话流程的会话语句中抽象出通用原子组件，所述通用原子组件包括属性信息；

按照所述属性信息，构建所述通用原子组件的会话逻辑结构。

7.根据权利要求6所述的方法，其特征在于，所述属性信息包括会话意图参数；

所述从会话逻辑结构中，确定所述意图信息对应的目标通用原子组件，包括：

将所述意图信息与所述会话逻辑结构中各通用原子组件的会话意图参数，进行匹配；

基于匹配结果，确定所述意图信息对应的目标通用原子组件。

8.根据权利要求1所述的方法，其特征在于，所述从会话逻辑结构中，确定所述意图信息对应的目标通用原子组件后，所述方法还包括：

当所述会话意图参数为预设的兜底参数时，确定所述兜底参数对应的兜底处理逻辑；

按照预设兜底处理逻辑，确定所述意图信息对应的意图响应信息；

9.一种智能会话装置，其特征在于，包括：

识别单元，用于识别所述目标通用原子组件的会话意图参数，确定所述目标会话语音信息对应的技能，包括：确定会话意图参数对应的预设对话参数类型，预设对话参数类型指示各通用原子组件对应的技能类型；根据预设对话参数类型，确定目标会话语音信息对应的技能；

第一获取单元，用于基于所述技能与历史轮的历史会话语音信息，获取所述意图信息对应的意图响应信息，包括：根据所述意图信息与历史轮的历史会话语音信息，确定当前轮的会话意图信息；基于所述会话意图信息，通过所述技能获取所述意图信息对应的意图响应信息；

10.一种计算机设备，其特征在于，包括存储器，处理器及存储在储存器上并可在处理器上运行的计算机程序，其中，所述处理器执行如权利要求1-8任一项所述的智能会话方法中的步骤。

11.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适用于处理器进行加载，以执行如权利要求1-8任一项所述的智能会话方法中的步骤。