CN113806503A

CN113806503A - 一种对话融合方法和装置及设备

Info

Publication number: CN113806503A
Application number: CN202110984024.5A
Authority: CN
Inventors: 张晨曦
Original assignee: Beijing Qury Technology Co ltd
Current assignee: Beijing Qury Technology Co ltd
Priority date: 2021-08-25
Filing date: 2021-08-25
Publication date: 2021-12-17

Abstract

本申请涉及一种对话融合方法和装置及设备，其中方法包括：获取请求信息，确定请求信息的应用场景；基于所确定的应用场景，调取应用场景的配置信息，并对请求信息进行意图识别，确定请求信息的对话类型；对请求信息进行解析，根据解析结果由所确定的对话类型对应的应答数据库中检索出相匹配的应答信息，并返回检索到的应答信息；其中，对话类型对应的应答数据库由应用场景的配置信息得到。其能够使得在进行对话融合过程中结合不同的应用场景，这也就有效打破了对话融合在应用场景上的局限性，使其能够适用于多种不同的应用场景。

Description

一种对话融合方法和装置及设备

技术领域

本申请涉及智能交互技术领域，尤其涉及一种对话融合方法和装置及设备。

背景技术

移动互联网时代，搜索入口的价值得到了进一步提升，在传统的检索查询功能基础上被赋予了更多用户服务与营销推广价值。通过搜索的结果推荐、内容排序、内容关联等实际应用，实现了面向互联网用户的服务体验与营销效果的提升。而人工智能技术的引入将搜索入口的服务好营销价值赋予了智能化的属性，以智能应答的形式精准理解用户意图提供更加丰富的场景化服务。其中，互联网智能人机对话模式主要包含自然语言聊天、任务驱动的多轮对话、问答和推荐等多个大类。现有的智能对话机器人服务大多是基于传统知识库的QA问答以及多轮任务的对话融合，交互较为单一，限制性强。

发明内容

有鉴于此，本申请提出了一种对话融合方法，可以有效提高对话融合的扩展性，能够满足多个不同应用场景下的交互对话。

根据本申请的一方面，提供了一种对话融合方法，包括：

获取请求信息，确定所述请求信息的应用场景；

基于所确定的所述应用场景，调取所述应用场景的配置信息，并对所述请求信息进行意图识别，确定所述请求信息的对话类型；

对所述请求信息进行解析，根据解析结果由所确定的所述对话类型对应的应答数据库中检索出相匹配的应答信息，并返回检索到的所述应答信息；

其中，所述对话类型对应的应答数据库由所述应用场景的配置信息得到。

在一种可能的实现方式中，不同的所述应用场景对应不同的应用；

其中，确定所述请求信息的应用场景，包括：

由所述请求信息中提取出相应的场景编码；

将提取的场景编码与预先构建的场景编码库中的场景编码进行比对，根据比对结果确定相应的所述应用场景；

其中，所述场景编码库中包含有多个场景编码，以及各场景编码所对应的应用场景。

在一种可能的实现方式中，所述对话类型包括：知识库问答、任务型对话、生活技能、搜索、智能推荐和闲聊中的至少一种；

对所述请求信息进行意图识别，确定所述请求信息的对话类型时，采用预先训练好的意图识别网络模型进行。

在一种可能的实现方式中，对所述请求信息进行意图识别，确定所述请求信息的对话类型时，包括：

提取出所述请求信息中的文本信息，对所述文本信息进行关键词处理，抽取出所述文本信息中的实体信息，形成结构化文本切片；

根据文本切片与意图分类的映射关系，得到所述结构化文本切片所映射的意图以及意图评分；

根据得到的各意图的意图评分顺序确定所述请求信息所对应的各所述对话类型。

在一种可能的实现方式中，根据解析结果由所确定的所述对话类型对应的应答数据库中提取出相应的应答信息后，还包括缓存提取出的所述应答信息的步骤。

在一种可能的实现方式中，对所述请求信息进行意图识别之前，还包括：

根据所述请求信息的上下文信息，判断所述请求信息当前是否还处于上一轮请求过程的多轮会话场景中；

在判断出所述请求信息当前还处于上一轮请求过程的多轮会话场景时，检索所述请求信息的上一轮请求过程中缓存的应答信息，并直接返回检索到的上一轮请求过程中缓存的应答信息；

在判断出所述请求信息当前已跳出上一轮请求过程的多轮会话场景时，执行对所述请求信息进行意图识别的操作。

在一种可能的实现方式中，根据所述请求信息的上下文信息，判断所述请求信息当前是否还处于上一轮请求过程的多轮会话场景中，包括：

获取所述请求信息的上下文信息，判断所述上下文信息是否为空；

在判断出所述上下文信息不为空时，根据所述上下文信息判断所述请求信息是否处于多轮会话流程；

在判断出所述请求信息处于所述多轮会话流程时，进行所述请求信息当前所处的多轮会话流程与所确定的所述应用场景的符合校验；

在校验出所述请求信息当前所处的多轮会话流程符合所确定的所述应用场景时，确定所述请求信息当前还处于上一轮请求过程的多轮会话场景中。

在一种可能的实现方式中，对所述请求信息进行意图识别，确定所述请求信息的对话类型后，还包括对所确定的对话类型设置有效时长的操作。

根据本申请的另一方面，还提供了一种对话融合装置，包括请求信息获取模块、应用场景确定模块、配置信息调取模块、对话类型确定模块和请求信息解析模块；

所述请求信息获取模块，被配置为获取请求信息；

所述应用场景确定模块，被配置为确定所述请求信息的应用场景；

所述配置信息调取模块，被配置为基于所确定的所述应用场景，调取所述应用场景的配置信息；

所述对话类型确定模块，被配置为对所述请求信息进行意图识别，确定所述请求信息的对话类型；

所述请求信息解析模块，被配置为对所述请求信息进行解析，根据解析结果由所确定的所述对话类型对应的应答数据库中检索出相匹配的应答信息，并返回提取出的所述应答信息；

根据本申请的另一方面，还提供了一种对话融合设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令时实现前面任一所述的方法。

通过确定请求信息的应用场景，并对请求信息进行意图识别，确定请求信息的对话类型，然后再对请求信息进行解析，根据解析结果由所确定的对话类型所对应的应答数据库中进行应答信息的检索，使得在返回应答信息时能够综合当前接收到的请求信息的应用场景和对话类型，这也就有效提高了所检索到的应答信息的准确性。同时，还能够使得在进行对话融合过程中结合不同的应用场景，这也就有效打破了对话融合在应用场景上的局限性，使其能够适用于多种不同的应用场景。

根据下面参考附图对示例性实施例的详细说明，本申请的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本申请的示例性实施例、特征和方面，并且用于解释本申请的原理。

图1示出本申请实施例的一种对话融合方法的流程图；

图2示出本申请实施例的一种对话融合方法实现时所设计的系统架构示意图；

图3示出本申请实施例的一种对话融合方法的另一流程图；

图4示出本申请实施例的一种对话融合装置的结构框图；

图5示出本申请实施例的一种对话融合设备的结构框图。

具体实施方式

以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本申请，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本申请同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本申请的主旨。

图1示出根据本申请一实施例的一种对话融合方法的流程图。如图1所示，该方法包括：步骤S100，获取请求信息，确定请求信息的应用场景。此处，需要说明的是，在本申请实施例的方法中，应用场景可以为多个，不同的应用场景对应不同的应用平台。举例来说，应用场景可以为现有的各种应用软件，如：淘宝、天猫、中国移动、美团、……等。如：在请求信息为“充话费”时，此时可以确定该请求信息的应用场景应当为中国移动、中国电信或中国联通等各移动营业厅的应用平台。

在确定当前接收到的请求信息的应用场景之后，即可执行步骤S200，基于所确定的应用场景，调取应用场景的配置信息。通过调取应用场景的配置信息，从而在进行请求信息的应答时能够在对应的应用场景下进行相应的应答信息的检索，这也就有效保证了检索到的应答信息与请求信息的匹配度，使得检索到的应答信息更加准确。

进而，再通过步骤S300，对请求信息进行意图识别，确定请求信息的对话类型。此处，需要指出的是，通过对请求信息进行意图识别，确定请求信息的对话类型，使得在进行应答信息的检索时能够更加具有针对性，这也就更进一步地保证了检索到的应答信息的准确性。其中，在一种可能的实现方式中，对话类型可以包括知识库问答、任务型对话、生活技能、搜索、智能推荐和闲聊中的至少一种。对于知识库问答和任务型对话，以及生活技能问答，还可以分为单轮会话和多轮会话。此处，本领域技术人员可以理解的是，单轮会话指的是只进行一轮问答即可完成的流程。多轮会话流程则指的是需要经过多次问答才能完成的会话流程。

在确定请求信息的对话类型之后，即可执行步骤S400，对请求信息进行解析，根据解析结果由所确定的对话类型对应的应答数据库中检索出相匹配的应答信息，并返回检索到的应答信息。其中，在由所确定的对话类型对应的应答数据库进行应答信息的匹配时，每一个对话类型所对应的应答数据库中的数据均是由应用场景的配置信息中得到的。

由此，本申请实施例的对话融合方法，通过确定请求信息的应用场景，并对请求信息进行意图识别，确定请求信息的对话类型，然后再对请求信息进行解析，根据解析结果由所确定的对话类型所对应的应答数据库中进行应答信息的检索，使得在返回应答信息时能够综合当前接收到的请求信息的应用场景和对话类型，这也就有效提高了所检索到的应答信息的准确性。同时，还能够使得在进行对话融合过程中结合不同的应用场景，这也就有效打破了对话融合在应用场景上的局限性，使其能够适用于多种不同的应用场景。

其中，需要说明的是，参阅图2，为实现本申请实施例的对话融合方法的系统结构图。该图中仅表示了对于单轮QA问答的处理逻辑，若用户语料命中任务型问答，则会调用多轮任务库。同理命中搜索、推荐、闲聊、预制技能等其它功能模块则会调用相应的索引库或应答库。意图主要分为六大类，分别为知识库问答、任务型对话、生活技能、搜索、智能推荐、闲聊，其中任务对话、生活技能中具体的对话场景细分子类，如话费充值、气候查询等。

具体说明如下：

前端接入层：获取用户多模态的输入信息以及发起请求的参数信息，如图片输入、文本输入、语音输入、省份编码、场景编码、用户标签等；对用户的交互行为进行物料采集形成日志文件，如输入的语音、图片、文本，发起请求时的所在地及场景等内容。

服务应用层：按照场景编码从后台管理层将对话应用的配置信息进行提取。对用户输入的信息以及发起请求携带的参数进行结构化处理。根据结构化信息进行多意图判定，根据最终意图进行功能调用，检索出应答信息并返回至前端接入层。应答系统支持知识库、多轮任务库、生活技能库、搜索索引库、推荐索引库、自然语言聊天等多种功能调用。

后台管理层：配置问答应用场景(生成场景编码)、应答功能配置(包括搜索、推荐、QA问答、多轮任务问答、闲聊等功能配置及阈值设定)、对话应答策略(多意图命中时，采用自定义优先级的调度策略或默认调度策略) 及对话搭建配置，包括知识库、问答库、实体库等配置信息。

物料分析单元：对物料采集形成的日志文件，如输入的语音、图片、文本，发起请求时的所在地及场景等内容进行分析，形成结构化数据。

物料存储单元：将经过物料分析处理的日志数据存储至数据库。

模型训练单元：1)获取物料存储单元中的物料对知识库、任务库等已有物料进行拟合训练，提升用户语料命中知识点的准确度。2)对物料存储单元的数据进行训练，提炼出相关语料或问题簇，扩充问答库。

由此，基于上述所设置的对话融合方法的系统架构，在本申请实施例的对话融合方法中，获取当前接收到的请求信息后，确定请求信息的应用场景时，可以通过以下方式来实现。

首先，由请求信息中提取出相应的场景编码。然后，将提取出的场景编码与预先构建的场景编码库中的场景编码进行比对，根据比对结果确定相应的应用场景。其中，所创建的场景编码库中包含有多个场景编码，以及各场景编码所对应的应用场景。

即，通过采用调度器服务根据用户发起的请求信息的场景编码，与后台配置的场景编码进行比对，获取应用场景的全部配置信息，并由获取到的应用场景的全部配置信息中的数据(包括算法策略、功能配置、意图识别策略等)作为当前请求信息的应答数据库中的数据，从而保证用户在进行数据访问时能够访问正确的应答数据库。

同时，还需要指出的是，在本申请实施例的方法中，用户发起的请求信息的场景编码可以根据用户发起请求信息时的请求参数自动生成。其中，所使用的请求参数包括用户发起请求信息时的所处的地理位置、移动终端的ID 等信息。在根据这些请求参数信息生成场景编码时可以通过本领域常规的编码方式来实现，此处不再进行赘述。

在确定请求信息的应用场景，并调用所确定的应用场景的配置信息后，即可对请求信息进行应答信息的检索。在进行应答信息的检索时，可以先通过步骤S300，对请求信息进行意图识别，确定请求信息的对话类型，从而使得在检索应答信息时能够更有针对性和目的性。

在一种可能的实现方式中，对话类型可以包括知识库问答、任务型对话、生活技能、搜索、智能推荐和闲聊中的至少一种。根据前面所述，对于知识库问答、任务型对话和生活技能问答这三种对话类型，其还可以细分为单轮会话流程和多轮会话流程。

对应的，对请求信息进行意图识别，确定请求信息的对话类型时，在一个请求信息下可能会识别出多种对话类型，也可以只识别出一种对话类型。并且，在本申请实施例的方法中，可以采用预先训练好的意图识别网络模型进行请求信息的意图识别，从而确定请求信息的对话类型。应当指出的是，所使用的意图识别网络模型可以采用本领域的常规目标识别网络模型来实现，此处不对其进行具体限定。

其中，本领域技术人员可以理解的是，对于意图识别网络模型的训练，需要构建相应的训练样本库，并对训练样本库中的样本数据进行标注。在本申请实施例的方法中，可以通过以下方式来实现。

即，用户在配置完知识点标注语料后，按照随机抽取和召回排名的方式自动生成反向语料提升语义理解精准性。配置的物料数据会存储至离线数据库进行模型训练，通过交互模型训练出知识点相似性的最佳拟合函数，以保证用户发起请求时的知识点或任务场景命中准确性。

由此，本申请实施例的方法中，在使用意图识别网络模型对当前发起的用户请求进行意图识别确定对话类型过程中，对于所使用的意图识别网络模型的训练，通过随机映射构建树形数据结构，将语义向量存储至树结构中进行查找并通过K-邻近算法计算向量距离，减少计算复杂度，提升效率。

其中，在后台管理层配置应用的基本信息、算法策略、兜底策略、功能意图(包括知识问答、多轮任务对话、智能搜索、智能推荐、生活技能等)、知识库、多轮任务库配置、索引库后，知识库、任务库等配置的物料均支持个性化配置，如分省、分用户。

进一步地，在对请求信息进行意图识别，确定请求信息的对话类型时，可以通过以下方式来实现。

首先，提取出请求信息中的文本信息，对文本信息进行关键词处理，抽取出文本信息中的实体信息，形成结构化文本切片。然后，根据文本切片与意图分类的映射关系，得到结构化文本切片所映射的意图以及意图评分。进而，再根据得到的各意图的意图评分顺序确定请求信息所对应的各对话类型。

具体的，由请求信息中提取出文本信息后，对文本信息进行切词、敏感信息过滤、纠错、简繁转换、同义转换等处理，对词性、词间依存关系进行标注，抽取用户文本中的实体信息，最终形成结构化文本切片。然后，再根据文本切片映射的意图评分返回进行相应的意图分类。其中，不同的意图分类对应不同的对话类型。进而，再根据意图评分高低进行意图的优先级调用。

其中，在确定出对话类型为多个时，可以按照其对应的意图评分进行依次调用。如：用户发起的请求信息命中知识问答、任务场景、搜索这三个意图，且评分分别为5.0，3.1，2.4。那么会优先调用知识问答，有结果则返回结果，无结果则调用任务场景，若三个意图都没有结果返回，则会调用兜底意图，兜底意图也无返回时，调用兜底回复语，以保证有应答返回，实现有问有答的目的。

其中，需要说明的是，对文本信息进行切词、敏感信息过滤、纠错、简繁转换、同义转换等处理，对词性、词间依存关系进行标注，抽取用户文本中的实体信息，最终形成结构化文本切片，可以直接采用本领域常规的语义处理方式来实现，此处不再进行赘述。

同理，对于根据文本切片映射的意图评分返回进行相应的意图分类，同样也可以采用本领域常规的技术手段来实现，此处也不再进行赘述。

在确定请求信息对应的对话类型之后，即可对请求信息进行解析，并根据解析结果由所确定的对话类型对应的应答数据库中提取出相应的应答信息。其中，对请求信息的解析具体可包括对请求信息中的文本信息进行关键词预处理，由文本信息中抽取出实体信息。其中，对文本信息进行关键词预处理包括对文本信息进行切词、敏感信息过滤、纠错、简繁转换、同义转换等。并且，对请求信息的解析过程可以采用本领域的常规技术手段来实现，此处也不再进行赘述。

此外，还需要指出的是，用户发起请求信息时可以通过多种方式进行，如：语音输入、图片输入和文字输入等。对应的，所获取到的请求信息的模态也会存在有多种。因此，在对请求信息进行解析和意图识别时，可以向根据请求信息的模态进行相应的处理。

在请求信息为文字格式时，此时直接提取出所输入的文字信息作为文本信息进行前面所述的处理即可。

在请求信息为语音格式时，则需要先进行语音到文字的转换，然后再以转换后的文字作为请求信息的文本信息。此处，本领域技术人员可以理解的是，语音到文字的转换可以采用本领域常规的转换方式来实现，在本申请中不再进行赘述。

在请求信息为图片格式时，则需要先对图片进行识别，如：可以采用OCR 技术，由图片中识别出相应的文字信息，然后再以识别出的文字信息作为请求信息的文本信息。如果有图片中不能识别出文字信息，则可以通过对图片进行向量表征，调取图片来实现对请求信息的解析和意图识别。

另外，还需要指出的是，由于在本申请实施例的方法中，对于请求信息的对话类型划分有知识库问答、任务型对话、生活技能、搜索、智能推荐和闲聊中的至少一种。其中，知识库问答、任务型对话和生活技能问答这三种类型又可以细分为单轮会话流程和多轮会话流程。对于多轮会话流程，会依次发起多个请求信息。因此，在本申请实施例的方法中，为了能够更加有效地提高请求信息的应答效率，提高用户体验，同时还提高请求信息应答的智能化，在对请求信息进行意图识别之前，还包括有以下步骤。

即，根据请求信息的上下文信息，判断请求信息当前是否还处于上一轮请求过程的多轮会话场景中。在判断出请求信息当前还处于上一轮请求过程的多轮会话场景时，检索请求信息的上一轮请求过程中缓存的应答信息，并直接返回检索到的上一轮请求过程中缓存的应答信息。在判断出请求信息当前已跳出上一轮请求过程的多轮会话场景时，执行对请求信息进行意图识别的操作。

具体的，参阅图3，在依次通过步骤S100’，接收请求信息和请求参数，步骤S200’，调度器根据请求参数信息确定的应用场景，调度相应的配置信息。进而再通过步骤S310，对用户发起的请求信息进行敏感词过滤，通过对请求信息进行切词，并对切词得到的各词语进行是否存在敏感词的判断(即，步骤S320)，在判断出存在有敏感词时，则可以通过步骤S330’，返回敏感词以提示用户。在判断出没有敏感词时，则执行步骤S330，获取当前接收到的请求信息的上下文信息，并通过步骤S340，判断请求信息是否存在上下文(即，上下文信息是否为空)。在判断出上下文信息不为空时，则根据上下文信息判断请求信息是否处于多轮会话流程(即，步骤S350’和步骤S360’)。在判断出请求信息处于多轮会话流程时，进行请求信息当前所处的多轮会话流程与所确定的应用场景的符合校验(即，步骤S370’和步骤S380’)。在校验出请求信息当前所处的多轮会话流程符合所确定的应用场景时，确定请求信息当前还处于上一轮请求过程的多轮会话场景中，此时则继续执行上一轮多轮会话流程(即，步骤S390’)，检索请求信息的上一轮请求过程中缓存的应答信息，由缓存的应答信息中检索到与当前用户发起的请求信息相匹配的应答信息并返回给用户。

在判断出请求信息当前已跳出上一轮请求过程的多轮会话场景时，则执行对请求信息进行意图识别的操作。即，首先通过步骤S390，清除多轮交互标识，进而再执行步骤S350，对请求信息中的文本信息进行关键词预处理，以及步骤S360，查询图形数据库词标签，得到请求信息的结构化文本切片，步骤S370，基于得到的结构化文本切片进行意图识别。进而再通过步骤S380，根据识别结果调用相应的应答流程。

也就是说，本申请实施例的对话融合方法，在确定当前用户发起的请求信息的应用场景，并调用相应的应用场景的配置信息后，会先判断当前发起的请求信息的上下文是否在任务对话场景或生活技能对话场景中，若上文对话在任务场景中，且任务尚未结束，则按照任务场景预设的流程中进行交互，通过语言处理(包括分词、实体抽取、语义理解等)判定是否跳出任务场景重新进行意图识别或将问话意图直接定向为原任务场景并进行文本处理继续交互返回应答，同时更新多轮交互标识，保证用户能够在多轮任务中灵活跳出，并与单轮交互进行融合，保证穿插型的对话流程可以顺畅进行。跳出任务场景和生活技能多轮对话后重新定向意图时，若无结果返回，会发起二次追问。

当用户请求不属于任务对话或生活技能等多轮会话场景时，用户的请求信息会输送到智能应答意图识别服务。意图识别服务首先根据用户输入信息的模态进行意图划分。即，文本类信息需要经过切词、敏感信息过滤、纠错、简繁转换、同义转换等处理，对词性、词间依存关系进行标注，抽取用户文本中的实体信息，最终形成结构化文本切片，根据文本切片映射的意图评分返回进行意图分类，根据评分高低进行意图的优先级调用。对于请求信息系为图片类信息的情况，根据前面所述可以先对图片中的文字进行识别，若能提取出文本信息则按照文本类信息进行语言处理；若未能提取出文本信息，则对图片进行向量表征，调取图片搜索意图。若无法返回意图(即，无法确定对话类型)时，则返回应答场景配置时的兜底意图或兜底回复。若返回意图为多层(即，确定的对话类型为多个)时，按照评分进行依次调用相应的对话类型，每次调用对应的对话类型时，有结果则返回结果，无结果则进行下一个对话类型的调用，若所确定的对话类型下都没有结果返回，则会调用兜底对话类型，兜底对话类型也无返回结果时，调用兜底回复语，从而保证有应答返回。跳出任务场景和生活技能多轮对话后重新定向意图时，若无结果返回，会发起二次追问，不会触发兜底意图及兜底回复。

其中，应当指出的是，在上述过程中，根据解析结果由所确定的对话类型对应的应答数据库中提取出相应的应答信息后，还包括缓存提取出的应答信息的步骤。

进一步地，在本申请实施例的方法中，对请求信息进行意图识别，确定请求信息的对话类型后，还包括对所确定的对话类型设置有效时长的操作，从而使得用户能够在有效时长内再次进行相同的请求信息的发起后，快速的从缓存的应答信息中查找到相匹配的应答信息，这就使得对话应答过程更加智能和高效，避免了用户短时间内发起相同的请求信息时重复执行相同的交互流程的情况，最终有效减少了短时间内相同请求信息下的用户交互轮次。

其中，在一种可能的实现方式中，不同的对话类型所设置的有效时长可以不同，也可以相同。如：对于知识库问答、任务型问答和生活技能问答中的多轮会话流程类型，其有效时长可以设置为15min—30min。

另外，还需要说明的是，在本申请实施例的方法中，由意图识别服务判定意图分类后，将调用不同服务进行结果召回，如搜索和推荐，则会按照场景配置的索引库及排序算法召回物品；闲聊，生成自然语言与用户进行开放性聊天；生活技能，应答场景配置时预设的应用对话技能，一般为可独立封装的应用对话技能，如天气查询、垃圾分类等；知识库问答，将进一步对文本进行理解，与知识库中的标准知识点进行相似度拟合，将相似度最高的知识问答对进行召回；任务对话场景，基于业务特征在后台管理层配置的任务对话场景，通过实体抽取对任务所需词槽的填充实现对话单元跳转，最终完成任务引导（如用户：我要充话费，系统：您想给哪个手机号充话费，用户：我想给188xxxx6789充值话费，系统：您想充多少钱。此时需要获取的词槽为“待充值的手机号”，而188xxxx6789作为实体被抽取填充到词槽中，以跳转下一个对话单元）。

此外，在本申请实施例的方法中，用户发起应答的请求以及物料信息经过数据清洗后录入到行为物料库中，通过K-means对物料形成新的问话簇（问话簇的形成支持个性化处理、如分地区、分用户类型）、通过matchparamid 交互模型算法计算用户采集物料与现有知识点、任务场景的相似性、并录入至知识库、任务库的物料数据中进行训练，保证问话精准性的持续优化。

为了更清楚地说明本申请实施例的对话融合方法的具体过程，以下以一具体实施例进行再次详细地说明。

举例来说，用户输入语音“充话费”，通过请求处理识别到输入类型为语音，进行语音识别转文字，进行敏感信息校验，根据缓存机制识别有无上下文，通过意图识别，根据任务场景语义词表进行相似度比对，匹配到充话费场景，返回系统根据离线配置好的对话场景返回第一轮交互“请问您想给哪个手机号进行充值”启动任务场景缓存30分钟时效，若用户回复“&%**&%”，服务端识别有上下文“充话费”任务场景，找到上一轮对话，用户回复的“&%**&%”不能满足填补任务词槽进入到下一轮对话的流程，且无法识别其它意图，重复向用户回复“请问您想给哪个手机号进行充值”，用户回复“188xxx09888”，服务端根据缓存找到上一轮对话在充话费场景中，且用户该次回复内容满足填槽要求，进入下一轮对话，系统回复“请问您想充值多少钱”，用户回复“三个月宝宝一天要吃多少奶”，系统获取请求识别到上下文为充话费场景，且用户回复不满足填槽进入下一轮任务对话，根据意图识别实体抽取句式分析获取到为问答意图，召回传统知识库或者实体知识库，根据语义相似度返回问答结果，用户在30分钟时效内再次问话费充值，系统缓存获取上下文已有充话费场景，且收集到电话号码，直接返回第二轮交互您想充值多少钱？当用户回复100元，服务端收到请求且满足填槽位充值金额，进入最后确认轮次，用户确认后完成对话，根据充值话费场景配置信息判定是否清空对话任务缓存，若不清空，则用户再次问充话费，服务端获取上下文，识别之前充话费场景已存用户充值手机号及金额，直接询问是否确认给188xxx8888充值100元。（对话过程中“三个月宝宝一天要吃多少奶”可以换做“华为手机”通过意图识别到搜索电子产品，获取品牌标签）。

需要说明的是，尽管以图1和图2作为示例介绍了如上所述的对话融合方法，但本领域技术人员能够理解，本申请应不限于此。事实上，用户完全可根据个人喜好和/或实际应用场景灵活设定各步骤的具体实现方式，只要能够满足多种不同应用场景下的智能交互对话即可。

另外，还应当说明的是，本申请实施例的对话融合方法可以广泛应用于客服、语音搜索、语音助手等领域通过智能交互的方式为客户提供及时、快速、准确、多样化的服务。

相应的，基于前面任一所述的对话融合方法，本申请还提供了一种对话融合装置。由于本申请提供的对话融合装置的工作原理与本申请的对话融合方法的原理相同或相似，因此重复之处不再赘述。

参阅图4，本申请提供的对话融合装置100，包括请求信息获取模块110、应用场景确定模块120、配置信息调取模块130、对话类型确定模块140和请求信息解析模块150。其中，请求信息获取模块110，被配置为获取请求信息。应用场景确定模块120，被配置为确定请求信息的应用。配置信息调取模块 130，被配置为基于所确定的应用场景，调取应用场景的配置信息。对话类型确定模块140，被配置为对请求信息进行意图识别，确定请求信息的对话类型。请求信息解析模块150，被配置为对请求信息进行解析，根据解析结果由所确定的对话类型对应的应答数据库中检索出相匹配的应答信息，并返回提取出的应答信息。其中，对话类型对应的应答数据库由应用场景的配置信息得到。

更进一步地，根据本申请的另一方面，还提供了一种对话融合设备200。参阅图5，本申请实施例对话融合设备200包括处理器210以及用于存储处理器210可执行指令的存储器220。其中，处理器210被配置为执行可执行指令时实现前面任一所述的对话融合方法。

此处，应当指出的是，处理器210的个数可以为一个或多个。同时，在本申请实施例的对话融合设备200中，还可以包括输入装置230和输出装置 240。其中，处理器210、存储器220、输入装置230和输出装置240之间可以通过总线连接，也可以通过其他方式连接，此处不进行具体限定。

存储器220作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序和各种模块，如：本申请实施例的对话融合方法所对应的程序或模块。处理器210通过运行存储在存储器220中的软件程序或模块，从而执行对话融合设备200的各种功能应用及数据处理。

输入装置230可用于接收输入的数字或信号。其中，信号可以为产生与设备/终端/服务器的用户设置以及功能控制有关的键信号。输出装置240可以包括显示屏等显示设备。

以上已经描述了本申请的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种对话融合方法，其特征在于，包括：

获取请求信息，确定所述请求信息的应用场景；

2.根据权利要求1所述的方法，其特征在于，不同的所述应用场景对应不同的应用；

其中，确定所述请求信息的应用场景，包括：

由所述请求信息中提取出相应的场景编码；

3.根据权利要求1所述的方法，其特征在于，所述对话类型包括：知识库问答、任务型对话、生活技能、搜索、智能推荐和闲聊中的至少一种；

4.根据权利要求1所述的方法，其特征在于，对所述请求信息进行意图识别，确定所述请求信息的对话类型时，包括：

5.根据权利要求1至4任一项所述的方法，其特征在于，根据解析结果由所确定的所述对话类型对应的应答数据库中提取出相应的应答信息后，还包括缓存提取出的所述应答信息的步骤。

6.根据权利要求5所述的方法，其特征在于，对所述请求信息进行意图识别之前，还包括：

7.根据权利要求6所述的方法，其特征在于，根据所述请求信息的上下文信息，判断所述请求信息当前是否还处于上一轮请求过程的多轮会话场景中，包括：

8.根据权利要求1所述的方法，其特征在于，对所述请求信息进行意图识别，确定所述请求信息的对话类型后，还包括对所确定的对话类型设置有效时长的操作。

9.一种对话融合装置，其特征在于，包括请求信息获取模块、应用场景确定模块、配置信息调取模块、对话类型确定模块和请求信息解析模块；

所述请求信息获取模块，被配置为获取请求信息；

10.一种对话融合设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述可执行指令时实现权利要求1至8中任意一项所述的方法。