CN110059000A

CN110059000A - 聊天剧本测试控制方法、装置、计算机设备及存储介质

Info

Publication number: CN110059000A
Application number: CN201910198877.9A
Authority: CN
Inventors: 刘丽珍; 吕小立; 刘芳
Original assignee: OneConnect Smart Technology Co Ltd
Current assignee: OneConnect Smart Technology Co Ltd
Priority date: 2019-03-15
Filing date: 2019-03-15
Publication date: 2019-07-26

Abstract

本发明实施例公开了一种聊天剧本测试控制方法、装置、计算机设备及存储介质，包括下述步骤：获取多轮智能聊天剧本数据集，其中，剧本数据集包括至少两条分支聊天剧本；根据预设的测试用例生成策略依次对至少两条分支聊天剧本进行转换生成测试用例；将测试用例输入至预设的智能聊天测试场景中，以使智能聊天测试场景对测试用例进行多轮聊天测试。本发明实施例通过获取多轮智能聊天剧本数据集中的多条分支聊天剧本进行转换生成测试用例，然后将测试用例输入至智能聊天测试场景中进行多轮聊天测试，通过将每一条分支聊天剧本对应生成一条测试用例，从而覆盖剧本数据集中所有的聊天剧本，避免出现漏测的情况，进而提高智能聊天的回答正确率。

Description

聊天剧本测试控制方法、装置、计算机设备及存储介质

技术领域

本发明实施例涉及智能聊天系统技术领域，尤其是一种聊天剧本测试控制方法、装置、计算机设备及存储介质。

背景技术

人工智能(Artificial Intelligence)，英文缩写为AI，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，现代科学技术对其应用早已充斥人们的日常生活，例如：苹果智能语音助手Siri、微软小娜、Bixby以及亚马逊Alexa等，人们可以通过智能聊天系统进行聊天或者询问，例如在银行APP中询问基础的银行业务，智能聊天系统能快速的回答用户的问题，用户不需要等待人工的回答，使用快捷方便，且能减少银行的人工成本。

在智能聊天系统中存储着多种聊天剧本，且剧本是树型格式的，一轮对话场景覆盖多种方式，例如用于在与智能机器人聊天时，对于用户的询问或者答复不尽相同，对于用户不同的询问或者答复方式，智能机器人就需要全面解析覆盖以返回正确的答案，所以对于树型结构需要更多的用例来覆盖，以满足不同场景的用户答复方式，但是，对于树型结构的聊天剧本进行一条一条测试，测试用时长，效率低，而且容易出现漏测导致覆盖不全面的情况，降低了智能机器人聊天的回答正确率。

发明内容

本发明实施例提供一种提高智能聊天剧本覆盖率和回答正确率的聊天剧本测试控制方法、装置、计算机设备及存储介质。

为解决上述技术问题，本发明创造的实施例采用的一个技术方案是：提供一种聊天剧本测试控制方法，包括下述步骤：

获取多轮智能聊天剧本数据集，其中，所述剧本数据集包括至少两条分支聊天剧本；

根据预设的测试用例生成策略依次对所述至少两条分支聊天剧本进行转换生成测试用例；

将所述测试用例输入至预设的智能聊天测试场景中，以使所述智能聊天测试场景对所述测试用例进行多轮聊天测试。

可选地，所述获取多轮智能聊天剧本数据集的步骤，还包括如下述步骤：

获取多轮智能聊天系统中预设的聊天剧本集合，其中，所述聊天剧本集合包括成树型结构的至少两条初始聊天剧本；

根据预设的拆分规则对所述聊天剧本集合中的所述至少两条初始聊天剧本进行拆分生成所述至少两条分支聊天剧本。

可选地，所述根据预设的拆分规则对所述聊天剧本集合中的所述至少两条初始聊天剧本进行拆分生成所述至少两条分支聊天剧本的步骤，包括如下述步骤：

根据预设的翻译规则将所述成树型结构的至少两条初始聊天剧本翻译成预设文件格式的目标聊天剧本；

根据预设的解析脚本将所述目标聊天剧本进行解析生成所述至少两条分支聊天剧本。

可选地，所述将所述测试用例输入至预设的智能聊天测试场景中，以使所述智能聊天测试场景对所述测试用例进行多轮聊天测试的步骤之后，还包括如下述步骤：

获取所述智能聊天测试场景进行多轮聊天测试返回的测试结果；

根据预设的检测规则对所述测试结果进行分析以判断所述测试结果是否正确。

可选地，所述根据预设的检测规则对所述测试结果进行分析以判断所述测试结果是否正确的步骤，包括如下述步骤：

获取所述剧本数据集中与进行多轮聊天测试的测试用例相对应的目标分支聊天剧本；

将所述目标分支聊天剧本与所述测试结果进行比对；

当所述目标分支聊天剧本与所述测试结果相匹配时，判断所述测试结果正确。

可选地，所述将所述目标分支聊天剧本与所述测试结果进行比对的步骤之后，还包括如下述步骤：

当所述目标分支聊天剧本与所述测试结果不相匹配时，判断所述测试结果错误；

根据预设的错误解析规则对错误的所述测试结果进行分析生成聊天场景错误信息；

根据所述聊天场景错误信息对多轮智能聊天系统中的智能聊天算法进行补充调整。

为解决上述技术问题，本发明实施例还提供一种聊天剧本测试控制装置，包括：

第一获取模块，用于获取多轮智能聊天剧本数据集，其中，所述剧本数据集包括至少两条分支聊天剧本；

第一处理模块，用于根据预设的测试用例生成策略依次对所述至少两条分支聊天剧本进行转换生成测试用例；

第一执行模块，用于将所述测试用例输入至预设的智能聊天测试场景中，以使所述智能聊天测试场景对所述测试用例进行多轮聊天测试。

可选地，还包括：

第二获取模块，用于获取多轮智能聊天系统中预设的聊天剧本集合，其中，所述聊天剧本集合包括成树型结构的至少两条初始聊天剧本；

第二执行模块，用于根据预设的拆分规则对所述聊天剧本集合中的所述至少两条初始聊天剧本进行拆分生成所述至少两条分支聊天剧本。

可选地，还包括：

翻译子模块，用于根据预设的翻译规则将所述成树型结构的至少两条初始聊天剧本翻译成预设文件格式的目标聊天剧本；

第一执行子模块，用于根据预设的解析脚本将所述目标聊天剧本进行解析生成所述至少两条分支聊天剧本。

可选地，还包括：

第三获取模块，用于获取所述智能聊天测试场景进行多轮聊天测试返回的测试结果；

第三执行模块，用于根据预设的检测规则对所述测试结果进行分析以判断所述测试结果是否正确。

可选地，还包括：

获取子模块，用于获取所述剧本数据集中与进行多轮聊天测试的测试用例相对应的目标分支聊天剧本；

比对子模块，用于将所述目标分支聊天剧本与所述测试结果进行比对；

第二执行子模块，用于当所述目标分支聊天剧本与所述测试结果相匹配时，判断所述测试结果正确。

可选地，还包括：

判断模块，用于当所述目标分支聊天剧本与所述测试结果不相匹配时，判断所述测试结果错误；

第二处理模块，用于根据预设的错误解析规则对错误的所述测试结果进行分析生成聊天场景错误信息；

第四执行模块，用于根据所述聊天场景错误信息对多轮智能聊天系统中的智能聊天算法进行补充调整。

为解决上述技术问题，本发明实施例还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行上述聊天剧本测试控制方法的步骤。

为解决上述技术问题，本发明实施例还提供一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述聊天剧本测试控制方法的步骤。

本发明实施例的有益效果为：通过获取多轮智能聊天剧本数据集，该剧本数据集包括多条分支聊天剧本，然后根据测试用例生成策略将该多条分支聊天剧本进行转换生成测试用例，然后将测试用例依次输入至智能聊天测试场景中进行多轮聊天测试，通过将每一条分支聊天剧本对应生成一条测试用例，从而覆盖剧本数据集中所有的聊天剧本，避免出现漏测的情况，进而提高智能聊天的回答正确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例聊天剧本测试控制方法的基本流程示意图；

图2为本发明实施例获取剧本数据集中分支聊天剧本的流程示意图；

图3为本发明实施例生成分支聊天剧本的流程示意图；

图4为本发明实施例检测测试是否正常的流程示意图；

图5为本发明实施例判断测试结果的流程示意图；

图6为本发明实施例调整聊天算法的流程示意图；

图7为本发明实施例聊天剧本测试控制装置基本结构示意图；

图8为本发明实施例计算机设备基本结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

具体请参阅图1，图1为本实施例聊天剧本测试控制方法的基本流程示意图。

如图1所示，一种聊天剧本测试控制方法，包括下述步骤：

S1100、获取多轮智能聊天剧本数据集，其中，所述剧本数据集包括至少两条分支聊天剧本；

剧本数据集是指分支聊天剧本的集合，剧本数据集是多轮智能聊天系统预设的，多轮智能聊天系统是一种人工智能AI(Artificial Intelligence)聊天系统，剧本数据集中包括多条(例如100条、500条或者800条)应对不同的聊天场景和用户问答方式的分支聊天剧本，当用户与多轮智能聊天系统进行聊天时，多轮智能聊天系统能根据用户输入的聊天内容选择不同的分支聊天剧本进行应答或者提问，从而提高多轮智能聊天系统的智能化程度。在实施时，剧本数据集存储于多轮智能聊天系统中，通过与该多轮智能聊天系统进行关联即可获取该剧本数据集。

S1200、根据预设的测试用例生成策略依次对所述至少两条分支聊天剧本进行转换生成测试用例；

在获取剧本数据集之后，系统根据测试用例生成策略将剧本数据集中的多条分支聊天剧本转换成测试用例，测试用例生成策略是系统预设的用于将分支聊天剧本转换成测试用例的，在实施时，测试用例生成策略的工作原理为：将呈树型结构的剧本数据集中的每条分支的分支聊天剧本进行转换生成一条测试用例，从而将整个树型结构的剧本数据集中所有分支聊天剧本转换生成测试用例。在另一个实施例中，剧本数据集中的分支聊天剧本呈嵌套型，系统通过测试用例生成策略将该呈嵌套型的每一条分支聊天剧本对应转换成一条测试用例，从而将整个剧本数据集中所有的分支聊天剧本转换成测试用例，生成的测试用例能覆盖剧本数据集中所有的分支聊天剧本，目标出现漏测的情况。

S1300、将所述测试用例输入至预设的智能聊天测试场景中，以使所述智能聊天测试场景对所述测试用例进行多轮聊天测试。

在生成测试用例后，系统将该多条(例如500条、1000条或者3000条)测试用例输入至智能聊天测试场景中进行多轮聊天测试，测试用例的数量与分支聊天剧本的数量对应，智能聊天测试场景是预设的用于进行聊天剧本测试的，在实施时，智能聊天测试场景是一个聊天程序，系统通过发起一个聊天程序，并按照测试用例预设的回答进行自动多轮聊天，具体地，以剧本数据集中包括2000条分支聊天剧本为例，该2000条分支聊天剧本呈树型结构组成剧本数据集，树型结构的每一条分支就是一条分支聊天剧本，系统与多轮智能聊天系统关联获取剧本数据集，然后根据测试用例生成策略将每一条分支聊天剧本自动生成一条自动化测试用例，系统再通过Python脚本编写调用Socket协议，发起一个聊天程序，并按照测试用例中预设的回答进行自动多轮聊天测试。Python是一种计算机程序设计语言，其是一种动态的、面向对象的脚本语言；Socket协议是用于网络上的两个程序通过一个双向的通信连接实现数据交换的协议。

本实施例通过获取多轮智能聊天剧本数据集，该剧本数据集包括多条分支聊天剧本，然后根据测试用例生成策略将该多条分支聊天剧本进行转换生成测试用例，然后将测试用例依次输入至智能聊天测试场景中进行多轮聊天测试，通过将每一条分支聊天剧本对应生成一条测试用例，从而覆盖剧本数据集中所有的聊天剧本，避免出现漏测的情况，进而提高智能聊天的回答正确率。

在一个可选实施例中，为了获得树型结构所有的分支聊天剧本，还可以将树型结构聊天剧本转换成嵌套型结构，以避免出现漏掉分支聊天剧本的情况，提高测试覆盖率。请参阅图2，图2是本发明一个实施例获取剧本数据集中分支聊天剧本的流程示意图。

如图2所示，步骤S1100还包括如下述步骤：

S1110、获取多轮智能聊天系统中预设的聊天剧本集合，其中，所述聊天剧本集合包括成树型结构的至少两条初始聊天剧本；

多轮智能聊天系统是一种AI聊天系统，用于根据用户的提问或者回答进行答复，实现人工智能聊天功能，聊天剧本集合是多轮智能聊天系统中预设的用于存储和管理初始聊天剧本的，在实施时，聊天剧本集合中存储有多条(例如300条、400条或者900条)初始聊天剧本，初始聊天剧本是树型格式的，树型结构上的每条分支作为一条初始聊天剧本，树型结构是一层次的嵌套结构，一个树型结构的外层和内层有相似的结构，所以这种结构可以递归的表示。

S1120、根据预设的拆分规则对所述聊天剧本集合中的所述至少两条初始聊天剧本进行拆分生成所述至少两条分支聊天剧本。

在获取多轮智能聊天系统中的聊天剧本集合后，系统根据拆分规则将该聊天剧本集合中的多条初始聊天剧本进行拆分，每一条初始聊天剧本生成一条分支聊天剧本，拆分规则是预设的用于将呈树型结构的聊天剧本集合中的每一条分支进行拆分，从而将每一条分支上的初始来头剧本拆分出来变成分支聊天剧本。在实施时，以聊天剧本集合为3层的树型结构为例，包括第一层的话题1、第二层的话题2和话题3以及第三层的话题4、话题5、话题6和话题7，其中，话题2和话题3为话题1的延伸话题，话题4和话题5为话题2的延伸话题，话题6和话题7为话题3的延伸话题，所以，该聊天剧本集合至少包括初始聊天剧本1、初始聊天剧本2、初始聊天剧本3和初始聊天剧本4，初始聊天话题1为话题1、话题2和话题4的组合，初始聊天话题2为话题1、话题2和话题5的组合，初始聊天话题3为话题1、话题3和话题6的组合，初始聊天话题4为话题1、话题3和话题7的组合，当然，在实施时，该聊天剧本集合还可以包括其它的初始聊天剧本，例如话题1、话题2和话题6的组合，话题1、话题3和话题4的组合，或者将话题1和话题2的组合或者话题1和话题3的组合当做一个初始聊天剧本，然后将这些初始聊天剧本从聊天剧本集合中提取出来生成分支聊天剧本，从而覆盖树型结构中的所有分支的聊天剧本。

在另一个可选实施例中，请参阅图3，图3是本发明一个实施例生成分支聊天剧本的基本流程示意图。

如图3所示，步骤S1120还包括如下述步骤：

S1121、根据预设的翻译规则将所述成树型结构的至少两条初始聊天剧本翻译成预设文件格式的目标聊天剧本；

在将树型结构的初始聊天剧本生成分支聊天剧本的过程中，系统根据翻译规则将呈树型结构的多条初始聊天剧本翻译成预设文件格式的目标聊天剧本，翻译规则是预设的用于将树型结构的每条分支上的初始聊天剧本翻译成目标聊天剧本，其中，目标聊天剧本的文件格式可以采用XML文件，XML(eXtensible Markup Language)可扩展标记语言(标准通用标记语言的子集)是一种简单的数据存储语言，例如：对所有的树型结构中的初始聊天剧本翻译成嵌套型XML。

S1122、根据预设的解析脚本将所述目标聊天剧本进行解析生成所述至少两条分支聊天剧本。

在将初始聊天剧本翻译成目标聊天剧本后，系统根据解析脚本将该多个目标聊天剧本进行解析生成多条分支聊天剧本，在实施时，每一条初始聊天剧本翻译成一条目标聊天剧本，每一条目标聊天剧本可以生成一条分支聊天剧本。解析脚本是预设的用于将目标聊天剧本生成分支聊天剧本，在实施时，可以通过Python脚本解析目标聊天剧本以生成分支聊天剧本，Python是一种计算机程序设计语言。是一种动态的、面向对象的脚本语言，例如：对于所有的树型结构的初始聊天剧本翻译成嵌套型XML文件，再通过Python脚本解析该XML文件即可将树型结构上的每条分支的初始聊天剧本生成一条分支聊天剧本。

在一个可选实施例中，请参阅图4，图4是本发明一个实施例检测测试是否正常的基本流程示意图。

如图4所示，步骤1300之后，还包括如下述步骤：

S1400、获取所述智能聊天测试场景进行多轮聊天测试返回的测试结果；

在将测试用例输入至智能聊天测试场景中后，系统将该测试用例在智能聊天测试场景中进行多轮聊天测试，系统获取再智能聊天测试场景中进行多轮聊天测试的测试结果，在实施时，该测试结果可以是在智能聊天测试场景中该测试用例进行对话的程度(例如测试用例测试到50％、60％或者90％就出现了错误回答)或者是在测试过程中该测试用例出现错误回答的次数以及出现错误回答的位置。

S1500、根据预设的检测规则对所述测试结果进行分析以判断所述测试结果是否正确。

在获取测试结果后，系统根据检测规则对该测试结果进行分析从而判断测试结果是否正确，在实施时，当智能聊天测试场景中出现回答错误就将结果返回，即测试结果不正确，系统可以根据该测试结果对聊天剧本或者AI算法进行补充，而当测试结果正确时，该测试用例是完善的，不需要对该测试用例进行调整或者补充。检测规则是系统预设的用于判断测试结果是否正确的，在实施时，检测规则的工作原理是将智能聊天测试场景返回的测试结果与树型结构的分支聊天剧本进行对比，当测试结果与分支聊天剧本不匹配是，判断测试结果不正确。

在一个可选实施例中，请参阅图5，图5是本发明一个实施例判断测试结果的基本流程示意图。

如图5所示，步骤S1500包括如下述步骤：

S1510、获取所述剧本数据集中与进行多轮聊天测试的测试用例相对应的目标分支聊天剧本；

在将测试用例输入至智能聊天测试场景中进行多轮聊天测试后获取测试结果，然后获取进行多轮聊天测试的测试用例对应的目标分支聊天剧本，在实施时，该目标分支聊天剧本是指生成测试用例的分支聊天剧本。

S1520、将所述目标分支聊天剧本与所述测试结果进行比对；

将目标分支聊天剧本与智能聊天测试场景返回的测试结果进行比对，从而判断目标分支聊天剧本与测试结果是否匹配。

S1530、当所述目标分支聊天剧本与所述测试结果相匹配时，判断所述测试结果正确。

当目标分支聊天剧本与测试结果不匹配时，判断测试结果不正确，当目标分支聊天剧本与测试结果相匹配时，判断测试结果正确，具体的，可以将目标分支聊天剧本中所有的话术与测试结果中的话术进行比对，当目标分支聊天剧本中的至少一句话术与测试结果中的话术不对应，则可以判断目标分支聊天剧本与测试结果不匹配，举例说明：目标分支聊天剧本包括第一话术1、第二话术2和第三话术3，其中，第一话术1为“亲，您好，非常高兴为您服务了，有什么可以为您效劳的呢？”；第二话术2包括第二分话术2.1和第二分话术2.2，第二分话术2.1为“亲，您看中的这款宝贝是有现货的呢，您可以放心拍哦。”第二分话术2.2为“亲，非常抱歉这款宝贝已经没有现货了呢，您可以看一下这款哦，两款宝贝的质量都是非常不错的，款式和价格也相差不多呢。”；第三话术3为“亲，您拍下的42个小时内就可以为您安排发货的呢”。

在实施是，在正常对话情况下，以下为一个对话场景举例：当智能聊天系统与用户终端通话连接时，系统将第一话术1“亲，您好，非常高兴为您服务了，有什么可以为您效劳的呢？”发送至用户终端，用户接听到该第一话术1时进行回复，回复信息为“是否有货？”，系统接收到用户的回复发送第二话术2中的第二分话术2.1“亲，您看中的这款宝贝是有现货的呢，您可以放心拍哦”，此时，用户再次回复，回复信息为“什么时候发货？”，系统根据用户的第二个回复信息发送第三话术3“亲，您拍下的42个小时内就可以为您安排发货的呢”至用户终端，从而完成完整的对话过程。

但是，在将测试用例进行多轮聊天测试过程中，用户的回复不尽相同，从而使得目标分支聊天剧本不能准确应答用户的回复信息，举例说明：当智能聊天系统与用户终端通话连接时，系统发送第一话术1“亲，您好，非常高兴为您服务了，有什么可以为您效劳的呢？”，用户接听到该第一话术1时进行回复，回复信息为“是否有货？”，系统接收到用户的回复发送第二话术2中的第二分话术2.1“亲，您看中的这款宝贝是有现货的呢，您可以放心拍哦”，此时，用户再次回复，回复信息为“发什么快递？”，系统根据其它分支聊天剧本中的第四话术4“亲，默认是发韵达快递哦”发送至用户终端，系统从而完成完整的对话过程。进行多轮聊天测试的测试结果中的第四话术4与目标分支聊天剧本中的第三话术3不相匹配，判断测试结果出错，系统进而可以根据该测试结果对聊天剧本进行补充或者调整，以提高多轮聊天的回答准确率。

在一个可选实施例中，请参阅图6，图6是本发明一个实施例调整聊天算法的基本流程示意图。

如图6所示，步骤S1520之后还包括如下述步骤：

S1521、当所述目标分支聊天剧本与所述测试结果不相匹配时，判断所述测试结果错误；

将目标分支聊天剧本与测试结果进行比对后，判断目标分支聊天剧本与测试结果是否匹配，当目标分支聊天剧本与测试结果不相匹配时，判断测试结果不正确。

S1522、根据预设的错误解析规则对错误的所述测试结果进行分析生成聊天场景错误信息；

当测试结果错误是，根据预设的错误解析规则对测试结果进行分析从而生成聊天场景错误信息，错误解析规则是预设的用于分析测试结果以找出在多轮聊天测试过程中出现的对话错误，包括发送聊天错误的具体话术以及发生聊天错误的次数等信息，例如：目标分支聊天剧本设置有100句话术，当使用目标分支聊天剧本作为测试用例进行多轮聊天测试时，出现了第55句话术、第78句话术和第98句话术发生错误的测试结果，系统将该测试结果根据错误解析规则进行分析，从而知道在第55句话术、第78句话术和第98句话术的位置处出现了对话错误。

S1523、根据所述聊天场景错误信息对多轮智能聊天系统中的智能聊天算法进行补充调整。

在得到聊天场景错误信息后，系统根据该聊天场景错误信息对多轮智能聊天系统中的智能聊天算法进行补充调整，例如通过基Encoder-Decoder深度学习框架不断增加训练数据来调整智能聊天算法，即将错误的测试用例而产生的聊天场景错误信息作为训练数据训练聊天机器人。

为解决上述技术问题，本发明实施例还提供一种聊天剧本测试控制装置。

具体请参阅图7，图7为本实施例聊天剧本测试控制装置基本结构示意图。

如图7所示，一种聊天剧本测试控制装置，包括：第一获取模块2100、第一处理模块2200和第一执行模块2300，其中，第一获取模块2100用于获取多轮智能聊天剧本数据集，其中，所述剧本数据集包括至少两条分支聊天剧本；第一处理模块2200用于根据预设的测试用例生成策略依次对所述至少两条分支聊天剧本进行转换生成测试用例；第一执行模块2300用于将所述测试用例输入至预设的智能聊天测试场景中，以使所述智能聊天测试场景对所述测试用例进行多轮聊天测试。

在一些实施方式中，聊天剧本测试控制装置还包括：第二获取模块和第二执行模块，其中，第二获取模块用于获取多轮智能聊天系统中预设的聊天剧本集合，其中，所述聊天剧本集合包括成树型结构的至少两条初始聊天剧本；第二执行模块用于根据预设的拆分规则对所述聊天剧本集合中的所述至少两条初始聊天剧本进行拆分生成所述至少两条分支聊天剧本。

在一些实施方式中，聊天剧本测试控制装置还包括：翻译子模块和第一执行子模块，其中，翻译子模块用于根据预设的翻译规则将所述成树型结构的至少两条初始聊天剧本翻译成预设文件格式的目标聊天剧本；第一执行子模块用于根据预设的解析脚本将所述目标聊天剧本进行解析生成所述至少两条分支聊天剧本。

在一些实施方式中，聊天剧本测试控制装置还包括：第三获取模块和第三执行模块，其中，第三获取模块用于获取所述智能聊天测试场景进行多轮聊天测试返回的测试结果；第三执行模块用于根据预设的检测规则对所述测试结果进行分析以判断所述测试结果是否正确。

在一些实施方式中，聊天剧本测试控制装置还包括：获取子模块、比对子模块和第二执行子模块，其中，获取子模块用于获取所述剧本数据集中与进行多轮聊天测试的测试用例相对应的目标分支聊天剧本；比对子模块用于将所述目标分支聊天剧本与所述测试结果进行比对；第二执行子模块用于当所述目标分支聊天剧本与所述测试结果相匹配时，判断所述测试结果正确。

在一些实施方式中，聊天剧本测试控制装置还包括：判断模块、第二处理模块和第四执行模块，其中，判断模块用于当所述目标分支聊天剧本与所述测试结果不相匹配时，判断所述测试结果错误；第二处理模块用于根据预设的错误解析规则对错误的所述测试结果进行分析生成聊天场景错误信息；第四执行模块用于根据所述聊天场景错误信息对多轮智能聊天系统中的智能聊天算法进行补充调整。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

为解决上述技术问题，本发明实施例还提供计算机设备。具体请参阅图8，图8为本实施例计算机设备基本结构框图。

如图8所示，计算机设备的内部结构示意图。如图8所示，该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中，该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令，数据库中可存储有控件信息序列，该计算机可读指令被处理器执行时，可使得处理器实现一种聊天剧本测试控制方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行一种聊天剧本测试控制方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解，图中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本实施方式中处理器用于执行图7中第一获取模块2100、第一处理模块2200和第一执行模块2300，存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有聊天剧本测试控制装置中执行所有子模块所需的程序代码及数据，服务器能够调用服务器的程序代码及数据执行所有子模块的功能。

计算机通过获取多轮智能聊天剧本数据集，该剧本数据集包括多条分支聊天剧本，然后根据测试用例生成策略将该多条分支聊天剧本进行转换生成测试用例，然后将测试用例依次输入至智能聊天测试场景中进行多轮聊天测试，通过将每一条分支聊天剧本对应生成一条测试用例，从而覆盖剧本数据集中所有的聊天剧本，避免出现漏测的情况，进而提高智能聊天的回答正确率。

本发明还提供一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述任一实施例所述聊天剧本测试控制方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述仅是本发明的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种聊天剧本测试控制方法，其特征在于，包括下述步骤：

2.根据权利要求1所述的聊天剧本测试控制方法，其特征在于，所述获取多轮智能聊天剧本数据集的步骤，还包括如下述步骤：

3.根据权利要求2所述的聊天剧本测试控制方法，其特征在于，所述根据预设的拆分规则对所述聊天剧本集合中的所述至少两条初始聊天剧本进行拆分生成所述至少两条分支聊天剧本的步骤，包括如下述步骤：

4.根据权利要求1所述的聊天剧本测试控制方法，其特征在于，所述将所述测试用例输入至预设的智能聊天测试场景中，以使所述智能聊天测试场景对所述测试用例进行多轮聊天测试的步骤之后，还包括如下述步骤：

5.根据权利要求4所述的聊天剧本测试控制方法，其特征在于，所述根据预设的检测规则对所述测试结果进行分析以判断所述测试结果是否正确的步骤，包括如下述步骤：

将所述目标分支聊天剧本与所述测试结果进行比对；

6.根据权利要求5所述的聊天剧本测试控制方法，其特征在于，所述将所述目标分支聊天剧本与所述测试结果进行比对的步骤之后，还包括如下述步骤：

7.一种聊天剧本测试控制装置，其特征在于，包括：

8.根据权利要求7所述的聊天剧本测试控制装置，其特征在于，还包括：

9.一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如权利要求1至6中任一项权利要求所述聊天剧本测试控制方法的步骤。

10.一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如权利要求1至6中任一项权利要求所述聊天剧本测试控制方法的步骤。