CN111897938A

CN111897938A - 结合rpa和ai的对话机器人回复方法、模型训练方法及装置

Info

Publication number: CN111897938A
Application number: CN202010792940.4A
Authority: CN
Inventors: 胡一川; 汪冠春; 褚瑞; 李玮; 段沛宸; 张海雷
Original assignee: Beijing Benying Network Technology Co Ltd; Beijing Laiye Network Technology Co Ltd
Current assignee: Beijing Benying Network Technology Co Ltd; Beijing Laiye Network Technology Co Ltd
Priority date: 2020-06-30
Filing date: 2020-08-07
Publication date: 2020-11-06

Abstract

本申请实施例公开了一种结合RPA和AI的对话机器人回复方法、用于结合RPA和AI的对话机器人上的检索模型训练方法、装置、设备及介质。其中，对话机器人回复方法包括：接收用户的提问语句；基于预设检索模型，确定与提问语句满足相似度要求的目标相似问题；将目标相似问题所属知识点的答案返回给用户。其中，预设检索模型通过预设知识库中的相似问题训练得到，以建立各相似问题与相似度之间的关联关系。通过采用上述技术方案，可以提升对话机器人的问题回答的准确率。

Description

结合RPA和AI的对话机器人回复方法、模型训练方法及装置

技术领域

本申请涉及智能对话领域，具体涉及一种结合RPA(Robotic ProcessAutomation，机器人流程自动化)和AI(Artificial Intelligence，人工智能)的对话机器人回复方法、模型训练方法、装置、设备及介质。

背景技术

机器人流程自动化(Robotic Process Automation，简称：RPA)是通过特定的“机器人软件”，模拟人在计算机上的操作，按规则自动执行流程任务。人工智能(ArtificialIntelligence，简称：AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。基于AI的对话机器人在日常生活中的应用越来越普遍。

目前，对话机器人技术主要是用预先训练好的模型对用户提问和召回的相似问题的相似程度进行打分，并返回分数最高的相似问题所属知识点的答案。由于传统预习训练好的模型需要单独标注句对语料来进行训练，因此传统预先训练好的模型无法学习到知识库本身的语义分布情况，所以可能会造成模型打分不准、回答错误等现象。

发明内容

本申请实施例公开一种结合RPA和AI的对话机器人回复方法、模型训练方法、装置、设备及介质，提升了对话机器人回答问题的准确率。

第一方面，本申请实施例公开了一种结合RPA和AI的对话机器人回复方法，该方法包括：

接收用户的提问语句；

基于预设检索模型，确定与所述提问语句满足相似度要求的目标相似问题；

将所述目标相似问题所属知识点的答案返回给用户；

其中，所述预设检索模型通过预设知识库中的相似问题训练得到，以建立各相似问题与相似度之间的关联关系。

可选的，所述基于预设检索模型，确定与所述提问语句满足相似度要求的目标相似问题，包括：

从预设知识库中召回所述提问语句对应的各个相似问题；

基于预设检索模型，从召回的各个相似问题中确定与所述提问语句相似度最高的目标相似问题。

可选的，所述基于预设检索模型，从召回的各个相似问题中确定与所述提问语句相似度最高的目标相似问题，包括：

计算所述提问语句与每个相似问题之间的相似度值；

将所有相似度值输入预设检索模型；

根据所述预设检索模型输出的置信度结果，从所述召回的各个相似问题中确定与所述提问语句相似度最高的目标相似问题。

可选的，所述根据所述预设检索模型输出的置信度结果，从所述召回的各个相似问题中确定与所述提问语句相似度最高的目标相似问题，包括：

基于所述预设检索模型的输出的所有置信度值，从所述召回的各个相似问题中选择置信度值最高的相似度问题；

将所述置信度值最高的相似度问题作为与所述提问语句相似度最高的目标相似问题。

可选的，所述计算所述提问语句与每个相似问题之间的相似度值，包括：

计算所述提问语句与所述每个相似问题之间的特征，并将得到的特征信息作为相似度值；

其中，所述特征包括如下一种或多种：最小编辑距离、最长公共子串长度、TFIDF(Term Frequency－Inverse Document Frequency，词频－逆文件频率)加权平均的词向量余弦距离、词移距离(Word Mover’s Distance，简称：WMD)分数和基于句对的神经网络特征。

可选的，所述预设检索模型通过如下方式得到：

对训练样本中的每对相似问题添加标签，其中，所述标签用于表示每对相似问题中的各相似问题是否属于所述知识库中的同一个知识点；

确定所述每对相似问题中各相似问题的相似度；

利用带有标签和相似度值的训练样本对预设监督模型进行训练，得到检索模型；

其中，所述训练样本中的各相似问题均为预设知识库中的相似问题。

第二方面，本申请实施例提供了一种用于结合RPA和AI的对话机器人上的检索模型训练方法，该方法包括：

对训练样本集中的每对相似问题添加标签，其中，所述标签用于表示每对相似问题中的各相似问题是否属于同一个知识点；

确定所述每对相似问题中各相似问题间的相似度；

利用带有标签和相似度值的训练样本集对预设监督模型进行训练，得到检索模型；

其中，所述训练样本集中的各相似问题均属于预设知识库。

可选的，所述训练样本集通过如下方式得到：

从预设知识库中选择设定数目的相似问题作为种子问题；

在所述预设知识库中对各种子问题进行检索，召回各种子问题对应的相似问题；

对于每个种子问题，将其与对应的各相似问题进行组合，并将组合后的多对相似问题的集合作为训练样本集。

可选的，所述确定所述每对相似问题中各相似问题间的相似度，包括：

计算所述每对相似问题中的各相似问题之间的特征，并将得到的特征作为相似度值；

其中，所述特征包括如下一种或多种：最小编辑距离、最长公共子串长度、TFIDF加权平均的词向量余弦距离、词移距离WMD分数和基于句对的神经网络特征。

可选的，所述预设监督模型为：

逻辑回归、分布式梯度增强库XGBoost或者梯度提升算法库CatBoost模型中的一种。

第三方面，本申请实施例还提供了一种结合RPA和AI的对话机器人回复装置，该装置包括：

提问语句接收模块，被配置为接收用户的提问语句；

目标相似问题确定模块，被配置为基于预设检索模型，确定与所述提问语句满足相似度要求的目标相似问题；

答案返回模块，被配置为将所述目标相似问题所属知识点的答案返回给用户；

其中，所述预设检索模型通过预设知识库中的相似问题训练得到，以建立各相似问题与其相似度之间的关联关系。

可选的，所述目标相似问题确定模块，具体包括：

相似问题召回单元，被配置为从预设知识库中召回所述提问语句对应的各个相似问题；

目标相似问题确定单元，被配置为基于预设检索模型，从召回的各个相似问题中确定与所述提问语句相似度最高的目标相似问题。

可选的，所述目标相似问题确定单元，具体包括：

相似度值计算子单元，被配置为计算所述提问语句与每个相似问题之间的相似度值；

输入子单元，被配置为将所有相似度值输入预设检索模型；

目标相似问题确定子单元，被配置为根据所述预设检索模型输出的置信度结果，从所述召回的各个相似问题中确定与所述提问语句相似度最高的目标相似问题。

可选的，所述目标相似问题确定子单元，具体被配置为：

基于所述预设检索模型的输出的所有置信度值，从所述召回的各个相似问题中选择置信度值最高的相似度问题，并将所述置信度值最高的相似度问题作为与所述提问语句相似度最高的目标相似问题。

可选的，所述相似度值计算子单元，具体被配置为：

计算所述提问语句与所述每个相似问题之间的特征，并将得到的特征作为相似度值；

可选的，所述预设检索模型通过如下方式得到：

确定所述每对相似问题中各相似问题的相似度；

利用带有标签和相似度值的训练样本对预设监督模型进行训练，得到检索模型。

第四方面，本申请实施例还公开了一种用于结合RPA和AI的对话机器人上的检索模型训练装置，该装置包括：

标签添加模块，被配置为对训练样本集中的每对相似问题添加标签，其中，所述标签用于表示每对相似问题中的各相似问题是否属于同一个知识点；

相似度确定模块，被配置为确定所述每对相似问题中各相似问题间的相似度；

模型训练模块，被配置为利用带有标签和相似度值的训练样本集对预设监督模型进行训练，得到检索模型；

其中，所述训练样本集中的各相似问题均属于预设知识库。

可选的，所述训练样本集通过如下方式得到：

从预设知识库中选择设定数目的相似问题作为种子问题；

可选的，所述相似度确定模块，具体被配置为：

可选的，所述预设监督模型为：

第五方面，本申请实施例还提供了一种计算设备，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本申请任意实施例所提供的结合RPA和AI的对话机器人回复方法的部分或全部步骤。

第六方面，本申请实时还提供了一种计算设备，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本申请任意实施例所提供的用于结合RPA和AI的对话机器人上的检索模型训练方法的部分或全部步骤。

第七方面，本申请实施例还提供了一种计算机可读存储介质，其存储计算机程序，所述计算机程序包括用于执行本申请任意实施例所提供的结合RPA和AI的对话机器人回复方法的部分或全部步骤的指令。

第八方面，本申请实施例还提供了一种计算机可读存储介质，其存储计算机程序，所述计算机程序包括用于执行本申请任意实施例所提供的用于结合RPA和AI的对话机器人上的检索模型训练方法的部分或全部步骤的指令。

本实施例提供的技术方案，当接收到用户的提问语句时，可基于预设检索模型，确定与该提问语句满足相似度要求的目标相似问题，并将该目标相似问题所属知识点的答案返回给用户。由于预设检索模型是利用预设知识库中的相似问题训练得到的，因此该相似问题可作为预设检索模型进行召回打分的依据，即利用该模型可提升目标相似问题准确度，从而提升对话机器人回答问题的准确率。

与现有技术相比，本申请的发明点包括：

1、由于预设检索模型是利用预设知识库中的相似问题训练得到的，因此，预设知识库中的相似问题可作为预设检索模型召回打分的依据，即通过该预设检索模型可得到与用户的提问语句相似度最高的目标相似问题。对话机器人将该目标相似问题所属知识点的答案返回给用户，从而提升对话机器人回答用户提问的准确率。

2、为训练样本集中的每对相似问题添加标签，并确定每对相似问题中各相似问题间的相似度，从而利用带有相似度值和标签的训练样本集对预设监督模型进行训练，得到检索模型，使得该检索模型建立各相似问题与相似度之间的关联关系。相对于现有技术中单独标注句对语料来训练模型的方式，本申请实施例提供的检索模型学习到了知识库本身的语义分布情况，有助于问答机器人回答问题的准确率。

3、在预设检索模型的训练过程中，通过从预设知识库中选择设定数目的相似问题作为种子问题，并将每个种子问题作为用户的提问语句在预设知识库中进行检索，召回与该种子问题对应的相似问题；对于每个种子问题，将其与对应的各相似问题进行组合，并将组合后的多对相似问题的集合作为训练样本集。相对于从预设知识库中随机选择相似问题进行组合来建立训练样本集的方式，本申请实施例这样设置，可使得用于进行模型训练的相似问题具有一定的相似度，从而减少训练样本的数量，提高模型的训练速率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种用于结合RPA和AI的对话机器人上的检索模型训练方法的流程示意图；

图2是本申请实施例提供的一种结合RPA和AI的对话机器人回复方法的流程示意图；

图3a是本申请实施例提供的用户对话机器人的对话过程效果图；

图3b是本申请实施例提供的用户对话机器人的对话过程效果图；

图4是本申请实施例提供的一种结合RPA和AI的对话机器人回复装置的结构示意图；

图5是本申请实施例提供的一种用于结合RPA和AI的对话机器人上的检索模型训练装置的结构示意图；

图6是本申请实施例提供的一种计算设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请实施例及附图中的术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本申请的描述中，术语“对话机器人”，广义上来讲，是指能够与人类通过语音或文字进行对话交互的计算机程序。

在本申请的描述中，术语“知识库”是某一业务领域内若干个知识点形成的结构化集合。知识库中的每个知识点均由问题和答案组成。创建一个知识点需要一个标准问题、多个相似问题以及一个或多个答案。

在本申请的描述中，术语“相似问题”是指与其所属知识点的标准问题语义高度相似或一致的多个问题，例如，某个问题不同的说法等。

在本申请的描述中，术语“有监督学习”是一个机器学习中的方法，是用已知某种或某些特性的样本作为训练集，以建立一个数学模型，如模式识别中的判别模型，人工神经网络法中的权重模型等，再用已建立的模型来预测未知样本。本申请实施例是利用带有相似度值和标签的相似问题数据集作为训练样本集，来对预设监督模型进行训练。其中，标签用于表示相似问题是否属于同一个知识点。

在本申请的描述中，术语“置信度”是机器人召回知识点或意图与用户问题的相关程度指标，置信度越高代表越相关，置信度是0到1之间的两位小数。

下面将结合附图，对本申请实施例提供的内容进行详细介绍。

实施例一

请参阅图1，图1是本申请实施例提供的一种用于结合RPA和AI的对话机器人上的检索模型训练方法的流程示意图，该模型可应用在用户与对话机器人的交互过程中。对话机器人基于该模型的输出结果，可将用户的问题匹配到预设知识库中最相近的相似问题上，并将该相似问题所属知识点的答案返回给用户。本实施例提供的用于结合RPA和AI的对话机器人上的检索模型训练方法可由用于结合RPA和AI的对话机器人上的检索模型训练装置来执行，该装置可通过软件和/或硬件的方式实现。如图1所示，该方法包括：

S110、为训练样本集中的每对相似问题添加标签。

其中，训练样本集中的各个训练样本均属于预设知识库中的相似问题。在训练样本集中，各相似问题两两组合，形成了多对相似问题，即各训练样本均以相似问题对的形成存在。

示例性的，从预设知识库中选择相似问题，得到训练样本集的方式有多种，例如，可从预设知识库中随机选择出多个相似问题，并两两组合，得到训练样本集。或者，也可从预设知识库的每个知识点中选择出属于该知识点的一个或多个相似问题，然后将所选出的相似问题两两随机组合，形成训练样本集。

优选的，从训练样本集的构建还可通过如下方式实现：

从预设知识库中选择设定数目的相似问题作为种子问题；对于每个种子问题，将其作为用户的提问语句在预设知识库中进行检索，召回各种子问题对应的相似问题；对于每个种子问题，将其与对应的各相似问题进行组合，并将组合后的多对相似问题的集合作为训练样本集。

其中，种子问题可从预设知识库中随机进行选择，例如，可从预设知识库中随机选择1000个相似问题作为种子问题。如果将每个种子问题当作用户提问，召回知识库中的200个相似问题，则最多可构成1000＊200＝200000对相似问题的数据集。相对于从预设知识库中随机选择相似问题的方式来建立训练样本集的方式，本实施例这样设置，可使得训练样本集中的训练样本具有一定的相似度，从而可减少训练样本的数量，提高的模型的训练速率。

本实施例中，为每对相似问题添加的标签用于表示每对相似问题对中的两个相似问题是否属于预设知识库中的同一个知识点，例如，如果属于同一个知识点，则标签可设置为1；如果属于不同知识点，则标签可设置为2。

S120、确定每对相似问题中各相似问题间的相似度。

其中，每对相似问题中各相似问题之间的相似度可通过相似度值来表示。该相似度值可以为语句之间的特征，这些特征可包括如下特征中的一种或多种：最小编辑距离、最长公共子串长度、TFIDF加权平均的词向量余弦距离、词移距离WMD分数和基于句对的神经网络特征。

S130、利用带有标签和相似度值的训练样本集对预设监督模型进行训练，得到检索模型。

本实施例中，训练模型采用有监督学习的训练方式，即利用训练样本集对预设监督模型进行训练时，训练样本都具有相应标注，即训练样本集中，每对相似问题都携带有对应的标签，该标签用于表示各对相似问题中的两个相似问题是否属于同一个知识点，且每对相似问题中的两个相似问题的相似度值也得到确定。其中，预设监督模型可以为逻辑回归、分布式梯度增强库(XGBoost)或者梯度提升算法库(CatBoost)模型。

本实施例提供的用于结合RPA和AI的对话机器人上的检索模型训练方法，由于训练样本集中的各对相似问题均属于预设知识库，且每对相似问题间的两个相似问题的相似度值及两个相似问题是否属于同一个知识点均得到确定，因此利用该训练样本集对预设监督模型进行训练后，得到的检索模型可以学习到知识库本身的语义分布情况。在利用该模型对用户提问和召回的相似问题进行置信度打分时，解决了打分不准的问题，从而提高了对话机器人回答问题的准确度，提升了用户体验。另外，相对于现有技术中采用单独标注句对语料来训练模型的方式，本实施例提供的模型训练方法无需单独标注语料，节省人力。

进一步的，在检索模型训练完成后，在检索模型的应用过程中，对话机器人先通过用户提问召回知识库中的相似问题，然后利用该检索模型，根据用户的提问语句和召回的相似问题的相似度，对各个相似问题进行置信度打分，并输出各相似问题对应的置信度值。对话机器人可从多个置信度值中选择出数值最大的置信度值所对应的相似问题，并将该相似问题所属知识点的答案返回给用户。具体的，关于该检索模型的应用过程将在下文实施例中进行详细介绍。

实施例二

请参阅图2，图2是本申请实施例提供的一种结合RPA和AI的对话机器人回复方法的流程示意图。该方法可由结合RPA和AI的对话机器人回复装置来执行，该装置可通过软件和/或硬件的方式实现。如图2所示，本实施例提供的方法具体包括：

S210、接收用户的提问语句。

具体的，对话机器人可接收用户通过客户端输入或发送的提问语句，其中，客户端可以为智能手机、平板电脑、PC机或人形智能机器人等。对话机器人在接收到提问语句后，可将该提问语句在与用户的对话框中进行显示。

具体的，图3a和图3b是本申请实施例提供的用户对话机器人的对话过程效果图，如图3a所示，当用户想要咨询孕期饮食相关的问题，可打开与孕期饮食知识机器人的对话框，并可输入自己想要咨询的问题。

S220、基于预设检索模型，确定与提问语句满足相似度要求的目标相似问题。

示例性的，步骤S220具体可包括：

从预设知识库中召回提问语句对应的各个相似问题；基于预设检索模型，从各个相似问题中确定与该提问语句相似度最高的目标相似问题。

具体的，对话机器人具有搜索引擎功能。在接收到用户的提问语句时，可利用搜索引擎功能在预设知识库中进行检索，召回与该提问语句的相似问题。其中，所召回的相似问题可能与该提问语句属于同一个知识点，也可能与该提问语句属于不同的知识点。

具体的，如图3a所示，当用户想要咨询孕期饮食相关的问题，可打开与孕期饮食知识机器人的对话框，并可输入自己想要咨询的问题。如图3b所示，当用户输入“怀孕能吃螃蟹吗”，这一提问语句时，机器人会在预设知识库中进行检索，并召回与该提问语句对应的相似问题，例如“孕早期能不能吃螃蟹”、“准妈妈可以吃螃蟹吗”，以及“吃螃蟹的不良反应”等。如果相似问题有多个，则对话机器人需将与用户的提问语句相似度最高的相似问题所属知识点的答案返回给用户。

本实施例中，利用预设检索模型可从各个相似问题中选择出置信度最高的目标相似问题，作为与提问语句相似度最高的相似问题。其中，该预设检索模型的训练方法可参照上述实施例的说明，本实施例对此不作赘述。

具体的，对话机器人在召回提问语句对应的相似问题后，可计算提问语句与每个相似问题之间的相似度值，并将所有相似度值输入预设检索模型；根据预设检索模型输出的置信度结果，确定与提问语句相似度最高的目标相似问题。

其中，用户的提问语句与各相似问题之间的相似度值可通过提问语句与每个相似问题之间的特征来表示，该特征可包括如下一种或多种：最小编辑距离、最长公共子串长度、TFIDF加权平均的词向量余弦距离、WMD分数和基于句对的神经网络特征。

本实施例在对预设检索模型的应用过程中，将提问语句与各相似问题之间的特征信息输入预设检索模型后，该预设检索模型会对各个相似问题进行置信度打分，并输出各相似问题对应的置信度值。对话机器人可从所有置信度值中选择出置信度值最高的相似问题，作为与用户的提问语句相似度最高的目标相似问题。例如，对于“怀孕能吃螃蟹吗”这一提问语句，如果预设检索模型输出的结果中，“孕早期能不能吃螃蟹”对应的置信度值为0.73、“准妈妈可以吃螃蟹吗”对应的置信度值为0.87，以及“吃螃蟹的不良反应”对应的置信度值为0.64，则对话机器人选择置信度值为0.87对应的相似问题“准妈妈可以吃螃蟹吗”作为与“怀孕能吃螃蟹吗”这一提问语句相似程度最高的目标相似问题。

S230、将目标相似问题所属知识点的答案返回给用户。

具体的，对话机器人在回答用户提问时，除了会将目标相似问题所属知识点的答案返回给用户之外，还可将其答案对应的解释也返回给用户，供用户参考，以提升用户体验。例如，如图3b所示，对于“怀孕能吃螃蟹吗”这一提问语句，对话机器人在回答用户提问时，处了将答案“孕期谨吃螃蟹”发送给用户之外，还将其解释“孕妈妈在孕早期甚至在孕中期可能出现胃肠功能下降的情况，而且如果怀孕前不经常吃螃蟹或者有过敏史，孕期食用螃蟹可能出现食物过敏现象；另外螃蟹如果清洗不干净或烹饪不当，也可能会导致微生物感染”返回给用户，以供用户参考。

本实施例提供的技术方案，当接收到用户的提问语句时，可基于预设检索模型，确定与该提问语句满足相似度要求的目标相似问题，并将该目标相似问题所属知识点的答案返回给用户。由于预设检索模型是利用预设知识库中的相似问题训练得到的，因此该相似问题可作为预设检索模型进行召回打分的依据，利用该模型可提升目标相似问题准确度，从而提升机器人回答问题的准确率。

实施例三

请参阅图4，图4是本申请实施例提供的一种结合RPA和AI的对话机器人回复装置的结构示意图，如图4所示，该装置包括：提问语句接收模块310、目标相似问题确定模块320和答案返回模块330；其中，

提问语句接收模块310，被配置为接收用户的提问语句；

目标相似问题确定模块320，被配置为基于预设检索模型，确定与所述提问语句满足相似度要求的目标相似问题；

答案返回模块330，被配置为将所述目标相似问题所属知识点的答案返回给用户；

可选的，所述目标相似问题确定模块320，具体包括：

目标相似问题确定单元，被配置为基于预设检索模型，从各个相似问题中确定与所述提问语句相似度最高的目标相似问题。

可选的，所述目标相似问题确定单元，具体包括：

输入子单元，被配置为将所有相似度值输入预设检索模型；

目标相似问题确定子单元，被配置为根据所述预设检索模型输出的置信度结果，确定与所述提问语句相似度最高的目标相似问题。

可选的，所述目标相似问题确定子单元，具体被配置为：

从所述预设检索模型的输出的所有置信度值中，选择置信度值最高的相似问题，作为与所述提问语句相似度最高的目标相似问题。

可选的，所述相似度值计算子单元，具体被配置为：

计算所述提问语句与每个相似问题之间的特征，并将得到的特征信息作为相似度值；

可选的，所述预设检索模型通过如下方式得到：

为训练样本中的每对相似问题添加标签，其中，所述标签用于表示每对相似问题中的各相似问题是否属于所述知识库中的同一个知识点；

确定每对相似问题中各相似问题的相似度；

本申请实施例所提供的结合RPA和AI的对话机器人回复装置可执行本申请任意实施例所提供的结合RPA和AI的对话机器人回复方法，具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本申请任意实施例所提供的结合RPA和AI的对话机器人回复方法。

实施例四

请参阅图5，图5是本申请实施例提供的一种用于结合RPA和AI的对话机器人上的检索模型训练装置的结构示意图。如图5所示，该装置包括：标签添加模块410、相似度确定模块420和模型训练模块430，其中

标签添加模块410，被配置为对训练样本集中的每对相似问题添加标签，其中，所述标签用于表示每对相似问题中的各相似问题是否属于同一个知识点；

相似度确定模块420，被配置为确定每对相似问题中各相似问题间的相似度；

模型训练模块430，被配置为利用带有标签和相似度值的训练样本集对预设监督模型进行训练，得到检索模型；

其中，训练样本中的各相似问题均属于预设知识库。

可选的，所述训练样本集通过如下方式得到：

从预设知识库中选择设定数目的相似问题作为种子问题；

可选的，所述相似度确定模块，具体被配置为：

计算每对相似问题中的各相似问题之间的特征，并将得到的特征信息作为相似度值；

可选的，所述预设监督模型为：

逻辑回归、分布式梯度增强库XGBoost或者梯度提升算法库CatBoost模型。

本申请实施例所提供的用于结合RPA和AI的对话机器人上的检索模型训练装置可执行本申请任意实施例所提供的用于结合RPA和AI的对话机器人上的检索模型训练方法，具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本申请任意实施例所提供的用于结合RPA和AI的对话机器人上的检索模型训练方法。

实施例六

请参阅图6，图6是本申请实施例提供的一种计算设备的结构示意图。如图6所示，该计算设备可以包括：

存储有可执行程序代码的存储器701；

与存储器701耦合的处理器702；

其中，处理器702调用存储器701中存储的可执行程序代码，执行本申请任意实施例所提供的结合RPA和AI的对话机器人回复方法。

本申请实施例还提供了另外一种计算机设备，包括存储有可执行程序代码的存储器；与存储器耦合的处理器；其中，处理器调用存储器中存储的可执行程序代码，执行本申请任意实施例所提供的用于结合RPA和AI的对话机器人上的检索模型训练方法。

本申请实施例公开一种计算机可读存储介质，其存储计算机程序，其中，该计算机程序使得计算机执行本申请任意实施例所提供的结合RPA和AI的对话机器人回复方法。

本申请实施例还公开一种计算机可读存储介质，其存储计算机程序，其中，该计算机程序使得计算机执行本申请任意实施例所提供的用于结合RPA和AI的对话机器人上的检索模型训练方法。

在本申请的各种实施例中，应理解，上述各过程的序号的大小并不意味着执行顺序的必然先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在本申请所提供的实施例中，应理解，“与A相应的B”表示B与A相关联，根据A可以确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。

另外，在本申请各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可获取的存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分，可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等，具体可以是计算机设备中的处理器)执行本申请的各个实施例上述方法的部分或全部步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read－Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read－only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One－time Programmable Read－Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically－Erasable Programmable Read－Only Memory，EEPROM)、只读光盘(Compact Disc Read－Only Memory，CD－ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本申请实施例公开的一种结合RPA和AI的对话机器人回复方法、训练方法、装置、设备及介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种结合RPA和AI的对话机器人回复方法，其特征在于，包括：

接收用户的提问语句；

基于预设检索模型，确定与所述提问语句满足相似度要求的目标相似问题；其中，所述预设检索模型通过预设知识库中的相似问题训练得到，以建立各相似问题与相似度之间的关联关系；

将所述目标相似问题所属知识点的答案返回给所述用户。

2.根据权利要求1所述的方法，其特征在于，所述基于预设检索模型，确定与所述提问语句满足相似度要求的目标相似问题，包括：

从预设知识库中召回所述提问语句对应的各个相似问题；

3.根据权利要求2所述的方法，其特征在于，所述基于预设检索模型，从召回的各个相似问题中确定与所述提问语句相似度最高的目标相似问题，包括：

计算所述提问语句与每个相似问题之间的相似度值；

将所有相似度值输入预设检索模型；

4.根据权利要求3所述的方法，其特征在于，所述根据所述预设检索模型输出的置信度结果，从所述召回的各个相似问题中确定与所述提问语句相似度最高的目标相似问题，包括：

5.根据权利要求3所述的方法，其特征在于，所述计算所述提问语句与每个相似问题之间的相似度值，包括：

计算所述提问语句与所述每个相似问题之间的特征，并将得到的特征作为相似度值；其中，所述特征包括：最小编辑距离、最长公共子串长度、词频－逆文件频率TFIDF加权平均的词向量余弦距离、词移距离WMD分数和基于句对的神经网络特征中的一种或多种。

6.根据权利要求1所述的方法，其特征在于，所述预设检索模型通过如下方式得到：

对训练样本中的每对相似问题添加标签，其中，所述标签用于表示每对相似问题中的各相似问题是否属于同一个知识点；

确定所述每对相似问题中各相似问题的相似度；

7.一种用于结合RPA和AI的对话机器人上的检索模型训练方法，其特征在于，包括：

对训练样本集中的每对相似问题添加标签，其中，所述标签用于表示所述每对相似问题中的各相似问题是否属于同一个知识点；

确定所述每对相似问题中各相似问题间的相似度；

其中，所述训练样本集中的各相似问题均属于预设知识库。

8.根据权利要求7所述的方法，其特征在于，所述训练样本集通过如下方式得到：

从预设知识库中选择设定数目的相似问题作为种子问题；

9.根据权利要求7所述的方法，其特征在于，所述确定所述每对相似问题中各相似问题间的相似度，包括：

计算所述每对相似问题中的各相似问题之间的特征，并将得到的特征作为相似度值；其中，所述特征包括：最小编辑距离、最长公共子串长度、词频－逆文件频率TFIDF加权平均的词向量余弦距离、词移距离WMD分数和基于句对的神经网络特征中的一种或多种。

10.根据权利要求7所述的方法，其特征在于，所述预设监督模型为：

11.一种结合RPA和AI的对话机器人回复装置，其特征在于，包括：

提问语句接收模块，被配置为接收用户的提问语句；

目标相似问题确定模块，被配置为基于预设检索模型，确定与所述提问语句满足相似度要求的目标相似问题；其中，所述预设检索模型通过预设知识库中的相似问题训练得到，以建立各相似问题与相似度之间的关联关系；

答案返回模块，被配置为将所述目标相似问题所属知识点的答案返回给所述用户。

12.一种用于结合RPA和AI的对话机器人上的检索模型训练装置，其特征在于，包括：

标签添加模块，被配置为对训练样本集中的每对相似问题添加标签，其中，所述标签用于表示所述每对相似问题中的各相似问题是否属于同一个知识点；

其中，所述训练样本集中的各相似问题均属于预设知识库。

13.一种计算设备，其特征在于，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如权利要求1－6任一所述的结合RPA和AI的对话机器人回复方法，或者，实现如权利要求7－10任一所述的用于结合RPA和AI的对话机器人上的检索模型训练方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1－6任一所述的结合RPA和AI的对话机器人回复方法，或者，实现如权利要求7－10任一所述的用于结合RPA和AI的对话机器人上的检索模型训练方法。