CN112527972A

CN112527972A - 基于深度学习的智能客服聊天机器人实现方法和系统

Info

Publication number: CN112527972A
Application number: CN202011564926.5A
Authority: CN
Inventors: 徐驰; 林健
Original assignee: Dongyun Ruilian Wuhan Computing Technology Co ltd
Current assignee: Dongyun Ruilian Wuhan Computing Technology Co ltd
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2021-03-19

Abstract

本发明公开了一种基于深度学习的智能客服聊天机器人实现方法和系统，该方法包括客服聊天机器人获取用户输入的自然语言问题文本；调用文本分类算法模型来确定自然语言问题文本对应的问题类别；获取与问题类别对应的目标问答数据库；分别计算自然语言问题文本与目标问答数据库中的各个预存问题文本的相似度；从全部相似度中确定最大相似度；在最大相似度大于预设阈值时，将最大相似度对应的目标预存问题文本相应的回答作为提供给所述用户的回答文本；在所述最大相似度不大于预设阈值时，从全部相似度中选取前n个最大的相似度各自对应的预存问题文本的相应的回答作为给所述用户的回答文本。本发明可降低客服服务成本，提升服务效率。

Description

基于深度学习的智能客服聊天机器人实现方法和系统

技术领域

本发明涉及人工智能技术领域，具体涉及一种基于深度学习的智能客服聊天机器人实现方法和系统。

背景技术

在客服场景中，用户总是会提出一些常规、重复性的问题，客服答复工作繁琐重复；在客服系统的高峰时间段，由于人工客服数量有限，用户的咨询不能得到及时的处理；人工客服的服务时间有限。为了解决上述问题，智能客服技术应运而生。与传统的人工客服相比，智能客服系统具有成本低、效率高的优势。

在智能客服聊天机器人系统方面，一些学者提出了一些具体方案。贺莎莎等人在专利号201910844278.X的发明专利《智能客服系统》中，提出了一种智能客服系统，该系统包括：知识库管理模块、机器人聊天模块和人工客服聊天模块。知识库管理模块存储与业务领域相关的问答数据库。机器人聊天模块用于：接收对话上文数据；从问答数据库中匹配出备选对话下文数据；获取备选对话下文数据与对话上文数据之间的相关度；响应于相关度超过预设阈值，确定备选对话下文数据为对话下文数据。人工客服模块用于接收人工客服确认在相关度低于预设阈值时所生成的人工客服聊天请求，并接收来自人工客服的对话下文数据。张成栋等人在专利号201710010926.2的发明专利《智能虚拟客服系统》中，也提出类似的智能客服机器人系统，包括：基础数据库，存储常见的客服问答；关键字识别模块，将基础数据库中的常见客服问答进行切词，模糊匹配给出单节点一问一答建议性匹配答案；流程化服务模块，实现与顾客的问答交互，根据顾客的问题从基础数据库中提取对应的答案，并重新定位此项问答节点在上下文中的位置。

目前，现有的智能客服聊天机器人系统主要是使用预设的问答数据库对用户提出的问题进行匹配，并返回预设问答数据库中对应的答复。但在某些行业的客服系统中，如电商客服、电信运营商客服，本领域内的分类较多，不同分类的客服系统需要面对的咨询问题差别较大。如电商客服，在衣服鞋帽、数码产品、零食生鲜等分类的咨询问题差别较大，仅使用预设的问答数据库进行匹配的方法时，存在准确率低、执行效率低的问题。针对上述问题，我们提出使用文本分类方法，对用户提出的问题进行分类，将不同类别的问题分配到相应类别的问答数据库中进行匹配，提高了匹配准确率和执行效率。

发明内容

针对现有技术中存在的缺陷，我们提出一种深度学习的智能客服聊天机器人实现方法和系统，对用户提出的问题进行分类，将不同类别的问题分配到相应类别的问答数据库中进行匹配，提高了匹配准确率和执行效率；可降低客服服务成本，提升服务效率。

本发明提供了一种基于深度学习的智能客服聊天机器人实现方法和系统，包括：

客服聊天机器人获取用户输入的自然语言问题文本；

调用文本分类算法模型来确定所述自然语言问题文本对应的问题类别；

获取与所述问题类别对应的目标问答数据库；

分别计算所述自然语言问题文本与所述目标问答数据库中的各个预存问题文本的相似度；

从全部相似度中确定最大相似度；

判断所述最大相似度是否大于预设阈值；

在所述最大相似度大于所述预设阈值时，将所述最大相似度对应的目标预存问题文本相应的回答作为提供给所述用户的回答文本；

或

在所述最大相似度不大于所述预设阈值时，从全部相似度中选取前n个最大的相似度各自对应的预存问题文本的相应的回答作为给所述用户的回答文本。

优选的，所述调用文本分类算法模型来确定所述自然语言问题文本对应的问题类别的步骤之前，所述方法还包括：

确定预设场景下的具有多个问题类别的问答数据库；

将所述问答数据库中的问题文本和对应的问题类别作为文本分类算法的训练样本数据集；

使用所述训练样本数据进行模型训练，获得用于将问题文本进行分类的文本分类算法模型。

优选的，所述文本分类算法模型具体包括数据输入单元、文本特征提取器、文本类别分类器以及类别输出单元：

所述数据输入单元，用于使用各个类别数据库中的自然语言问题文本和对应的类别，其中，所述自然语言问题文本为输入的数据，对应的问题类别为标签；

所述第一文本特征提取器，用于使用双向Transformer编码器Bert将所述数据输入单元的自然语言问题文本进行特征提取，得到特征向量；

所述文本类别分类器，用于使用神经网络分类器对所述特征向量进行分类，输出各类别的概率值；其中，所述神经网络算法可使用全连接神经网络、卷积神经网络或者循环神经网络；

所述类别输出单元，用于计算所述文本类别分类器输出的各类别概率值，将所述各类别概率值中的最大值对应的类别作为所述自然语言问题文本的分类类别。

优选的，所述分别计算所述自然语言问题文本与所述目标问答数据库中的各个预存问题文本的相似度的步骤，具体包括：

调用文本相似度模型提取所述自然语言问题文本和所述目标问答数据库中的预存问题文本的特征向量；其中，所述文本相似度模型包括第二文本特征提取器，所述第二文本特征提取器包含双向Transformer编码器Bert；

所述调用文本相似度模型提取所述自然语言问题文本和所述问答数据库中的预存问题文本的特征向量的步骤，具体包括：

将所述自然语言问题文本和所述问答数据库中的预存问题文本输入到所述第二文本特征提取器502，嵌入到高维向量空间中，分别计算得到所述自然语言问题文本对应的高维向量和所述问答数据库中的预存问题文本对应的高维向量；

计算所述自然语言问题文本对应的高维向量和所述问答数据库中的预存问题文本对应的高维向量的余弦距离，将所述余弦距离作为所述自然语言问题文本与所述目标问答数据库中的预存问题文本的相似度。

此外，本发明还提供一种基于深度学习的智能客服聊天机器人系统，所述系统包括：

自然语言问题文本获取单元，用于获取用户输入的自然语言问题文本；

文本分类算法模型单元，用于调用文本分类算法模型来确定所述自然语言问题文本对应的问题类别；

文本相似度模型单元，用于获取与所述问题类别对应的目标问答数据库；分别计算所述自然语言问题文本与所述目标问答数据库中的各个预存问题文本的相似度；从全部相似度中确定最大相似度；在所述最大相似度大于预设阈值时，将所述最大相似度对应的目标预存问题文本相应的回答作为提供给所述用户的回答文本；在所述最大相似度不大于预设阈值时，从全部相似度中选取前n个最大的相似度各自对应的预存问题文本的相应的回答作为给所述用户的回答文本。

此外，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有可执行程序，所述可执行程序用于执行如上所述的基于深度学习的智能客服聊天机器人实现方法的步骤。

本申请的有益效果在于：对用户提出的问题进行分类，将不同类别的问题分配到相应类别的问答数据库中进行匹配，提高了匹配准确率和执行效率，进而可降低客服服务成本，提升服务效率。

附图说明

图1为本发明实施例中的基于深度学习的智能客服聊天机器人实现方法的流程示意图；

图2为本发明实施例文本分类算法训练流程的流程示意图；

图3为本发明实施例的文本分类算法的结构示意图；

图4为本发明实施例的文本相似度计算的流程示意图；

图5为本发明实施例的文本相似度模型算法的结构示意图；

图6为本发明实施例的文本相似度模型的结构示意图；

图7为本发明实施例智能客服聊天机器人系统的结构框图。

具体实施方式

以下结合附图及实施例对本发明作进一步详细说明。请参见图1，图1是本发明中提供的一种智能客服聊天机器人的实现方法的示意流程图。该方法可以运行在某种计算机中，如智能手机、笔记本电脑、服务器等。

步骤S101，客服聊天机器人获取用户输入的自然语言问题文本。具体的说，假设当前应用场景是电商智能客服场景，用户使用本智能客服聊天机器人系统，咨询电子产品的售后政策。用户可输入咨询语句：“iPhone手机有多长时间的保修期？”。该自然语言问题是步骤S101中获取的用户输入的自然语言问题文本。

步骤S102，调用文本分类算法模型来确定所述自然语言问题文本对应的问题类别。

具体地，对于步骤S101中输入的自然语言问题文本，使用基于深度学习的文本分类算法，计算得到该自然语言问题的类别。

例如，对于电商智能客服场景，分类类别包括：“数码产品”、“衣服鞋帽”、“零食生鲜”等。对于上述用户输入的自然语言问题“iPhone手机有多长时间的保修期？”，经过文本分类算法计算后得到类别“数码产品”。

步骤S103，获取与所述问题类别对应的目标问答数据库；分别计算所述自然语言问题文本与所述目标问答数据库中的各个预存问题文本的相似度；从全部相似度中确定最大相似度；

具体地，根据步骤S102得到的文本类别，取出该类别的问答数据库，并计算所述用户输入的自然语言问题文本与所述该类别问答数据库中问题的相似度。例如，电商场景下的多个类别问答数据库如下所示：

a类别：“数码产品”。问题：“请问iPhone手机保修时间有多长？”。回答：“本产品全国联保，享受三包服务，质保期为：1年质保。如因质量问题或故障，凭厂商维修中心或特约维修点的质量检测证明，享受7日内退货，15日内换货，15日以上在质保期内享受免费保修等三包服务！”

b类别：“数码产品”。问题：“请问MacBook Pro笔记本电脑是否支持加装内存？”。回答：“MacBook Pro笔记本电脑不支持自行加装内存升级。”

c类别：“衣服鞋帽”。问题：“衣服尺码不合适怎么办？”。回答：“若商品尺码不合适，在收到商品之日起7天内，不影响二次销售的情况下，我们将提供无理由退换货服务。”

d类别：“零食生鲜”。问题：“收到的鸡蛋有破损怎么办？”。回答：“生鲜商品的破损或腐坏等问题，请在商品签收后48小时内提交赔付申请，100分钟内审核通过后即享补偿，无需返回商品；非鲜活易腐类商品需上门取件。”

此处仅以问答数据库中的四个数据为例。根据步骤S102中确定的用户问题类别“数码产品”，选择“数码产品”类别的问答数据库。

进一步地，计算所述用户输入的自然语言问题“iPhone手机有多长时间的保修期？”与“数码产品”类别中的问题“请问iPhone手机保修时间有多长？”和“请问MacBook Pro笔记本电脑是否支持加装内存？”的相似度，相似度值分别(0.92,0.37)。

步骤S104，判断所述最大相似度是否大于预设阈值；

具体地，假设所述系统预设的阈值为0.9，由于0.92>0.9，则相似度0.92对应的问题“请问iPhone手机保修时间有多长？”与所述用户输入的自然语言问题文本“iPhone手机有多长时间的保修期？”意义相同。

此时将执行步骤S105,在所述最大相似度大于所述预设阈值时，将所述最大相似度对应的目标预存问题文本相应的回答作为提供给所述用户的回答文本；

具体地，将“数码产品”问答数据库中“请问iPhone手机保修时间有多长？”对应的答复“本产品全国联保，享受三包服务，质保期为：1年质保。如因质量问题或故障，凭厂商维修中心或特约维修点的质量检测证明，享受7日内退货，15日内换货，15日以上在质保期内享受免费保修等三包服务！”作为给用户的回答。

假设所述用户输入的自然语言问题文本是“请问MacBook Pro笔记本电脑是否已安装了操作系统？”，在步骤S102中，确定的自然语言问题类别仍然为“数码产品”；在步骤S103中，计算出“请问MacBook Pro笔记本电脑是否已安装了操作系统？”与“数码产品”问答数据库中的问题“请问iPhone手机保修时间有多长？”和“请问MacBook Pro笔记本电脑是否支持加装内存？”相似度为(0.23,0.42)；在步骤S104中，这些相似度值均小于系统预设的阈值0.9，则将执行步骤S106，具体地，在所述最大相似度不大于所述预设阈值时，从全部相似度中选取前n个(优选3个)最大的相似度各自对应的预存问题文本的相应的回答作为给所述用户的回答文本。

具体地，将“数码产品”分类下的问答数据库中问题相似度最大的三个值对应的回答作为参考返回，并提供人工客服选项，保证用户咨询答复的完整性。

在步骤S102中，使用文本分类算法模型之前，还需要对文本分类算法模型进行训练。

请参见图2，图2是本发明中，文本分类算法训练流程，具体步骤如下:

步骤S201，确定预设场景下的具有多个问题类别的问答数据库；具体地，使用电商场景下的多个类别问答数据库。

步骤S202，将所述问答数据库中的问题文本和对应的类别作为文本分类算法的训练样本数据集，如上述步骤S103中所示的目标问答数据库中示例内容。

步骤S203，使用所述训练样本数据进行模型训练，获得用于将问题文本进行分类的文本分类算法模型。所述深度学习文本分类算法模型如图3所示。图3是本实施例中，文本分类算法的结构图，所述文本分类算法模型的结构包括：

数据输入单元301：用于使用各个类别数据库中的自然语言问题文本和对应的类别，其中，所述自然语言问题文本为输入的数据，对应的问题类别为标签；。在步骤S103的示例数据中，数据输入单元301的内容包括：

(“请问iPhone手机保修时间有多长？”，“数码产品”)

(“请问MacBook Pro笔记本电脑是否支持加装内存？”，“数码产品”)

(“衣服尺码不合适怎么办？”，“衣服鞋帽”)

(“收到的鸡蛋有破损怎么办？”，“零食生鲜”)

第一文本特征提取器302：将所述数据输入单元301的自然语言问题文本，使用双向Transformer编码器Bert进行特征提取，得到特征向量；

文本类别分类器303：用于将所述文本特征提取器302得到的特征向量，使用神经网络分类器进行分类，输出各类别的概率值。此处的神经网络算法可使用全连接神经网络、卷积神经网络或者循环神经网络；

类别输出单元304：用于计算所述文本类别分类器303输出的各类别概率值，将所述各类别概率值中的最大值对应的类别作为所述自然语言问题文本的分类类别。

请参见图4，图4是本发明中，文本相似度计算的流程，具体步骤如下：

步骤S401，根据文本分类的结果选择相应的问答数据库，即根据步骤S102计算得出的文本分类类别，选择相应的问答数据库。在上述例子中，对于用户输入的自然语言问题文本“iPhone手机有多长时间的保修期？”，计算得出分类为“数码产品”，则选择“数码产品”类别的问答数据库。

步骤S402，调用文本相似度模型提取所述自然语言问题文本和所述目标问答数据库中的预存问题文本的特征向量；具体地，图5是本发明中，文本相似度模型算法的结构示意图。所述问答数据库中的自然语言问题文本对应图5中的自然语言问题文本501，使用第二文本特征提取器502，嵌入到高维向量空间中，得到高维特征向量503。每个自然语言问题文本就是这个高维向量空间中的一个独立的向量。

请参见图6，图6是本发明中，文本相似度模型的结构示意图。具体来说，对于步骤S101中用户输入的自然语言问题文本，对应到自然语言问题文本601，使用双向Transformer编码器Bert603对所述自然语言问题文本“iPhone手机有多长时间的保修期？”编码，得到相应的高维特征向量604。

同时将各分类问答数据库中的预存问题文本602也使用同样的方式进行编码，得到问答数据库自然语言问题文本对应的高维向量605。

进一步地，计算所自然语言问题文本对应的高维向量604与问答数据库自然语言问题文本对应的高维向量605的余弦距离606，即相似度值。

通过实施本申请实施例，与传统的人工客服相比，智能客服系统具有成本低、效率高的优势。

请参见图7，图7是本发明中，智能客服聊天机器人系统，该系统可运行在某种计算机中，如智能手机、笔记本电脑、服务器等，包括：

所述系统用于执行上述方法实施例的步骤，所述系统包括：

自然语言问题文本获取单元701，用于获取用户输入的自然语言问题文本；

文本分类算法模型单元702，用于调用文本分类算法模型来确定所述自然语言问题文本对应的问题类别；

文本相似度模型单元703，用于获取与所述问题类别对应的目标问答数据库；分别计算所述自然语言问题文本与所述目标问答数据库中的各个预存问题文本的相似度；从全部相似度中确定最大相似度；在所述最大相似度大于预设阈值时，将所述最大相似度对应的目标预存问题文本相应的回答作为提供给所述用户的回答文本；在所述最大相似度不大于预设阈值时，从全部相似度中选取前n个最大的相似度各自对应的预存问题文本的相应的回答作为给所述用户的回答文本。

进一步，本发明不局限于上述实施方式，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种基于深度学习的智能客服聊天机器人实现方法，其特征在于，所述方法包括：

客服聊天机器人获取用户输入的自然语言问题文本；

获取与所述问题类别对应的目标问答数据库；

从全部相似度中确定最大相似度；

判断所述最大相似度是否大于预设阈值；

或

2.如权利要求1所述的方法，其特征在于，所述调用文本分类算法模型来确定所述自然语言问题文本对应的问题类别的步骤之前，所述方法还包括：

确定预设场景下的具有多个问题类别的问答数据库；

3.如权利要求2所述的方法，其特征在于，所述文本分类算法模型具体包括数据输入单元、文本特征提取器、文本类别分类器以及类别输出单元：

4.如权利要求1所述的方法，其特征在于，所述分别计算所述自然语言问题文本与所述目标问答数据库中的各个预存问题文本的相似度的步骤，具体包括：

将所述自然语言问题文本和所述问答数据库中的预存问题文本输入到所述第二文本特征提取器，嵌入到高维向量空间中，分别计算得到所述自然语言问题文本对应的高维向量和所述问答数据库中的预存问题文本对应的高维向量；

5.一种基于深度学习的智能客服聊天机器人系统，其特征在于，所述系统包括：

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有可执行程序，所述可执行程序用于执行如权利要求1-4任一项所述的基于深度学习的智能客服聊天机器人实现方法的步骤。