CN111666385A

CN111666385A - 一种基于深度学习的客服问答系统及实现方法

Info

Publication number: CN111666385A
Application number: CN201910170588.8A
Authority: CN
Inventors: 邵曦; 陈明
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2019-03-07
Filing date: 2019-03-07
Publication date: 2020-09-15

Abstract

本发明公开了一种基于深度学习的客服问答系统及实现方法，包括用于采集客服对话数据，构建基于Python爬虫的数据获取模块；用于进行中间语义分析的数据处理模块；用于通过问答模型生成回答并返回给客户的系统实现模块，本发明把深度学习技术应用到客服问答系统中，可以有效地实现自动生成问答的功能，使得客户在与客服对话过程中感到真实感，以及强于人工客服的高效率。采用Seq2Seq(Encoder‑Decoder)框架和Attention机制训练出来的问答系统，能够更加准确地理解用户的语义，不仅包含了过去对话的上下文信息，而且将历史对话信息融入到当前对话中，从而能够做到精准回答客户的问题。同时，使用Bi‑RNN训练单元，可以对未来对话信息进行预测，进一步提高了客户对系统的满意度。

Description

一种基于深度学习的客服问答系统及实现方法

技术领域

本发明属于互联网在线问答领域，具体涉及一种基于深度学习的客服问答系统及实现方法。

背景技术：

随着互联网经济的不断发展，提供在线商品和服务选购的电商平台的规模和成交量也在日益增大，这种改变的潮流对在线客服的服务质量和服务效率提出了更高的要求。因此，如何通过计算机技术来辅助人工客服提升器工作效率和工作质量是个值得研究的问题。

传统的问答系统，大都是采用基于规则和基于统计机器翻译系统的，该技术具有回答问题快速的优点，但是也存在对于复杂的语句环境问答准确率低、回答语句生硬、不具备自动生成回答等缺陷。对于这种技术，在进行模型训练的时候就需要有充足的训练样本，否则模型效果会很差。然而在实际应用中，不可能所有场合都训练过，从而该方法实际效果不理想。

发明内容

本发明的目的在于提供一种基于深度学习的客服问答系统及实现方法，以解决现有技术中导致的上述多项缺陷。

一种基于深度学习的客服问答系统，包括：

数据获取模块：用于收集客服与用户的问答对话并形成基础语料库，构建好一对一的问答连接；

数据处理模块：所述数据处理模块与所述数据获取模块连接，用于对基础语料库进行预处理，为系统模型的训练做准备；

问答系统模块：所述系统实现模块与所述数据处理模块连接，用于通过训练好的系统模型自动生成回答并输出给用户。

一种基于深度学习的客服问答系统的实现方法，所述方法包括如下步骤：

接收输入的问句，对问句进行数据处理；

通过训练好的问答系统模型将处理后的问句进行编码生成中间语义向量；

问答系统模型根据中间语义向量生成回答返回给用户。

优选的，所述数据处理的方法包括如下步骤：

对问句进行分词操作；

将分词后的问句去除停用词操作；

给分词后的问句分配id号。

优选的，所述中间语义向量的编码方法包括如下步骤：

将分词后的字、词或句映射成向量的形式。

优选的，问答系统模型根据中间语义向量的余弦相似度生成回答返回给用户。

优选的，所述问答系统模型的训练方法包括如下步骤：

获取客服与用户的对话记录，并将对话内容转换成文本形式，以此构建问答文档；

对问答文档进行分词、去除停用词和分配id号操作，从而得到数据集；

将数据集作为深度学习网络模型的输入，通过多次对深度学习网络模型的训练，不断减小真实值与预测值的熵值，从而达到收敛，形成问答系统模型。

优选的，所述对话记录通过Python的爬虫技术获取。

优选的，所述问答文档包括问题文档和回答文档，并且问句与答句一一对应。

优选的，所述深度学习网络模型为Encoder-Decoder框架，采用Bi-RNN作为框架的输入和输出单元。

优选的，所述深度学习网络模型采用id号与word一一对应的方式，通过id号得到对应的词句。

本发明的优点在于：

1、本发明把深度学习技术应用到客服问答系统中，可以有效地实现自动生成问答的功能，使得客户在与客服对话过程中感到真实感，以及强于人工客服的高效率，因此，本发明的客服问答系统具有更好的实用性与先进性；

2、本发明采用的系统模型和训练单元，结构简单，训练样本容易构造，训练效率高，解决了训练效率低下与高时效性需求间的矛盾。采用Seq2Seq框架和Attention机制训练出来的问答系统，能够更加准确地理解客户问题的语义，不仅包含了对话的上下文信息，而且将历史对话信息融入到当前对话中，从而能够做到精准回答客户的问题。同时，使用Bi-RNN训练单元，能够更好地对对话做出语义的预测，进一步提高了客户对系统的体验性。

附图说明

图1为本发明客服问答系统结构框图。

图2为本发明问答系统模型训练过程流程图。

具体实施方式

本发明揭示了一种基于深度学习的客服问答系统及实现方法，结合图1-图2所示，所述问答系统包括用于采集客服对话数据，构建基于Python爬虫的数据获取模块；用于进行中间语义分析的数据处理模块；用于通过问答模型生成回答并返回给客户的系统实现模块。所述数据处理模块用于对基础语料库进行分词等处理，为问答模型的训练做准备。所述系统实现模块用于通过训练好的系统模型返回给客户精准回答。

以上所述的一种基于深度学习的客服问答系统及实现方法，包括如下步骤：

S1、数据获取模块用于采集客服对话数据，通过Python爬虫技术获取电商平台的客服问答对话数据，进行人工筛选操作；选择一问一答的有意义对话，将其整理成两个单独的文档，其中一个全是问句，另一个是该问题的回答，且保持一一对应的关系。本发明的对话语料库来源于淘宝及京东的客服对话数据。

S2、利用jieba分词器分别对整理好的两个问答文档进行分词操作，即将一句完整的语句切分成一个个中文单词的形式；建立停用词表，将分好词的问答文档进行去除停用词操作。本发明建立的停用词包括：你、您、的、吗、呢等常用词语。

S3、为分好的每个词分配一个id号，定义word到id的映射规则，在进行问答模型训练时，通过调用word_token模块，由id号获得对应的词句；构造训练数据：将数据整理成网络训练单元模型要求的格式，要求输入数据格式为tuple；设置神经网络的初始学习率、选择合适的优化器、模型的迭代次数以及模型持久化，通过一系列的样本训练，训练深度学习模型，不断减小真实值与预测值之间的熵值，从而达到收敛，最终形成问答模型。本发明中优选采用的Encoder-Decoder网络模型的训练单元为Bi-RNN，从而可以充分利用对话的上下文信息进行预测并能够很好地解决RNN网络在面对长对话时的梯度爆炸问题；设置模型的初始学习率为0.9，采用GradientDescent梯度下降优化算法；设置模型的迭代次数为50000次，每隔10次打印一下模型的步数、损失值和学习率。

S4、测试终端问句经过S3问答模型，同样经过分词、去除标点符号、去除停用词等处理，输入语句经过Encoder编码成中间语义向量，中间语义向量就是将词映射成向量来表示，比如：‘我’对应成(0.1,0.3,5)这样的形式，此时每一个时刻输出词的概率都与前一个时刻的输出有关系，这也就是Decoder过程，并将生成的最佳回答返回给客户。

由技术常识可知，本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此，上述公开的实施方案，就各方面而言，都只是举例说明，并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。

Claims

1.一种基于深度学习的客服问答系统，其特征在于，包括：

2.根据权利要求1所述的一种基于深度学习的客服问答系统的实现方法，其特征在于：所述方法包括如下步骤：

接收输入的问句，对问句进行数据处理；

问答系统模型根据中间语义向量生成回答返回给用户。

3.根据权利要求2所述的一种基于深度学习的客服问答实现方法，其特征在于：所述数据处理的方法包括如下步骤：

对问句进行分词操作；

将分词后的问句去除停用词操作；

给分词后的问句分配id号。

4.根据权利要求2所述的一种基于深度学习的客服问答实现方法，其特征在于：所述中间语义向量的编码方法包括如下步骤：

将分词后的字、词或句映射成向量的形式。

5.根据权利要求2所述的一种基于深度学习的客服问答实现方法，其特征在于：

问答系统模型根据中间语义向量的余弦相似度来生成回答并返回给用户。

6.根据权利要求2所述的一种基于深度学习的客服问答实现方法，其特征在于：所述问答系统模型的训练方法包括如下步骤：

将数据集作为深度学习网络模型的输入，对深度学习网络模型进行多次训练，不断减小真实值与预测值的熵值，从而达到收敛，形成问答系统模型。

7.根据权利要求6所述的一种基于深度学习的客服问答实现方法，其特征在于：所述对话记录通过Python的爬虫技术获取。

8.根据权利要求6所述的一种基于深度学习的客服问答实现方法，其特征在于：所述问答文档包括问题文档和回答文档，并且问句与答句一一对应。

9.根据权利要求6所述的一种基于深度学习的客服问答实现方法，其特征在于：所述深度学习网络模型为Encoder-Decoder框架，采用Bi-RNN作为框架的输入和输出单元。

10.根据权利要求9所述的一种基于深度学习的客服问答实现方法，其特征在于：所述深度学习网络模型采用id号与word一一对应的方式，通过id号得到对应的词句。