CN112818105A

CN112818105A - 一种融合上下文信息的多轮对话方法及系统

Info

Publication number: CN112818105A
Application number: CN202110163418.4A
Authority: CN
Inventors: 潘昌琴; 林涵阳; 杨涛; 卓丽栋; 张路; 卢进桦; 陈羽中
Original assignee: Jiangsu Start Dima Data Processing Co ltd
Current assignee: Jiangsu Start Dima Data Processing Co ltd
Priority date: 2021-02-05
Filing date: 2021-02-05
Publication date: 2021-05-18
Anticipated expiration: 2041-02-05
Also published as: CN112818105B

Abstract

本发明涉及一种融合上下文信息的多轮对话方法及系统，该方法包括以下步骤：步骤A：从智能客服系统中获取用户与客服的相关对话数据，提取用户与客服之间的会话，构建多轮对话训练集；步骤B：构建用于多轮对话的融合上下文信息的深度学习网络模型及其损失函数，以多轮对话训练集中的对话与回答作为输入，在训练集上通过最小化损失函数训练深度学习网络模型；步骤C：将用户的对话输入训练好的深度学习网络模型中，输出最匹配的回答。该方法及系统有利于在与用户对话中给出更匹配的回答。

Description

一种融合上下文信息的多轮对话方法及系统

技术领域

本发明属于自然语言处理领域，具体涉及一种融合上下文信息的多轮对话方法及系统。

背景技术

随着自然语言处理技术的发展，人机对话取得了重大的进展，对话系统也逐渐走进人们的生活当中。对话系统在生活中有着广泛的应用比如：教育辅导、问答系统、在线客服、个人秘书等。其优势在于24小时在线、准确及时回复等，既可以将人从繁重的工作中解放出来，又可以提高用户的体验度。对话系统具有巨大的商用价值，目前很多互联网公司都推出了自己的产品。

Hu等人将视觉和话语中适应卷积策略相结合，不仅优化了序列的层次结构还捕获了不同级别的丰富匹配模式。Wang等人提出了一种被称为深度匹配树的模型。深度匹配树利用深度神经网络挖掘句法信息的模式，从而更高效、直观地计算两个短句之间的相似度。Zhou等人提出的模型集成了来自两个不同视图的信息，分别是单词序列视图和话语序列视图。通过深度神经网络共同对这两种视图进行建模，从而更加有效的捕捉句子之间的依赖关系。Deng等人将匹配网络中常用的递归神经网络替换为门控卷积神经网络，以构建更具表达力的句子语义表示。之后利用增强的顺序推理模型来捕获对话上下文和回答中每个话语之间的交互信息。Gu等人使用了多层LSTM，从而层次化的对句子进行编码，通过注意力机制将不同层次的编码进行聚合从而生成更加具有描述性的语义信息。Yan等人首先使用双向长短期记忆网络进行编码，再使用CNN提取连续词之间的局部邻接特征，从而生成话语的复合表示。Zhou等人受到了Transformer机制的启发，于是Zhou等人将注意力机制扩展为两个点。它们分别是自注意力机制和交互注意力机制，自注意力机制使句子自身进行交互，从而可以捕获其内部单词级别的依存关系，交互注意力机制通过使对话上下文和回答相互融合，从而捕获潜在匹配段之间的依赖关系。通过这两种注意力机制，增强了句子自身的表示并丰富了提取到的语义信息。

发明内容

本发明的目的在于提供一种融合上下文信息的多轮对话方法及系统，该方法及系统有利于在与用户对话中给出更匹配的回答。

为实现上述目的，本发明采用的技术方案是：一种融合上下文信息的多轮对话方法，其特征在于，包括以下步骤：

步骤A：从智能客服系统中获取用户与客服的相关对话数据，提取用户与客服之间的会话，，构建多轮对话训练集；

步骤B：构建用于多轮对话的融合上下文信息的深度学习网络模型及其损失函数，以多轮对话训练集中的对话与回答作为输入，在训练集上通过最小化损失函数训练深度学习网络模型；

步骤C：将用户的对话输入训练好的深度学习网络模型中，输出最匹配的回答。

进一步地，所述多轮对话训练集中的每条样本由一个三元组(u,a,y)构成，其中u＝{u₁,u₂,...,u_t,...,u_n}表示用户与客服之间的对话上下文，u_t表示对话中的第t条语句，n表示对话的语句数，a表示候选的回答，y表示标签，y∈{0,1}，y＝1表示回答a是正确的回答，y＝0表示回答a是错误的回答；在智能客服系统中，若用户与客服间的会话标记为已解决，表示用户与客服间的对话解决了用户提出的问题，故利用标记为已解决的会话构造多轮对话训练集的正样本：首先排除用户与客服对话过程中的寒暄语句，之后将客服最后的回答作为三元组(u,a,y)的a，客服最后的回答之前的用户与客服的对话语句构成u，标签y设置为1，构成多轮对话训练集中的正样本；除客服最后的回答以外，在用户与客服的对话语句中随机选择客服回复的一条语句作为a，标签设置为0，则构成多轮对话训练集的负样本。

进一步地，所述步骤B具体包括以下步骤：

步骤B1：构建融合上下文信息的深度学习网络模型，所述深度学习网络模型包括输入编码层、注意力层、上下文建模层以及输出层；所述输入编码层分别对对话与回答进行字符级和词语级编码，并分别融合对话与回答的词语级表征和字符级表征，生成对话与回答的多粒度语义表征；所述注意力层包括多头注意力子层、交互子层和自注意力子层，用于提取对话与回答中与对话与回答语义匹配相关的上下文信息，减少噪声的影响，得到语义增强后的对话与答案的语义表征向量；所述上下文建模层用于捕获对话和回答之间的长期依赖关系；最后将融合后的语义表征向量输入到所述输出层中，使用softmax输出回答与对话相匹配的概率；

步骤B2：构建所述深度学习网络模型的损失函数，选择交叉熵作为深度学习网络模型的损失函数，计算公式如下：

其中，p_i表示第i个样本中包含的回答为对话的正确答案的概率，y_i为标签，y_i∈{0,1}，y_i＝1表示第i个样本中包含的回答为对话的正确答案，y_i＝0表示第i个样本中包含的回答不是对话的正确答案；

是L₂正则化项，λ是学习率，θ包含所有参数；

步骤B3：遍历多轮对话训练集，对训练集中的每个训练样本，按步骤B4-B7进行处理；

步骤B4：将训练样本中的对话输入到输入编码层，进行词语级和字符级编码，融合得到对话的多粒度表征向量，将训练样本中的回答输入到输入编码层，进行词语级和字符级编码，得到回答的多粒度表征向量；

步骤B5：将对话的多粒度表征向量与回答的多粒度表征向量输入到注意力层，计算得到融合对话与回答语义信息的表征向量序列

步骤B6：将步骤B5得到的表征向量序列

输入到上下文建模层中进行上下文建模，提取对话与回答语句之间的依赖关系，得到上下文感知的融合对话与回答语义信息的表征向量

步骤B7：将步骤B6得到的表征向量

输入到输出层中，使用softmax进行归一化操作，得到回答与对话相匹配的概率；

步骤B8：根据步骤B2的损失函数计算损失并进行反向传播，通过多次迭代最小化损失函数，采用mini-batch梯度下降法进行分批优化，得到训练好的融合上下文信息的深度学习网络模型。

进一步地，所述步骤B4具体包括以下步骤：

步骤B41：对样本进行预处理，然后查询预训练的词向量矩阵，分别得到该样本的对话与回答的词语级表征向量；

对对话中的每条语句进行分词并去除停用词，设定为固定长度l，若该语句进行分词并去除停用词后剩余的词数小于l，则填充零向量，若大于l，则截断到固定长度l；然后查询预训练的词向量矩阵得到每条语句中每个词的词向量，由对话中各个词的词向量构成对应语句的词语级表征向量，同样，对回答a进行分词并去除停用词，设定为固定长度l，若回答进行分词并去除停用词后剩余的词数小于l，则填充零向量，若大于l，则截断到固定长度l；然后查询预训练的词向量矩阵得到回答中每个词的词向量，由回答中各个词的词向量构成回答的词语级表征向量；

步骤B42：查询预训练的字符向量矩阵，分别得到该样本的对话与回答的字符级表征向量；

其中，对于对话中的每条语句u_t,t＝1,2,...,n，对于u_t中的每个词，查询预训练的字符向量矩阵，获得构成该词的每个字符的字符向量，由每个字符的字符向量构成该词的字符向量矩阵，将该词的字符向量矩阵输入到卷积神经网络中，使用多个卷积核进行字符级特征提取，再进行最大池化操作，得到每个词的字符级表征向量，由u_t中各个词的字符级表征向量序列构成u_t的字符级表征向量；对于回答a中的每个词，查询预训练的字符向量矩阵，获得构成该词的每个字符的字符向量，由每个字符的字符向量构成该词的字符向量矩阵，将该词的字符向量矩阵输入到卷积神经网络中，使用多个卷积核进行字符级特征提取，再进行最大池化操作，得到每个词的字符级表征向量，由回答a中各个词的字符级表征向量序列构成回答的字符级表征向量；

步骤B43：对于对话中的每条语句，分别连接语句中每个词的字符级表征向量与词语级表征向量，得到对话中每条语句的多粒度表征向量

对于回答，分别连接回答中每个词的字符级表征向量与词语级表征向量，得到回答的多粒度表征向量

d表示每个词的多粒度表征向量的维度。

进一步地，所述步骤B5具体包括以下步骤：

步骤B51：将对话中的每条语句的多粒度表征向量输入到多头注意力子层中，提取每条语句的关键信息，得到对话中每条语句的表征向量；将回答的多粒度表征向量输入到多头注意力子层中，提取回答中的关键信息，得到回答的表征向量；

选择能够整除d的整数s，对于对话中的每条语句u_t,t＝1,2,...,n，将u_t分成多个子句，即将u_t的表征向量

平均切分成s个子向量，得到子向量序列

其中

是

的第h个子向量，然后对每个子句单独进行注意力权重的计算，即将

与自身构成一个子向量对

对每个子向量对单独利用注意力机制进行计算，提取每个子句的关键信息，汇总后得到u_t的表征向量，公式如下：

其中MHA表示多头注意力机制，

为多头注意力的输出，W₁为多头注意力机制的训练参数，[；]表示向量连接操作；

连接对话中每条语句的表征向量，得到对话的表征向量

其中[；]表示向量连接操作，L_u＝n×l，为对话中的每条语句的词语数之和，因此，

也可定义为

表示

中对应第i个词的表征向量；

按照同样方式，将回答分成多个子句，即将回答a的表征向量

平均切分成s个子向量，得到子向量序列

其中

回答的表征向量的第h个子向量；对回答的每个子句单独进行注意力权重的计算，即将

与自身构成一个子向量对

对每个子向量对单独利用注意力机制进行计算，提取每个子句的关键信息，汇总后得到a的表征向量

公式如下：

其中MHA表示多头注意力机制，

为多头注意力的输出，W₂为多头注意力机制的训练参数，[；]表示向量连接操作；l为回答的词语数，因此，

也可以定义为

表示

中对应第j个词的表征向量；

步骤B52：将对话的表征向量

与回答的表征向量

输入到交互子层，计算对话与回答的语义交互，得到对话的回答语义信息指导下的表征向量

和回答的对话语义信息指导下的表征向量

步骤B53：将对话的回答语义信息指导下的表征向量

与回答的对话语义信息指导下的表征向量

输入到自注意力子层，输出融合对话与回答语义信息的表征向量。

进一步地，所述步骤B52具体包括以下步骤：

步骤B521：将整个对话的语义表征和回答的语义表征进行交互，获取对话的表征向量

与回答的表征向量

计算公式如下：

其中e_ij表示对话和回答之间的相似度矩阵，

为对话中第i个词考虑回答语义信息交互后的表征向量，

为回答中第j个词考虑对话语义信息交互后的表征向量，

步骤B522：计算表征向量

与

的差

与

的哈达玛积

连接

四个包含对话与回答之间语义匹配信息的表征向量，得到对话的表征向量

计算表征向量

与

的差

与

的哈达玛积

连接

四个回答与对话之间语义匹配信息的表征向量，得到回答的表征向量

其中

[；]表示向量连接操作；

步骤B523：对步骤B522得到的对话的表征向量

在第一个维度上进行切分，切分为n个维度为l×4d的向量矩阵，分别对应对话中每条语句的表征向量

进一步地，所述步骤B53具体包括以下步骤：

步骤B531：将对话中每条语句的表征向量

输入到自注意力机制模块中，首先将

在第一个维度上划分为

对应u_t中第i个词的表征向量，然后通过tanh激活函数得到

的隐层表示，然后动态计算语句中不同词的注意力权重分布，通过softmax函数归一化注意力权重，通过注意力权重加权，得到对话中每条语句的的表征向量

同样将回答的表征向量

输入到自注意力机制模块中，在第一个维度上划分

对应回答a中第i个词的表征向量，然后通过tanh激活函数得到

的隐层表示，然后动态计算语句中不同词的注意力权重分布，通过softmax函数归一化注意力权重，通过注意力权重加权，得到回答的表征向量

其公式如下：

其中，W₃,b₃,W₄,W₅,b₅,W₆均为待训练的参数；

步骤B532：拼接对话中的每条语句的表征向量

与

得到融合对话与回答语义信息的表征向量序列

本发明还提供了一种融合上下文信息的多轮对话系统，包括存储器、处理器以及存储于存储器上并能够在处理器上运行的程序模块，所述程序模块包括：

训练集构建模块，用于采集用户与客服之间的对话与回答数据，构建对话训练集；

模型训练模块，用于使用对话训练集，训练融合上下文信息的深度学习网络模型；以及

多轮对话模块，用于与用户进行对话，将用户的对话输入训练好的深度学习网络模型中，输出最匹配的回答；

当处理器运行所述程序模块时，实现所述的方法步骤。

相较于现有技术，本发明具有以下有益效果：该方法及系统通过对多轮对话的上下文进行语义建模，能够有效提高对用户提问意图的语义理解程度，从而在与用户的多轮对话中给出更加匹配的回答。因此，本发明具有很强的实用性和广阔的应用前景。

附图说明

图1是本发明实施例的方法实现流程图。

图2是本发明实施例的系统程序模块结构图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示，本实施例提供了一种融合上下文信息的多轮对话方法，包括以下步骤：

步骤A：从智能客服系统中获取用户与客服的相关对话数据，提取用户与客服之间的会话，构建多轮对话训练集。

所述多轮对话训练集中的每条样本由一个三元组(u,a,y)构成，其中u＝{u₁,u₂,...,u_t,...,u_n}表示用户与客服之间的对话上下文，u_t表示对话中的第t条语句，n表示对话的语句数，a表示候选的回答，y表示标签，y∈{0,1}，y＝1表示回答a是正确的回答，y＝0表示回答a是错误的回答；在智能客服系统中，若用户与客服间的会话标记为已解决，表示用户与客服间的对话解决了用户提出的问题，故利用标记为已解决的会话构造多轮对话训练集的正样本：首先排除用户与客服对话过程中的寒暄语句，之后将客服最后的回答作为三元组(u,a,y)的a，客服最后的回答之前的用户与客服的对话语句构成u，标签y设置为1，构成多轮对话训练集中的正样本；除客服最后的回答以外，在用户与客服的对话语句中随机选择客服回复的一条语句作为a，标签设置为0，则构成多轮对话训练集的负样本。

步骤B：构建用于多轮对话的融合上下文信息的深度学习网络模型及其损失函数，以多轮对话训练集中的对话与回答作为输入，在训练集上通过最小化损失函数训练深度学习网络模型。

所述步骤B具体包括以下步骤：

步骤B1：构建融合上下文信息的深度学习网络模型，所述深度学习网络模型包括输入编码层、注意力层、上下文建模层以及输出层；所述输入编码层分别对对话与回答进行字符级和词语级编码，并分别融合对话与回答的词语级表征和字符级表征，生成对话与回答的多粒度语义表征；所述注意力层包括多头注意力子层、交互子层和自注意力子层，用于提取对话与回答中与对话与回答语义匹配相关的上下文信息，减少噪声的影响，得到语义增强后的对话与答案的语义表征向量；所述上下文建模层用于捕获对话和回答之间的长期依赖关系；最后将融合后的语义表征向量输入到所述输出层中，使用softmax输出回答与对话相匹配的概率。

在本实施例中，所述上下文建模层可以采用旋转记忆单元(ROTATION UNIT OFMEMORY，公开于论文“ANovel Representation Unit for RNNs with ScalableApplications”)来捕获对话和回答之间的长期依赖关系，所述旋转记忆单元通过在欧几里德空间中旋转的方式来操纵隐藏状态，以更有效地提取对话与回答的语义表征向量。

是L₂正则化项，λ是学习率，θ包含所有参数。

步骤B3：遍历多轮对话训练集，对训练集中的每个训练样本，按步骤B4-B7进行处理。

步骤B4：将训练样本中的对话输入到输入编码层，进行词语级和字符级编码，融合得到对话的多粒度表征向量，将训练样本中的回答输入到输入编码层，进行词语级和字符级编码，得到回答的多粒度表征向量。所述步骤B4具体包括以下步骤：

步骤B42：查询预训练的字符向量矩阵，分别得到该样本的对话与回答的字符级表征向量。

其中，对于对话中的每条语句u_t,t＝1,2,...,n，对于u_t中的每个词，查询预训练的字符向量矩阵，获得构成该词的每个字符的字符向量，由每个字符的字符向量构成该词的字符向量矩阵，将该词的字符向量矩阵输入到卷积神经网络中，使用多个卷积核进行字符级特征提取，再进行最大池化操作，得到每个词的字符级表征向量，由u_t中各个词的字符级表征向量序列构成u_t的字符级表征向量；对于回答a中的每个词，查询预训练的字符向量矩阵，获得构成该词的每个字符的字符向量，由每个字符的字符向量构成该词的字符向量矩阵，将该词的字符向量矩阵输入到卷积神经网络中，使用多个卷积核进行字符级特征提取，再进行最大池化操作，得到每个词的字符级表征向量，由回答a中各个词的字符级表征向量序列构成回答的字符级表征向量。

d表示每个词的多粒度表征向量的维度。

所述步骤B5具体包括以下步骤：

步骤B51：将对话中的每条语句的多粒度表征向量输入到多头注意力子层中，提取每条语句的关键信息，得到对话中每条语句的表征向量；将回答的多粒度表征向量输入到多头注意力子层中，提取回答中的关键信息，得到回答的表征向量。

平均切分成s个子向量，得到子向量序列

其中

是

与自身构成一个子向量对

其中MHA表示多头注意力机制，

为多头注意力的输出，W₁为多头注意力机制的训练参数，[；]表示向量连接操作。

连接对话中每条语句的表征向量，得到对话的表征向量

也可定义为

表示

中对应第i个词的表征向量。

按照同样方式，将回答分成多个子句，即将回答a的表征向量

平均切分成s个子向量，得到子向量序列

其中

与自身构成一个子向量对

公式如下：

其中MHA表示多头注意力机制，

也可以定义为

表示

中对应第j个词的表征向量。

步骤B52：将对话的表征向量

与回答的表征向量

和回答的对话语义信息指导下的表征向量

所述步骤B52具体包括以下步骤：

与回答的表征向量

计算公式如下：

其中e_ij表示对话和回答之间的相似度矩阵，

为对话中第i个词考虑回答语义信息交互后的表征向量，

为回答中第j个词考虑对话语义信息交互后的表征向量，

步骤B522：计算表征向量

与

的差

与

的哈达玛积

连接

计算表征向量

与

的差

与

的哈达玛积

连接

其中

[；]表示向量连接操作。

步骤B523：对步骤B522得到的对话的表征向量

步骤B53：将对话的回答语义信息指导下的表征向量

与回答的对话语义信息指导下的表征向量

输入到自注意力子层，输出融合对话与回答语义信息的表征向量。所述步骤B53具体包括以下步骤：

步骤B531：将对话中每条语句的表征向量

输入到自注意力机制模块中，首先将

在第一个维度上划分为

对应u_t中第i个词的表征向量，然后通过tanh激活函数得到

同样将回答的表征向量

输入到自注意力机制模块中，在第一个维度上划分

对应回答a中第i个词的表征向量，然后通过tanh激活函数得到

其公式如下：

其中，W₃,b₃,W₄,W₅,b₅,W₆均为待训练的参数。

步骤B532：拼接对话中的每条语句的表征向量

与

得到融合对话与回答语义信息的表征向量序列

步骤B6：将步骤B5得到的表征向量序列

步骤B7：将步骤B6得到的表征向量

输入到输出层中，使用softmax进行归一化操作，得到回答与对话相匹配的概率。

本实施例还提供了一种融合上下文信息的多轮对话系统，包括存储器、处理器以及存储于存储器上并能够在处理器上运行的程序模块，如图2所示，所述程序模块包括训练集构建模块、模型训练模块和多轮对话模块。

所述训练集构建模块用于采集用户与客服之间的对话与回答数据，构建对话训练集。

所述模型训练模块用于使用对话训练集，训练融合上下文信息的深度学习网络模型。

所述多轮对话模块用于与用户进行对话，将用户的对话输入训练好的深度学习网络模型中，输出最匹配的回答。

当处理器运行所述程序模块时，实现上述的方法步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作其它形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型，仍属于本发明技术方案的保护范围。

以上是本发明的较佳实施例，凡依本发明技术方案所作的改变，所产生的功能作用未超出本发明技术方案的范围时，均属于本发明的保护范围。

Claims

1.一种融合上下文信息的多轮对话方法，其特征在于，包括以下步骤：

步骤A：从智能客服系统中获取用户与客服的相关对话数据，提取用户与客服之间的会话，构建多轮对话训练集；

2.根据权利要求1所述的一种融合上下文信息的多轮对话方法，其特征在于，所述多轮对话训练集中的每条样本由一个三元组(u,a,y)构成，其中u＝{u₁,u₂,...,u_t,...,u_n}表示用户与客服之间的对话上下文，u_t表示对话中的第t条语句，n表示对话的语句数，a表示候选的回答，y表示标签，y∈{0,1}，y＝1表示回答a是正确的回答，y＝0表示回答a是错误的回答；在智能客服系统中，若用户与客服间的会话标记为已解决，表示用户与客服间的对话解决了用户提出的问题，故利用标记为已解决的会话构造多轮对话训练集的正样本：首先排除用户与客服对话过程中的寒暄语句，之后将客服最后的回答作为三元组(u,a,y)的a，客服最后的回答之前的用户与客服的对话语句构成u，标签y设置为1，构成多轮对话训练集中的正样本；除客服最后的回答以外，在用户与客服的对话语句中随机选择客服回复的一条语句作为a，标签设置为0，则构成多轮对话训练集的负样本。

3.根据权利要求2所述的一种融合上下文信息的多轮对话方法，其特征在于，所述步骤B具体包括以下步骤：

步骤B1：构建融合上下文信息的深度学习网络模型，所述深度学习网络模型包括输入编码层、注意力层、上下文建模层以及输出层；所述输入编码层分别对对话与回答进行词语级和字符级编码，并分别融合对话与回答的词语级表征和字符级表征，生成对话与回答的多粒度语义表征；所述注意力层包括多头注意力子层、交互子层和自注意力子层，用于提取对话与回答中与对话与回答语义匹配相关的上下文信息，减少噪声的影响，得到语义增强后的对话与答案的语义表征向量；所述上下文建模层用于捕获对话和回答之间的长期依赖关系；最后将融合后的语义表征向量输入到所述输出层中，使用softmax输出回答与对话相匹配的概率；

是L₂正则化项，λ是学习率，θ包含所有参数；

步骤B6：将步骤B5得到的表征向量序列

步骤B7：将步骤B6得到的表征向量

4.根据权利要求3所述的一种融合上下文信息的多轮对话方法，其特征在于，所述步骤B4具体包括以下步骤：

其中，对于对话中的每条语句u_t,t＝1,2,...,n，对于u_t中的每个词，查询预训练的字符向量矩阵，获得构成该词的每个字符的字符向量，由每个字符的字符向量构成该词的字符向量矩阵，将该词的字符向量矩阵输入到卷积神经网络中，使用多个卷积核进行字符级特征提取，再进行最大池化操作，得到每个词的字符级表征向量，由u_t中各个词的字符级表征向量构成u_t的字符级表征向量；对于回答a中的每个词，查询预训练的字符向量矩阵，获得构成该词的每个字符的字符向量，由每个字符的字符向量构成该词的字符向量矩阵，将该词的字符向量矩阵输入到卷积神经网络中，使用多个卷积核进行字符级特征提取，再进行最大池化操作，得到每个词的字符级表征向量，由回答a中各个词的字符级表征向量构成回答的字符级表征向量；