WO2020133470A1

WO2020133470A1 - 聊天语料的清洗方法、装置、计算机设备和存储介质

Info

Publication number: WO2020133470A1
Application number: PCT/CN2018/125768
Authority: WO
Inventors: 熊友军; 熊为星; 廖洪涛
Original assignee: 深圳市优必选科技有限公司
Priority date: 2018-12-29
Filing date: 2018-12-29
Publication date: 2020-07-02

Abstract

一种聊天语料的清洗方法、装置、计算机设备及存储介质，包括：获取聊天语料，所述聊天语料包括问语料和答语料（S102）；将所述聊天语料进行分词处理，并将分词结果转换成词向量（S104），将所述词向量输入预设的深度检索匹配排序模型，获取与所述聊天语料对应的匹配分值（S106）；根据所述匹配分值对所述聊天语料进行清洗（S108）。通过上述方式，能够自动对聊天语料进行清洗，提高聊天语料的质量，从而提高后续模型训练的准确性。

Description

聊天语料的清洗方法、装置、计算机设备和存储介质

技术领域

本发明涉及计算机技术领域和深度学习技术领域，尤其涉及一种聊天语料的清洗方法、装置、计算机设备和存储介质。

背景技术

智能机器人聊天一直是人工领域的主要研究方向，如何通过深度学习等方法使得智能聊天机器人像人一样自如的进行聊天，例如，在产品售后部门中作为智能客服。在目前的智能聊天机器人的训练过程中，不管是检索式还是生成式，均需要闲聊语料来机器人进行训练。

对智能聊天机器人进行问答训练需要大量的闲聊语料，目前大量的闲聊语料来自于网上的开源材料，但是这些闲聊语料普遍存在质量不高的情况，需要对这些闲聊语料进行清洗。而采用人工筛选的方式需要专业的人员对闲聊语料进行标注，不仅耗费人力、效率低下，还可能因为标注人员的水平和理解的不同导致结果的准确性不足，从而导致最终训练语料的质量不高。

发明内容

基于此，有必要针对上述问题，提出一种对聊天语料清洗效率高的聊天语料的清洗方法、装置、计算机设备和存储介质。

在本发明的第一方面，提供了一种聊天语料的清洗方法，所述方法包括：

获取聊天语料，所述聊天语料包括问语料和答语料；

将所述聊天语料进行分词处理，并将分词结果转换成词向量，

将所述词向量输入预设的深度检索匹配排序模型，获取与所述聊天语料对应的匹配分值；

根据所述匹配分值对所述聊天语料进行清洗。

在本发明的第二方面，还提供了一种聊天语料的清洗装置，包括：

聊天语料获取模块，用于获取聊天语料，所述聊天语料包括问语料和答语料；

聊天语料处理模块，用于将所述聊天语料进行分词处理，并将分词结果转换成词向量，

模型计算模块，用于将所述词向量输入预设的深度检索匹配排序模型，获取与所述聊天语料对应的匹配分值；

语料清洗模块，用于根据所述匹配分值对所述聊天语料进行清洗。

在本发明的第三方面，提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

获取聊天语料，所述聊天语料包括问语料和答语料；

根据所述匹配分值对所述聊天语料进行清洗。

在本发明的第四方面，提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

获取聊天语料，所述聊天语料包括问语料和答语料；

根据所述匹配分值对所述聊天语料进行清洗。

实施本发明实施例，将具有如下有益效果：

本发明提出了一种聊天语料的清洗方法、装置、计算机设备和存储介质，首先获取待清洗的聊天语料，每一条聊天语料包含了对应的问题和回复，问问题、回复对应的语料进行分词处理，并转换成词向量，然后根据训练好的深度检索匹配排序模型计算问句、回复对应的词向量之间的匹配分值，从而来判断当前聊天语料是否是匹配的，是否需要进行清洗。也就是说，对于原始获取的聊天语料，在本实施例中，可以根据深度检索匹配排序模型进行自动的清洗，不再需要人工逐条聊天语料进行标注，省去了大量的人工操作时间，在一定程度上减少了成本花销。并且，采用上述聊天语料的清洗方法，避免了人工操作的认为错误，也在一定程度上提高了聊天语料清洗的准确性。进一步的，在本实施例中，通过深度检索匹配排序模型对问题和答复之间的匹配程度进行判断，提高了聊天语料的匹配性判断的准确性，也即提高了聊天语料清洗的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为一个实施例中聊天语料的清洗方法的实现流程示意图；

图2为一个实施例中聊天语料的清洗方法的实现流程示意图；

图3为一个实施例中DRMR模型训练的实现流程示意图；

图4为一个实施例中问答对语料构建示意图；

图5为一个实施例中DRMR模型示意图；

图6为一个实施例中聊天语料的清洗方法的实现流程示意图；

图7为一个实施例中聊天语料的清洗装置的结构框图；

图8为一个实施例中计算机设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，在一个实施例中，提供了一种聊天语料的清洗方法，本发明实施例所述的聊天语料的清洗方法的执行主体可以是服务器，当然本发明实施例所述的聊天语料的清洗方法的执行主体还可以是其他终端设备，例如，机器人设备。

具体的，如图1所示，上述聊天语料的清洗方法包括如下步骤：

步骤S102：获取聊天语料，所述聊天语料包括问语料和答语料。

聊天语料为从网络或其他途径获取的未经清洗的闲聊语料，其中，每条聊天语料包括一个问句(问语料)和一个答句(答语料)。例如，相应的聊天语料为若干个问答对，如(问题1，回复1)，(问题2，回复2)，……

需要说明的是，在本实施例中，在对聊天语料进行具体的清洗之前，还需要对聊天语料进行预处理，主要是针对原始的聊天语料中可能存在的不规范性，如，去掉反复重复的标点符号(如，一个问句后出现大量的问号，在这种情况下，仅保留其中的一个)，再例如，去掉含有包情包的聊天语料，去掉聊天语料中含有的空格，过滤到敏感信息(如政治敏感词及色情暴力等词)。也就是说，经过针对聊天语料的预处理之后，可以去掉部分质量不高的聊天语料，提高后续聊天语料清洗的效率和准确性。

进一步的，在本实施例中，对聊天语料还需要进一步的改写，例如，去标点、取空格、英文大小写转换、去停用词等，以去掉对语义理解无关的字符，避免对后续聊天语料的清洗过程的准确性的影响。

步骤S104：将所述聊天语料进行分词处理，并将分词结果转换成词向量。

在本实施例中，对聊天语料中的问语料或答语料的分词处理，可以是按字进行切割的，如果是英文字符，可以按照字母进行切割。然后对于已经分词处理完毕的聊天语料，进一步的将每一个字/词转换成对应的词向量(因为分词处理是按字进行切割的，也可以称为词向量)。

具体的，采用正态分布随机初始化为300维的字向量，像分词结果中包含的每一个词/字转换成相应的词向量/字向量。

在本实施例中，因为中文、英文或者长度的问题，可能导致不同的词向量的长度不一致，为了后续向量或矩阵计算的方便，在本实施例中，还需要按照预设的长度阈值对相应的词向量进行长度的改写。即，按照预设的长度阈值，对所有的词向量进行截断或补齐操作。

步骤S106：将所述词向量输入预设的深度检索匹配排序模型，获取与所述聊天语料对应的匹配分值；

步骤S108：根据所述匹配分值对所述聊天语料进行清洗。

深度检索匹配排序(Deep Retrieval Match Ranking，DRMR)模型(下称DRMR模型)为根据深度学习模型构建的对聊天语料之间是否匹配进行评估预测的模型，输入为聊天语料中的问语料对应的词向量、答语料对应的词向量，输出为该问语料与答语料之间的匹配分值。

在本步骤中，获取聊天语料对应的匹配分值之后，即可根据该匹配分值进行清洗。例如，如图2所示，在匹配分值大于或等于预设的匹配阈值的情况下，确定聊天语料需要进行保留，反之，在匹配分值小于预设的匹配阈值的情况下，确定将该聊天语料丢弃。

具体的，在一个具体的实施例中，通过DRMR模型获取聊天语料对应的匹配分值的过程具体如下：

令q ₁为聊天语料中的问语料对应的词向量，q ₂为聊天语料中的答语料对应的词向量，即q ₁＝(x ₁,x ₂,x ₃,...,x _m)，q ₂＝(y ₁,y ₂,y ₃,...,y _n)，其中m为问语料分词之后的长度，n为答语料分词之后的长度，x _i表示为问语料中第i个词对应的词向量，y _i表示为答语料中第i个词对应的词向量。

首先对q ₁、q ₂做叉乘处理：

其中，

表示为对应元素相乘，f表示映射函数(Mapping函数)，在这里Mapping函数为挑选出叉乘之后的前K个值(例如，K＝10或K＝30)。从而获取相应的词向量进行叉乘处理之后获取出关键的前K个值，且输入问题也转换成固定长度的问题或回复。

进一步的，在按照公式1进行处理之后，进一步的还需要采用预设的激活函数进行激活(公式2)，并进行投影(公式3)，以获取最终的匹配分值(公式4)。

z ^(l)＝relu(W ^(l)z ^(l-1)+b ^(l)),l＝1,2,...,L (2)

h＝relu(W _pq ₁+b _p) (3)

其中，relu为relu激活函数，W ^(l)为第l层的权重矩阵，b ^(l)为第l层的偏置矩阵，L是神经网络的总层数，W _p是预置问句训练文本的权重矩阵，b _p是预置问句训练文本的权重矩阵，s是预置问句训练文本经过映射后的输出值。

在本实施例中，可以根据过滤的程度或次数的不同，设定不同的匹配阈值，例如，第一次过滤情况下，可以将匹配阈值设置为0.5，在经过多次清洗之后，可以将匹配阈值逐步提高，将最后一次或最终的清洗过程中的匹配阈值设置为0.9。

进一步的，在本实施例中，还需要对上述DRMR模型进行模型训练、验证，然后再进行具体的聊天语料的清洗。

在一个具体的实施例中，如图3所示，上述聊天语料的清洗方法还包括如下步骤：

步骤S202：获取训练语料，根据所述训练语料构建问答对语料；

步骤S204：将所述问答对语料进行分词处理，并将分词结果转换成词向量；

步骤S206：根据所述问答对语料对预设的深度检索匹配排序模型进行训练，获取训练完成的深度检索匹配排序模型。

训练语料为获取到的闲聊语料之后经过预处理之后的聊天语料，与前述聊天语料可以为同一语料。在本实施例中，在获取到训练语料之后，构建相应的问答对语料，该问答对语料为符合DRMR训练数据的形式。

具体的，通过以下方式构建正负样本对。如问题1-回复1，问题2-回复2，问题3-回复3，以上三条闲聊语料，可构成6个问答对，具体可如图4所示，为：(问题1，回复1，回复2)、(问题1，回复1，回复3)、(问题2，回复2，回复1)、(问题2，回复2，回复3)、(问题3，回复3，回复1)、(问题3，回复3，回复2)等问答对语料，其中(问题1，回复1，回复2)该问答对表示为问题1与回复1的匹配度比问题1与回复2的匹配度高。

进一步的，在本实施例中，在构建训练语料时，根据8:1:1的比例构建训练样本、验证样本、测试样本，从而完成整个DRMR模型的训练。

也就是说，上述问答对语料包括训练问语料、第一答语料和第二答语料；则对应的转换成词向量的方式与前述根据DRMR模型评估聊天语料的匹配分值的方式一致，则相应的词向量包括问语料词向量、第一答语料词向量、第二答语料词向量。

将构建完成的训练语料对应的问答对语料，输入如图5所示的DRMR模型中，并获取与所述问语料词向量、第一答语料词向量对应的第一匹配分值和与问语料词向量、第二答语料词向量匹配的第二匹配分值。然后将第一匹配分值、第二匹配分值与真实结果(第一匹配分值大于第二匹配分值)进行比对，从而完成对于模型的训练。

具体的，具体的DRMR的计算过程如下：

令q ₁为聊天语料中的问语料对应的词向量，q ₂为聊天语料中的第一答语料对应的词向量，q ₃为聊天语料中的第一答语料对应的词向量。

分别针对q ₁、q ₂和q ₁、q ₃计算相应的匹配分值，其计算过程如下：

首先对q ₁、q ₂做叉乘处理：

其中，

进一步的，在按照公式(5)进行处理之后，进一步的还需要采用预设的激活函数进行激活(公式6)，并进行投影(公式7)，以获取最终的匹配分值(公式8)。

z ^(l)＝relu(W ^(l)z ^(l-1)+b ^(l)),l＝1,2,...,L (6)

h＝relu(W _pq ₁+b _p) (7)

其中，relu为relu激活函数，W ^(l)为第l层的权重矩阵，b ^(l)为第l层的偏置矩阵，L是神经网络的总层数，W _p是预置问句训练文本的权重矩阵，b _p是预置问句训练文本的权重矩阵，s是预置问句训练文本经过映射后的输出值。也就是说，经过上述步骤获取s(q ₁,q ₂)。

并且，可以按照相同的方式，计算问语料q ₁与第二答语料q ₃之间的匹配分值s(q ₁,q ₃)。

然后按照预设的损失函数计算损失值L，具体可以使用hinge-loss损失函数：

L(q ₁,q ₂,q ₃；Θ)＝max(0,margin-s(q ₁,q ₂)+s(q ₁,q ₃)) (9)

其中margin为正反间样本相似间距(本实施例中可以将margin设为1)，s(q ₁,q ₂)表示q ₁,q ₂输入到DRMR模型计算的结果值，s(q ₁,q ₃)为将q ₁,q ₃输入到DRMR模型计算的结果值，Θ为当前的给定参数。

根据损失值进行梯度更新，即可完成模型的训练，为了加快模型训练的速度我们选用了Adam算法来完成梯度的更新。最后，保存模型以及其中的参数。

需要说明的是，在第一次模型训练时，其中的参数的具体值可以采用初始值，例如，可以是通过正态分布随机初始化的参数进行计算，并且，在每一轮模型训练完毕之后，对模型中的参数进行更新和迭代，以进行下一步的聊天语料的清洗，即执行前述步骤S102-S108。

在一个具体的实施例中，在通过步骤S202-S206对DRMR模型完成训练之后，即可根据该DRMR模型对聊天语料进行清洗，并且，对于经过第一轮清洗之后的聊天语料，可以进一步的作为DRMR模型的训练语料，并对DRMR模型再进行一轮模型训练，再据此对聊天语料进行再次的清洗。并且，在此循环过程中，不断的减少匹配阈值，例如，第一次清洗过程中，匹配阈值取0.5，并按照匹配阈值为0.5、0.6、0.7、0.8、0.9逐步进行过滤，完成最终的清洗工作，并将最后一轮聊天语料经过DRMR模型输出的匹配分值与0.9进行相比，在匹配分值大于或等于0.9的情况下，保留相应的聊天语料，否则，将相应的聊天语料进行过滤。具体可参考图6所示。

在本实施例中，经过DRMR模型的不断的训练、语料清洗的循环，通过反复操作进行无监督的清洗聊天语料，大量的节省了人工清洗聊天语料的时间，并且能保证聊天语料清洗之后的质量，提高了后续对智能聊天机器人进行训练的准确性。

如图7所示，提供了一种聊天语料的清洗装置，具体包括：

聊天语料获取模块102，用于获取聊天语料，所述聊天语料包括问语料和答语料；

聊天语料处理模块104，用于将所述聊天语料进行分词处理，并将分词结果转换成词向量，

模型计算模块106，用于将所述词向量输入预设的深度检索匹配排序模型，获取与所述聊天语料对应的匹配分值；

语料清洗模块108，用于根据所述匹配分值对所述聊天语料进行清洗。

上述聊天语料的清洗装置，首先获取待清洗的聊天语料，每一条聊天语料包含了对应的问题和回复，问问题、回复对应的语料进行分词处理，并转换成词向量，然后根据训练好的深度检索匹配排序模型计算问句、回复对应的词向量之间的匹配分值，从而来判断当前聊天语料是否是匹配的，是否需要进行清洗。也就是说，对于原始获取的聊天语料，在本实施例中，可以根据深度检索匹配排序模型进行自动的清洗，不再需要人工逐条聊天语料进行标注，省去了大量的人工操作时间，在一定程度上减少了成本花销。并且，采用上述聊天语料的清洗方法，避免了人工操作的认为错误，也在一定程度上提高了聊天语料清洗的准确性。进一步的，在本实施例中，通过深度检索匹配排序模型对问题和答复之间的匹配程度进行判断，提高了聊天语料的匹配性判断的准确性，也即提高了聊天语料清洗的准确度。

在其中一个实施例中，模型计算模块106还用于：对所述问语料对应的第一词向量、所述答语料对应的第二词向量进行叉乘处理，按照预设的映射函数获取叉乘处理结果的预设数量的映射值，根据预设的激活函数、预设的投影函数获取与所述映射值对应的匹配分值。

在其中一个实施例中，如图7所示，上述装置还包括词向量改写模块110，用于按照预设的长度阈值对所述词向量进行长度改写。

在其中一个实施例中，语料清洗模块108还用于判断所述匹配分值是否大于或等于预设的匹配阈值；在所述匹配分值小于所述匹配阈值的情况下，对所述聊天语料进行清洗。

在其中一个实施例中，如图7所示，聊天语料的清洗装置还包括模型训练模块112，用于：

获取训练语料，根据所述训练语料构建问答对语料；

将所述问答对语料进行分词处理，并将分词结果转换成词向量；

根据所述问答对语料对预设的深度检索匹配排序模型进行训练，获取训练完成的深度检索匹配排序模型。

在其中一个实施例中，所述问答对语料包括训练问语料、第一答语料和第二答语料；所述词向量包括问语料词向量、第一答语料词向量、第二答语料词向量；模型训练模块112还用于根据预设的深度检索匹配排序模型对所述转换成词向量的问答对语料进行评估预测，得到与所述问语料词向量、第一答语料词向量对应的第一匹配分值和与问语料词向量、第二答语料词向量匹配的第二匹配分值；按照预设的损失函数以所述第一匹配分值、第二匹配分值为输入，输出对应的损失值；按照预设的迭代算法对所述损失值进行更新迭代。

在其中一个实施例中，模型训练模块112还用于以所述清洗完成的聊天语料作为训练语料，对所述深度检索匹配排序模型进行训练，获取所述训练完成的深度检索匹配排序模型。

图8示出了一个实施例中计算机设备的内部结构图。该计算机设备可以是服务器，也可以是机器人。如图8所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现聊天语料的清洗方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行聊天语料的清洗方法。本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的聊天语料的清洗方法可以实现为一种计算机程序的形式，计算机程序可在如图8所示的计算机设备上运行。计算机设备的存储器中可存储组成聊天语料的清洗装置的各个程序模板。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：

获取聊天语料，所述聊天语料包括问语料和答语料；

将所述聊天语料进行分词处理，并将分词结果转换成词向量；

根据所述匹配分值对所述聊天语料进行清洗。

在一个实施例中，提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

获取聊天语料，所述聊天语料包括问语料和答语料；

根据所述匹配分值对所述聊天语料进行清洗。

需要说明的是，上述聊天语料的清洗方法、聊天语料的清洗装置、计算机设备及计算机可读存储介质属于一个总的发明构思，聊天语料的清洗方法、聊天语料的清洗装置、计算机设备及计算机可读存储介质实施例中的内容可相互适用。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种聊天语料的清洗方法，其特征在于，所述方法包括：

获取聊天语料，所述聊天语料包括问语料和答语料；

将所述聊天语料进行分词处理，并将分词结果转换成词向量；

将所述词向量输入预设的深度检索匹配排序模型，获取与所述聊天语料对应的匹配分值；

根据所述匹配分值对所述聊天语料进行清洗。
根据权利要求1所述的聊天语料的清洗方法，其特征在于，所述将所述词向量输入预设的深度检索匹配排序模型，获取与所述聊天语料对应的匹配分值，还包括：

对所述问语料对应的词向量、所述答语料对应的词向量进行叉乘处理，按照预设的映射函数获取叉乘处理结果的预设数量的映射值，根据预设的激活函数、预设的投影函数获取与所述映射值对应的匹配分值。
根据权利要求1所述的聊天语料的清洗方法，其特征在于，所述将分词结果转换成词向量之后，还包括：

按照预设的长度阈值对所述词向量进行长度改写。
根据权利要求1所述的聊天语料的清洗方法，其特征在于，所述根据所述匹配分值对所述聊天语料进行清洗，还包括：

判断所述匹配分值是否大于或等于预设的匹配阈值；

在所述匹配分值小于所述匹配阈值的情况下，对所述聊天语料进行清洗。
根据权利要求1所述的聊天语料的清洗方法，其特征在于，所述方法还包括：

获取训练语料，根据所述训练语料构建问答对语料；

将所述问答对语料进行分词处理，并将分词结果转换成词向量；

根据所述问答对语料对预设的深度检索匹配排序模型进行训练，获取训练完成的深度检索匹配排序模型。
根据权利要求5所述的聊天语料的清洗方法，其特征在于，所述问答对语料包括训练问语料、第一答语料和第二答语料；

所述词向量包括问语料词向量、第一答语料词向量、第二答语料词向量；

所述根据所述问答对语料对预设的深度检索匹配排序模型进行训练，还包括：

根据预设的深度检索匹配排序模型对所述转换成词向量的问答对语料进行评估预测，得到与所述问语料词向量、第一答语料词向量对应的第一匹配分值和与问语料词向量、第二答语料词向量匹配的第二匹配分值；

按照预设的损失函数以所述第一匹配分值、第二匹配分值为输入，输出对应的损失值；

按照预设的迭代算法对所述损失值进行更新迭代。
根据权利要求5所述的聊天语料的清洗方法，其特征在于，所述根据所述匹配分值对所述聊天语料进行清洗之后，还包括：

以所述清洗完成的聊天语料作为训练语料，对所述深度检索匹配排序模型进行训练，获取所述训练完成的深度检索匹配排序模型。
一种聊天语料的清洗装置，其特征在于，所述装置包括：

聊天语料获取模块，用于获取聊天语料，所述聊天语料包括问语料和答语料；

聊天语料处理模块，用于将所述聊天语料进行分词处理，并将分词结果转换成词向量，

模型计算模块，用于将所述词向量输入预设的深度检索匹配排序模型，获取与所述聊天语料对应的匹配分值；

语料清洗模块，用于根据所述匹配分值对所述聊天语料进行清洗。
一种计算机设备，其特征在于，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述聊天语料的清洗方法的步骤。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述聊天语料的清洗方法的步骤。