CN110705717B

CN110705717B - 计算机执行的机器学习模型的训练方法、装置及设备

Info

Publication number: CN110705717B
Application number: CN201910942795.0A
Authority: CN
Inventors: 张望舒; 温祖杰
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2022-05-17
Anticipated expiration: 2039-09-30
Also published as: CN110705717A

Abstract

本说明书实施例提供一种计算机执行的机器学习模型的训练方法、装置及设备，在训练方法中，获取在当前时间段内的增量数据，作为训练样本集。基于训练样本集，对在上一时间段训练后的机器学习模型进行增量训练，得到初始机器学习模型。将测试样本集中的各测试样本输入初始机器学习模型，以得到测试结果。基于测试结果，确定初始机器学习模型的准确率。若准确率大于第一阈值，则将初始机器学习模型作为在当前时间段训练后的机器学习模型。若准确率不大于第一阈值，则将测试样本集中测试结果错误的测试样本加入训练样本集，得到更新后的训练样本集，并基于更新后的训练样本集，对初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型。

Description

计算机执行的机器学习模型的训练方法、装置及设备

技术领域

本说明书一个或多个实施例涉及计算机技术领域，尤其涉及一种计算机执行的机器学习模型的训练方法、装置及设备。

背景技术

随着机器学习的普遍流行，各种机器学习模型越来越受到关注。对于机器学习模型，通常需要先基于训练数据(也称训练样本)对其进行训练，之后，利用训练后的机器学习模型执行某种预测，如，执行类别预测等。

需要说明的是，为了确保训练后的机器学习模型的准确率，通常需要基于大量的训练数据对其进行训练，这就使得模型的训练过程通常比较复杂。由于模型的训练过程比较复杂，传统技术中，通常会在训练后的机器学习模型的预测能力退化后，才再次启动模型的训练过程。因此，基于这种方式训练的机器学习模型通常适用于数据相对稳定的场景。而对于随着时间的推移，数据不断发生变化的场景，模型的预测准确率通常会比较低。

因此，需要提供一种机器学习模型的训练方法，以适应随着时间的推移，数据不断变化的场景。

发明内容

本说明书一个或多个实施例描述了一种计算机执行的机器学习模型的训练方法、装置及设备，可以大大提升机器学习模型训练的准确度和效率。

第一方面，提供了一种计算机执行的机器学习模型的训练方法，包括：

获取在当前时间段内的增量数据，作为训练样本集；

基于所述训练样本集，对在上一时间段训练后的机器学习模型进行增量训练，得到当前时间段的初始机器学习模型；

将测试样本集中的各测试样本输入所述初始机器学习模型，以得到所述各测试样本的测试结果；

基于所述各测试样本的测试结果，确定所述初始机器学习模型的准确率；

若所述准确率大于第一阈值，则将所述初始机器学习模型作为在当前时间段训练后的机器学习模型；

若所述准确率不大于第一阈值，则将所述测试样本集中测试结果错误的测试样本加入所述训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对所述初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型。

第二方面，提供了一种计算机执行的机器学习模型的训练装置，包括：

获取单元，用于获取在当前时间段内的增量数据，作为训练样本集；

训练单元，用于基于所述获取单元获取的所述训练样本集，对在上一时间段训练后的机器学习模型进行增量训练，得到当前时间段的初始机器学习模型；

输入单元，用于将测试样本集中的各测试样本输入所述训练单元训练得到的所述初始机器学习模型，以得到所述各测试样本的测试结果；

确定单元，用于基于所述各测试样本的测试结果，确定所述初始机器学习模型的准确率；

所述确定单元，还用于若所述准确率大于第一阈值，则将所述初始机器学习模型作为在当前时间段训练后的机器学习模型；

所述确定单元，还用于若所述准确率不大于第一阈值，则将所述测试样本集中测试结果错误的测试样本加入所述训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对所述初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型。

第三方面，提供了一种计算机执行的机器学习模型的训练设备，包括：

存储器；

一个或多个处理器；以及

一个或多个程序，其中所述一个或多个程序存储在所述存储器中，并且被配置成由所述一个或多个处理器执行，所述程序被所述处理器执行时实现以下步骤：

获取在当前时间段内的增量数据，作为训练样本集；

本说明书一个或多个实施例提供的计算机执行的机器学习模型的训练方法、装置及设备，获取在当前时间段内的增量数据，作为训练样本集。基于训练样本集，对在上一时间段训练后的机器学习模型进行增量训练，得到当前时间段的初始机器学习模型。将测试样本集中的各测试样本输入初始机器学习模型，以得到各测试样本的测试结果。基于各测试样本的测试结果，确定初始机器学习模型的准确率。若准确率大于第一阈值，则将初始机器学习模型作为在当前时间段训练后的机器学习模型。若准确率不大于第一阈值，则将测试样本集中测试结果错误的测试样本加入训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型。也即，本说明是提供的方案中，可以采用基于课程学习的增量学习的方式，训练机器学习模型。其中，增量学习的方式可以确保机器学习模型的训练只基于发生变化的数据进行，由此可以大大减少训练数据量，进而可以提升模型训练的效率。此外，在增量学习的方式中加入课程学习之后，可以确保机器学习模型在每个增量学习阶段，不仅可以学习新知识，还可以对原有的知识进行强化复习，这可以提升模型训练的准确度。

附图说明

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本说明书提供的人脑对知识学习的遗忘曲线示意图；

图2为本说明书提供的计算机执行的机器学习模型的训练方法应用场景示意图；

图3为本说明书一个实施例提供的计算机执行的机器学习模型的训练方法流程图；

图4为本说明书提供的计算机执行的机器学习模型的训练过程示意图；

图5为本说明书一个实施例提供的计算机执行的机器学习模型的训练装置示意图；

图6为本说明书一个实施例提供的计算机执行的机器学习模型的训练设备示意图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

在描述本说明书提供的方案之前，先对本方案的发明构思作以下说明。

在实际中，在多种场景下，随着时间的推移，数据是不断发生变化的。在数据不断发生变化的场景下，为了提升模型预测准确率，就需要可以基于发生变化的数据对模型进行实时或者及时地调整。以支付宝智能客服场景为例来说，随着支付宝业务复杂度日益提升，业务变更速度日益频繁，用户对相关业务问题的提问也处于一个动态快速频繁变化的趋势之中，这就要求智能客服可以进行频繁的更新迭代不断适应新用户的提问。

为了实现模型的实时或者及时地调整，可以考虑基于增量学习的方式对机器学习模型进行训练。增量学习是指一个学习系统能不断地从新样本中学习新的知识，并能保存大部分以前已经学习到的知识。

可以理解的是，上述增量学习的过程可以是不断重复执行的。具体地，可以预先设定增量学习周期(如，一周或者一个月)。之后，在每个增量学习周期，获取在当前增量学习周期内发生变化的数据，并基于该发生变化的数据，对原先的机器学习模型进行增量训练，以得到增量迭代的模型(具体训练过程后续说明)。

需要说明的是，上述增量学习的过程属于机器学习过程的一种。而机器学习过程与人脑的学习过程有类似的效应，即随着时间的推移，记忆程度呈现一个逐渐下降的态势，如果不进行复习再次强化记忆，初次记忆学到的知识会被遗忘。具体地，可参见图1所示。图1中，曲线a为合理安排复习的记忆曲线，曲线b为不合理安排复习的遗忘曲线，曲线c为不复习的自然遗忘曲线。

为了确保在上述增量学习的过程中，模型不对原有的知识产生遗忘。在上述增量学习的过程中可以引入课程学习的方式。课程学习(curriculum learning)是一种机器学习方法，通过对学习的数据点按照重要程度分配一定的权重，之后基于权重挑选出重要的知识点进行学习。

引入课程学习之后，在每个增量学习周期，在训练增量迭代的模型的过程中，不断调整课程内容。如，向训练数据中加入模型遗忘的知识(具体调整方法后续说明)。由此，可以实现让模型在学习新知识的同时，对原有的知识进行强化复习。从而避免了模型对原有的知识的遗忘。此外，逐渐的小数据增量训练方法，也节省了模型训练时间和成本。

以上就是本说书提供的发明构思，基于该发明构思就可以得到本方案，以下对本方案进行详细阐述。

图2为本说明书提供的计算机执行的机器学习模型的训练方法应用场景示意图。图2中，智能客服系统可以接收用户问句。之后，智能客服系统可以基于问答匹配模型，预测用户问句对应的标准问句。最后，可以基于标准问句对应的答案对用户问句进行回复。

图2中的问答匹配模型为机器学习模型的一种。其可以是基于课程学习的增量学习的方式训练得到。具体地，在每个增量学习周期，可以基于该增量学习周期的增量数据，对原先的模型(如，上一增量学习周期的增量迭代的模型)进行增量训练。训练完成之后，对得到的新的模型进行考试(Exam)，以用于检测新的模型对原有的知识是否产生了遗忘。根据测试过程中模型输出错误的知识重新调整课程内容，即重新将测试中错误的数据加入训练数据中一起继续训练。如此，不断地进行训练、测试、调整课程、再训练，循环迭代，直到测试通过率达到一定指标。最后输出该增量学习周期的达到要求的增量迭代的模型。

图3为本说明书一个实施例提供的计算机执行的机器学习模型训练方法流程图。所述方法的执行主体可以为具有处理能力的设备：服务器或者系统或者装置，如，可以为图2中的智能客服系统。如图3所示，所述方法具体可以包括：

步骤302，获取在当前时间段内的增量数据，以作为训练样本集。

这里的当前时间段可以理解为是前述增量学习过程中的一个增量学习周期。其长度可以为一周或者一个月。需要说明的是，上述基于时间段获取的增量数据通常是有偏的。

以智能客服场景为例来说，上述增量数据可以是从用户与客服的对话日志中获取的。这里获取的增量数据存在偏置主要是基于如下两方面的原因。第一方面，获取增量数据的操作本身可能是有偏的。例如，根据业务需要只对问答转人工部分进行抽样或者只对用户反馈部分进行抽样。第二方面，由于业务变动、时间因素等数据分布产生偏移，例如月底账单日、各种营销活动等等都会对整体样本产生偏置。

对于上述增量数据，对其进行打标之后，就可以得到当前时间段的训练样本集。由于当前时间段的增量数据是有偏的，从而基于其确定的当前时间段的训练样本集也是有偏的。

以智能客服场景为例来说，上述获取的增量数据可以为用户问句。在对用户问句添加对应的标准问句的标识之后，即在对用户问句添加标签值之后，就可以得到该场景下的训练样本集。也就是说，该步骤所述的训练样本集中的训练样本具有对应的标签值。

步骤304，基于训练样本集，对在上一时间段训练后的机器学习模型进行增量训练，得到当前时间段的初始机器学习模型。

以上述智能客服场景为例来说，这里的机器学习模型具体可以为问答匹配模型。该问答匹配模型用于基于用户的用户问句匹配对应的标准问句。

可以理解的是，由于当前时间段的训练样本集是有偏的，从而基于其训练的初始机器学习模型也是有偏的。因此，可以对机器学习模型进行调整。

步骤306，将测试样本集中的各测试样本输入初始机器学习模型，以得到各测试样本的测试结果。

这里，将测试样本集中的各测试样本输入初始机器学习模型是为了检测模型是否对原有的知识产生了遗忘。如果产生了遗忘，则调整模型的课程内容，如，将产生遗忘的知识加入到训练样本集，并重新对初始机器学习模型进行训练，以实现对原有的知识的强化复习。这里课程内容的调整过程以及再训练过程可参见步骤312。

此外，上述测试样本集还可以包括上一时间段的训练样本集中预测误差低于第二阈值的第二训练样本。这里的预测误差也可以称为损失函数，其可以是基于上一时间段训练后的机器学习模型针对第二训练样本的预测值和标签值确定。此外，这里的上一时间段的训练样本集可以看作是原有的知识库，第二训练样本可以理解为是原有的知识中比较容易的数据。

步骤308，基于各测试样本的测试结果，确定初始机器学习模型的准确率。

这里的初始机器学习模型的准确率可以是基于测试样本集中测试结果正确的测试样本的个数与测试样本的总个数确定。

步骤310，若准确率大于第一阈值，则将初始机器学习模型作为在当前时间段训练后的机器学习模型。

步骤312，若准确率不大于第一阈值，则将测试样本集中测试结果错误的测试样本加入训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型。

需要说明的是，上述将测试样本集中测试结果错误的测试样本加入训练样本集可以理解为是对模型的课程内容进行调整的过程。具体地，测试结果错误的测试样本可以理解为模型遗忘的原有知识。

由上述内容可以看出，本申请实施例可以基于测试样本集，来调整模型的课程内容。而如前所述，当前时间段的测试样本集中可以包括上一时间段的训练样本集中预测误差低于第二阈值的第二训练样本。而第二训练样本可以理解为是原有的知识中比较容易的数据。由此，就可以实现对原有的知识库中简单数据的再学习，也即，本说明书中，可以将原有的知识中比较容易的数据作为重点学习的内容。这可以大大提升模型对遗忘的知识点的学习效率。

还需要说明的是，上述步骤312中的基于更新后的训练样本集，对初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型具体可以如下：

迭代地执行以下步骤，直至训练后的初始机器学习模型的准确率大于第一阈值：基于更新后的训练样本集，对初始机器学习模型进行训练。利用测试样本集，对训练后的初始机器学习模型进行测试。判断训练后的初始机器学习模型的准确率是否大于第一阈值。若大于，则迭代过程结束。若不大于，则基于测试样本集中测试结果错误的测试样本，再次对更新后的训练样本集进行更新。

迭代结束后，将在最后一轮迭代过程中训练后的初始机器学习模型作为在当前时间段训练后的机器学习模型。

可以理解的是，在执行完成步骤312之后，则机器学习模型的一次增量训练过程结束。之后，可以进入下一增量学习周期。如此，不断对机器学习模型进行增量训练，就可以实现基于变化的数据，对模型进行实时或及时地调整。

需要补充说明的是，在机器学习模型的一次增量训练过程结束之后，可以对测试样本集进行调整。如，从当前时间段的训练样本集中选取预测误差低于第二阈值的第一训练样本。将第一训练样本加入测试样本集，以得到更新后的测试样本集。将更新后的测试样本集作为下一时间段的测试样本集。该第一训练样本具有对应的标签值。第一训练样本的预测误差基于当前时间段训练后的机器学习模型针对第一训练样本的预测值和标签值确定。

具体地，可基于如下公式来选取上述第一训练样本。

表示训练样本i是否加入测试样本集，li表示当前模型在训练样本i的预测误差，当预测误差小于λ的时候，将训练样本视为已经学习良好的数据(或者视为容易的数据)，加入下一时间段的测试样本集。

综上，本说明书实施例基于小数据，对机器学习模型进行增量训练的方法，可以节省模型训练时间和成本。此外，在每个增量学习周期，通过对训练样本集不断调整，可以有效避免对有偏抽样数据的过拟合。最后，在调整训练样本集的过程中，通过加入测试样本集中测试结果错误的样本，可以避免模型对原有的知识的遗忘。

需要说明的是，当将本说明书实施例提供的机器学习模型的训练方法应用于智能客服场景时，可有利于线上系统的自动闭环训练，是智能客服系统的数据闭环更新中的重要一环。此外，当将本说明书提供的方法应用于智能客服场景时，可将客服转在线人工率降低0.5％，这可以极大地节约服务成本。

图4为本说明书提供的计算机执行的机器学习模型的训练过程示意图。图4中，T1、T2、T3以及T4分别用于表示四个时间段或者增量学习周期。S1、S2、S3以及S4分别用于表示在上述四个时间段或者增量学习周期获取的增量数据。ModelT1、ModelT2、ModelT3以及ModelT4分别用于表示在上述四个时间段或者增量学习周期训练后的机器学习模型(也称增量迭代的模型)。

以T2为例来说，在进入T2之后，可以基于S2对在T1输出的ModelT1进行增量训练，以得到初始训练后的ModelT2。在得到初始训练后的ModelT2之后，可以基于在T1更新后的测试样本集，对初始训练后的ModelT2进行测试。这里更新后的测试样本集可以包括T1的训练样本集中预测误差低于λ的训练样本。之后，如果初始训练后的ModelT2的准确率大于第一阈值，则输出初始训练后的ModelT2，并结束T1。否则，将测试样本集中测试结果错误的测试样本加入S2中，以得到更新后的S2。之后，基于更新后的S2，对初始训练后的ModelT2进行继续训练。继续训练后的ModelT2的准确率如果大于第一阈值，则输出继续训练后的ModelT2，并结束T1。否则，再次更新S2，并再次基于更新后的S2对继续训练后的ModelT2进行再次训练；以此类推，直至训练后的ModelT2的准确率大于第一阈值。最后，可以输出在T2中最后一次训练得到的ModelT2，也即输出最终训练后的ModelT2。

与上述计算机执行的机器学习模型的训练方法对应地，本说明书一个实施例还提供的一种计算机执行的机器学习模型的训练装置，如图5所示，该装置可以包括：

获取单元502，用于获取在当前时间段内的增量数据，作为训练样本集。

训练单元504，用于基于获取单元502获取的训练样本集，对在上一时间段训练后的机器学习模型进行增量训练，得到当前时间段的初始机器学习模型。

这里的机器学习模型可以包括问答匹配模型。问答匹配模型用于基于用户的用户问句匹配对应的标准问句。训练样本集中的样本可以包括：用户问句和标签值，标签值指示用户问句对应的标准问句。

输入单元506，用于将测试样本集中的各测试样本输入训练单元504训练得到的初始机器学习模型，以得到各测试样本的测试结果。

确定单元508，用于基于各测试样本的测试结果，确定初始机器学习模型的准确率。

确定单元508，还用于若准确率大于第一阈值，则将初始机器学习模型作为在当前时间段训练后的机器学习模型。

确定单元508，还用于若准确率不大于第一阈值，则将测试样本集中测试结果错误的测试样本加入训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型。

确定单元508具体可以用于：

迭代地执行以下步骤，直至训练后的初始机器学习模型的准确率大于第一阈值：

基于更新后的训练样本集，对初始机器学习模型进行训练。

利用测试样本集，对训练后的初始机器学习模型进行测试。

判断训练后的初始机器学习模型的准确率是否大于第一阈值。

若不大于，则基于测试样本集中测试结果错误的测试样本，再次对更新后的训练样本集进行更新。

可选地，该装置还可以包括：

选取单元(图中未示出)，用于从训练样本集中选取预测误差低于第二阈值的第一训练样本。

这里的第一训练样本具有对应的标签值。第一训练样本的预测误差基于当前时间段训练后的机器学习模型针对第一训练样本的预测值和标签值确定。

更新单元(图中未示出)，用于将选取单元选取的第一训练样本加入测试样本集，以得到更新后的测试样本集。

确定单元508，还用于将更新单元更新后的测试样本集作为下一时间段的测试样本集。

本说明书上述实施例装置的各功能模块的功能，可以通过上述方法实施例的各步骤来实现，因此，本说明书一个实施例提供的装置的具体工作过程，在此不复赘述。

本说明书一个实施例提供的计算机执行的机器学习模型的训练装置，获取单元502获取在当前时间段内的增量数据，作为训练样本集。训练单元504基于训练样本集，对在上一时间段训练后的机器学习模型进行增量训练，得到当前时间段的初始机器学习模型。输入单元506将测试样本集中的各测试样本输入初始机器学习模型，以得到各测试样本的测试结果。确定单元508基于各测试样本的测试结果，确定初始机器学习模型的准确率。若准确率大于第一阈值，则确定单元508将初始机器学习模型作为在当前时间段训练后的机器学习模型。若准确率不大于第一阈值，则确定单元508将测试样本集中测试结果错误的测试样本加入训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型。由此，可以大大提升机器学习模型训练的准确度和效率。

本说明书一个实施例提供的计算机执行的机器学习模型的训练装置可以为图2中智能客服系统的一个模块或者单元。

与上述计算机执行的机器学习模型的训练方法对应地，本说明书一个实施例还提供的一种计算机执行的机器学习模型的训练设备，如图6所示，该设备可以包括：存储器602、一个或多个处理器604以及一个或多个程序。其中，该一个或多个程序存储在存储器602中，并且被配置成由一个或多个处理器604执行，该程序被处理器604执行时实现以下步骤：

获取在当前时间段内的增量数据，作为训练样本集。

基于训练样本集，对在上一时间段训练后的机器学习模型进行增量训练，得到当前时间段的初始机器学习模型。

将测试样本集中的各测试样本输入初始机器学习模型，以得到各测试样本的测试结果。

基于各测试样本的测试结果，确定初始机器学习模型的准确率。

若准确率大于第一阈值，则将初始机器学习模型作为在当前时间段训练后的机器学习模型。

若准确率不大于第一阈值，则将测试样本集中测试结果错误的测试样本加入训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对初始机器学习模型进行训练，以得到在当前时间段训练后的机器学习模型。

本说明书一个实施例提供的计算机执行的机器学习模型的训练设备，可以大大提升机器学习模型训练的准确度和效率。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现，也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外，该ASIC可以位于服务器中。当然，处理器和存储介质也可以作为分立组件存在于服务器中。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述的具体实施方式，对本说明书的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本说明书的具体实施方式而已，并不用于限定本说明书的保护范围，凡在本说明书的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本说明书的保护范围之内。

Claims

1.一种计算机执行的问答匹配模型的训练方法，所述问答匹配模型用于基于用户的用户问句匹配对应的标准问句；所述方法包括：

获取在当前时间段内的增量数据，作为训练样本集；所述训练样本集中的样本包括：用户问句和标签值，所述标签值指示用户问句对应的标准问句；所述增量数据是在当前时间段内发生变化的数据；

基于所述训练样本集，对在上一时间段训练后的问答匹配模型进行增量训练，得到当前时间段的初始问答匹配模型；

将测试样本集中的各测试样本输入所述初始问答匹配模型，以得到所述各测试样本的测试结果；

基于所述各测试样本的测试结果，确定所述初始问答匹配模型的准确率；

若所述准确率大于第一阈值，则将所述初始问答匹配模型作为在当前时间段训练后的问答匹配模型；

若所述准确率不大于第一阈值，则将所述测试样本集中测试结果错误的测试样本加入所述训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对所述初始问答匹配模型进行训练，以得到在当前时间段训练后的问答匹配模型。

2.根据权利要求1所述的方法，还包括：

从所述训练样本集中选取预测误差低于第二阈值的第一训练样本；

将所述第一训练样本加入所述测试样本集，以得到更新后的测试样本集；

将更新后的测试样本集作为下一时间段的测试样本集。

3.根据权利要求2所述的方法，所述第一训练样本具有对应的标签值；所述第一训练样本的预测误差基于当前时间段训练后的问答匹配模型针对所述第一训练样本的预测值和所述标签值确定。

4.根据权利要求1所述的方法，所述基于更新后的训练样本集，对所述初始问答匹配模型进行训练，以得到在当前时间段训练后的问答匹配模型，包括：

迭代地执行以下步骤，直至训练后的初始问答匹配模型的准确率大于所述第一阈值：

基于更新后的训练样本集，对所述初始问答匹配模型进行训练；

利用所述测试样本集，对训练后的初始问答匹配模型进行测试；

判断训练后的初始问答匹配模型的准确率是否大于所述第一阈值；

若不大于，则基于所述测试样本集中测试结果错误的测试样本，再次对所述更新后的训练样本集进行更新；

迭代结束后，将在最后一轮迭代过程中训练后的初始问答匹配模型作为在当前时间段训练后的问答匹配模型。

5.一种计算机执行的问答匹配模型的训练装置，所述问答匹配模型用于基于用户的用户问句匹配对应的标准问句；所述装置包括：

获取单元，用于获取在当前时间段内的增量数据，作为训练样本集；所述训练样本集中的样本包括：用户问句和标签值，所述标签值指示用户问句对应的标准问句；所述增量数据是在当前时间段内发生变化的数据；

训练单元，用于基于所述获取单元获取的所述训练样本集，对在上一时间段训练后的问答匹配模型进行增量训练，得到当前时间段的初始问答匹配模型；

输入单元，用于将测试样本集中的各测试样本输入所述训练单元训练得到的所述初始问答匹配模型，以得到所述各测试样本的测试结果；

确定单元，用于基于所述各测试样本的测试结果，确定所述初始问答匹配模型的准确率；

所述确定单元，还用于若所述准确率大于第一阈值，则将所述初始问答匹配模型作为在当前时间段训练后的问答匹配模型；

所述确定单元，还用于若所述准确率不大于第一阈值，则将所述测试样本集中测试结果错误的测试样本加入所述训练样本集，以得到更新后的训练样本集，并基于更新后的训练样本集，对所述初始问答匹配模型进行训练，以得到在当前时间段训练后的问答匹配模型。

6.根据权利要求5所述的装置，还包括：

选取单元，用于从所述训练样本集中选取预测误差低于第二阈值的第一训练样本；

更新单元，用于将所述选取单元选取的所述第一训练样本加入所述测试样本集，以得到更新后的测试样本集；

所述确定单元，还用于将所述更新单元更新后的测试样本集作为下一时间段的测试样本集。

7.根据权利要求6所述的装置，所述第一训练样本具有对应的标签值；所述第一训练样本的预测误差基于当前时间段训练后的问答匹配模型针对所述第一训练样本的预测值和所述标签值确定。

8.根据权利要求5所述的装置，所述确定单元具体用于：

9.一种计算机执行的问答匹配模型的训练设备，所述问答匹配模型用于基于用户的用户问句匹配对应的标准问句；所述设备包括：

存储器；

一个或多个处理器；以及