CN110610415B

CN110610415B - 一种模型更新的方法和装置

Info

Publication number: CN110610415B
Application number: CN201910921984.XA
Authority: CN
Inventors: 张�杰; 吴信东
Original assignee: Beijing Mininglamp Software System Co ltd
Current assignee: Beijing Mininglamp Software System Co ltd
Priority date: 2019-09-26
Filing date: 2019-09-26
Publication date: 2022-06-17
Anticipated expiration: 2039-09-26
Also published as: CN110610415A

Abstract

本申请提供一种模型更新的方法和装置。模型更新的方法包括：在获取到新的还款数据时，获取待更新的训练样本集和根据所述训练样本集训练得到的模型；所述训练样本集中包括多个客户的还款信息，及每个客户的客户评估值；根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集；基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型。该模型更新的方法提高了模型的准确性和适用性。

Description

一种模型更新的方法和装置

技术领域

本申请涉及计算机领域，具体而言，涉及一种模型更新的方法和装置。

背景技术

随着金融科技技术的发展，越来越多的金融机构引入机器学习的方法建立信用评分模型来逐步代替人工审批的方式，以期达到降低人工成本、提高工作效率、排除人为不稳定因素的目的。

然而，常规的训练模型的方法，是将历史的数据集作为样本，对模型进行训练，所得到的模型并不能适应于数据的不断变化，因此，模型的准确性和适用性较低。

发明内容

本申请实施例的目的在于提供一种模型更新的方法和装置，用以提高模型的准确性和适用性。

第一方面，本申请实施例提供一种模型更新的方法，包括：在获取到新的还款数据时，获取待更新的训练样本集和根据所述训练样本集训练得到的模型；所述训练样本集中包括多个客户的还款信息，及每个客户的客户评估值；根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集；基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型。

在本申请实施例中，每当获取到有新的还款数据时，根据还款数据对训练样本集进行更新，再基于更新的训练样本集对模型进行训练，进而实现模型的更新。与现有技术相比，当获取到还款数据时，就会基于还款数据更新训练样本集，通过更新的训练样本集再次对模型进行训练，使得到的模型能够适应于数据的变化，提高了模型的准确性和适用性。

作为一种可能的实现方式，所述客户评估值设置有惩罚权重，所述惩罚权重用于表征所述客户评估值的正确性；在根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集之后，所述方法还包括：基于所述更新的训练样本集，更新所述惩罚权重；对应的，基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型，包括：基于所述更新的训练样本集、更新的惩罚权重对所述模型进行训练，得到更新好的模型。

在本申请实施例中，训练样本集中的客户评估值设置有用于表征所述客户评估值的正确性的惩罚权重，当训练样本集更新后，同时也对该惩罚权重进行更新，在训练时，基于更新的惩罚权重一并进行训练。进而能够有效的捕捉到客户评估值的数据漂移的特征，并及时的更新到模型中。

作为一种可能的实现方式，基于所述更新的训练样本集，更新所述惩罚权重，包括：根据所述更新的训练样本集中各个客户评估值更新的时间对所述各个客户评估值进行更新时间排序；根据所述更新时间排序更新所述惩罚权重。

在本申请实施例中，通过时间排序法确定惩罚权重，不仅简单，且能够体现时间对数据漂移的影响，因此能够实现简单有效的确定惩罚权重。

作为一种可能的实现方式，所述还款信息设置有漂移权重，所述漂移权重用于表征所述还款信息的稳定性；在根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集之后，所述方法还包括：基于所述更新的训练样本集，更新所述漂移权重；对应的，基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型，包括：基于所述更新的训练样本集、更新的漂移权重对所述模型进行训练，得到更新好的模型。

在本申请实施例中，训练样本集中的还款信息设置有漂移权重，在训练样本集更新后，还可以对该漂移权重进行更新，在训练时，基于更新的漂移权重一并进行训练。进而能够有效的捕捉到还款信息的数据漂移的特征，并及时的更新到模型中。

作为一种可能的实施方式，每个客户的还款信息中包括多个还款特征，基于所述更新的训练样本集，更新所述漂移权重，包括：获取每个还款特征在所述多个还款特征的预期占比和实际占比；根据所述预期占比和所述实际占比更新每个所述还款特征的漂移权重。

在本申请实施例中，通过预期占比和实际占比更新漂移权重，简单有效的实现漂移权重的更新。

作为一种可能的实现方式，所述客户评估值设置有惩罚权重，所述惩罚权重用于表征所述客户评估值的正确性；所述还款信息设置有漂移权重，所述漂移权重用于表征所述还款信息的稳定性；在根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集之后，所述方法还包括：基于所述更新的训练样本集，更新所述惩罚权重；基于所述更新的训练样本集，更新所述漂移权重；对应的，基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型，包括：基于所述更新的训练样本集、更新的惩罚权重、更新的漂移权重对所述模型进行训练，得到更新好的模型。

在本申请实施例中，惩罚权重和漂移权重还可以同时设置，在得到更新的训练样本集后，同时对惩罚权重和漂移权重进行更新，并进行模型的训练，进而能够将还款信息和客户评估值的数据漂移特征都及时的更新到模型中。

作为一种可能的实现方式，根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集，包括：根据所述还款数据对与所述还款数据相关的客户的所述还款信息以及所述客户评估值进行更新；将所述相关的客户的更新的所述还款信息以及所述客户评估值加入到所述训练样本集中，得到所述更新的训练样本集。

在本申请实施例中，在更新训练样本集时，可以直接基于原有的还款信息和客户评估值进行扩充，扩大训练样本集的数据量，进而可以根据扩大数据量的训练样本集实现模型的更新。

作为一种可能的实现方式，根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集，包括：根据所述还款数据对与所述还款数据相关的客户的所述还款信息以及所述客户评估值进行更新；将所述相关的客户的更新的还款信息替换所述训练样本集中的所述相关的客户的初始的还款信息；以及将所述相关的客户的更新的客户评估值替换所述训练样本集中的所述相关的客户的初始的客户评估值，得到所述更新的训练样本集。

在本申请实施例中，在更新训练样本集时，可以将还款数据涉及到的还款信息和客户评估值直接替换掉，使训练样本集中的相关的数据得到更新，进而可以根据更新数据的训练样本集实现模型的更新。

作为一种可能的实现方式，基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型，包括：基于所述更新的训练样本集中的新增数据对所述模型进行训练，得到更新好的模型。

在本申请实施例中，在进行训练时，可以只基于有变化的样本进行训练，使更新时的训练样本数量少一些，但是更具有代表性，并且节约训练时间，提高模型更新的效率。

第二方面，本申请实施例提供一种模型更新的装置，该模型更新的装置包括用于实现第一方面以及第一方面的任意可能的实现方式中所述的方法的各个功能模块。

第三方面，本申请实施例提供一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被计算机运行时执行如第一方面的以及第一方面的任意可能的实现方式中所述的方法中的步骤。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的模型更新的方法的流程图；

图2为本申请实施例提供的第一种权重衰减函数示意图；

图3为本申请实施例提供的第二种权重衰减函数示意图；

图4为本申请实施例提供的第三种权重衰减函数示意图；

图5为本申请实施例提供的模型更新的装置的功能模块框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

在金融领域，类似于银行借贷等应用场景，例如一个客户当前想要申请借款服务，可以通过机器学习建立的信用评估模型直接对该客户的信用值进行评估，评估是否可以借款给该客户。本申请实施例所提供的模型更新的方法可以应用于该信用评估模型的更新。

图1为本申请实施例提供的模型更新的方法的流程图，如图1所示，该方法包括：

步骤101：在获取到新的还款数据时，获取待更新的训练样本集和根据所述训练样本集训练得到的模型。训练样本集中包括多个客户的还款信息，及每个客户的客户评估值。

步骤102：根据还款数据对训练样本集进行更新，得到更新的训练样本集。

步骤103：基于更新的训练样本集对模型进行训练，得到更新好的模型。

通过步骤101-步骤103，每当获取到有新的还款数据时，根据还款数据对训练样本集进行更新，再基于更新的训练样本集对模型进行训练，进而实现模型的更新。与现有技术相比，当获取到还款数据时，就会基于还款数据更新训练样本集，通过更新的训练样本集再次对模型进行训练，使得到的模型能够适应于数据的变化，提高了模型的准确性和适用性。

在步骤101中，获取新的还款数据的实施方式可以有多种，一种可选的实施方式：在预设时间点获取新的还款数据，该预设时间点可以是每天的某一时刻，如每天8点；也可以是一周中的某天，如每周五；当然也可以是一个月的某天，如每个月的15号。预设时间点可以根据具体的应用场景中的数据更新的速度进行设置，如果还款数据更新的比较快，每天都有上百条的还款数据，那么预设时间点就可以设置为每天的某一时刻；如果还款数据更新的比较慢，一个月中才会有几笔还款数据更新，那么预设时间点就可以设置为每个月的15号。另一种可选的实施方式：在接收到模型更新请求时获取新的还款数据。在这种实施方式中，可以由用户发起模型的更新请求，即用户认为模型需要更新时，发起对应的更新请求。这里的用户可以是系统开发员或者系统维护员等，该类用户定期对模型的使用结果或者使用效果进行评估，若觉得使用结果或者使用效果较差时，就可以做出模型需要更新的判断。

需要注意的是，在各种金融服务平台上，当用户有还款，或者借款等操作时，金融服务平台就会对应更新还款数据，在有更新的还款数据后，直接获取这些更新的还款数据即可。

更进一步的，在步骤101中，待更新的模型可以理解为上一次更新后的模型，待更新的训练样本集可以理解为上一次对模型进行更新训练时所采用的训练样本集。相当于步骤101-步骤103其实是一个可以循环进行的过程，即每对训练样本集进行一次更新，就进行一次模型的训练，得到更新的模型。并且，这里的还款数据也是在上一次更新模型后所产生的新的还款数据。即待更新的模型是在新的还款数据产生之前进行过更新训练的模型，待更新的训练样本集是在新的还款数据产生之前所更新的训练样本集。

在训练样本集中，包括多个客户的还款信息，以及每个客户的客户评估值。其中，还款信息中可以包括多个还款特征，例如：借款天数、逾期天数、逾期金额、账龄、还款余额等。比如客户一的还款信息是：借款天数：100天；逾期天数：50天；逾期金额：1万元；账龄：1年。客户一的还款信息，代表客户一已经借了100天的款，但是客户一有1万元已经逾期了50天未还。再比如客户二的还款信息是：借款天数：30天；逾期天数：0天；逾期金额：0元；账龄：2年；还款余额：1000元。客户二的还款信息，代表客户二已经借款30天，没有逾期，还剩1000元未还清。

对于客户评估值，相当于样本标签，用于评价客户的信用。客户评估值可以设置为多种形式，一种可选的实施方式：客户信用包括两种，一种是好信用，在客户为好信用的情况下，可以为客户提供借款、贷款等服务；另一种是坏信用，在客户为坏信用的情况下，不为客户提供借款、贷款等服务。好信用的客户评估值可以为1，坏信用的客户评估值可以为0。这种实施方式是比较简单的形式，当然，也可以设置为更复杂的形式：客户信用设置有等级，不同的等级对应不同的客户评估值，如客户评估值一共10分，那么0-2.5为四等，2.6-5为三等，5.1-7.5为二等，7.6-10为一等，不同等级的客户评估值享受不同的服务，且不同的服务所对应的金额也可以不同，例如一等的客户评估值可以享受更高额的借款和贷款服务，而四等的客户评估值只能享受低额的借贷服务，甚至不具有借贷资格。

假如将客户评估值定义为y，将各个还款特征定义为x，那么客户评估值与还款特征之间的关系可为y＝f(x)，即客户评估值由还款特征决定。对应的，因为客户评估值相当于样本标签，所以一个客户及其还款信息仅对应一个客户评估值。客户评估值可以由用户进行标注，即将客户的还款信息提供给用户，用户基于还款信息对客户评估值进行标注。

在执行步骤101后，执行步骤102，即：根据还款数据对训练样本集进行更新，得到更新的训练样本集。对于步骤102，本申请实施例提供两种可选的实施方式。

步骤102的第一种实施方式：根据还款数据对与还款数据相关的客户的还款信息以及客户评估值进行更新；将相关的客户的更新的还款信息以及客户评估值加入到训练样本集中，得到更新的训练样本集。

对于第一种实施方式，相当于是采用的样本扩充的方式，即保留原来的还款信息和客户评估值的同时，将基于原来的还款信息和客户评估值进行更新得到的数据也加入到样本集中，实现样本集的扩充。另外，对于一个客户来说，还可以把原来的还款信息与更新的客户评估值进行组合，或者说将更新的还款信息与原来的客户评估值进行组合，得到一个新的样本，以实现拆分式的扩充样本集。

此外，基于还款数据对还款信息和客户评估值进行更新的实现方式：确定更新的还款数据所相关的还款特征，基于该还款数据对还款特征进行更新。例如：更新的还款数据中指示客户A将待还款金额全部还清，待还款金额的还清对应的还款特征，那么此时可以将还款余额更新为0，并同时从客户A借款开始计算客户A的总共借款时间，进而计算客户A还清所有还款所用的时间。在对还款信息进行更新后，将更新的还款信息反馈给用户，用户再对客户评估值进行标注以实现更新。

步骤102的第二种实施方式，步骤102包括：根据还款数据对与还款数据相关的客户的还款信息以及客户评估值进行更新；将相关的客户的更新的还款信息替换训练样本集中的相关的客户的初始的还款信息；以及将相关的客户的更新的客户评估值替换训练样本集中的相关的客户的初始的客户评估值，得到更新的训练样本集。

在第二种实施方式中，采用的是替换式的更新方式，即训练样本集中的样本数量不会变化。在这种实施方式中，基于还款数据更新还款信息和客户评估值的方式与第一种实施方式中的相同，不再重复介绍。

需要注意的是，对于训练样本集所采用的更新方式，在循环过程中一般采用一种更新方式即可，即不需要进行更新方式的切换。因为，在第二种更新方式中，需要替换掉原来的还款信息和客户评估值，若前一次采用的是扩充的方式，当前采用的是替换的方式，需要替换的数据就会比较多，反而使样本数量减少，可能会影响训练效果。当然，在某些特殊的情况下，也可以交替使用扩充或者替换的方式对训练样本集进行更新，根据实际需求可以进行选择。

在完成步骤102后，执行步骤103，即基于更新的训练样本集对模型进行训练，得到更新好的模型。

在机器学习中，对于模型的训练来说，除了更新的训练样本集，还可以选择模型的优化策略和模型所采用的算法，模型的优化策略所考虑的是什么样的解才是与训练集最匹配的解，即按照什么样的准则学习，从而定义优化目标。模型所采用的具体算法是指学习模型的具体计算方法，通常采用数值计算的方法求解，如梯度下降法。在本申请实施例中，可采用的模型如：逻辑斯蒂回归模型、梯度提升树模型等。因此，在步骤103中，将更新的训练样本集输入到之前已经训练过的逻辑斯蒂回归模型或者梯度提升树模型等模型中进行训练即可，训练好的模型即为当前更新的模型。

此外，对于更新的训练样本集中，其中一部分可能是还款数据没有涉及到的样本，这部分样本之前已经进行过训练。因此，在训练时，可以将更新的训练样本集全部输入到模型中进行训练，例如假设原来训练样本集中包括100个样本，经过更新后，包括120个样本，将该120个样本都输入到模型中进行训练。在训练时，还可以仅基于更新的训练样本集中的新增数据对模型进行训练，例如假设原来训练样本集中包括1000个样本，经过更新后，该样本集中新增了500个数据，共包括1500个样本，将该500个新增的数据输入到待更新的模型中进行训练即可。在这种实施方式中，还有一种情况是，该新增的数据不一定是扩充得到的，也有可能是基于原来的数据进行替换得到的，也属于新增的数据，但是样本的总量可能并没变。例如：假设原来训练样本集中包括800个样本，经过更新，该800个样本中的300个样本的数据发生了改变，那么将该300个样本视为新增的数据输入到待更新的模型中进行训练即可。

进一步的，在本申请实施例中，训练样本集中的客户评估值还可以设置惩罚权重，该惩罚权重用于表征客户评估值的正确性，引用前述实施例中所介绍的y＝f(x)，相当于给y值一个权重值。给客户评估值一个权重值的目的是：在模型训练阶段，对不同时间远近的样本做出错误预测时，给与不同程度的惩罚，距离当前时间越近的样本在模型做出错误判断时给予更高的惩罚。因此，除了更新训练样本集，还可以对惩罚权重进行一并更新，在步骤102之后，该方法还包括：基于更新的训练样本集，更新惩罚权重。对应的，步骤103包括：基于更新的训练样本集、更新的惩罚权重对模型进行训练，得到更新好的模型。

基于更新的训练样本集，更新惩罚权重，可以包括：根据更新的训练样本集中各个客户评估值更新的时间对各个客户评估值进行更新时间排序；根据更新时间排序更新惩罚权重。其中，更新时间排序可以从远到近排列，即更新的时间距离当前时间越久的排在前面，更新的时间距离当前时间越近的排在后面，当然，也可以从近到远排列。更新的时间也可以理解，假如客户评估值一是8.26日更新的，客户评估值二是8.01日更新的，那么客户评估值一的更新时间远于客户评估值二的更新时间。

进一步的，根据更新时间排序更新惩罚权重的实现方式：可以通过权重衰减函数为客户评估值更新惩罚权重值。可选的权重衰减函数包括：高斯函数、圆函数以及反比例函数(y＝1/kx)等。其中，如图2所示，为高斯函数的变化趋势示意图，其中的横坐标为更新时间距离当前时间点的时间间隔，纵坐标为惩罚权重，参见横坐标值大于0的部分，随着距离当前时间点的时间间隔越大，对应的惩罚权重值也就越小。再如图3所示，为圆函数的变化趋势示意图，其中的横坐标为更新时间距离当前时间点的时间间隔，纵坐标为惩罚权重，参见横坐标值大于0的部分，随着距离当前时间点的时间间隔越大，对应的惩罚权重值也就越小。再如图4所示，为反比例函数的变化趋势示意图，其中的横坐标为更新时间距离当前时间点的时间间隔，纵坐标为惩罚权重，参见横坐标值大于0的部分，随着距离当前时间点的时间间隔越大，对应的惩罚权重值也就越小。对比三种权重衰减函数，不同的权重衰减函数，随着时间间隔的变大，惩罚权重减小的速度是不同的，可根据实际需求选取不同的权重衰减函数进行惩罚权重的更新。

通过时间排序法确定惩罚权重，不仅简单，且能够体现时间对数据漂移的影响，因此能够实现简单有效的确定惩罚权重。

进一步的，在步骤103中，在训练时，基于更新的惩罚权重一并进行训练。进而能够有效的捕捉到还款信息的数据漂移的特征，并及时的更新到模型中。

除了客户评估值设置有惩罚权重，还款信息也设置有漂移权重，漂移权重用于表征还款信息的稳定性，引用前述实施例中所介绍的y＝f(x)，相当于给f(x)中的各个x变量一个权重值。给还款信息设置漂移权重的目的是：在训练时有目的的降低变化较大的特征的权重。因此，在步骤102后，该方法还包括：基于更新的训练样本集，更新漂移权重；对应的，步骤103包括：基于更新的训练样本集、更新的漂移权重对模型进行训练，得到更新好的模型。

其中，基于所述更新的训练样本集，更新漂移权重，包括：获取每个还款特征在多个还款特征中的预期占比和实际占比；根据预期占比和实际占比更新每个还款特征的漂移权重。更新漂移权重本质上是再次计算还款特征的稳定性，可采用PSI(PopulationStability Index，群体稳定性指数)指标评估特征稳定性，计算公式为：psi＝sum((实际占比-预期占比)/ln(实际占比/预期占比))。其中，预期占比可理解为通过历史的数据所统计出的占比，实际占比理解为更新后的数据所统计出的占比。占比代表的是变化率，例如一共有10个还款特征，还款特征一的变化率为百分之十，还款特征二的变化量为百分之一，其他还款特征可以依次类推。

通过预期占比和实际占比更新漂移权重，简单有效的实现漂移权重的更新。

进一步的，在步骤103中，在训练时，基于更新的漂移权重一并进行训练。进而能够有效的捕捉到还款信息的数据漂移的特征，并及时的更新到模型中。

此外，对于漂移权重和惩罚权重来说，可以只设置其中一个，也可以同时设置，上述实施例介绍的是只设置其中一个的情况，在同时设置时，在步骤102后，该方法还包括：基于更新的训练样本集，更新惩罚权重；基于更新的训练样本集，更新漂移权重。对应的，步骤103包括：基于更新的训练样本集、更新的惩罚权重、更新的漂移权重对模型进行训练，得到更新好的模型。

在这种实施方式中，对于更新惩罚权重和漂移权重的实施方式与只设置一个时的实施方式相同，在此不再赘述。

进一步的，在本申请实施例中，在完成步骤103，即完成模型的更新后，还可以对更新好的模型进行评估。模型评估的方式可以是：通过测试样本集对更新好的模型进行测试，将模型输出的结果与正确的结果进行比对，根据比对的结果对模型进行评估。其中，测试样本集可以是从更新好的训练样本集中筛选出的客户还款信息；正确的结果可以是在训练样本集中客户还款信息对应的客户评估值。进一步的，比对的结果可以以评估准确率的形式体现，例如，一共有100个测试样本集，模型输出的评估结果中有98是正确的，那么模型的评估准确率可以为98％。在对更新好的模型完成评估后，还可以生成模型的评估报告，提供给建模人员进行参考，以对模型进行进一步改进。

在本申请实施例中，还可以对更新好的模型进行评估，进一步增加更新的模型的准确性。

基于同一发明构思，请参照图5，本申请实施例中还提供一种模型更新的装置200，包括：获取模块201、更新模块202以及训练模块203。

获取模块201用于：在获取到新的还款数据时，获取待更新的训练样本集和根据所述训练样本集训练得到的模型；所述训练样本集中包括多个客户的还款信息，及每个客户的客户评估值。更新模块202用于：根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集。训练模块203用于：基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型。

可选的，更新模块202还用于：基于所述更新的训练样本集，更新所述惩罚权重。训练模块203还用于：基于所述更新的训练样本集、更新的惩罚权重对所述模型进行训练，得到更新好的模型。

可选的，更新模块202还用于：根据所述更新的训练样本集中各个客户评估值更新的时间对所述各个客户评估值进行更新时间排序；根据所述更新时间排序更新所述惩罚权重。

可选的，更新模块202还用于：基于所述更新的训练样本集，更新所述漂移权重。训练模块203还用于：基于所述更新的训练样本集、更新的漂移权重对所述模型进行训练，得到更新好的模型。

可选的，更新模块202还用于：获取每个还款特征在所述多个还款特征中的预期占比和实际占比；根据所述预期占比和所述实际占比更新每个所述还款特征的漂移权重。

可选的，更新模块202还用于：基于所述更新的训练样本集，更新所述惩罚权重；基于所述更新的训练样本集，更新所述漂移权重。训练模块203还用于：基于所述更新的训练样本集、更新的惩罚权重、更新的漂移权重对所述模型进行训练，得到更新好的模型。

可选的，更新模块202还用于：根据所述还款数据对与所述还款数据相关的客户的所述还款信息以及所述客户评估值进行更新；将所述相关的客户的更新的所述还款信息以及所述客户评估值加入到所述训练样本集中，得到所述更新的训练样本集。

可选的，更新模块202还用于：根据所述还款数据对与所述还款数据相关的客户的所述还款信息以及所述客户评估值进行更新；将所述相关的客户的更新的还款信息替换所述训练样本集中的所述相关的客户的初始的还款信息；以及将所述相关的客户的更新的客户评估值替换所述训练样本集中的所述相关的客户的初始的客户评估值，得到所述更新的训练样本集。

可选的，训练模块203还用于：基于所述更新的训练样本集中的新增数据对所述模型进行训练，得到更新好的模型。

图5所示的模型更新的装置200中的各个模块用于实现本申请实施例所提供的模型更新的方法中的各个步骤，因此，对于各个模块的实施方式与各个步骤的实施方式一一对应，为了说明书的简洁，在此不再重复介绍。

基于同一发明构思，本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被计算机运行时执行本申请实施例所提供的模型更新的方法中的任意步骤。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种模型更新的方法，其特征在于，包括：

在获取到新的还款数据时，获取待更新的训练样本集和根据所述训练样本集训练得到的模型；所述训练样本集中包括多个客户的还款信息，及每个客户的客户评估值；

根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集；

基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型；

所述客户评估值设置有惩罚权重，所述惩罚权重用于表征所述客户评估值的正确性；在根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集之后，所述方法还包括：

基于所述更新的训练样本集，更新所述惩罚权重；

对应的，基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型，包括：

基于所述更新的训练样本集、更新的惩罚权重对所述模型进行训练，得到更新好的模型；

基于所述更新的训练样本集，更新所述惩罚权重，包括：

根据所述更新的训练样本集中各个客户评估值更新的时间对所述各个客户评估值进行更新时间排序；

根据所述更新时间排序更新所述惩罚权重。

2.根据权利要求1所述的方法，其特征在于，所述还款信息设置有漂移权重，所述漂移权重用于表征所述还款信息的稳定性；在根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集之后，所述方法还包括：

基于所述更新的训练样本集，更新所述漂移权重；

基于所述更新的训练样本集、更新的漂移权重对所述模型进行训练，得到更新好的模型。

3.根据权利要求2所述的方法，其特征在于，每个客户的还款信息中包括多个还款特征，基于所述更新的训练样本集，更新所述漂移权重，包括：

获取每个还款特征在所述多个还款特征中的预期占比和实际占比；

根据所述预期占比和所述实际占比更新每个所述还款特征的漂移权重。

4.根据权利要求1所述的方法，其特征在于，所述还款信息设置有漂移权重，所述漂移权重用于表征所述还款信息的稳定性；在根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集之后，所述方法还包括：

基于所述更新的训练样本集，更新所述漂移权重；

基于所述更新的训练样本集、更新的惩罚权重、更新的漂移权重对所述模型进行训练，得到更新好的模型。

5.根据权利要求1所述的方法，其特征在于，根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集，包括：

根据所述还款数据对与所述还款数据相关的客户的所述还款信息以及所述客户评估值进行更新；

将所述相关的客户的更新的所述还款信息以及所述客户评估值加入到所述训练样本集中，得到所述更新的训练样本集。

6.根据权利要求1所述的方法，其特征在于，根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集，包括：

将所述相关的客户的更新的还款信息替换所述训练样本集中的所述相关的客户的初始的还款信息；以及

将所述相关的客户的更新的客户评估值替换所述训练样本集中的所述相关的客户的初始的客户评估值，得到所述更新的训练样本集。

7.根据权利要求1所述的方法，其特征在于，基于所述更新的训练样本集对所述模型进行训练，得到更新好的模型，包括：

基于所述更新的训练样本集中的新增数据对所述模型进行训练，得到更新好的模型。

8.一种模型更新的装置，其特征在于，包括：

获取模块，用于在获取到新的还款数据时，获取待更新的训练样本集和根据所述训练样本集训练得到的模型；所述训练样本集中包括多个客户的还款信息，及每个客户的客户评估值；所述客户评估值设置有惩罚权重，所述惩罚权重用于表征所述客户评估值的正确性；

更新模块，用于根据所述还款数据对所述训练样本集进行更新，得到更新的训练样本集；

训练模块，用于根据所述更新的训练样本集中各个客户评估值更新的时间对所述各个客户评估值进行更新时间排序；根据所述更新时间排序更新所述惩罚权重；

所述训练模块还用于基于所述更新的训练样本集、更新的惩罚权重对所述模型进行训练，得到更新好的模型。