WO2020024716A1

WO2020024716A1 - 一种针对新场景的预测模型训练方法及装置

Info

Publication number: WO2020024716A1
Application number: PCT/CN2019/091658
Authority: WO
Inventors: 张天翼; 陈明星; 郭龙
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2018-08-03
Filing date: 2019-06-18
Publication date: 2020-02-06
Also published as: TW202008237A; TWI818999B; CN109359793B; CN109359793A

Abstract

公开了一种针对新场景的预测模型训练方法及装置。一种针对新场景的预测模型训练方法，该方法包括：获得待迁移模型的集合；从所述待迁移模型的集合中选择至少一个模型，以用于对新场景中的无标签样本进行预测标注；获得新场景中的初始训练样本集；利用所选择的模型，为初始训练样本集中的无标签样本添加预测标签；利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，得到可适用于新场景的模型。

Description

一种针对新场景的预测模型训练方法及装置

技术领域

本说明书实施例涉及互联网应用技术领域，尤其涉及一种针对新场景的预测模型训练方法及装置。

背景技术

大数据时代可以基于积累的样本数据，通过机器学习训练模型，从而实现需要的决策功能。例如，在金融风险控制场景，可以将大量的交易数据作为样本数据，通过机器学习训练风控模型，从而可以使用所训练的风控模型，自动对新的交易进行风险决策等。

但是，在某些场景中，积累样本数据并训练模型，从而实现机器学习模型的部署，往往需要较长的时间，如风控模型的数据积累与训练一般需要半年以上。对此，一种解决方案是，在新场景中部署使用历史模型，该历史模型是基于其他场景中的历史数据所训练，但由于各场景样本数据间存在差异，历史模型应用于在新场景中的效果通常较差。

基于现有技术，需要更高效、更准确的针对新场景的预测模型训练方案。

发明内容

针对上述技术问题，本说明书实施例提供一种针对新场景的预测模型训练方法及装置，技术方案如下：

一种针对新场景的预测模型训练方法，该方法包括：

获得待迁移模型的集合，所述待迁移模型为：在旧场景部署使用、且可迁移至新场景的模型；

从所述待迁移模型的集合中选择至少一个模型，以用于对新场景中的无标签样本进行预测标注；

获得新场景中的初始训练样本集，所述初始训练样本集中包括无标签样本；

利用所选择的模型，为初始训练样本集中的无标签样本添加预测标签；

利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，得到可适用于新场景的模型。

一种针对新场景的预测模型训练装置，该装置包括：

待迁移模型获取模块，用于获得待迁移模型的集合，所述待迁移模型为：在旧场景部署使用、且可迁移至新场景的模型；

标注模型选取模块，用于从所述待迁移模型的集合中选择至少一个模型，以用于对新场景中的无标签样本进行预测标注；

样本集获取模块，用于获得新场景中的初始训练样本集，所述初始训练样本集中包括无标签样本；

样本标注模块，用于利用所选择的模型，为初始训练样本集中的无标签样本添加预测标签；

模型更新模块，用于利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，得到可适用于新场景的模型。

本说明书实施例所提供的技术方案，可以将旧场景中部署使用的模型迁移至新场景中，并且在新场景中样本积累时间较短，因而样本没有或只有少数实际标签的情况下，通过待迁移模型进行标签预测，从而进一步优化待迁移模型，使这些模型更适于在新场景中使用，为新场景提供一种更高效且更准确的预测模型训练方案。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书实施例。

此外，本说明书实施例中的任一实施例并不需要达到上述的全部效果。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本说明书实施例的针对新场景的预测模型训练方法的流程示意图；

图2是本说明书实施例的针对新场景的风控模型训练方法的流程示意图；

图3是本说明书实施例的针对新场景的预测模型训练装置的结构示意图；

图4是用于配置本说明书实施例装置的一种设备的结构示意图。

具体实施方式

为了使本领域技术人员更好地理解本说明书实施例中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行详细地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于保护的范围。

本说明书实施例提供一种针对新场景的预测模型训练方法，参见图1所示，该方法可以包括以下步骤：

S101，获得待迁移模型的集合；

由于新场景与旧场景的差异，在旧场景部署使用的各个模型，其中部分可能不适用于新场景，而部分可能适用于新场景，可以迁移至新场景，待迁移模型即为在旧场景部署使用、且可迁移至新场景的模型。

本说明书不限定获得待迁移模型的集合的具体方式。

在本说明书实施例中，可以比较旧场景中各个模型输入的特征向量、与新场景中训练样本可提取的特征向量，从而确定旧场景中各个模型是否可以迁移至新场景。具体地，首先获得第一特征集合，该集合中包括：预先确定的新场景训练样本可提取的若干特征向量；然后针对在旧场景部署使用的任一模型：获得第二特征集合，该集合中包括：该模型所输入的若干特征向量；在该模型符合预设迁移规则的情况下，将该模型确定为待迁移模型；所述预设迁移规则包括：第一特征集合与第二特征集合的交集中包括的特征向量满足预设迁移条件。

上述预设迁移条件具体可以通过多种形式，从多种角度比较第一特征集合与第二特征集合。

例如，预设迁移条件可以为：交集中包括的特征向量的数量不小于预设阈值，即通过比较第一特征集合与第二特征集合的交集中特征向量的数量，确定该模型是否可以迁移至新场景。如果交集中特征向量数量较少，则该模型在新场景中表现较差的概率较高，因而可以认为该模型不可以被迁移至新场景；反之，则认为该模型可以被迁移至新场景。

又例如，新场景中的某些特征向量对于模型训练较为重要，则可以在衡量旧场景中模型是否适合迁移到新场景时，重点考虑是否包括这些特征向量，因此，预设迁移条件可以为：根据交集中包括的各特征向量的预设权重计算的加权分值不小于预设阈值。对于模型训练较为重要的特征向量可以预设较高的权重，且越重要预设权重越高。从而，如果交集中包括的重要特征向量较高，则最终计算的加权分值也较高，并且可以认为该模型可以迁移至新场景。

预设迁移条件也可以为其他形式，并且各迁移条件可以单独使用，也可以搭配使用，本领域技术人员可以根据实际需求灵活地设定，本说明书对此不做具体限定。

此外，预设迁移规则中也可以包括其他具体规则。新场景中所训练的预测模型的类型，可以由研发人员预先根据经验或算法确定并指定，那么，为了在比较特征向量的基础上，进一步地衡量旧场景中各模型，可否迁移至新场景，在获得待迁移模型的集合时，还可以进一步地获得预先为新场景预测模型指定的至少一个类型，并且，预设迁移规则中还可以进一步包括：预先指定的至少一个类型中包括该模型的类型。

从特征向量及模型类型两个维度，确定旧场景中的某个模型，是否可以迁移至新场景，从而使迁移至新场景的模型可以通过进一步的训练，更好地应用于新场景。当然，预设迁移规则中也可以包括其他维度的规则，本说明书实施例对此不做限定。

当然，也可以由研发人员指定旧场景迁移至新场景的待迁移模型，并且研发人员在指定时，也可以根据经验或算法，通过从特征向量、模型类型等维度，衡量各个模型是否可以迁移至新场景、以及迁移后的表现、等等。

S102，从所述待迁移模型的集合中选择至少一个模型，以用于对新场景中的无标签样本进行预测标注；

S103，获得新场景中的初始训练样本集，所述初始训练样本集中包括无标签样本；

S104，利用所选择的模型，为初始训练样本集中的无标签样本添加预测标签；

为了便于描述，将S102至S104结合进行说明。

基于有监督学习训练样本时，需要训练样本为有标签样本。训练样本通常可以通过多种方式标注标签。例如，可以人工进行标注，且人工标注通常较为准确，但是用于模型训练的训练样本数据量通常很大，人工标注效率较低；又如，部分场景中可以根据实际情况产生标签，如信用卡风控场景中，当银行核实某信用卡被盗后，该信用卡及对应交易均可以被标注为黑样本，但这种场景中短期内可能无法获得黑样本标签。

本说明书实施例中，从待迁移模型的集合中选择至少一个模型，用于对新场景中的无标签样本进行预测标注，从而提高标注效率、缩短标注周期。

各个待迁移模型均为可迁移至新场景的模型，但具体地，由于各模型输入的特征向量与模型类型等存在区别，其中部分模型可以直接较好地应用于新场景，而部分模型则需要更新后才可以较好地应用于新场景，因此，可以从待迁移模型的集合中，选择在新场景中表现较好的部分模型，用于预测标注。

从所述待迁移模型的集合中选择至少一个模型具体可以通过多种方式实现。

在本说明书实施例中，可以首先获得第三特征集合，该集合中包括：预先指定的用于预测新场景中样本标签的若干特征向量；然后获得各待迁移模型对应的各特征集合，其中任一特征集合中包括：对应模型所输入的若干特征向量；根据预设选择规则，从所述待迁移模型的集合中，选择至少一个模型。

与S101中确定待迁移模型类似地，在选择用于预测标注的模型时，也可以从交集中特征向量的数量、重要特征向量的数量、及模型类型是否相同等维度，衡量是否选择某个模型用于预测标注，本说明书在此不再赘述。

此外，仅通过数量或加权分值是否大于预设阈值、模型类型是否相同等硬性条件，可能会出现待迁移模型的集合中，不存在符合预设选择规则的模型的情况，因此，还可以预设各种优先级排序条件，并根据排序结果，选择1个或多个模型用于预测标注。

如S101所述，待迁移模型可以由研发人员指定，而本步骤中从待迁移模型的集合中，选择用于对新场景中的无标签样本进行预测标注的模型时，也可以由研发人员根据经验或算法进行选择，在此不再赘述。

新场景中的初始训练样本集中，可以包括需要被标注预测标签的无标签样本，也可以包括已标注实际标签的有标签样本(可以为白样本和/或黑样本)，所选择的模型用于对无标签样本进行预测标注。

具体可以通过多种方式添加预测标签。

在本说明书实施例中，可以预先设定不同数值与不同预测标签的对应关系，如数值大于或小于某预设值时，对应黑样本标签，反之对应白样本标签等。对于所选择的任一模型：将初始训练样本集中的无标签样本输入该模型，得到输出的预测值；对于所输入的任一无标签样本：确定各模型输出的预测值的权重；计算各预测值的加权和，并确定该加权和对应的预测标签；为该无标签样本添加该预测标签。

例如，如果仅从待迁移模型的集合中，选择了1个模型进行预测标注，则可以直接根据该模型输出的预测值(即等于加权和)，得到对应的预测标签。

又如，如果从待迁移模型的集合中，选择了多个模型进行预测标注，则可以预先设定各模型输出值对应的权重，如表现更好的模型对应权重更高或更低，当然，也可以预先设定各模型权重相同，即相当于未对各模型设定权重。

此外，利用所选择的模型添加的预测标签，还可以通过人工检查及修正，以提高预测标签的准确度。

对于上述情况，本领域可以根据实际情况灵活地设定，本说明书不做限定。

S105，利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，得到可适用于新场景的模型。

对待迁移模型进行更新时，可以仅将初始训练样本集中，已添加预测标签的训练样本输入待迁移模型。

如果新场景中所积累的训练样本数量较少，还可以获得旧场景中的训练样本集，该训练样本集中包括已添加实际标签的有标签样本；将新场景中的初始样本集与旧场景中的训练样本集合并，利用合并后的训练样本集，基于有监督学习算法，对待迁移模型进行更新。

旧场景中已经积累了大量的训练样本，且训练样本为已添加实际标签的有标签样本，因此可以在新场景中所积累的训练样本数量较少的情况下，用于辅助新场景中对待迁移模型进行更新。

当然，旧场景中的训练样本，并不一定完全适用于新场景的模型更新，其中可能有部分样本与新场景中的训练样本相似度较高，而其他样本的相似度较低，因此可以为新场景中的初始样本集与旧场景中的训练样本集合并后的训练样本集中的不同训练样本，预设不同的权重。

例如，初始样本集中的各训练样本权重最高，旧场景中的训练样本集中，与初始样本集中的各训练样本相似度较高的各训练样本权重次之，而相似度较低的各训练样本权重最低。

此外，随着时间的推移，新场景中也将积累到已添加实际标签的有标签样本，从而构成优化训练样本集，可以获得新场景中的优化训练样本集，所述优化训练样本集中包括已添加实际标签的有标签样本；将已添加预测标签的初始训练样本集与已添加实际标签的优化训练样本集合并，利用合并后的训练样本集，基于有监督学习算法，对待迁移模型进行更新。

可以理解的是，根据新场景对预测模型的需求，各个待迁移模型可以直接应用于新场景中，并在应用的同时按照本方案进行更新，得到更适用于新场景的模型，也可以经过一段时间的更新后，再应用于新场景中，并且还可以在应用之后继续进行更新，本说明书不做限定。

下面结合一个更为具体的实例，对本说明书提供的针对新场景的预测模型训练方法进行说明。

金融风险控制领域，可以将积累的大量交易数据作为样本数据，通过机器学习训练风控模型，从而可以基于所训练的风控模型，及时、准确地对新的交易进行风险决策等。

但是，在新场景中建立风险控制模型时，积累训练模型所需的大量样本数据，往往需要较长的时间。例如，样本数据量通常与新场景的交易量及累计时间有关，此外，样本训练集中需要包括一定量的黑样本数据，而以信用卡盗卡等情况作为黑样本数据时，由于银行对盗卡业务处理时间较长等原因，使得短时间内无法积累到训练所需的黑样本数据量。

针对上述问题，可以将旧场景中已有的风控模型，迁移到新场景中。

新场景与旧场景可以为不同国家、地区的交易市场，旧场景中部署使用的风控模型可以包括：盗卡风控模型、盗账户风控模型、隐案识别模型、等等，并且这些风控模型可以是基于多个国家、地区的交易数据训练得到。

如图2所示，可以预先在云端，基于从各个旧场景中集中的数据，训练可在新、旧场景中部署使用的多个模型。

其中，盗卡风控模型与盗账户风控模型，分别针对盗信用卡与盗支付账户的情况进行风险控制，并且可以通过有监督学习训练。

隐案识别模型通过输入针对性更强的特征向量，用于识别银行尚未定为案件(即，非显案)、但具备案件特征的交易。

例如，如果同一台设备(如手机)、或同一网络环境等，同时使用多个信用卡或支付账户，则该设备或环境中存在批量盗卡、盗账户的风险较高；又例如，对于已被列为黑名单的设备、账户、信用卡、网络环境等，与之发生关联的设备、账户、信用卡、网络环境等，存在盗卡、盗账户的风险也较高；在例如，进行了异常交易(如交易量、交易时间、交易地点等异常)的设备、账户、信用卡、网络环境等，存在盗卡、盗账户的风险也较高；隐案识别模型可以基于上述特征，将对应的交易识别为黑样本。

并且，隐案识别模型可以通过无监督学习训练，从而可以应用于尚无实际案件(标签)的场景。

当新场景中需要部署盗卡风控模型、盗账户风控模型及隐案识别模型时，可以以模型文件的形式，将上述模型下发到新场景本地。并且，本地可以直接使用所部署的模型，对交易事件进行打分、进行风险决策等。

云端下发部署的模型，是通过多个国家、地区的训练样本训练得到，其优点是训练样本全面，通用性较强，而其缺点是与通过新场景本地的数据训练的全新模型相比，并非完全适用于新场景，因此，还需要在新场景积累一定训练样本后，更新这些模型。

各模型部署到新场景本地并使用后，从训练样本积累的角度，可以分为多个阶段。

在第一阶段中，可以认为新场景中积累时间较短，如在部署后的1个周内，积累的训练样本较少，且各样本均无标签，无法进行模型的更新。因此，在第一阶段中，使用云端训练并且未更新的各模型，对新场景中的交易进行风控决策。

在第二阶段中，如在部署后的1个周至1个月之间，可以认为新场景中积累了一定量的训练样本，构成初始训练样本集，如果结合云端下发的旧场景中的大量训练数据，可以对各模型进行更新。但是，由于金融机构处理盗卡、盗账户的周期较长，此时还未积累到带有实际标签的有标签样本，因此可以通过隐案识别模型，为初始训练样本集添加预测样本。

此外，可以对新、旧场景中的训练样本设置不同的权重，例如，新场景为马来西亚的市场，旧场景包括泰国、美国、日本等市场，其中，泰国与马来西亚的消费水平、习惯更接近，交易数据相似度更高，而美国、日本与马来西亚的交易数据相似度更低。因此，可以为马来西亚本地积累的训练样本设置最高的权重，为来自泰国的训练样本设置较高的权重，而为来自美国、日本的训练样本设置更低的权重。从而，通过动态加权的方式，可以在新场景中数据较少的情况下，使更新训练后的各模型更适于新场景。

在第二阶段中更新后的各模型，仍可以用于新场景的交易决策。

在第三阶段中，如在部署1个月之后，可以认为新场景中已经积累了足够量的训练样本，并且积累到了带有实际标签的有标签样本，则可以进一步地更新各模型。更新所使用的训练样本，可以仅包括新场景中、带有实际标签的训练样本，也可以包括新场景中、带有隐案识别模型添加的预测标签的训练样本，还可以包括旧场景中的大量训练样本，等等。

除了通过云端预先训练的模型及积累的数据，在新场景中部署与更新风控模型，新场景中所积累的数据，也可以上传至云端，以用于更新已有模型、训练其他新模型，并部署到其他新场景等。

可见，应用上述方案，可以将旧场景中部署使用的模型迁移至新场景中，并且在新场景中样本积累时间较短，因而样本没有或只有少数实际标签的情况下，通过待迁移模型进行标签预测，从而进一步优化待迁移模型，使这些模型更适于在新场景中使用，为新场景提供一种更高效且更准确的预测模型训练方案。

相应于上述方法实施例，本说明书实施例还提供一种针对新场景的预测模型训练装置，参见图3所示，该装置可以包括：

待迁移模型获取模块110，用于获得待迁移模型的集合，所述待迁移模型为：在旧场景部署使用、且可迁移至新场景的模型；

标注模型选取模块120，用于从所述待迁移模型的集合中选择至少一个模型，以用于对新场景中的无标签样本进行预测标注；

样本集获取模块130，用于获得新场景中的初始训练样本集，所述初始训练样本集中包括无标签样本；

样本标注模块140，用于利用所选择的模型，为初始训练样本集中的无标签样本添加预测标签；

模型更新模块150，用于利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，得到可适用于新场景的模型。

在本说明书提供的一种具体实施方式中，所述待迁移模型获取模块110，可以包括：

待迁移特征获取单元111，用于获得第一特征集合，该集合中包括：预先确定的新场景训练样本可提取的若干特征向量；针对在旧场景部署使用的任一模型：获得第二特征集合，该集合中包括：该模型所输入的若干特征向量；

待迁移模型选取单元112，用于在该模型符合预设迁移规则的情况下，将该模型确定为待迁移模型；所述预设迁移规则包括：第一特征集合与第二特征集合的交集中包括的特征向量满足预设迁移条件。

在本说明书提供的一种具体实施方式中，所述预设迁移条件可以包括：

交集中包括的特征向量的数量不小于预设阈值；和/或根据交集中包括的各特征向量的预设权重计算的加权分值不小于预设阈值。

在本说明书提供的一种具体实施方式中，所述待迁移模型获取模块110，还可以包括：待迁移类型获取单元113，用于获得预先为新场景预测模型指定的至少一个类型；

所述预设迁移规则，还可以包括：预先指定的至少一个类型中包括该模型的类型。

在本说明书提供的一种具体实施方式中，所述标注模型选取模块120，可以包括：

标注特征获取单元121，用于获得第三特征集合，该集合中包括：预先指定的用于预测新场景中样本标签的若干特征向量；获得各待迁移模型对应的各特征集合，其中任一特征集合中包括：对应模型所输入的若干特征向量；

标注模型选取单元122，用于根据预设选择规则，从所述待迁移模型的集合中，选择至少一个模型。

在本说明书提供的一种具体实施方式中，所述样本标注模块140，可以包括：

预测值确定单元141，用于对于所选择的任一模型：将初始训练样本集中的无标签样本输入该模型，得到输出的预测值；

预测标签确定单元142，用于对于所输入的任一无标签样本：确定各模型输出的预测值的权重；计算各预测值的加权和，并确定该加权和对应的预测标签；为该无标签样本添加该预测标签。

在本说明书提供的一种具体实施方式中，所述样本集获取模块130，还可以用于：获得新场景中的优化训练样本集，所述优化训练样本集中包括已添加实际标签的有标签样本；

所述模型更新模块150，具体可以用于：将已添加预测标签的初始训练样本集与已添加实际标签的优化训练样本集合并，利用合并后的训练样本集，基于有监督学习算法，对待迁移模型进行更新。

在本说明书提供的一种具体实施方式中，所述样本集获取模块130，还可以用于：获得旧场景中的训练样本集，该训练样本集中包括已添加实际标签的有标签样本；

所述模型更新模块150，具体可以用于：将新场景中的初始样本集与旧场景中的训练样本集合并，利用合并后的训练样本集，基于有监督学习算法，对待迁移模型进行更新。

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

本说明书实施例还提供一种计算机设备，其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，处理器执行所述程序时实现前述的针对新场景的预测模型训练方法。该方法至少包括：

图4示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图，该设备可以包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory，只读存储器)、RAM(Random Access Memory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

本说明书实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述的针对新场景的预测模型训练方法。该方法至少包括：

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本说明书实施例的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本说明书实施例原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本说明书实施例的保护范围。

Claims

一种针对新场景的预测模型训练方法，该方法包括：

获得待迁移模型的集合，所述待迁移模型为：在旧场景部署使用、且可迁移至新场景的模型；

从所述待迁移模型的集合中选择至少一个模型，以用于对新场景中的无标签样本进行预测标注；

获得新场景中的初始训练样本集，所述初始训练样本集中包括无标签样本；

利用所选择的模型，为初始训练样本集中的无标签样本添加预测标签；

利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，得到可适用于新场景的模型。
根据权利要求1所述的方法，所述获得待迁移模型的集合，包括：

获得第一特征集合，该集合中包括：预先确定的新场景训练样本可提取的若干特征向量；

针对在旧场景部署使用的任一模型：

获得第二特征集合，该集合中包括：该模型所输入的若干特征向量；

在该模型符合预设迁移规则的情况下，将该模型确定为待迁移模型；所述预设迁移规则包括：第一特征集合与第二特征集合的交集中包括的特征向量满足预设迁移条件。
根据权利要求2所述的方法，所述预设迁移条件包括：

交集中包括的特征向量的数量不小于预设阈值；

和/或

根据交集中包括的各特征向量的预设权重计算的加权分值不小于预设阈值。
根据权利要求2所述的方法，

所述获得待迁移模型的集合，还包括：获得预先为新场景预测模型指定的至少一个类型；

所述预设迁移规则，还包括：预先指定的至少一个类型中包括该模型的类型。
根据权利要求1所述的方法，所述从所述待迁移模型的集合中选择至少一个模型，包括：

获得第三特征集合，该集合中包括：预先指定的用于预测新场景中样本标签的若干特征向量；

获得各待迁移模型对应的各特征集合，其中任一特征集合中包括：对应模型所输入的若干特征向量；

根据预设选择规则，从所述待迁移模型的集合中，选择至少一个模型。
根据权利要求1所述的方法，所述利用所选择的模型，为初始训练样本集中的无标签样本添加预测标签，包括：

对于所选择的任一模型：将初始训练样本集中的无标签样本输入该模型，得到输出的预测值；

对于所输入的任一无标签样本：确定各模型输出的预测值的权重；计算各预测值的加权和，并确定该加权和对应的预测标签；为该无标签样本添加该预测标签。
根据权利要求1所述的方法，所述利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，包括：

获得新场景中的优化训练样本集，所述优化训练样本集中包括已添加实际标签的有标签样本；

将已添加预测标签的初始训练样本集与已添加实际标签的优化训练样本集合并，利用合并后的训练样本集，基于有监督学习算法，对待迁移模型进行更新。
根据权利要求1所述的方法，所述利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，包括：

获得旧场景中的训练样本集，该训练样本集中包括已添加实际标签的有标签样本；

将新场景中的初始样本集与旧场景中的训练样本集合并，利用合并后的训练样本集，基于有监督学习算法，对待迁移模型进行更新。
一种针对新场景的预测模型训练装置，该装置包括：

待迁移模型获取模块，用于获得待迁移模型的集合，所述待迁移模型为：在旧场景部署使用、且可迁移至新场景的模型；

标注模型选取模块，用于从所述待迁移模型的集合中选择至少一个模型，以用于对新场景中的无标签样本进行预测标注；

样本集获取模块，用于获得新场景中的初始训练样本集，所述初始训练样本集中包括无标签样本；

样本标注模块，用于利用所选择的模型，为初始训练样本集中的无标签样本添加预测标签；

模型更新模块，用于利用已添加预测标签的初始训练样本集，基于有监督学习算法，对待迁移模型进行更新，得到可适用于新场景的模型。
根据权利要求9所述的装置，所述待迁移模型获取模块，包括：

待迁移特征获取单元，用于获得第一特征集合，该集合中包括：预先确定的新场景训练样本可提取的若干特征向量；针对在旧场景部署使用的任一模型：获得第二特征集合，该集合中包括：该模型所输入的若干特征向量；

待迁移模型选取单元，用于在该模型符合预设迁移规则的情况下，将该模型确定为待迁移模型；所述预设迁移规则包括：第一特征集合与第二特征集合的交集中包括的特征向量满足预设迁移条件。
根据权利要求10所述的装置，所述预设迁移条件包括：

交集中包括的特征向量的数量不小于预设阈值；

和/或

根据交集中包括的各特征向量的预设权重计算的加权分值不小于预设阈值。
根据权利要求10所述的装置，

所述待迁移模型获取模块，还包括：待迁移类型获取单元，用于获得预先为新场景预测模型指定的至少一个类型；

所述预设迁移规则，还包括：预先指定的至少一个类型中包括该模型的类型。
根据权利要求9所述的装置，所述标注模型选取模块，包括：

标注特征获取单元，用于获得第三特征集合，该集合中包括：预先指定的用于预测新场景中样本标签的若干特征向量；获得各待迁移模型对应的各特征集合，其中任一特征集合中包括：对应模型所输入的若干特征向量；

标注模型选取单元，用于根据预设选择规则，从所述待迁移模型的集合中，选择至少一个模型。
根据权利要求9所述的装置，所述样本标注模块，包括：

预测值确定单元，用于对于所选择的任一模型：将初始训练样本集中的无标签样本输入该模型，得到输出的预测值；

预测标签确定单元，用于对于所输入的任一无标签样本：确定各模型输出的预测值的权重；计算各预测值的加权和，并确定该加权和对应的预测标签；为该无标签样本添加该预测标签。
根据权利要求9所述的装置，

所述样本集获取模块，还用于：获得新场景中的优化训练样本集，所述优化训练样本集中包括已添加实际标签的有标签样本；

所述模型更新模块，具体用于：将已添加预测标签的初始训练样本集与已添加实际标签的优化训练样本集合并，利用合并后的训练样本集，基于有监督学习算法，对待迁移模型进行更新。
根据权利要求9所述的装置，

所述样本集获取模块，还用于：获得旧场景中的训练样本集，该训练样本集中包括已添加实际标签的有标签样本；

所述模型更新模块，具体用于：将新场景中的初始样本集与旧场景中的训练样本集合并，利用合并后的训练样本集，基于有监督学习算法，对待迁移模型进行更新。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现如权利要求1至8任一项所述的方法。