CN115937617B

CN115937617B - 一种风险识别模型训练、风险控制方法、装置和设备

Info

Publication number: CN115937617B
Application number: CN202310230066.9A
Authority: CN
Inventors: 王立; 王维强
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2023-03-06
Filing date: 2023-03-06
Publication date: 2023-05-30
Anticipated expiration: 2043-03-06
Also published as: CN115937617A

Abstract

本说明书实施例公开了一种风险识别模型训练、风险控制方法、装置和设备，所述风险识别模型训练方法可在初始化第一风险识别模型和第二风险识别模型后；先采用标签准确性高的历史交易事件的特征数据对所述第一风险识别模型进行预训练；然后在所述第一风险识别模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的历史交易事件和标签准确性低的历史交易事件。所述训练方法可以兼顾风险识别模型的准确性和鲁棒性，从而能持续稳定地对不同交易事件进行风险识别，并且能得出准确的识别结果，避免出现误漏识别或误识别，提升了网络交易的安全性。

Description

一种风险识别模型训练、风险控制方法、装置和设备

技术领域

本文件涉及计算机技术领域，尤其涉及一种风险识别模型训练、风险控制方法、装置和设备。

背景技术

在网络交易事件的风控场景下，用于训练风险识别模型的样本的标签很多时候是不准的（不纯的），有噪音的，或者，标签准确性高的样本的数量不足。如果选用标签不准的样本训练分类模型，会导致风险识别模型的识别结果不准确。如果仅选用准确性高的样本训练风险识别模型，又会因样本量不足带来模型的鲁棒性差的问题。

因此，亟需提出一种能够对样本进行提纯的风险识别模型训练方案，以兼顾风险识别模型的准确性和鲁棒性。

发明内容

本说明书实施例提供了一种风险识别模型训练、风险控制方法、装置和设备，以兼顾风险识别模型的准确性和鲁棒性。

第一方面，提出了一种分类模型训练方法，包括：

初始化第一分类模型和第二分类模型；

采用标签准确性高的样本的特征数据对所述第一分类模型进行预训练；

在所述第一分类模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的样本和标签准确性低的样本。

第二方面，提出了一种分类方法，包括：

获取待分类对象的特征数据；

将所述待分类对象的特征数据输入第一分类模型和/或第二分类模型，其中，所述第一分类模型和所述第二分类模型是基于如第一方面所述的方法训练得到的；

基于所述第一分类模型和/或所述第二分类模型的输出确定所述待分类对象的分类结果。

第三方面，提出了一种风险识别模型训练方法，包括：

初始化第一风险识别模型和第二风险识别模型；

采用标签准确性高的历史交易事件的特征数据对所述第一风险识别模型进行预训练；

在所述第一风险识别模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的历史交易事件和标签准确性低的历史交易事件。

第四方面，提出了一种风险控制方法，包括：

获取目标交易事件的特征数据；

将所述目标交易事件的特征数据输入第一风险识别模型和/或第二风险识别模型，其中，所述第一风险识别模型和所述第二风险识别模型是基于如第三方面所述的方法训练得到的；

基于所述第一风险识别模型和/或所述第二风险识别模型的输出，确定所述目标交易事件的风险识别结果；

基于所述风险识别结果对所述目标交易事件进行风控。

第五方面，提出了一种图片分类模型训练方法，包括：

初始化第一分类模型和第二分类模型；

采用标签准确性高的样本图片对所述第一分类模型进行预训练；

在所述第一分类模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的样本图片和标签准确性低的样本图片。

第六方面，提出了一种图片分类方法，包括：

获取待分类图片；

将所述待分类图片输入第一分类模型和/或第二分类模型，其中，所述第一分类模型和所述第二分类模型是基于如第五方面所述的方法训练得到的；

基于所述第一分类模型和/或所述第二分类模型的输出确定所述待分类图片的分类结果。

第七方面，提出了一种分类模型训练装置，包括：

初始化模块，初始化第一分类模型和第二分类模型；

预训练模块，采用标签准确性高的样本的特征数据对所述第一分类模型进行预训练；

互学习模块，在所述第一分类模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的样本和标签准确性低的样本。

第八方面，提出了一种分类装置，包括：

数据获取模块，获取待分类对象的特征数据；

数据输入模块，将所述待分类对象的特征数据输入第一分类模型和/或第二分类模型，其中，所述第一分类模型和所述第二分类模型是基于如第一方面所述的方法训练得到的；

分类结果确定模块，基于所述第一分类模型和/或所述第二分类模型的输出确定所述待分类对象的分类结果。

第九方面，提出了一种风险识别模型训练装置，包括：

初始化模块，初始化第一风险识别模型和第二风险识别模型；

预训练模块，采用标签准确性高的历史交易事件的特征数据对所述第一风险识别模型进行预训练；

互学习模块，在所述第一风险识别模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的历史交易事件和标签准确性低的历史交易事件。

第十方面，提出了一种风险控制装置，包括：

数据获取模块，获取目标交易事件的特征数据；

数据输入模块，将所述目标交易事件的特征数据输入第一风险识别模型和/或第二风险识别模型，其中，所述第一风险识别模型和所述第二风险识别模型是基于如第三方面所述的方法训练得到的；

风险确定模块，基于所述第一风险识别模型和/或所述第二风险识别模型的输出，确定所述目标交易事件的风险识别结果；

风控模块，基于所述风险识别结果对所述目标交易事件进行风控。

第十一方面，提出了一种图片分类模型训练装置，包括：

初始化模块，初始化第一分类模型和第二分类模型；

预训练模块，采用标签准确性高的样本图片对所述第一分类模型进行预训练；

互学习模块，在所述第一分类模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的样本图片和标签准确性低的样本图片。

第十二方面，提出了一种图片分类装置，包括：

图片获取模块，获取待分类图片；

图片输入模块，将所述待分类图片输入第一分类模型和/或第二分类模型，其中，所述第一分类模型和所述第二分类模型是基于如第五方面所述的方法训练得到的；

分类结果确定模块，基于所述第一分类模型和/或所述第二分类模型的输出确定所述待分类图片的分类结果。

第十三方面，提出了一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行以下操作：

初始化第一分类模型和第二分类模型；

第十四方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

初始化第一分类模型和第二分类模型；

第十五方面，提出了一种电子设备，包括：

处理器；以及

获取待分类对象的特征数据；

第十六方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

获取待分类对象的特征数据；

第十七方面，提出了一种电子设备，包括：

处理器；以及

初始化第一风险识别模型和第二风险识别模型；

第十八方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

初始化第一风险识别模型和第二风险识别模型；

第十九方面，提出了一种电子设备，包括：

处理器；以及

获取目标交易事件的特征数据；

基于所述风险识别结果对所述目标交易事件进行风控。

第二十方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

获取目标交易事件的特征数据；

基于所述风险识别结果对所述目标交易事件进行风控。

第二十一方面，提出了一种电子设备，包括：

处理器；以及

初始化第一分类模型和第二分类模型；

第二十二方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

初始化第一分类模型和第二分类模型；

第二十三方面，提出了一种电子设备，包括：

处理器；以及

获取待分类图片；

第二十四方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

获取待分类图片；

本说明书实施例提供的以上至少一个技术方案，一方面，由于在互学习前，采用标签准确性高的样本对第一风险识别模型进行了预训练，使第一风险识别模型在互学习前就具备比较好的准确性，而不是直接进行互学习，因此可以有效避免随机初始化带来的初始误差，从而避免互学习时多次迭代后可能出现的误差累计情况；另一方面，由于互学习本身具有较优的标签低准样本提纯性能，再加上互学习开始时第一风险识别模型已经具备比较好的准确性，因此可以起到利用标签高准样本带动标签低准样本进行提纯的作用，从而使得标签高准样本逐渐增多，提升两个风险识别模型的鲁棒性，最终取得准确性和鲁棒性兼顾的有益效果。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本说明书实施例提供的一种分类模型训练方法的流程示意图。

图2A是本说明书实施例提供的一种互学习框架示意图。

图2B是本说明书实施例提供的一种分类模型训练方法的原理示意图。

图3是本说明书实施例提供的一种分类方法的流程示意图。

图4是本说明书实施例提供的一种风险识别模型训练方法的流程示意图。

图5是本说明书实施例提供的一种风险控制方法的流程示意图。

图6是本说明书实施例提供的一种图片分类模型训练方法的流程示意图。

图7是本说明书实施例提供的一种图片分类方法的流程示意图。

图8是本说明书一实施例提供的一种电子设备的结构示意图。

图9是本说明书实施例提供的一种分类模型训练装置的结构示意图。

图10是本说明书实施例提供的一种分类装置的结构示意图。

图11是本说明书实施例提供的一种风险识别模型训练装置的结构示意图。

图12是本说明书实施例提供的一种风控装置的结构示意图。

图13是本说明书实施例提供的一种图片分类模型训练装置的结构示意图。

图14是本说明书实施例提供的一种图片分类装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本文件保护的范围。

为了能够对样本进行提纯，以兼顾分类模型的准确性和鲁棒性，本说明书实施例提供一种分类模型训练方法和装置，以及一种分类方法和装置。这些方法和装置可以由电子设备执行，或者由安装在电子设备中的软件或硬件设备执行。这里的电子设备包括但不限于终端设备和服务器，所述终端设备包括但不限于：智能手机、个人电脑（personalcomputer，PC）、笔记本电脑、平板电脑、电子阅读器、网络电视、可穿戴设备等智能终端设备中的任一种，所述服务器包括但不限于：单台服务器、多台服务器、服务器集群以及云服务器中的任一种。

为了便于理解本说明书实施例提出的技术方案，下面先对本说明书实施例涉及的一些术语进行解释。

互学习（co-teaching），是指一种通过同时维护两个模型进行相互学习的机器学习方法，该方法常用于解决标签不纯（不准）的问题。

样本提纯是指从标签不纯的样本中提取标签准确性高的样本的技术。

标签准确性高的样本可以简称为高准样本。如果一个样本的标签的置信度较高（比如置信度高于预设的阈值），则认为该样本是一个高准样本。

标签准确性低的样本可以简称为低准样本。如果一个样本的标签的置信度较低（比如置信度低于预设的阈值），则认为该样本是一个低准样本。低准样本也称为弱标签样本。

下面对本说明书实施例提供的一种分类模型训练方法进行说明。

如图1所示，本说明书实施例提出的一种分类模型训练方法，可以包括：

步骤102、初始化第一分类模型和第二分类模型。

在步骤102中，可采用随机初始化的方式对第一分类模型和第二分类模型进行初始化。第一分类模型和第二分类模型所采用的分类算法相同。作为一个例子，第一分类模型和第二分类模型均可以是神经网络模型。当然，第一分类模型和第二分类模型还可以是其他分类模型，本说明书实施例对此不做限制。

步骤104、采用标签准确性高的样本的特征数据对所述第一分类模型进行预训练。

在不同的应用场景下，样本和样本的特征数据可能是不一样的。比如，在网络交易场景的网络账户转账这一具体业务场景下，样本可能是历史转账事件，标签准确性高的黑样本可能是交易系统外部机构（如第三方权威机构）提供的历史转账事件、交易系统收到投诉或举报的历史转账事件，样本的特征数据可以是与风险有关的特征，比如样本的特征数据可以包括：是否是向同名卡转账、是否是向同姓用户转账、转账时间、是否是向境外转账、账户余额以及银行标识代码（Bank Identification Number，BIN）等特征中的一项或多项。再如，在图片分类场景下，样本就是标注好的图片，样本的特征数据就是图片的特征数据。

可以理解，在互学习前，采用标签准确性高的样本对第一分类模型进行预训练，而不是直接进行互学习，可以使第一分类模型在互学习前就具备比较好的准确性，因此可以有效避免随机初始化带来的初始误差，从而避免互学习时多次迭代后可能出现的误差累计情况。

可选的，对于第二分类模型，可以不进行预训练，而是保持初始化状态。

步骤106、在所述第一分类模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的样本和标签准确性低的样本。

图2A示出了本说明书实施例提供的一种互学习框架示意图。如图2A所示，假设A表示第一分类模型，B表示第二分类模型，那么，A和B互学习的过程可包括：先随机初始化A和B；然后分别向A和B输入训练样本的特征数据以对A和B进行训练，具体的，为了得到A的训练梯度，可先采用B对当前一批（batch）训练样本进行预测，选取其中一定比例（例如30%）更接近标签的样本，作为B认为高准的样本，然后将这些样本作为A网络的训练样本对A的梯度进行迭代；同样的，可先采用A对当前一批（batch）训练样本进行预测，选取其中一定比例（例如30%）更接近标签的样本，作为A认为高准的样本，然后将这些样本作为B网络的训练样本对B的梯度进行迭代。在这个过程中，A和B同时基于对方认为高准的样本进行训练直到模型收敛。

此外，如图2A所示，在不同的学习轮次中，可选取不同批次的样本，例如，在第一轮训练中，选取第一批训练样本（Mini-batch1）；在第二轮训练中，选取第二批训练样本（Mini-batch2）；在第三轮训练中，选取第三批训练样本（Mini-batch3），以此类推，不再赘述。

具体的，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，可包括：

步骤1、分别向所述第一分类模型和所述第二分类模型输入一批训练样本的特征数据，预测得到所述一批训练样本对应的分类结果，其中，所述一批训练样本既包括标签准确性高的样本又包括标签准确性低的样本。同时，所述一批训练样本中既包括黑样本也包括白样本，且白样本和黑样本的比例可根据需要设定。一般而言，黑样本的数量远低于白样本的数量，比如黑白样本的比例可以为1:100。

同样以网络交易中的网络账户转账这一场景为例，所述一批训练样本中的高准黑样本可来自于显性案件，所述一批训练样本中的低准黑样本可来自于隐性案件。

步骤2、基于所述第一分类模型对所述一批训练样本的分类结果，从所述一批训练样本中选出第一部分样本，基于所述第一部分样本的特征数据对所述第二分类模型进行迭代训练，其中，所述第一部分样本是所述第一分类模型认为标签准确性高的样本。

步骤3、基于所述第二分类模型对所述一批训练样本的分类结果，从所述一批训练样本中选出第二部分样本，基于所述第二部分样本的特征数据对所述第一分类模型进行迭代训练，其中，所述第二部分样本是所述第二分类模型认为标签准确性高的样本。

上述步骤1、步骤2和步骤3是对一轮互学习过程的描述。

可选的，在第一个例子中，在互学习的各轮学习中，所述第一部分样本的数量与所述第二部分样本的数量可以相当，且在不同轮次的互学习中，所述第一部分样本的数量可以相同（比如每轮选取所述一批训练样本中的固定比例（如30%）的样本）也可以不同（比如选取比例随训练轮次的增加而增大），同样的，在不同轮次的互学习中，所述第二部分样本的数量可以相同（比如每轮选取所述一批训练样本中的固定比例（如30%）的样本）也可以不同（比如选取比例随训练轮次的增加而增大）。

进一步的，在上述第一个例子中，所述第一分类模型和所述第二分类模型在互学习中的学习速率可以一致。

可选的，在第二个例子中，在互学习的第一轮学习中，所述第一部分样本的数量可以大于所述第二部分样本的数量，且随学习轮数的增加，所述第一部分样本的数量逐渐减少，所述第二部分样本的数量逐渐增多，直到所述第一部分样本的数量与所述第二部分样本的数量相当。

进一步的，在上述第二个例子中，所述第一分类模型在互学习中的学习速率与所述第二部分样本的数量正相关；所述第二分类模型在互学习中的学习速率与所述第一部分样本的数量正相关。

比如，在上述第二个例子中，可以从选取的高准样本比例以及学习速率两方面入手，在第一轮互学习中，可以从第二分类模型认为高准的样本中挑选1%对第一分类模型进行迭代训练，同时，第一分类模型的学习速率也等比例缩小，然后随学习轮数的增加，慢慢调整到从第二分类模型认为高准的样本中挑选30%对第一分类模型进行迭代训练，学习速率也逐步恢复；相应的，在第一轮互学习中，可以从第一分类模型认为高准的样本中挑选60%对第二分类模型进行迭代训练，同时，第二分类模型的学习速率也等比例增大，然后随学习轮数的增加，慢慢调整到从第一分类模型认为高准的样本中挑选30%对第二分类模型进行迭代训练，学习速率也逐步降低。

可以看出，相比于上述第一个例子，在上述第二个例子中，在第一分类模型和第二分类模型的互学习过程中，第一分类模型一开始处于微调状态（采用少量第二分类模型认为高准的样本对第一分类模型进行迭代），随后随学习轮数的增加逐渐调整到正常学习状态，而第二分类模型一开始处于大幅学习状态（采用较多的第一分类模型认为高准的样本对第二分类模型进行迭代），随后随学习轮数的增加逐渐调整到正常学习状态。这种不断调整样本圈选率和学习速率的互学习方式，可以维持预训练后的第一分类模型识别准确性高的性能，不断添加和高准样本分布差距较小的部分样本进行迭代更新，可以保证相互学习的两个模型能持续稳定细腻的选择高准样本进行训练，达到样本提纯的目的。

此外，互学习本身具有较优的样本提纯性能，所以相比于相关技术中采用人工规则或人工策略提纯的方式，通过互学习能够更好、更全面地挑选高准样本，避免了人工规则或人工策略的繁重工作，同时还可以避免有偏样本的框定。

在上述第二个例子中，步骤2和步骤3的实现方式可以有很多种，下面介绍两种。

第一种实现方式

假设第一分类模型和第二分类模型对训练样本的分类结果为评分。一般而言，该评分的取值在0到1之间，且一个样本的评分越接近1，说明该样本是一个黑样本，一个样本的评分越接近0，说明该样本是一个白样本，当然也可以反过来，也即一个样本的评分越接近0，说明该样本是一个黑样本，一个样本的评分越接近1，说明该样本是一个白样本。

在此基础上，上述步骤2可包括：基于所述第一分类模型对所述一批训练样本的评分，对所述一批训练样本中的黑样本和白样本分别进行排序，得到第一排序结果和第二排序结果，在所述第一排序结果和所述第二排序结果中，所述第一分类模型认为排序越靠前分类结果越准确；分别从所述第一排序结果和所述第二排序结果中，选取排序在前的第一比例（如Top20%）的样本作为第一部分样本。

相应的，上述步骤3可包括：基于所述第二分类模型对所述一批训练样本的评分，对所述一批训练样本中的黑样本和白样本分别进行排序，得到第三排序结果和第四排序结果，在所述第三排序结果和所述第四排序结果中，所述第二分类模型认为排序越靠前分类结果越准确；分别从所述第三排序结果和所述第四排序结果中，选取排序在前的第二比例的样本作为第二部分样本。

其中，在互学习的第一轮学习中，所述第一比例大于所述第二比例，随学习轮数的增加，所述第一比例逐渐减小，所述第二比例逐渐增大，直到所述第一比例与所述第二比例相当。不难看出，这符合上述第二个例子中关于“在互学习的第一轮学习中，所述第一部分样本的数量可以大于所述第二部分样本的数量，且随学习轮数的增加，所述第一部分样本的数量逐渐减少，所述第二部分样本的数量逐渐增多，直到所述第一部分样本的数量与所述第二部分样本的数量相当”的限定。

第二种实现方式

同样假设第一分类模型和第二分类模型对训练样本的分类结果为评分。一般而言，该评分的取值在0到1之间，且一个样本的评分越接近1，说明该样本是一个黑样本，一个样本的评分越接近0，说明该样本是一个白样本，当然也可以反过来，也即一个样本的评分越接近0，说明该样本是一个黑样本，一个样本的评分越接近1，说明该样本是一个白样本。

在此基础上，上述步骤2可包括：从所述一批训练样本中，选出所述第一分类模型的评分满足第一阈值条件的黑样本和白样本作为第一部分样本，其中，所述第一分类模型认为满足所述第一阈值条件的样本的分类结果更准确。

相应的，上述步骤3可包括：从所述一批训练样本中，选出所述第二分类模型的评分满足第二阈值条件的黑样本和白样本作为第二部分样本，其中，所述第二分类模型认为满足所述第二阈值条件的样本的分类结果更准确。

其中，在互学习的第一轮学习中，所述第一阈值条件比所述第二阈值条件宽松，随学习轮数的增加，所述第一阈值条件逐渐严格，所述第二阈值条件逐渐宽松，直到所述第一阈值条件与所述第二阈值条件相当。可以理解，所述第一阈值条件越宽松，选出的第一部分样本的数量越多，所述第一阈值条件越严格，选出的第一部分样本的数量越少；同样的，所述第二阈值条件越宽松，选出的第二部分样本的数量越多，所述第二阈值条件越严格，选出的第二部分样本的数量越少。因此，也符合上述第二个例子中关于“在互学习的第一轮学习中，所述第一部分样本的数量可以大于所述第二部分样本的数量，且随学习轮数的增加，所述第一部分样本的数量逐渐减少，所述第二部分样本的数量逐渐增多，直到所述第一部分样本的数量与所述第二部分样本的数量相当”的限定。

需要说明的是，所述第一阈值条件和所述第二阈值条件的设定与黑样本和白样本的风险评分基准有关。假设一个样本的风险评分越接近1，说明该样本是一个黑样本，一个样本的风险评分越接近0，说明该样本是一个白样本。那么，在第一轮互学习中，第一阈值条件可以包括：黑样本的风险评分大于预设阈值（如0.9）、白样本的风险评分小于预设阈值（如0.1），第二阈值条件可以包括：黑样本的风险评分大于预设阈值（如0.7）、白样本的风险评分小于预设阈值（如0.3）。

可选的，无论是在上述第一个例子中，还是在上述第二个例子中，所述第一部分样本中黑白样本的比例与所述第二部分样本中黑白样本的比例一致，比如黑白样本比例都是1:100。

图2B示出了本说明书实施例提供的一种分类模型训练方法的原理示意图。如图2B所示，假设A表示第一分类模型，B表示第二分类模型，那么本说明书实施例提供的一种分类模型训练方法，在传统的互学习的基础上，初始化之后，在正式进行互学习之前，先根据高准样本对第一分类模型进行预训练（第一步），然后再对第一分类模型和第二分类模型进行互学习（第二步）。在图2B中，互学习部分与图2A类似，不再赘述。

总之，本说明书实施例提供的一种分类模型训练方法，一方面，由于在互学习前，采用标签准确性高的样本对第一分类模型进行了预训练，使第一分类模型在互学习前就具备比较好的准确性，而不是直接进行互学习，因此可以有效避免随机初始化带来的初始误差，从而避免互学习时多次迭代后可能出现的误差累计情况；另一方面，由于互学习本身具有较优的标签低准样本提纯性能，再加上互学习开始时第一分类模型已经具备比较好的准确性，因此可以起到利用标签高准样本带动标签低准样本进行提纯的作用，从而使得标签高准样本逐渐增多，提升两个分类模型的鲁棒性，最终取得准确性和鲁棒性兼顾的有益效果。

在上述一种分类模型训练方法的基础上，本说明书实施例还提供了一种分类方法，如图3所示，该方法可包括；

步骤302、获取待分类对象的特征数据。

步骤304、将所述待分类对象的特征数据输入第一分类模型和/或第二分类模型。

其中，所述第一分类模型和所述第二分类模型是基于图1所示的方法训练得到的。

步骤306、基于所述第一分类模型和/或所述第二分类模型的输出确定所述待分类对象的分类结果。

可以理解，在基于所述第一分类模型或所述第二分类模型的输出确定所述待分类对象的分类结果时，可直接将所述第一分类模型或所述第二分类模型的输出作为所述待分类对象的分类结果。在基于所述第一分类模型和所述第二分类模型的输出确定所述待分类对象的分类结果时，可将所述第一分类模型和所述第二分类模型的输出进行一定的融合运算（比如求平均），然后基于融合运算结果确定所述待分类对象的分类结果。

由于本说明书实施例提供的一种分类方法，应用了本说明书实施例提供的一种分类模型训练方法训练得到的第一分类模型和/或第二分类模型，而所述第一分类模型和/或所述第二分类模型具有较优的准确性和鲁棒性，所以该分类方法的分类结果准确且可靠。

需要说明的是，本说明书实施例提供的一种分类模型训练方法，可应用于任何需要样本提纯的应用场景下的分类模型的训练，相应的，本说明书实施例提供的一种分类方法，可应用于任何应用场景下的分类对象的分类。

比如，本说明书实施例提供的一种分类模型训练方法，可应用于网络交易场景下的交易事件的风险识别模型的训练，本说明书实施例提供的一种分类方法，可应用于网络交易场景下的交易事件的风险识别及控制。

再如，本说明书实施例提供的一种分类模型训练方法，可应用于图片分类模型的训练，本说明书实施例提供的一种分类方法，可应用于图片分类，等等，本说明书在此不一一列举。

下面分别以这两个场景为例，对本说明书实施例提供的一种分类模型训练方法，以及本说明书实施例提供的一种分类方法的具体应用进行说明。

实施例 1

在网络交易事件的风控场景（比如网络转账欺诈风控场景）中，风险样本（标签为有风险，即黑样本）的来源一般包括交易系统外部机构（如第三方权威机构）提供的风险案件、交易系统收到投诉或举报的风险案件，以及一些交易系统内部风控策略识别出的但无用户反馈的风险案件。由于交易系统外部机构（如第三方权威机构）提供的风险案件，以及交易系统收到投诉或举报的风险案件的风险是确定的、显性存在的，因此，可将这类案件称为显性案件。由于交易系统内部风控策略识别出的但无用户反馈的风险案件的风险是不确定的，因此，可以将这类案件称为隐性案件。

从标签的准确度（置信度）来看，交易系统外部机构（如第三方权威机构）提供的风险案件，以及交易系统收到投诉或举报的风险案件是高准的，但是交易系统内部风控策略识别出的但无用户反馈的风险案件的准确率比较低，而从量级上讲，大量的黑样本集中在隐性案件中。对风险识别模型的训练而言，如果采用显性案件进行训练，会面临样本不足带来的模型鲁棒性问题，所以需要进行样本提纯。

鉴于此，基于本说明书实时里提供的一种分类模型训练方法的技术构思，如图4所示，本说明书实施例提供了一种风险识别模型训练方法，该方法可包括：

步骤402、初始化第一风险识别模型和第二风险识别模型；

可以理解，第一风险识别模型和第二风险识别模型就是一种分类模型。

在步骤402中，可采用随机初始化的方式对第一风险识别模型和第二风险识别模型进行初始化。第一风险识别模型和第二风险识别模型所采用的分类算法相同。作为一个例子，第一风险识别模型和第二风险识别模型均可以是神经网络模型。当然，第一风险识别模型和第二风险识别模型还可以是其他分类模型，本说明书实施例对此不做限制。

步骤404、采用标签准确性高的历史交易事件的特征数据对所述第一风险识别模型进行预训练。

例如，在网络交易场景的网络账户转账这一具体业务场景下，样本可能是历史转账事件，标签准确性高的黑样本可能是交易系统外部机构（如第三方权威机构）提供的历史转账事件、交易系统收到投诉或举报的历史转账事件，样本的特征数据可以是与风险有关的特征，比如样本的特征数据可以包括：是否是向同名卡转账、是否是向同姓用户转账、转账时间、是否是向境外转账、账户余额以及银行标识代码（Bank Identification Number，BIN）等特征中的一项或多项。

可以理解，在互学习前，采用标签准确性高的样本对第一风险识别模型进行预训练，而不是直接进行互学习，可以使第一风险识别模型在互学习前就具备比较好的准确性，因此可以有效避免随机初始化带来的初始误差，从而避免互学习时多次迭代后可能出现的误差累计情况。

可选的，对于第二风险识别模型，可以不进行预训练，而是保持初始化状态。

步骤406、在所述第一风险识别模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的历史交易事件和标签准确性低的历史交易事件。

具体的，基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，可包括：

步骤1、分别向所述第一风险识别模型和所述第二风险识别模型输入一批训练样本的特征数据，预测得到所述一批训练样本对应的分类结果，其中，所述一批训练样本既包括标签准确性高的样本又包括标签准确性低的样本。同时，所述一批训练样本中既包括黑样本也包括白样本，且白样本和黑样本的比例可根据需要设定。

其中，标签准确性高的作为黑样本的历史交易事件来源于显性案件，所述显性案件包括下述至少一项：交易系统外部机构提供的风险案件，交易系统收到投诉或举报的风险案件；标签准确性低的作为黑样本的历史交易事件来源于隐性案件，所述隐性案件包括交易系统内部风控策略识别出的无用户反馈的风险案件。

步骤2、基于所述第一风险识别模型对所述一批训练样本的分类结果，从所述一批训练样本中选出第一部分样本，基于所述第一部分样本的特征数据对所述第二风险识别模型进行迭代训练，其中，所述第一部分样本是所述第一风险识别模型认为标签准确性高的样本。

步骤3、基于所述第二风险识别模型对所述一批训练样本的分类结果，从所述一批训练样本中选出第二部分样本，基于所述第二部分样本的特征数据对所述第一风险识别模型进行迭代训练，其中，所述第二部分样本是所述第二风险识别模型认为标签准确性高的样本。

上述步骤1、步骤2和步骤3是对一轮互学习过程的描述。

可选的，在第一个例子中，在互学习的各轮学习中，所述第一部分样本的数量与所述第二部分样本的数量可以相当，且在不同轮次的互学习中，所述第一部分样本的数量可以相同也可以不同，同样的，在不同轮次的互学习中，所述第二部分样本的数量可以相同也可以不同。进一步的，在上述第一个例子中，所述第一风险识别模型和所述第二风险识别模型在互学习中的学习速率可以一致。

可选的，在第二个例子中，在互学习的第一轮学习中，所述第一部分样本的数量可以大于所述第二部分样本的数量，且随学习轮数的增加，所述第一部分样本的数量逐渐减少，所述第二部分样本的数量逐渐增多，直到所述第一部分样本的数量与所述第二部分样本的数量相当。进一步的，在上述第二个例子中，所述第一风险识别模型在互学习中的学习速率与所述第二部分样本的数量正相关；所述第二风险识别模型在互学习中的学习速率与所述第一部分样本的数量正相关。

可以看出，相比于上述第一个例子，在上述第二个例子中，在第一风险识别模型和第二风险识别模型的互学习过程中，第一风险识别模型一开始处于微调状态（采用少量第二风险识别模型认为高准的样本对第一风险识别模型进行迭代），随后随学习轮数的增加逐渐调整到正常学习状态，而第二分类模型一开始处于大幅学习状态（采用较多的第一风险识别模型认为高准的样本对第二风险识别模型进行迭代），随后随学习轮数的增加逐渐调整到正常学习状态。这种不断调整样本圈选率和学习速率，维持了预训练后的第一风险识别模型识别准确性高的性能，不断添加和高准样本分布差距较小的部分样本进行迭代更新，可以保证相互学习的两个模型能持续稳定细腻的选择高准样本进行训练，达到样本提纯的目的。

第一种实现方式

假设第一风险识别模型和第二风险识别模型对训练样本的分类结果为风险评分。一般而言，该风险评分的取值在0到1之间，且一个样本的风险评分越接近0，说明该样本是一个白样本，一个样本的风险评分越接近1，说明该样本是一个黑样本（风险样本）。

在此基础上，上述步骤2可包括：基于所述第一风险识别模型对所述一批训练样本的风险评分，对所述一批训练样本中的黑样本和白样本分别进行排序，得到第一排序结果和第二排序结果，在所述第一排序结果和所述第二排序结果中，所述第一风险识别模型认为排序越靠前分类结果越准确；分别从所述第一排序结果和所述第二排序结果中，选取排序在前的第一比例的样本作为第一部分样本。

相应的，上述步骤3可包括：基于所述第二风险识别模型对所述一批训练样本的风险评分，对所述一批训练样本中的黑样本和白样本分别进行排序，得到第三排序结果和第四排序结果，在所述第三排序结果和所述第四排序结果中，所述第二风险识别模型认为排序越靠前分类结果越准确；分别从所述第三排序结果和所述第四排序结果中，选取排序在前的第二比例的样本作为第二部分样本。

其中，在互学习的第一轮学习中，所述第一比例大于所述第二比例，随学习轮数的增加，所述第一比例逐渐减小，所述第二比例逐渐增大，直到所述第一比例与所述第二比例相当。

第二种实现方式

同样假设第一风险识别模型和第二风险识别模型对训练样本的分类结果为风险评分。一般而言，该风险评分的取值在0到1之间，且一个样本的风险评分越接近0，说明该样本是一个白样本，一个样本的风险评分越接近1，说明该样本是一个黑样本。

在此基础上，上述步骤2可包括：从所述一批训练样本中，选出所述第一风险识别模型的风险评分满足第一阈值条件的黑样本和白样本作为第一部分样本，其中，所述第一风险识别模型认为满足所述第一阈值条件的样本的分类结果更准确。

相应的，上述步骤3可包括：从所述一批训练样本中，选出所述第二风险识别模型的风险评分满足第二阈值条件的黑样本和白样本作为第二部分样本，其中，所述第二风险识别模型认为满足所述第二阈值条件的样本的分类结果更准确。

其中，在互学习的第一轮学习中，所述第一阈值条件比所述第二阈值条件宽松，随学习轮数的增加，所述第一阈值条件逐渐严格，所述第二阈值条件逐渐宽松，直到所述第一阈值条件与所述第二阈值条件相当。可以理解，所述第一阈值条件越宽松，选出的第一部分样本的数量越多，所述第一阈值条件越严格，选出的第一部分样本的数量越少；同样的，所述第二阈值条件越宽松，选出的第二部分样本的数量越多，所述第二阈值条件越严格，选出的第二部分样本的数量越少。

需要说明的是，所述第一阈值条件和所述第二阈值条件的设定与黑样本和白样本的风险评分基准有关。假设一个样本的风险评分越接近1，说明该样本是一个黑样本，一个样本的风险评分越接近0，说明该样本是一个白样本，那么，在第一轮互学习中，第一阈值条件可以包括：黑样本的风险评分大于预设阈值（如0.9）、白样本的风险评分小于预设阈值（如0.1），第二阈值条件可以包括：黑样本的风险评分大于预设阈值（如0.7）、白样本的风险评分小于预设阈值（如0.3）。

本说明书实施例提供的一种风险识别模型训练方法，一方面，充分考虑到风控场景中样本口径不同带来的样本置信度差异，通过高准样本预训练的方式避免互学习的误差累计现象；另一方面，由于互学习本身具有较优的标签低准样本提纯性能，再加上互学习开始时第一风险识别模型已经具备比较好的准确性，因此可以起到利用标签高准样本带动标签低准样本进行提纯的作用，从而使得标签高准样本逐渐增多，提升两个风险识别模型的鲁棒性，最终取得准确性和鲁棒性兼顾的有益效果。

在上述一种风险识别模型训练方法的基础上，本说明书实施例还提供了一种风险控制方法，如图5所示，该方法可包括；

步骤502、获取目标交易事件的特征数据。

步骤504、将所述目标交易事件的特征数据输入第一风险识别模型和/或第二风险识别模型。

其中，所述第一风险识别模型和所述第二风险识别模型是基于图4所示的方法训练得到的。

步骤506、基于所述第一风险识别模型和/或所述第二风险识别模型的输出，确定所述目标交易事件的风险识别结果。

可以理解，在基于所述第一风险识别模型或所述第二风险识别模型的输出确定所述目标交易事件的分类结果时，可直接将所述第一风险识别模型或所述第二风险识别模型的输出作为所述目标交易事件的分类结果。在基于所述第一风险识别模型和所述第二风险识别模型的输出确定所述目标交易事件的分类结果时，可将所述第一风险识别模型和所述第二风险识别模型的输出进行一定的融合运算（比如求平均），然后基于融合运算结果确定所述目标交易事件的分类结果。

步骤508、基于所述风险识别结果对所述目标交易事件进行风控。

例如，可根据风险识别结果决定放行或拦截该交易事件，当然，还可以对发起目标交易事件的用户进行风险提示。

由于本说明书实施例提供的一种风险控制方法，应用了本说明书实施例提供的一种风险识别模型训练方法训练得到的第一风险识别模型和/或第二风险识别模型，而所述第一风险识别模型和/或所述第二风险识别模型具有较优的准确性和鲁棒性，所以该风险控制方法可有效控制目标交易事件存在的风险。

实施例 2

基于本说明书实时里提供的一种分类模型训练方法的技术构思，如图6所示，本说明书实施例提供了一种图片分类模型训练方法，该方法可包括：

步骤602、初始化第一分类模型和第二分类模型。

在步骤602中，可采用随机初始化的方式对第一分类模型和第二分类模型进行初始化。第一分类模型和第二分类模型所采用的分类算法相同。作为一个例子，第一分类模型和第二分类模型均可以是神经网络模型。当然，第一分类模型和第二分类模型还可以是其他分类模型，本说明书实施例对此不做限制。

步骤604、采用标签准确性高的样本图片对所述第一分类模型进行预训练。

在图片分类场景下，样本就是标注好的图片，样本的特征数据就是图片的特征数据。

步骤606、在所述第一分类模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的样本图片和标签准确性低的样本图片。

步骤1、分别向所述第一分类模型和所述第二分类模型输入一批训练样本的特征数据，预测得到所述一批训练样本对应的分类结果，其中，所述一批训练样本既包括标签准确性高的样本又包括标签准确性低的样本。同时，所述一批训练样本中既包括黑样本也包括白样本，且白样本和黑样本的比例可根据需要设定。

上述步骤1、步骤2和步骤3是对一轮互学习过程的描述。

可选的，在第一个例子中，在互学习的各轮学习中，所述第一部分样本的数量与所述第二部分样本的数量可以相当，且在不同轮次的互学习中，所述第一部分样本的数量可以相同也可以不同，同样的，在不同轮次的互学习中，所述第二部分样本的数量可以相同也可以不同。进一步的，在上述第一个例子中，所述第一分类模型和所述第二分类模型在互学习中的学习速率可以一致。

可选的，在第二个例子中，在互学习的第一轮学习中，所述第一部分样本的数量可以大于所述第二部分样本的数量，且随学习轮数的增加，所述第一部分样本的数量逐渐减少，所述第二部分样本的数量逐渐增多，直到所述第一部分样本的数量与所述第二部分样本的数量相当。进一步的，在上述第二个例子中，所述第一分类模型在互学习中的学习速率与所述第二部分样本的数量正相关；所述第二分类模型在互学习中的学习速率与所述第一部分样本的数量正相关。

可以看出，相比于上述第一个例子，在上述第二个例子中，在第一分类模型和第二分类模型的互学习过程中，第一分类模型一开始处于微调状态，随后随学习轮数的增加逐渐调整到正常学习状态，而第二分类模型一开始处于大幅学习状态，随后随学习轮数的增加逐渐调整到正常学习状态。这种不断调整样本圈选率和学习速率的互学习方式，可以维持预训练后的第一分类模型识别准确性高的性能，不断添加和高准样本分布差距较小的部分样本进行迭代更新，可以保证相互学习的两个模型能持续稳定细腻的选择高准样本进行训练，达到样本提纯的目的。

第一种实现方式

假设第一分类模型和第二分类模型对训练样本的分类结果为评分。一般而言，该评分的取值在0到1之间，且一个样本的评分越接近1，说明该样本是一个黑样本，一个样本的评分越接近0，说明该样本是一个白样本。

在此基础上，上述步骤2可包括：基于所述第一分类模型对所述一批训练样本的评分，对所述一批训练样本中的黑样本和白样本分别进行排序，得到第一排序结果和第二排序结果，在所述第一排序结果和所述第二排序结果中，所述第一分类模型认为排序越靠前分类结果越准确；分别从所述第一排序结果和所述第二排序结果中，选取排序在前的第一比例的样本作为第一部分样本。

第二种实现方式

同样假设第一分类模型和第二分类模型对训练样本的分类结果为评分。一般而言，该评分的取值在0到1之间，且一个样本的评分越接近1，说明该样本是一个黑样本，一个样本的评分越接近0，说明该样本是一个白样本。

其中，在互学习的第一轮学习中，所述第一阈值条件比所述第二阈值条件宽松，随学习轮数的增加，所述第一阈值条件逐渐严格，所述第二阈值条件逐渐宽松，直到所述第一阈值条件与所述第二阈值条件相当。

可选的，无论是在上述第一个例子中，还是在上述第二个例子中，所述第一部分样本中黑白样本的比例与所述第二部分样本中黑白样本的比例一致。

本说明书实施例提供的一种图片分类模型训练方法，一方面，由于在互学习前，采用标签准确性高的样本对第一分类模型进行了预训练，使第一分类模型在互学习前就具备比较好的准确性，而不是直接进行互学习，因此可以有效避免随机初始化带来的初始误差，从而避免互学习时多次迭代后可能出现的误差累计情况；另一方面，由于互学习本身具有较优的标签低准样本提纯性能，再加上互学习开始时第一分类模型已经具备比较好的准确性，因此可以起到利用标签高准样本带动标签低准样本进行提纯的作用，从而使得标签高准样本逐渐增多，提升两个分类模型的鲁棒性，最终取得准确性和鲁棒性兼顾的有益效果。

在上述一种图片分类模型训练方法的基础上，本说明书实施例还提供了一种图片分类方法，如图7所示，该方法可包括；

步骤702、获取待分类图片。

步骤704、将所述待分类图片输入第一分类模型和/或第二分类模型。

其中，所述第一分类模型和所述第二分类模型是基于图6所示的方法训练得到的。

步骤706、基于所述第一分类模型和/或所述第二分类模型的输出确定所述待分类图片的分类结果。

可以理解，在基于所述第一分类模型或所述第二分类模型的输出确定所述待分类图片的分类结果时，可直接将所述第一分类模型或所述第二分类模型的输出作为所待分类图片的分类结果。在基于所述第一分类模型和所述第二分类模型的输出确定所述待分类图片的分类结果时，可将所述第一分类模型和所述第二分类模型的输出进行一定的融合运算（比如求平均），然后基于融合运算结果确定所述待分类图片的分类结果。

由于本说明书实施例提供的一种图片分类方法，应用了本说明书实施例提供的一种图片分类模型训练方法训练得到的第一分类模型和/或第二分类模型，而所述第一分类模型和/或所述第二分类模型具有较优的准确性和鲁棒性，所以该图片分类方法的分类结果准确且可靠。

以上对本说明书提供的方法进行了说明，下面对本说明书提供的电子设备进行介绍。

图8是本说明书的一个实施例提供的电子设备的结构示意图。请参考图8，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器（non-volatile memory），例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构）总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构）总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成分类模型训练装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

初始化第一分类模型和第二分类模型；

或者，处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成分类装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

获取待分类对象的特征数据；

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成风险识别模型训练装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

初始化第一风险识别模型和第二风险识别模型；

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成风险控制装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

获取目标交易事件的特征数据；

基于所述风险识别结果对所述目标交易事件进行风控。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成图片分类模型训练装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

初始化第一分类模型和第二分类模型；

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成图片分类装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

获取待分类图片；

上述如本说明书图1、图3、图4、图5、图6和图7中任一实施例揭示的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器（Central ProcessingUnit，CPU）、网络处理器（Network Processor，NP）等；还可以是数字信号处理器（DigitalSignal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field－Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1、图3、图4、图5、图6或图7所示实施例提供的方法，本说明书不再赘述。

当然，除了软件实现方式之外，本说明书的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本说明书实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1、图3、图4、图5、图6或图7所示实施例的方法，为避免重复，不再赘述。

如图9所示，本说明书的一个实施例提供了一种分类模型训练装置900，在一种软件实施方式中，装置900可包括：初始化模块901、预训练模块902和互学习模块903。

初始化模块901，初始化第一分类模型和第二分类模型。

预训练模块902，采用标签准确性高的样本的特征数据对所述第一分类模型进行预训练。

互学习模块903，在所述第一分类模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的样本和标签准确性低的样本。

具体的，互学习模块903，可用于：

分别向所述第一分类模型和所述第二分类模型输入一批训练样本的特征数据，预测得到所述一批训练样本对应的分类结果，其中，所述一批训练样本既包括标签准确性高的样本又包括标签准确性低的样本；

基于所述第一分类模型对所述一批训练样本的分类结果，从所述一批训练样本中选出第一部分样本，基于所述第一部分样本的特征数据对所述第二分类模型进行迭代训练，其中，所述第一部分样本是所述第一分类模型认为标签准确性高的样本；

基于所述第二分类模型对所述一批训练样本的分类结果，从所述一批训练样本中选出第二部分样本，基于所述第二部分样本的特征数据对所述第一分类模型进行迭代训练，其中，所述第二部分样本是所述第二分类模型认为标签准确性高的样本。

需要说明的是，分类模型训练装置900能够实现图1提供的一种分类模型训练方法，并能取得相同的技术效果，详细内容可参考上文对方法实施例部分的描述，不再赘述。

如图10所示，本说明书的一个实施例提供了一种分类装置1000，在一种软件实施方式中，装置1000可包括：数据获取模块1001、数据输入模块1002和分类结果确定模块1003。

数据获取模块1001，获取待分类对象的特征数据。

数据输入模块1002，将所述待分类对象的特征数据输入第一分类模型和/或第二分类模型，其中，所述第一分类模型和所述第二分类模型是基于如图1所述的方法训练得到的。

分类结果确定模块1003，基于所述第一分类模型和/或所述第二分类模型的输出确定所述待分类对象的分类结果。

需要说明的是，分类装置1000能够实现图3提供的一种分类方法，并能取得相同的技术效果，详细内容可参考上文对方法实施例部分的描述，不再赘述。

如图11所示，本说明书的一个实施例提供了一种风险识别模型训练装置1100，在一种软件实施方式中，装置1100可包括：初始化模块1101、预训练模块1102和互学习模块1103。

初始化模块1101，初始化第一风险识别模型和第二风险识别模型。

预训练模块1102，采用标签准确性高的历史交易事件的特征数据对所述第一风险识别模型进行预训练。

互学习模块1103，在所述第一风险识别模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的历史交易事件和标签准确性低的历史交易事件。

需要说明的是，风险识别模型训练装置1100能够实现图4提供的一种风险识别模型训练方法，并能取得相同的技术效果，详细内容可参考上文对方法实施例部分的描述，不再赘述。

如图12所示，本说明书的一个实施例提供了一种风险控制装置1200，在一种软件实施方式中，装置1200可包括：数据获取模块1201、数据输入模块1202、风险确定模块1203和风控模块1204。

数据获取模块1201，获取目标交易事件的特征数据。

数据输入模块1202，将所述目标交易事件的特征数据输入第一风险识别模型和/或第二风险识别模型，其中，所述第一风险识别模型和所述第二风险识别模型是基于如图4所示的方法训练得到的。

风险确定模块1203，基于所述第一风险识别模型和/或所述第二风险识别模型的输出，确定所述目标交易事件的风险识别结果。

风控模块1204，基于所述风险识别结果对所述目标交易事件进行风控。

需要说明的是，风险控制装置1200能够实现图5提供的一种风险控制方法，并能取得相同的技术效果，详细内容可参考上文对方法实施例部分的描述，不再赘述。

如图13所示，本说明书的一个实施例提供了一种图片分类模型训练装置1300，在一种软件实施方式中，装置1300可包括：初始化模块1301、预训练模块1302和互学习模块1303。

初始化模块1301，初始化第一分类模型和第二分类模型。

预训练模块1302，采用标签准确性高的样本图片对所述第一分类模型进行预训练。

互学习模块1303，在所述第一分类模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一分类模型和所述第二分类模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的样本图片和标签准确性低的样本图片。

需要说明的是，图片分类模型训练装置1300能够实现图6提供的一种图片分类模型训练方法，并能取得相同的技术效果，详细内容可参考上文对方法实施例部分的描述，不再赘述。

如图14所示，本说明书的一个实施例提供了一种图片分类装置1400，在一种软件实施方式中，装置1400可包括：图片获取模块1401、图片输入模块1402和分类结果确定模块1403。

图片获取模块1401，获取待分类图片。

图片输入模块1402，将所述待分类图片输入第一分类模型和/或第二分类模型，其中，所述第一分类模型和所述第二分类模型是基于如图6所示的方法训练得到的。

分类结果确定模块1403，基于所述第一分类模型和/或所述第二分类模型的输出确定所述待分类图片的分类结果。

需要说明的是，图片分类装置1400能够实现图7提供的一种图片分类方法，并能取得相同的技术效果，详细内容可参考上文对方法实施例部分的描述，不再赘述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

总之，以上所述仅为本说明书的较佳实施例而已，并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本说明书一个或多个实施例的保护范围之内。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制时，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

Claims

1.一种风险识别模型训练方法，包括：

初始化第一风险识别模型和第二风险识别模型；

在所述第一风险识别模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的历史交易事件和标签准确性低的历史交易事件；

其中，所述基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，包括：

分别向所述第一风险识别模型和所述第二风险识别模型输入一批所述训练样本的特征数据，预测得到所述一批所述训练样本对应的风险识别结果，其中，所述一批所述训练样本包括标签准确性高的样本和标签准确性低的样本；

基于所述第一风险识别模型对所述一批所述训练样本的风险识别结果，从所述一批所述训练样本中选出第一部分样本，基于所述第一部分样本的特征数据对所述第二风险识别模型进行迭代训练，其中，所述第一部分样本是所述第一风险识别模型认为标签准确性高的样本；

基于所述第二风险识别模型对所述一批所述训练样本的风险识别结果，从所述一批所述训练样本中选出第二部分样本，基于所述第二部分样本的特征数据对所述第一风险识别模型进行迭代训练，其中，所述第二部分样本是所述第二风险识别模型认为标签准确性高的样本。

2.根据权利要求1所述的方法，

在互学习的第一轮学习中，所述第一部分样本的数量大于所述第二部分样本的数量，随学习轮数的增加，所述第一部分样本的数量逐渐减少，所述第二部分样本的数量逐渐增多，直到所述第一部分样本的数量与所述第二部分样本的数量相当。

3.根据权利要求2所述的方法，

所述第一风险识别模型在互学习中的学习速率与所述第二部分样本的数量正相关；

所述第二风险识别模型在互学习中的学习速率与所述第一部分样本的数量正相关。

4.根据权利要求2或3所述的方法，样本的风险识别结果为评分；

其中，所述基于所述第一风险识别模型对所述一批所述训练样本的风险识别结果，从所述一批所述训练样本中选出第一部分样本，包括：

基于所述第一风险识别模型对所述一批所述训练样本的评分，对所述一批所述训练样本中的黑样本和白样本分别进行排序，得到第一排序结果和第二排序结果，其中，在所述第一排序结果和所述第二排序结果中，所述第一风险识别模型认为排序越靠前风险识别结果越准确；

分别从所述第一排序结果和所述第二排序结果中，选取排序在前的第一比例的样本作为第一部分样本；

其中，所述基于所述第二风险识别模型对所述一批所述训练样本的风险识别结果，从所述一批所述训练样本中选出第二部分样本，包括：

基于所述第二风险识别模型对所述一批所述训练样本的评分，对所述一批所述训练样本中的黑样本和白样本分别进行排序，得到第三排序结果和第四排序结果，其中，在所述第三排序结果和所述第四排序结果中，所述第二风险识别模型认为排序越靠前风险识别结果越准确；

分别从所述第三排序结果和所述第四排序结果中，选取排序在前的第二比例的样本作为第二部分样本；

5.根据权利要求2或3所述的方法，样本的风险识别结果为评分；

从所述一批所述训练样本中，选出所述第一风险识别模型的评分满足第一阈值条件的黑样本和白样本作为第一部分样本，其中，所述第一风险识别模型认为满足所述第一阈值条件的样本的风险识别结果更准确；

从所述一批所述训练样本中，选出所述第二风险识别模型的评分满足第二阈值条件的黑样本和白样本作为第二部分样本，其中，所述第二风险识别模型认为满足所述第二阈值条件的样本的风险识别结果更准确；

6.根据权利要求1-3任一项所述的方法，所述第一风险识别模型和所述第二风险识别模型均为神经网络模型。

7.根据权利要求1所述的方法，

标签准确性高的作为黑样本的历史交易事件来源于显性案件，所述显性案件包括下述至少一项：交易系统外部机构提供的风险案件，交易系统收到投诉或举报的风险案件；

标签准确性低的作为黑样本的历史交易事件来源于隐性案件，所述隐性案件包括交易系统内部风控策略识别出的风险案件。

8.一种风险控制方法，包括：

获取目标交易事件的特征数据；

将所述目标交易事件的特征数据输入第一风险识别模型和/或第二风险识别模型，其中，所述第一风险识别模型和所述第二风险识别模型是基于如权利要求1-7任一项所述的方法训练得到的；

基于所述风险识别结果对所述目标交易事件进行风控。

9.一种风险识别模型训练装置，包括：

互学习模块，在所述第一风险识别模型在预训练过程中达到收敛的情况下，基于互学习框架对所述第一风险识别模型和所述第二风险识别模型进行训练，其中，互学习中采用的训练样本包括标签准确性高的历史交易事件和标签准确性低的历史交易事件；

其中，互学习模块具体用于：

分别向所述第一风险识别模型和所述第二风险识别模型输入一批训练样本的特征数据，预测得到所述一批训练样本对应的分类结果，其中，所述一批训练样本既包括标签准确性高的样本又包括标签准确性低的样本；

基于所述第一风险识别模型对所述一批训练样本的分类结果，从所述一批训练样本中选出第一部分样本，基于所述第一部分样本的特征数据对所述第二风险识别模型进行迭代训练，其中，所述第一部分样本是所述第一风险识别模型认为标签准确性高的样本；

基于所述第二风险识别模型对所述一批训练样本的分类结果，从所述一批训练样本中选出第二部分样本，基于所述第二部分样本的特征数据对所述第一风险识别模型进行迭代训练，其中，所述第二部分样本是所述第二风险识别模型认为标签准确性高的样本。

10.一种风险控制装置，包括：

数据获取模块，获取目标交易事件的特征数据；

数据输入模块，将所述目标交易事件的特征数据输入第一风险识别模型和/或第二风险识别模型，其中，所述第一风险识别模型和所述第二风险识别模型是基于如权利要求1-7任一项所述的方法训练得到的；

11.一种电子设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行以下操作：

初始化第一风险识别模型和第二风险识别模型；

12.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

初始化第一风险识别模型和第二风险识别模型；