CN115935265A

CN115935265A - 训练风险识别模型的方法、风险识别方法及对应装置

Info

Publication number: CN115935265A
Application number: CN202310224138.9A
Authority: CN
Inventors: 刘芳卿
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2023-03-03
Filing date: 2023-03-03
Publication date: 2023-04-07
Anticipated expiration: 2043-03-03
Also published as: CN115935265B

Abstract

本说明书实施例提供了一种训练风险识别模型的方法、风险识别方法及对应装置，涉及人工智能技术领域。本申请采用元学习的方式训练包含编码模块和第一预测模块的第一风险识别模型，基于第一事件样本的特征向量、第一训练样本的安全支持集以及各风险域的风险支持集中各事件的特征向量确定第一事件样本分别与安全支持集、各风险域的风险支持集的相关度，依据第一事件样本分别与安全支持集、各风险域的风险支持集的相关度预测第一事件样本的风险信息。通过这种方式将对多个风险域的学习统一到一个风险识别模型中，相比较针对不同风险域分别训练独立的风险识别模型的方式，减轻了对存储性能和计算性能所带来的压力。

Description

训练风险识别模型的方法、风险识别方法及对应装置

技术领域

本说明书一个或多个实施例涉及人工智能技术领域，尤其涉及一种训练风险识别模型的方法、风险识别方法及对应装置。

背景技术

随着互联网技术的迅猛发展，人们越来越多地利用互联网进行通信、学习、工作，甚至通过互联网进行交易、支付、转账、投资等行为。一方面这些行为可能存在一定的风险；另一方面也有一些不法分子容易利用互联网的技术缺陷、法律缺陷等进行不法行为。这些都对网络行为的安全性带来了威胁，因此风险识别就尤为重要。

机器学习作为人工智能技术的重要分支，已经广泛应用于多种风控场景中。通过训练风险识别模型对发生的事件进行风险识别，但由于不同风险域的风险不同、特征数据不同，因此往往需要进行精细化模型运营，即针对不同风险域分别进行建模，得到对应不同风险域的风险识别模型。这种方式显然对于存储性能和计算性能而言都造成了较大压力。

发明内容

有鉴于此，本说明书一个或多个实施例公开了一种训练风险识别模型的方法、风险识别方法及对应装置，以便于降低对存储和计算性能带来的压力。

根据第一方面，本公开提供了一种训练风险识别模型的方法，所述方法包括：

获取包括多个第一训练样本的第一训练数据，所述第一训练样本包括第一事件样本以及该第一事件样本的风险信息标签；以及获取各第一训练样本的安全支持集和N个风险域的风险支持集，所述N为预设的正整数；

利用所述第一训练数据训练包括编码模块和第一预测模块的第一风险识别模型；所述编码模块对所述第一训练样本中的第一事件样本、所述第一训练样本的安全支持集和N个风险域的风险支持集中的各事件进行编码，得到第一事件样本的特征向量、所述第一训练样本的安全支持集和N个风险域的风险支持集中各事件的特征向量；所述第一预测模块利用所述第一事件样本的特征向量和所述第一训练样本的安全支持集中各事件的特征向量，确定所述第一事件样本与所述安全数据集的相关度，利用所述第一事件样本的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定所述第一事件样本与各风险域的风险支持集的相关度，依据所述第一事件样本分别与所述安全支持集、各风险域的风险支持集的相关度预测所述第一事件样本的风险信息；

所述训练的目标包括：最小化所述第一预测模块预测得到的所述第一事件样本的风险信息与该第一事件样本的风险信息标签之间的差异。

根据本申请实施例中一可实现的方式，所述获取各第一训练样本的安全支持集和N个风险域的风险支持集包括：

获取所述第一训练样本中第一事件样本的发起用户对应的历史安全事件，将该历史安全事件所构成的序列作为该第一训练样本的安全支持集；

分别获取N个风险域的风险事件，将各风险域的风险事件所构成的序列分别作为各风险域的风险支持集，各风险域的风险支持集由各第一训练样本共享。

根据本申请实施例中一可实现的方式，利用所述第一事件样本的特征向量和所述第一训练样本的安全支持集中各事件的特征向量，确定所述第一事件样本与所述安全数据集的相关度包括：确定所述第一事件样本的特征向量与所述安全支持集的表征中心之间的距离作为所述第一事件样本与所述安全支持集的相关度，其中所述安全支持集的表征中心由所述安全支持集中各事件的特征向量进行求平均后得到；

利用所述第一事件样本的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定所述第一事件样本与各风险域的风险支持集的相关度包括：针对各风险域，分别确定所述第一事件样本的特征向量与风险域的风险支持集的表征中心之间的距离作为所述第一事件样本与该风险域的风险支持集的相关度，其中所述风险域的风险支持集的表征中心由该风险域的风险支持集中各事件的特征向量进行求平均后得到。

根据本申请实施例中一可实现的方式，所述方法还包括：

获取包括多个第二训练样本的第二训练数据，所述第二训练样本包括第二事件样本以及该第二事件样本的风险信息标签；

所述第一风险识别模型训练结束后，利用训练得到的编码模块和第二预测模块构建第二风险识别模型；

利用所述第二训练数据训练所述第二风险识别模型；其中所述编码模块对所述第二训练样本中的第二事件样本进行编码，得到所述第二事件样本的特征向量；所述第二预测模块利用所述第二事件样本的特征向量预测所述第二事件样本的风险信息；

所述第二风险识别模型的训练目标包括：最小化所述第二预测模块预测得到的所述第二事件样本的风险信息与该第二事件样本的风险信息标签之间的差异。

根据本申请实施例中一可实现的方式，所述N个风险域包括N个风险类别，所述风险信息包括风险类别信息。

第二方面，提供了一种风险识别方法，所述方法包括：

获取待识别事件、待识别事件的安全支持集和M个风险域的风险支持集，所述M为预设的正整数；

将所述待识别事件以及所述待识别事件的安全支持集输入第一风险识别模型，所述第一风险识别模型包括编码模块和第一预测模块；所述编码模块对所述待识别事件、所述安全支持集和所述M个风险域的风险支持集中的各事件进行编码，得到所述待识别事件的特征向量、所述安全支持集和M个风险域的风险支持集中各事件的特征向量；所述第一预测模块利用所述待识别事件的特征向量和所述安全支持集中各事件的特征向量，确定所述待识别事件与所述安全支持集的相关度，利用所述待识别事件的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定所述待识别事件与各风险域的风险支持集的相关度，依据所述待识别事件分别与所述安全支持集、各风险域的风险支持集的相关度预测所述待识别事件的风险信息，所述M为预设的正整数。

根据本申请实施例中一可实现的方式，获取所述待识别事件的安全支持集包括：

获取所述待识别事件的发起用户对应的历史安全事件，将该历史安全事件所构成的序列作为所述待识别事件的安全支持集。

根据本申请实施例中一可实现的方式，利用所述待识别事件的特征向量和所述安全支持集中各事件的特征向量，确定所述待识别事件与所述安全支持集的相关度包括：确定所述待识别事件的特征向量与所述安全支持集的表征中心之间的距离作为所述待识别事件与所述安全支持集的相关度，其中所述安全支持集的表征中心由所述安全支持集中各事件的特征向量进行求平均后得到；

利用所述待识别事件的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定所述待识别事件与各风险域的风险支持集的相关度包括：针对各风险域，分别确定所述待识别事件的特征向量与风险域的风险支持集的表征中心之间的距离作为所述待识别事件与该风险域的风险支持集的相关度，其中所述风险域的风险支持集的表征中心由该风险域的风险支持集中各事件的特征向量进行求平均后得到。

根据本申请实施例中一可实现的方式，所述第一预测模块获取预先存储的各风险域的风险支持集的表征中心；各风险域的风险支持集的表征中心是所述第一风险识别模型训练结束后，利用所述编码模块对所述M个风险域的风险支持集中的事件进行编码，得到所述M个风险域的风险支持集中各事件的特征向量后，利用所述M个风险域的风险支持集中各事件的特征向量进行求平均后得到的。

第三方面，提供了一种风险识别方法，所述方法包括：

获取待识别事件；

将所述待识别事件输入采用如上第一方面中所述方法预先训练得到的第二风险识别模型，获取所述第二风险识别模型输出的所述待识别事件的风险信息。

第四方面，提供了一种训练风险识别模型的装置，所述装置包括：

第一样本获取单元，被配置为获取包括多个第一训练样本的第一训练数据，所述第一训练样本包括第一事件样本以及该第一事件样本的风险信息标签；以及获取各第一训练样本的安全支持集和N个风险域的风险支持集，所述N为预设的正整数；

第一模型训练单元，被配置为利用所述第一训练数据训练包括编码模块和第一预测模块的第一风险识别模型；所述编码模块对所述第一训练样本中的第一事件样本、所述第一训练样本的安全支持集和N个风险域的风险支持集中的各事件进行编码，得到第一事件样本的特征向量、所述第一训练样本的安全支持集和N个风险域的风险支持集中各事件的特征向量；所述第一预测模块利用所述第一事件样本的特征向量和所述第一训练样本的安全支持集中各事件的特征向量，确定所述第一事件样本与所述安全数据集的相关度，利用所述第一事件样本的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定所述第一事件样本与各风险域的风险支持集的相关度，依据所述第一事件样本分别与所述安全支持集、各风险域的风险支持集的相关度预测所述第一事件样本的风险信息；所述训练的目标包括：最小化所述第一预测模块预测得到的所述第一事件样本的风险信息与该第一事件样本的风险信息标签之间的差异。

根据本申请实施例中一可实现的方式，所述装置还包括：

第二样本获取单元，被配置为获取包括多个第二训练样本的第二训练数据，所述第二训练样本包括第二事件样本以及该第二事件样本的风险信息标签；

第二模型训练单元，被配置为所述第一风险识别模型训练结束后，利用训练得到的编码模块和第二预测模块构建第二风险识别模型；利用所述第二训练数据训练所述第二风险识别模型；其中所述编码模块对所述第二训练样本中的第二事件样本进行编码，得到所述第二事件样本的特征向量；所述第二预测模块利用所述第二事件样本的特征向量预测所述第二事件样本的风险信息；所述第二风险识别模型的训练目标包括：最小化所述第二预测模块预测得到的所述第二事件样本的风险信息与该第二事件样本的风险信息标签之间的差异。

第五方面，提供了一种风险识别装置，所述装置包括：

第一获取单元，被配置为获取待识别事件、待识别事件的安全支持集和M个风险域的风险支持集，所述M为预设的正整数；

第一识别单元，被配置为将所述待识别事件以及所述待识别事件的安全支持集输入第一风险识别模型，所述第一风险识别模型包括编码模块和第一预测模块；所述编码模块对所述待识别事件、所述安全支持集和所述M个风险域的风险支持集中的各事件进行编码，得到所述待识别事件的特征向量、所述安全支持集和M个风险域的风险支持集中各事件的特征向量；所述第一预测模块利用所述待识别事件的特征向量和所述安全支持集中各事件的特征向量，确定所述待识别事件与所述安全支持集的相关度，利用所述待识别事件的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定所述待识别事件与各风险域的风险支持集的相关度，依据所述待识别事件分别与所述安全支持集、各风险域的风险支持集的相关度预测所述待识别事件的风险信息，所述M为预设的正整数。

第六方面，提供了一种风险识别装置，所述装置包括：

第二获取单元，被配置为获取待识别事件；

第二识别单元，被配置为将所述待识别事件输入由第四方面中所述装置预先训练得到的第二风险识别模型，获取所述第二风险识别模型输出的所述待识别事件的风险信息。

根据第七方面，本公开提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行如上所述的方法。

根据第八方面，本公开提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现如上所述的方法。

由以上技术方案可以看出，本公开可以具备以下优点：

1）本申请采用元学习的方式训练包含编码模块和第一预测模块的第一风险识别模型，基于第一事件样本的特征向量、第一训练样本的安全支持集以及各风险域的风险支持集中各事件的特征向量确定第一事件样本分别与安全支持集、各风险域的风险支持集的相关度，依据第一事件样本分别与安全支持集、各风险域的风险支持集的相关度预测第一事件样本的风险信息。通过这种方式将对多个风险域的学习统一到一个风险识别模型中，相比较针对不同风险域分别训练独立的风险识别模型的方式，减轻了对存储性能和计算性能所带来的压力。

2）本申请通过第一事件样本与安全数据集、各风险域的风险支持集的相关度，来预测第一事件样本的风险信息，模型参数量级小，可以统一所有风险域上的训练效果。且不存在多风险域上训练任务的梯度冲突、收敛情况不一致等问题。

3）通过增加、删除、修改风险域的风险支持集数据，即可简单、快速地扩展风险识别任务，即利用N个风险域的风险支持集数据训练得到的第一风险识别模型可以用以对M个风险域进行风险识别，仅需要获取并存储M个风险域的风险支持集即可。

4）通过元学习方式预训练得到的第一风险识别模型中的编码模块得到的是对各风险域而言通用的表征，因此能够利用该表征在下游任务上进行较快地泛化又不会产生梯度冲突。

5）基于预训练得到的编码模块结合第二预测模块可以进行进一步的精调得到第二风险识别模型，第二预测模块能够利用事件的特征向量直接预测事件的风险信息，利用第二风险识别模型进行风险识别，无需存储各风险域的风险支持集的相关数据，减轻了存储压力。

当然，实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了可以应用本公开实施例的示例性系统架构图；

图2为本申请实施例提供的训练风险识别模型的方法流程图；

图3为本申请实施例提供的第一风险识别模型的结构示意图；

图4为本申请实施例提供的一种风险识别方法的流程图；

图5为本申请实施例提供的另一种训练风险识别模型的方法流程图；

图6为本申请实施例提供的第二风险识别模型的结构示意图；

图7为本申请实施例提供的一种训练风险识别模型的装置的结构示意图；

图8为本申请实施例提供的一种风险识别装置的结构示意图；

图9为本申请实施例提供的另一种风险识别装置的结构示意图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测（陈述的条件或事件）”可以被解释成为“当确定时”或“响应于确定”或“当检测（陈述的条件或事件）时”或“响应于检测（陈述的条件或事件）”。

为了降低因针对各风险域分别建立不同的风险识别模型对存储和计算性能带来的压力，将各种风险域统一到同一模型中做到风险识别模型的复用。例如采用MMOE（Multi-gate Mixture-of-Experts，多门混合专家网络）等多任务框架进行有监督的预训练，通常将多任务中的一个作为主任务，其他作为辅助任务。但诸如MMOE等多任务框架需要的模型参数量级较大，难以保证所有任务的训练效果。

有鉴于此，本申请提供了一种全新的思路，将各种风险域统一到同一模型中。为了方便对本申请的理解，首先对本申请所基于的系统架构进行描述。图1示出了可以应用本公开实施例的示例性系统架构。该系统主要包括采用离线方式建立风险识别模型的模型训练装置，以及在线对待识别事件进行风险识别的风险识别装置。

其中，模型训练装置在获取训练数据后，可以采用本申请实施例提供的方法进行模型训练，得到风险识别模型。

风险识别装置利用已经训练得到的风险识别模型，对待识别事件进行风险识别，得到待识别事件的风险信息。

模型训练装置和风险识别装置可以分别设置为独立的服务器，也可以设置于同一个服务器或服务器群组，还可以设置于独立的或者同一云服务器。云服务器又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决传统物理主机与虚拟专用服务器（VPs，Virtual Private Server）服务中存在的管理难度大，服务扩展性弱的缺陷。模型训练装置和风险识别装置还可以设置于具有较强计算能力的计算机终端。

需要说明的是，上述风险识别装置除了在线上进行风险识别之外，也可以采用离线的方式进行风险识别，例如针对批量的待识别事件分别进行风险识别。

应该理解，图1中的模型训练装置、风险识别装置以及风险识别模型的数目仅仅是示意性的。根据实现需要，可以具有任意数目的模型训练装置、风险识别装置以及风险识别模型。

图2为本申请实施例提供的训练风险识别模型的方法流程图，该方法可以由图1所示系统中的模型训练装置执行。如图2中所示，该方法可以包括以下步骤：

步骤202：获取包括多个第一训练样本的第一训练数据，第一训练样本包括第一事件样本以及该第一事件样本的风险信息标签。

步骤204：获取各第一训练样本的安全支持集和N个风险域的风险支持集，N为预设的正整数。

步骤206：利用第一训练数据训练包括编码模块和第一预测模块的第一风险识别模型；编码模块对第一训练样本中的第一事件样本、第一训练样本的安全支持集和N个风险域的风险支持集中的各事件进行编码，得到第一事件样本的特征向量、第一训练样本的安全支持集和N个风险域的风险支持集中各事件的特征向量；第一预测模块利用第一事件样本的特征向量和第一训练样本的安全支持集中各事件的特征向量，确定第一事件样本与安全数据集的相关度，利用第一事件样本的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定第一事件样本与各风险域的风险支持集的相关度，依据第一事件样本分别与安全支持集、各风险域的风险支持集的相关度预测第一事件样本的风险信息；训练的目标包括：最小化第一预测模块预测得到的第一事件样本的风险信息与该第一事件样本的风险信息标签之间的差异。

由上述流程可以看出，本申请采用元学习的方式训练包含编码模块和第一预测模块的第一风险识别模型，基于第一事件样本的特征向量、第一训练样本的安全支持集以及各风险域的风险支持集中各事件的特征向量确定第一事件样本分别与安全支持集、各风险域的风险支持集的相关度，依据第一事件样本分别与安全支持集、各风险域的风险支持集的相关度预测第一事件样本的风险信息。通过这种方式将对多个风险域的学习统一到一个风险识别模型中，相比较针对不同风险域分别训练独立的风险识别模型的方式，减轻了对存储性能和计算性能所带来的压力。

下面分别对上述流程中的各步骤进行详细描述。首先结合实施例对上述步骤202即“获取包括多个第一训练样本的第一训练数据”进行详细描述。

本申请实施例中涉及的事件主要指的是行为事件，即用户执行网络行为而产生的事件。用户在使用网络的过程中被服务器端记录了大量的行为数据，这些行为数据通常记录于数据仓库中，这些行为数据体现用户的行为意图。其中一些行为是具有风险的，而多数行为是可信的。本申请实施例中可以将其中一些具有明确风险信息的事件作为第一事件样本，并标注该第一事件样本的风险信息标签。

上述用户的行为数据会因不同场景而不同。以网络交易场景为例，上述的用户可以是诸如账户、银行卡、红包id等。网络行为可以是诸如支付行为、存取款行为、签约绑定行为、收发红包行为、收款行为等等与金融类相关的交易行为。以网络交友场景为例，上述的用户可以是社交平台账户，网络行为可以是诸如登录行为、发送好友请求行为、接受好友请求行为、聊天行为、发送链接行为等等。

本申请实施例中可以将不同风险域的事件作为第一事件样本，相应地针对第一事件样本标注的风险信息标签也是对应不同风险域的标签。其中不同风险域可以是同一场景下的不同风险类型，也可以是不同场景。在本申请实施例中风险域的数量为N个，N为预设的正整数。以同一场景下的不同风险类型为例，例如可以获取具有欺诈风险、赌博风险、非法投资风险等风险类型的事件、可信行为事件等作为第一事件样本，对这些第一事件样本标注风险类型，构成第一训练数据。

下面结合实施例对上述步骤204即“获取各第一训练样本的安全支持集和N个风险域的风险支持集”。

在获取第一训练样本的安全支持集时，实际上是获取第一训练样本中第一事件样本的安全支持集。所谓安全支持集指的是第一事件样本对应的安全事件所构成的支持集。对于一个行为事件而言，其行为的风险信息很大程度上取决于行为发起方，因此，作为其中一种可实现的方式，可以获取第一事件样本的发起用户对应的历史安全事件，将这些历史安全事件所构成的序列作为第一训练样本的安全支持集。安全支持集是每个第一事件样本所独有的。

在获取N个风险域的风险支持集时，可以分别获取N个风险域的风险事件，将各风险域的风险事件所构成的序列分别作为各风险域的风险支持集。各风险域的风险支持集由各第一训练样本共享。

以其中一个第一事件样本为例，假设该第一事件样本为一个交易事件，对该交易事件的发起账户历史的可信交易行为事件进行采样，得到L个可信交易行为即安全事件构成安全支持集，表示为support_white。L为大于1的正整数。

假设存在4个风险域：A、B、C、D。对风险域A的风险事件（即具有该风险域对应风险的事件）采样L个风险事件构成风险域A的风险支持集，表示为support_black_A。同理可以得到风险域B、C和D的风险支持集，表示为support_black_B、support_black_C和support_black_D。

由于具有4个风险域，因此在标签空间中存在5个标签：可信类别、类别A、类别B、类别C和类别D。

下面结合实施例对上述步骤206即“利用第一训练数据训练包括编码模块和第一预测模块的第一风险识别模型”进行详细描述。

本申请实施例训练的第一风险识别模型旨在利用一个模型实现对N个风险域的统一风险识别。如图3中所示，第一风险识别模型包括编码模块和第一预测模块。

编码模块用以对输入的事件进行编码，得到该事件的特征向量。对于每一个事件可以具有相同数量和维度的特征信息，因此该事件可以表示为：，其中为第个特征信息。以网络交易行为为例，可以具有诸如交易类型、交易金额、交易渠道、交易时间、交易地点、交易频率等个特征，为预设的正整数。在本申请实施例涉及的训练过程中，编码模块可以对第一训练样本中的第一事件样本、第一训练样本的安全支持集和N个风险域的风险支持集中的各事件进行编码，得到第一事件样本的特征向量、第一训练样本的安全支持集和N个风险域的风险支持集中各事件的特征向量。编码模块的编码处理可以表示为。其中编码模块可以采用诸如CNN（Convolutional Neural Networks，卷积神经网络）、Transformer（转换）网络等神经网络来实现。

第一预测模块可以利用第一事件样本的特征向量和第一训练样本的安全支持集中各事件的特征向量，确定第一事件样本与安全数据集的相关度；利用第一事件样本的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定第一事件样本与各风险域的风险支持集的相关度，依据第一事件样本分别与安全支持集、各风险域的风险支持集的相关度预测第一事件样本的风险信息。

其中，在确定第一事件样本与安全数据集的相关度以及第一事件样本与风险支持集的相关度时，可以采用基于特征向量之间的距离的方式。作为其中一种可实现的方式，可以确定第一事件样本的特征向量与安全支持集的表征中心之间的距离作为第一事件样本与安全支持集的相关度，其中安全支持集的表征中心由安全支持集中各事件的特征向量进行求平均后得到。针对各风险域，分别确定第一事件样本的特征向量与风险域的风险支持集的表征中心之间的距离作为第一事件样本与该风险域的风险支持集的相关度，其中风险域的风险支持集的表征中心由该风险域的风险支持集中各事件的特征向量进行求平均后得到。

例如，第一事件样本的特征向量表示为。第一事件样本的安全支持集中各事件的特征向量进行求平均处理后得到该安全支持集的表征中心，表示为。第个风险域的风险支持集中各事件的特征向量进行求平均处理后得到该风险支持集的表征中心，表示为。第一事件样本与安全支持集的相关度可以由和之间的距离确定，例如可以采用L2距离。第一事件样本与第个风险域的风险支持集的相关度可以由和之间的距离确定。

除了确定第一事件样本的特征向量与安全支持集的表征中心之间的距离作为第一事件样本与安全支持集的相关度之外，也可以采用其他方式。例如可以将第一事件样本的特征向量分别与安全支持集中各事件的特征向量求距离，将获得的距离进行求平均处理、取中值处理等，从而得到第一事件样本与安全支持集的相关度。第一事件样本与该风险域的风险支持集的相关度的确定方式类似。

第一预测模块在得到和各之后，可以进分别对和各进行映射，例如进行softmax处理，得到第一事件样本属于类别的概率。据此可以进一步得到第一事件样本的风险信息，例如具体属于可信事件还是具体某一个风险类别。

其中，可以采用如下公式表示：是类别的表征中心，是取距离的函数，为所有类别中的任意类别，包括可信事件和各风险域对应的风险类别。

第一风险识别模型的训练目标包括：最小化第一预测模块预测得到的第一事件样本的风险信息与该第一事件样本的风险信息标签之间的差异。也就是说，将第一事件样本被标注的风险信息标签作为目标输出。

可以依据上述训练目标构造损失函数，例如采用交叉熵（cross_entropy）损失函数。在每一轮迭代中利用损失函数的取值，采用诸如梯度下降等方式更新模型参数，直至满足预设的训练结束条件。其中训练结束条件可以包括诸如损失函数的取值小于或等于预设的损失函数阈值，迭代次数达到预设的次数阈值等。可见在上述训练过程中，不同任务（即不同风险域的训练任务）在训练过程中共享编码模块的模型参数，每个任务的预测是独立的，即利用不同风险域的表征中心来进行预测。

从上述公式（1）中可以看出，本申请实施例提供的第一风险识别模型的训练方式只需要可导即可，避免了多任务训练梯度冲突的问题。

训练结束后，编码模块就能够针对输入事件得到一个针对各风险域的通用表征。对于训练得到的第一风险识别模型可以用以统一进行不同风险域的风险识别。风险识别方法可以如图4中所示，该方法可以由图1所示系统架构中的风险识别装置执行。如图4所示，该方法可以包括如下步骤：

步骤402：获取待识别事件、待识别事件的安全支持集和M个风险域的风险支持集，M为预设的正整数。

其中待识别事件可以是网络中实时发生的网络行为事件，也可以是已经发生的历史网络行为事件。同样根据不同场景而不同，以网络交易场景为例，可以是诸如支付行为、存取款行为、收款行为、收发红包行为等等与金融类相关的交易行为。

在获取待识别事件的安全支持集时，作为其中一种可实现的方式，可以获取待识别事件的发起用户对应的历史安全事件，将该历史安全事件所构成的序列作为待识别事件的安全支持集。例如，对待识别事件的发起账户历史的可信事件进行采样，得到L个可信事件构成安全支持集，表示为support_white。L为大于1的正整数。

需要说明的是，利用已经训练得到的第一风险识别模型不仅仅可以进行N个风险域的风险识别，也可以进行风险域的扩展、限缩和修改。即可以进行M个风险域的识别，该M个风险域可以是训练过程中所使用N个风险域的子集，也可以包括上述N个风险域，或者与上述N个风险域有部分重合。在风险识别过程中仅需要获取M个风险域的风险支持集即可，即分别获取M个风险域的风险事件分别构成M个风险域的风险支持集。

假设获取5个风险域：A、B、C、D和E，即相对于训练第一风险识别模型过程中，增加了一个风险域E。分别得到各风险域的风险支持集，表示为support_black_A、support_black_B、support_black_C、support_black_D和support_black_E。

步骤404：将待识别事件以及待识别事件的安全支持集输入第一风险识别模型，第一风险识别模型包括编码模块和第一预测模块；编码模块对待识别事件、安全支持集和M个风险域的风险支持集中的各事件进行编码，得到待识别事件的特征向量、安全支持集和M个风险域的风险支持集中各事件的特征向量；第一预测模块利用待识别事件的特征向量和安全支持集中各事件的特征向量，确定待识别事件与安全支持集的相关度，利用待识别事件的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定待识别事件与各风险域的风险支持集的相关度，依据待识别事件分别与安全支持集、各风险域的风险支持集的相关度预测待识别事件的风险信息。

其中，第一预测模块在确定待识别事件与安全数据集的相关度以及待识别事件与风险支持集的相关度时，可以采用基于特征向量之间的距离的方式。作为其中一种可实现的方式，可以确定待识别事件的特征向量与安全支持集的表征中心之间的距离作为待识别事件与安全支持集的相关度，其中安全支持集的表征中心由安全支持集中各事件的特征向量进行求平均后得到。针对各风险域，分别确定待识别事件的特征向量与风险域的风险支持集的表征中心之间的距离作为待识别事件与该风险域的风险支持集的相关度，其中风险域的风险支持集的表征中心由该风险域的风险支持集中各事件的特征向量进行求平均后得到。

例如，待识别事件的特征向量表示为。待识别事件的安全支持集中各事件的特征向量进行求平均处理后得到该安全支持集的表征中心，表示为。第个风险域的风险支持集中各事件的特征向量进行求平均处理后得到该风险支持集的表征中心，表示为。待识别事件与安全支持集的相关度可以由和之间的距离确定，例如可以采用L2距离。待识别事件与第个风险域的风险支持集的相关度可以由和之间的距离确定。

除了确定待识别事件的特征向量与安全支持集的表征中心之间的距离作为待识别事件与安全支持集的相关度之外，也可以采用其他方式。例如可以将待识别事件的特征向量分别与安全支持集中各事件的特征向量求距离，将获得的距离进行求平均处理、取中值处理等，从而得到待识别事件与安全支持集的相关度。待识别事件与该风险域的风险支持集的相关度的确定方式类似。

第一预测模块在得到和之后，可以分别对和各进行映射，例如进行softmax处理，得到待识别事件属于可信事件的概率以及待识别事件属于各风险域对应风险类别的概率，据此可以进一步得到待识别事件的风险信息，例如属于可信事件还是具体某一个风险类别。由于待识别事件在第风险域上的预测结果是与该风险域中各事件的特征向量相关的，而各风险域中的事件是独立的。因此，由N个风险域上训练得到的第一风险预测模型可以很容易扩展至M个风险域上，仍可以达到很好的识别效果。

接续上例，假设获取5个风险域：A、B、C、D和E，即相对于训练第一风险识别模型过程中，增加了一个风险域E。分别得到各风险域的风险支持集，表示为support_black_A、support_black_B、support_black_C、support_black_D和support_black_E。第一预测模块最终得到待识别事件属于可信事件的概率、属于风险域A所对应类别的概率、属于风险域B所对应类别的概率、属于风险域C所对应类别的概率、属于风险域D所对应类别的概率以及属于风险域E所对应类别的概率。根据这些概率的取值，确定待识别事件的风险类别，例如将最高概率值对应的风险类别确定为待识别事件的风险类别。

第一风险预测模型在训练完毕后，由编码模块对各事件得到的特征向量是一定的。为了方便识别过程，提高识别效率，可以在第一风险预测模型训练完毕后，预先利用其中的编码模块对M个风险域的风险支持集中的事件进行编码，得到M个风险域的风险支持集中各事件的特征向量，进行存储，以便第一风险预测模型在针对待识别事件进行风险识别时，直接获取各风险域风险支持集中各事件的特征向量，而不必每次预测都重复对M个风险域的风险支持集中的事件进行编码。

作为其中一种可实现的方式，可以在第一风险预测模型训练完毕后，预先利用其中的编码模块对M个风险域的风险支持集中的事件进行编码，得到M个风险域的风险支持集中各事件的特征向量并分别进行求平均后，得到各风险域的风险支持集的表征中心并进行存储。在利用第一风险预测模型对待识别事件进行风险识别时，获取已经存储的各风险域的风险支持集的表征中心从而确定待识别事件与各风险域的风险支持集的相关度。

更进一步地，由于第一风险识别模型中编码模块得到的是对各风险域而言通用的表征，因此能够利用该表征在下游任务上进行较快地泛化又不会产生梯度冲突。因此本申请实施例可以将利用图2所示流程训练得到的编码模块作为一个预训练模型，在该编码模块的基础上进行进一步的精调，得到新的风险识别模型。精调过程可以如图5中所示，包括以下步骤：

步骤502：获取包括多个第二训练样本的第二训练数据，第二训练样本包括第二事件样本以及该第二事件样本的风险信息标签。

本实施例中获取的第二事件样本是具有明确风险信息的事件，对第二事件样本标注的风险信息标签可以是一个风险域的风险信息标签，也可以是多个风险域的风险信息标签，这与精调得到的第二风险识别模型相关。可以是N个风险域的风险信息标签，即与预训练编码模块时采用的风险域一致。也可以是M个风险域的风险信息标签，该M个风险域可以是预训练编码模块时采用的N个风险域的子集，也可以包括上述N个风险域，或者与上述N个风险域有部分重合。

步骤504：利用图2所示流程训练得到的编码模块和第二预测模块构建第二风险识别模型。

步骤506：利用第二训练数据训练第二风险识别模型，第二风险识别模型的训练目标包括：最小化第二预测模块预测得到的第二事件样本的风险信息与该第二事件样本的风险信息标签之间的差异。

第二风险识别模型的结构可以如图6中所示，编码模块对第二训练样本中的第二事件样本进行编码，得到第二事件样本的特征向量。

第二预测模块利用第二事件样本的特征向量预测第二事件样本的风险信息。与第一预测模块不同的是，第二预测模块并非利用第二事件样本与安全数据集、各风险支持集的相关度来进行风险信息的映射，而是直接利用第二事件样本的特征向量映射至风险信息空间，得到第二时间样本的风险信息。

可以依据上述训练目标构造损失函数，例如采用交叉熵（cross_entropy）损失函数。在每一轮迭代中利用损失函数的取值，采用诸如梯度下降等方式更新模型参数，直至满足预设的训练结束条件。其中训练结束条件可以包括诸如损失函数的取值小于或等于预设的损失函数阈值，迭代次数达到预设的次数阈值等。

训练结束后，第二风险识别模型也可以用以统一进行不同风险域的风险识别。获取待识别事件后，将待识别事件输入第二风险识别模型后，获取第二风险识别模型输出的待识别事件的风险信息。具体地，第二风险识别模型中的编码模块对待识别事件进行编码，得到待识别事件的特征向量。第二预测模块利用待识别事件的特征向量映射至风险信息空间，以预测待识别事件的风险信息。

线上利用第二风险识别模型进行风险识别，无需存储各风险域的风险支持集的相关数据，减轻了存储压力。

在实际应用中，上述第一风险识别模型或者第二风险识别模型可以在线上对行为事件对应的流量进行风险识别。如果识别得到行为事件为可信事件，则可以对该流量进行放行即正常转发。若识别得到具体的风险类别，则可以将该流量转发与该风险类别相对应的风险控制系统。例如，若识别得到行为事件具有洗钱风险，则可以将包含该行为事件对应的流量转发至洗钱风险对应的风险控制系统，由洗钱风险对应的风险控制系统对该行为事件进行更细致的判别或者对该行为事件进行与该风险类别相对应的控制处理。

以上是对本公开所提供方法进行的详细描述，下面对本公开所提供的装置进行详细描述。

图7为本申请实施例提供的一种训练风险识别模型的装置的结构示意图，如图7所示，该装置700可以包括：第一样本获取单元701和第一模型训练单元702，还可以进一步包括数据存储单元703、第二样本获取单元704和第二模型训练单元705。其中各组成单元的主要功能如下：

第一样本获取单元701，被配置为获取包括多个第一训练样本的第一训练数据，第一训练样本包括第一事件样本以及该第一事件样本的风险信息标签；以及获取各第一训练样本的安全支持集和N个风险域的风险支持集，N为预设的正整数。

第一模型训练单元702，被配置为利用第一训练数据训练包括编码模块和第一预测模块的第一风险识别模型；编码模块对第一训练样本中的第一事件样本、第一训练样本的安全支持集和N个风险域的风险支持集中的各事件进行编码，得到第一事件样本的特征向量、第一训练样本的安全支持集和N个风险域的风险支持集中各事件的特征向量；第一预测模块利用第一事件样本的特征向量和第一训练样本的安全支持集中各事件的特征向量，确定第一事件样本与安全数据集的相关度，利用第一事件样本的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定第一事件样本与各风险域的风险支持集的相关度，依据第一事件样本分别与安全支持集、各风险域的风险支持集的相关度预测第一事件样本的风险信息；训练的目标包括：最小化第一预测模块预测得到的第一事件样本的风险信息与该第一事件样本的风险信息标签之间的差异。

作为其中一种可实现的方式，第一样本获取单元701可以具体被配置为：获取第一训练样本中第一事件样本的发起用户对应的历史安全事件，将该历史安全事件所构成的序列作为该第一训练样本的安全支持集；分别获取N个风险域的风险事件，将各风险域的风险事件所构成的序列分别作为各风险域的风险支持集，各风险域的风险支持集由各第一训练样本共享。

作为其中一种可实现的方式，第一模型训练单元702可以具体被配置为：确定第一事件样本的特征向量与安全支持集的表征中心之间的距离作为第一事件样本与安全支持集的相关度，其中安全支持集的表征中心由安全支持集中各事件的特征向量进行求平均后得到。针对各风险域，分别确定第一事件样本的特征向量与风险域的风险支持集的表征中心之间的距离作为第一事件样本与该风险域的风险支持集的相关度，其中风险域的风险支持集的表征中心由该风险域的风险支持集中各事件的特征向量进行求平均后得到。

作为其中一种可实现的方式，数据存储单元703，被配置为第一风险识别模型训练结束后，利用训练得到的编码模块对N个风险域的风险支持集中的事件进行编码，得到N个风险域的风险支持集中各事件的特征向量；分别利用各风险域的风险支持集中各事件的特征向量得到各风险域的表征中心；存储各风险域的表征中心以供风险识别过程中使用。

第二样本获取单元704，被配置为获取包括多个第二训练样本的第二训练数据，第二训练样本包括第二事件样本以及该第二事件样本的风险信息标签。

第二模型训练单元705，被配置为第一风险识别模型训练结束后，利用训练得到的编码模块和第二预测模块构建第二风险识别模型；利用第二训练数据训练第二风险识别模型；其中编码模块对第二训练样本中的第二事件样本进行编码，得到第二事件样本的特征向量；第二预测模块利用第二事件样本的特征向量预测第二事件样本的风险信息；第二风险识别模型的训练目标包括：最小化第二预测模块预测得到的第二事件样本的风险信息与该第二事件样本的风险信息标签之间的差异。

图8为本申请实施例提供的一种风险识别装置的结构示意图，如图8中所示，该装置可以包括：第一获取单元801和第一识别单元802。其中各组成单元的主要功能如下：

第一获取单元801，被配置为获取待识别事件、待识别事件的安全支持集和M个风险域的风险支持集，M为预设的正整数。

第一识别单元802，被配置为将待识别事件以及待识别事件的安全支持集输入第一风险识别模型，第一风险识别模型包括编码模块和第一预测模块；编码模块对待识别事件、安全支持集和M个风险域的风险支持集中的各事件进行编码，得到待识别事件的特征向量、安全支持集和M个风险域的风险支持集中各事件的特征向量；第一预测模块利用待识别事件的特征向量和安全支持集中各事件的特征向量，确定待识别事件与安全支持集的相关度，利用待识别事件的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定待识别事件与各风险域的风险支持集的相关度，依据待识别事件分别与安全支持集、各风险域的风险支持集的相关度预测待识别事件的风险信息，M为预设的正整数。

作为其中一种可实现的方式，第一获取单元801在获取待识别事件的安全支持集时，获取待识别事件的发起用户对应的历史安全事件，将该历史安全事件所构成的序列作为待识别事件的安全支持集。

作为其中一种可实现的方式，第一识别单元802，被具体配置为确定待识别事件的特征向量与安全支持集的表征中心之间的距离作为待识别事件与安全支持集的相关度，其中安全支持集的表征中心由安全支持集中各事件的特征向量进行求平均后得到；针对各风险域，分别确定第一事件样本的特征向量与风险域的风险支持集的表征中心之间的距离作为待识别事件与该风险域的风险支持集的相关度，其中风险域的风险支持集的表征中心由该风险域的风险支持集中各事件的特征向量进行求平均后得到。

作为其中一种可实现的方式，预测模块获取预先存储的各风险域的风险支持集的表征中心；各风险域的风险支持集的表征中心是第一风险识别模型训练结束后，利用编码模块对M个风险域的风险支持集中的事件进行编码，得到M个风险域的风险支持集中各事件的特征向量后，利用M个风险域的风险支持集中各事件的特征向量进行求平均后得到的。

图9为本申请实施例提供的另一种风险识别装置的结构示意图，如图9中所示，该装置可以包括：第二获取单元901和第二识别单元902。其中各组成单元的主要功能如下：

第二获取单元901，被配置为获取待识别事件。

第二识别单元902，被配置为将待识别事件输入由如图8所示装置预先训练得到的第二风险识别模型，获取第二风险识别模型输出的待识别事件的风险信息。

其中第二风险识别模型包括编码模块和第二预测模块。

编码模块对待识别事件进行编码，得到待识别事件的特征向量；第二预测模块利用待识别事件的特征向量预测待识别事件的风险信息。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述方法实施例中任一项所述的方法的步骤。

以及一种电子设备，包括：

一个或多个处理器；以及

与所述一个或多个处理器关联的存储器，所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时，执行前述方法实施例中任一项所述的方法的步骤。

本申请还提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现前述方法实施例中任一项所述的方法的步骤。

其中，存储器可以采用ROM（Read Only Memory，只读存储器）、RAM（Random AccessMemory，随机存取存储器）、静态存储设备，动态存储设备等形式实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机程序产品的形式体现出来，该计算机程序产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例或者实施例的某些部分所述的方法。

以上的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种训练风险识别模型的方法，其特征在于，所述方法包括：

利用所述第一训练数据训练包括编码模块和第一预测模块的第一风险识别模型；所述编码模块对所述第一训练样本中的第一事件样本、所述第一训练样本的安全支持集和N个风险域的风险支持集中的各事件进行编码，得到第一事件样本的特征向量、所述第一训练样本的安全支持集和N个风险域的风险支持集中各事件的特征向量；所述第一预测模块利用所述第一事件样本的特征向量和所述第一训练样本的安全支持集中各事件的特征向量，确定所述第一事件样本与安全数据集的相关度，利用所述第一事件样本的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定所述第一事件样本与各风险域的风险支持集的相关度，依据所述第一事件样本分别与所述安全支持集、各风险域的风险支持集的相关度预测所述第一事件样本的风险信息；

2.根据权利要求1所述的方法，其特征在于，所述获取各第一训练样本的安全支持集和N个风险域的风险支持集包括：

3.根据权利要求1所述的方法，其特征在于，利用所述第一事件样本的特征向量和所述第一训练样本的安全支持集中各事件的特征向量，确定所述第一事件样本与所述安全数据集的相关度包括：确定所述第一事件样本的特征向量与所述安全支持集的表征中心之间的距离作为所述第一事件样本与所述安全支持集的相关度，其中所述安全支持集的表征中心由所述安全支持集中各事件的特征向量进行求平均后得到；

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述N个风险域包括N个风险类别，所述风险信息包括风险类别信息。

6.一种风险识别方法，其特征在于，所述方法包括：

7.根据权利要求6所述的方法，其特征在于，获取所述待识别事件的安全支持集包括：

8.根据权利要求6所述的方法，其特征在于，利用所述待识别事件的特征向量和所述安全支持集中各事件的特征向量，确定所述待识别事件与所述安全支持集的相关度包括：确定所述待识别事件的特征向量与所述安全支持集的表征中心之间的距离作为所述待识别事件与所述安全支持集的相关度，其中所述安全支持集的表征中心由所述安全支持集中各事件的特征向量进行求平均后得到；

9.根据权利要求8所述的方法，其特征在于，所述第一预测模块获取预先存储的各风险域的风险支持集的表征中心；各风险域的风险支持集的表征中心是所述第一风险识别模型训练结束后，利用所述编码模块对所述M个风险域的风险支持集中的事件进行编码，得到所述M个风险域的风险支持集中各事件的特征向量后，利用所述M个风险域的风险支持集中各事件的特征向量进行求平均后得到的。

10.一种风险识别方法，其特征在于，所述方法包括：

获取待识别事件；

将所述待识别事件输入采用如权利要求4所述方法预先训练得到的第二风险识别模型，获取所述第二风险识别模型输出的所述待识别事件的风险信息。

11.一种训练风险识别模型的装置，其特征在于，所述装置包括：

第一模型训练单元，被配置为利用所述第一训练数据训练包括编码模块和第一预测模块的第一风险识别模型；所述编码模块对所述第一训练样本中的第一事件样本、所述第一训练样本的安全支持集和N个风险域的风险支持集中的各事件进行编码，得到第一事件样本的特征向量、所述第一训练样本的安全支持集和N个风险域的风险支持集中各事件的特征向量；所述第一预测模块利用所述第一事件样本的特征向量和所述第一训练样本的安全支持集中各事件的特征向量，确定所述第一事件样本与安全数据集的相关度，利用所述第一事件样本的特征向量以及各风险域的风险支持集中各事件的特征向量分别确定所述第一事件样本与各风险域的风险支持集的相关度，依据所述第一事件样本分别与所述安全支持集、各风险域的风险支持集的相关度预测所述第一事件样本的风险信息；所述训练的目标包括：最小化所述第一预测模块预测得到的所述第一事件样本的风险信息与该第一事件样本的风险信息标签之间的差异。

12.根据权利要求11所述的装置，其特征在于，所述装置还包括：

13.一种风险识别装置，其特征在于，所述装置包括：

14.一种风险识别装置，其特征在于，所述装置包括：

第二获取单元，被配置为获取待识别事件；

第二识别单元，被配置为将所述待识别事件输入由如权利要求13所述装置预先训练得到的第二风险识别模型，获取所述第二风险识别模型输出的所述待识别事件的风险信息。

15.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1至10中任一项所述的方法。

16.一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1至10中任一项所述的方法。