CN114092097B

CN114092097B - 风险识别模型的训练方法、交易风险确定方法及装置

Info

Publication number: CN114092097B
Application number: CN202111396497.XA
Authority: CN
Inventors: 周璟; 傅幸; 吕乐; 王宁涛; 杨阳; 范东云; 刘佳; 王维强; 宝鹏庆
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-11-23
Filing date: 2021-11-23
Publication date: 2024-05-24
Anticipated expiration: 2041-11-23
Also published as: CN114092097A

Abstract

本说明书一个或多个实施例涉及数据处理技术领域，尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。该方法包括：获取训练样本，训练样本包括第一交易的意愿标签、风险标签以及多个特征；将多个特征输入风险识别模型进行预测处理，预测处理包括，在特征处理网络，对多个特征进行特征交叉处理，得到表征向量；在第一识别层，基于对表征向量的第一处理结果，确定第一交易的意愿度；在第二识别层，基于对表征向量的第二处理结果，确定第一交易的风险度；在预测损失减小的方向，更新风险识别模型的参数，其中预测损失包括第一损失和第二损失，第一损失基于意愿度和意愿标签确定，第二损失基于风险度和风险标签确定。

Description

风险识别模型的训练方法、交易风险确定方法及装置

技术领域

本说明书一个或多个实施例涉及数据处理技术领域，尤其涉及一种风险识别模型的训练方法、交易风险确定方法及装置。

背景技术

随着网络及计算机技术的发展，线上服务平台为用户提供了多种多样的便捷化服务，例如购买商品、转账等交易支付服务。用户的每笔交易支付有可能存在交易风险，例如盗用风险、欺诈风险、虚假交易风险等。因此，能够及时发现交易风险，保障用户的资产安全是线上服务平台所重点关注的。

发明内容

本说明书一个或多个实施例描述了一种风险识别模型的训练方法、交易风险确定方法及装置，可以高效且准确的识别可信交易。

第一方面，提供了一种风险识别模型的训练方法，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层，所述方法包括：获取训练样本，所述训练样本包括第一交易的意愿标签、风险标签以及多个特征，所述第一交易为第一用户和第二用户之间的交易，所述多个特征至少包括第一用户的特征和第二用户的特征；将所述多个特征输入所述风险识别模型进行预测处理，所述预测处理包括，在所述特征处理网络，对所述多个特征进行特征交叉处理，得到表征向量；在所述第一识别层，基于对所述表征向量的第一处理结果，确定所述第一交易的意愿度；在所述第二识别层，基于对所述表征向量的第二处理结果，确定所述第一交易的风险度；在预测损失减小的方向，更新所述风险识别模型的参数，其中所述预测损失包括第一损失和第二损失，所述第一损失基于所述意愿度和所述意愿标签确定，第二损失基于所述风险度和所述风险标签确定。

在一个实施例中，所述多个特征还包括关联特征，所述关联特征用于表示所述第一用户和第二用户之间的关联关系。

在一个实施例中，所述特征处理网络包括，表征层，特征交叉层和融合层，所述特征交叉处理包括：在所述表征层，对所述多个特征进行嵌入处理，得到多个编码向量；在所述特征交叉层，对所述多个编码向量中的各个编码向量进行多个维度的交叉处理，得到多个子向量；在所述融合层，对所述多个子向量进行组合，得到所述表征向量。

在一个实施例中，所述特征交叉层包括多层感知机，因子分解机和高维交叉层，所述多个维度的交叉处理包括：利用所述多层感知机，对所述多个编码向量进行线性处理，得到第一子向量；利用所述因子分解机，对所述多个编码向量进行二阶交叉处理，得到第二子向量；其中二阶交叉处理包括两两向量之间的元素组合；利用所述高维交叉层，对所述多个编码向量进行高阶交叉处理，得到第三子向量；其中，所述高阶交叉处理包括，三个以上向量之间的元素组合。

在一个实施例中，所述高阶交叉处理包括：对所述多个编码向量进行拼接和非线性变换，得到第一特征向量，所述第一特征向量中所有元素均为正数；针对所述高阶交叉处理中任意的交叉阶数，利用与所述交叉阶数对应的矩阵处理所述第一特征向量的自然对数，得到中间向量，并基于所述中间向量的自然指数确定所述交叉阶数对应的交叉向量；基于所述高阶交叉处理中各个交叉阶数各自对应的交叉向量，确定所述第三子向量。

在一个实施例中，对所述多个子向量进行组合包括，将所述多个子向量进行拼接，得到所述表征向量。

在一个实施例中，所述风险识别模型还包括多个打分模块，第一门控层和第二门控层；所述预测处理还包括：利用所述多个打分模块，基于所述表征向量分别进行打分，得到多个打分结果；在所述第一门控层，基于所述表征向量和第一参数，确定针对所述第一识别层的多个第一权重；其中，基于所述多个第一权重对所述多个打分结果进行加权组合的结果，作为所述第一处理结果；在所述第二门控层，基于所述表征向量和第二参数，确定针对所述第二识别层的多个第二权重；其中，基于所述多个第二权重对所述多个打分结果进行加权组合的结果，作为所述第二处理结果。

在一个实施例中，所述获取训练样本包括，通过以下方式确定所述意愿标签：当在所述第一交易发生后预设时长内，所述第一用户和所述第二用户之间再次发生了交易，确定所述意愿标签为符合用户意愿；和/或，当在所述第一交易发生后预设时长内，所述第一用户和所述第二用户之间没有发生交易，确定所述意愿标签为不符合用户意愿。

第二方面，提供了一种利用风险识别模型确定交易风险的方法，所述风险识别模型利用第一方面提供的方法训练得到，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层，所述方法包括：获取目标交易的多个交易特征，所述多个交易特征至少包括发起方特征和接收方特征；将所述多个交易特征输入所述风险识别模型，通过所述第二识别层输出所述目标交易的目标风险度；至少根据所述目标风险度，确定所述目标交易是否被允许。

在一个实施例中，该方法还包括，通过所述第一识别层输出所述目标交易的目标意愿度；至少根据所述目标风险度，确定所述目标交易是否被允许，包括：根据所述目标意愿度和所述目标风险度，确定所述目标交易是否被允许。

在一个实施例中，根据所述目标意愿度和所述目标风险度，确定所述目标交易是否被允许，包括：获取所述目标交易所要交易的第一资源量；根据所述目标风险度和所述第一资源量，确定资源损失量；当所述资源损失量小于第一阈值，且所述目标意愿度大于第二阈值时，确定所述目标交易为被允许的交易。

第三方面，提供了一种风险识别模型的训练装置，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层，所述装置包括：获取单元，被配置为：获取训练样本，所述训练样本包括第一交易的意愿标签、风险标签以及多个特征，所述第一交易为第一用户和第二用户之间的交易，所述多个特征至少包括第一用户的特征和第二用户的特征；预测单元，被配置为：将所述多个特征输入所述风险识别模型进行预测处理，所述预测处理包括，在所述特征处理网络，对所述多个特征进行特征交叉处理，得到表征向量；确定单元，被配置为：在所述第一识别层，基于对所述表征向量的第一处理结果，确定所述第一交易的意愿度；在所述第二识别层，基于对所述表征向量的第二处理结果，确定所述第一交易的风险度；更新单元，被配置为：在预测损失减小的方向，更新所述风险识别模型的参数，其中所述预测损失包括第一损失和第二损失，所述第一损失基于所述意愿度和所述意愿标签确定，第二损失基于所述风险度和所述风险标签确定。

在一个实施例中，所述特征处理网络包括，表征层，特征交叉层和融合层，所述预测单元被配置为：在所述表征层，对所述多个特征进行嵌入处理，得到多个编码向量；在所述特征交叉层，对所述多个编码向量中的各个编码向量进行多个维度的交叉处理，得到多个子向量；在所述融合层，对所述多个子向量进行组合，得到所述表征向量。

在一个实施例中，所述特征交叉层包括多层感知机，因子分解机和高维交叉层，所述预测单元还被配置为：利用所述多层感知机，对所述多个编码向量进行线性处理，得到第一子向量；利用所述因子分解机，对所述多个编码向量进行二阶交叉处理，得到第二子向量；其中二阶交叉处理包括两两向量之间的元素组合；利用所述高维交叉层，对所述多个编码向量进行高阶交叉处理，得到第三子向量；其中，所述高阶交叉处理包括，三个以上向量之间的元素组合。

在一个实施例中，所述预测单元还被配置为：对所述多个编码向量进行拼接和非线性变换，得到第一特征向量，所述第一特征向量中所有元素均为正数；针对所述高阶交叉处理中任意的交叉阶数，利用与所述交叉阶数对应的矩阵处理所述第一特征向量的自然对数，得到中间向量，并基于所述中间向量的自然指数确定所述交叉阶数对应的交叉向量；基于所述高阶交叉处理中各个交叉阶数各自对应的交叉向量，确定所述第三子向量。

在一个实施例中，所述预测单元还被配置为：将所述多个子向量进行拼接，得到所述表征向量。

在一个实施例中，所述风险识别模型还包括多个打分模块，第一门控层和第二门控层；所述预测单元还被配置为：利用所述多个打分模块，基于所述表征向量分别进行打分，得到多个打分结果；在所述第一门控层，基于所述表征向量和第一参数，确定针对所述第一识别层的多个第一权重；其中，基于所述多个第一权重对所述多个打分结果进行加权组合的结果，作为所述第一处理结果；在所述第二门控层，基于所述表征向量和第二参数，确定针对所述第二识别层的多个第二权重；其中，基于所述多个第二权重对所述多个打分结果进行加权组合的结果，作为所述第二处理结果。

在一个实施例中，所述获取单元被配置为：通过以下方式确定所述意愿标签：当在所述第一交易发生后预设时长内，所述第一用户和所述第二用户之间再次发生了交易，确定所述意愿标签为符合用户意愿；和/或，当在所述第一交易发生后预设时长内，所述第一用户和所述第二用户之间没有发生交易，确定所述意愿标签为不符合用户意愿。

第四方面，提供了一种利用风险识别模型确定交易风险的装置，所述风险识别模型利用第一方面提供的方法训练得到，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层，所述装置包括：获取单元，被配置为：获取目标交易的多个交易特征，所述多个交易特征至少包括发起方特征和接收方特征；识别单元，被配置为：将所述多个交易特征输入所述风险识别模型，通过所述第二识别层输出所述目标交易的目标风险度；确定单元，被配置为：至少根据所述目标风险度，确定所述目标交易是否被允许。

在一个实施例中，所述识别单元还被配置为：通过所述第一识别层输出所述目标交易的目标意愿度；所述确定单元还被配置为：根据所述目标意愿度和所述目标风险度，确定所述目标交易是否被允许。

在一个实施例中，所述确定单元还被配置为：获取所述目标交易所要交易的第一资源量；根据所述目标风险度和所述第一资源量，确定资源损失量；当所述资源损失量小于第一阈值，且所述目标意愿度大于第二阈值时，确定所述目标交易为被允许的交易。

第五方面，本说明书实施例提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面或第二方面的所述的方法。

第六方面，本说明书实施例提供了一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面或第二方面所述的方法。

根据本说明书训练得到的风险识别模型可以根据交易双方的交叉关系，来识别交易事件的交易风险和用户意愿度，进而可以根据交易事件的交易风险和用户意愿度，来判断交易事件是否被允许，可以提高识别非法交易事件的准确率，改善用户体验。。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出本说明书披露的一种风险识别模型的结构；

图2示出了本说明书披露的风险识别模型的一种训练方法；

图3示出了本说明书披露的一种确定交易风险的方法；

图4示出了本说明书披露的一种识别模型更新示意图；

图5示出了本说明书披露的风险识别模型的一种训练装置示意图；

图6示出了本说明书披露的交易风险确定装置的示意图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

为了能够及时发现交易风险，保障用户的资产安全，线上服务平台需要一套较为完整的风控体系。

风控体系在能够保障交易风险发现率，实现交易拦截率的同时，还需要追求以下三个目标。

1、降打扰：对进行正常交易支付操作的用户打扰应足够低；

2、减资源：对交易支付操作进行的分析所耗费的机器资源应当足够少；

3、低耗时：对交易支付操作进行的分析所耗费时间应足够低。

一种方案采用了基于人工策略的风控体系，具体而言，该风控体系可以用人工策略对于交易支付事件的是否涉及交易风险做出判断，例如根据RFM策略(RecencyFrequencyMonetary)判断账户和银行卡的关系是否涉及交易风险。该方案只适用于使用同一银行卡反复给同一账户转账的情况，覆盖率较差。例如，刷单类欺诈事件，因为其在前一阶段进行小额多次转账，后面再次大额转账完成欺诈，所以难以被该方案所识别。

另一种方案采用了事件维度的在线树模型，具体而言，使用在线树模型，识别每一笔支付交易事件是否涉及交易风险。该方案衡量指标单一，当交易的接收方特征较少时，效果较差。

本说明书提供了一种风险识别模型，可基于该风险识别模型，对交易事件的交易双方的特征进行特征交叉处理，以表示交易双方的交叉关系，并基于交易双方的交叉关系，识别交易事件涉及交易风险的可能性以及符合用户意愿的可能性，进而根据涉及交易风险的可能性和符合用户意愿的可能性，判断交易事件是否被允许。

其中，交易事件也可以称为交易支付事件或交易，其为线上服务平台基于交易双方或其中一方的交易支付操作而产生的事件。

本说明书提供的风险识别方案可以通过交易双方的交叉关系，来识别交易事件的交易风险和用户意愿度，进而可以根据交易事件的交易风险和用户意愿度，来判断交易事件是否被允许，可以提高非法交易事件的准确率，改善用户交易支付体验。

接下来，首先介绍本说明书提供的风险识别模型及其训练方案。

图1示出了风险识别模型的一种可能结构。如图1所示，该风险识别模型可以包括特征处理网络、第一识别层和第二识别层。其中，第一识别层和第二识别层并列设置，并分别与特征处理网络串联设置。其中，特征处理网络可以对某交易的交易双方的多个特征进行特征交叉处理，得到表征向量。第一识别层可以基于表征向量的一个进一步处理结果，确定交易的意愿度。第二识别层可以基于表征向量或表征向量的另一个进一步处理结果，确定交易的风险度。其中，交易的意愿度和风险度用于联合确定该交易是否被允许。

在一些实施例中，参阅图1，该风险识别模型中的特征处理网络还可以包括依次串联设置的表征层、特征交叉层和融合层。示例性的，该特征交叉层还可以包括并列设置的多层感知机，因子分解机和高维交叉层。这些层的功能将在下文进行介绍，在此不再赘述。

在一些实施例中，参阅图1，特征处理网络还包括并列设置有第一门控层、第二门控层和多个打分模块。该多个打分模块可以包括打分模块A1、打分模块A2……、打分模块Ak。门控层和打分模块的功能将在下文进行介绍，在此不再赘述。

在一些实施例中，参阅图1，风险识别模型还可以包括与特征处理网络串联，且位于特征处理网之前的数据预处理层。该层的功能将在下文进行介绍，在此不再赘述。

接下来，结合风险识别模型的训练过程，对风险识别模型的各层或模块的功能进行举例介绍。

图2示出了风险识别模型的一种可能的训练方法，该方法可以由任何具有计算、处理能力的装置、平台或设备集群执行。为方便描述，可以将该方法的执行主体称为训练平台，训练平台可以在训练方的触发操作下，开始执行该方法。参阅图2，该方法包括如下步骤。

步骤201，获取训练样本，所述训练样本包括第一交易的意愿标签、风险标签以及多个特征，所述第一交易为第一用户和第二用户之间的交易，所述多个特征至少包括第一用户的特征和第二用户的特征。步骤203，将所述多个特征输入所述风险识别模型进行预测处理，所述预测处理包括，在所述特征处理网络，对所述多个特征进行特征交叉处理，得到表征向量。步骤205a，在所述第一识别层，基于对所述表征向量的第一处理结果，确定所述第一交易的意愿度。步骤205b，在所述第二识别层，基于对所述表征向量的第二处理结果，确定所述第一交易的风险度。步骤207，在预测损失减小的方向，更新所述风险识别模型的参数，其中所述预测损失包括第一损失和第二损失，所述第一损失基于所述意愿度和所述意愿标签确定，第二损失基于所述风险度和所述风险标签确定。

接下来，在不同实施例中，对该方法进行示例说明。

首先，在步骤201，可以获取训练样本，所述训练样本包括第一交易的意愿标签、风险标签以及多个特征，所述第一交易为第一用户和第二用户之间的交易，所述多个特征至少包括第一用户的特征和第二用户的特征。

如上所述，第一交易可以为线上服务平台根据第一用户和/或第二用户的交易支付操作而产生的。第一交易可以为在第一用户和第二用户之间发生的一次或多次交易。其中，第一用户可以为第一交易的主动方，第二用户可以为第一交易的被动方。第一用户可以为第一交易的被动方，第二用户可以为第一交易的主动方。其中，交易的主动方可以是指交易中转出资源(例如金钱、积分等)的一方，交易的被动方可以是指交易中接收交易主动方转出的资源的一方。

另外，在下文描述中，当对第一用户和第二用户没有特别区分时，它们可以被简称为用户。

用户的特征可以包括用户的性别、年龄、职业、注册时间、所在地域、所使用设备的型号、支付渠道等可由训练方获取并输入至训练平台的信息。

在一些实施例中，训练样本中多个特征还可以包括第一用户和第二用户的关联特征，所述关联特征用于表示所述第一用户和第二用户之间的关联关系。两个用户的关联特征也可以称为两个用户的交叉类特征。第一用户和第二用户的关联特征可以包括第一用户和第二用户之间发生的交易信息，该交易信息可以包括交易次数、交易时间、交易的资源量、交易的商品等中的一种或多种。示例性的，该交易信息可以包括第一交易的信息。

在一些实施例中，训练样本的数据格式可以如[Fi,Fj,Fk,Label0,Label1]，其中Fi代表交易主动方的特征，Fj代表交易被动方的特征，Fk代表交易主被动方交叉类特征。Fi,Fj,Fk共同组成了训练样本中的多个特征。Label0代表意愿标签，Label1代表风险标签。

在一些实施例中，交易的意愿标签可分为不符合用户意愿、符合用户意愿。第一交易的意愿标签可以由第一用户和第二用户之间是否发生了其他交易确定。具体而言，若在第一交易发生后预设时长内，第一交易的交易双方(即第一用户和第二用户)之间再次发生了其他交易，可以确定第一交易的意愿标签为符合用户意愿。若在第一交易发生后预设时长内，第一用户和第二用户之间没有发生其他交易，可以确定第一交易的意愿标签为不符合用户意愿。

在该实施例中的一个示例中，第一用户和第二用户的角色是固定的。例如，在第一交易和第二交易中，第一用户均为交易主动方，第二用户均为交易被动方。也就是说，当第一用户在第二交易中的角色和第一用户在第一交易中的角色相同，且第二用户在第二交易中的角色和第二用户在第二交易中的角色相同时，该第二交易可以用于确定第一交易的意愿标签为符合用户意愿。

在该实施例中的另一个示例中，第一用户和第二用户在该其他交易中的角色可以不固定。例如，在第一交易中，第一用户为交易主动方，则在该其他交易中，第一用户可以为交易主动方，也可以为交易被动方。

在该实施例中的另一个示例中，预设时长可以为训练方根据实验或经验自由设置。例如，可以将预设时长预设为一周，也可以将预设时长预设为一个月，等等，此处不再一一列举。

在一些实施例中，交易的风险标签可以分为有风险标签、无风险标签。第一交易的风险标签可以人工打标。例如，用户举报某个交易发生了风险，则将该交易打标上风险正标签。

在一些实施例中，回到图1，风险识别模型还可以包括数据预处理层，可以用于对训练样本进行预处理。在数据预处理层可以采用例如归一化，格式对齐等处理机制，对于训练样本中的用户特征进行预处理。

接着，在步骤203中，将所述多个特征输入所述风险识别模型进行预测处理，所述预测处理包括，在所述特征处理网络，对所述多个特征进行特征交叉处理，得到表征向量。

在一些实施例中，如图1所示，特征处理网络可以包括表征层、特征交叉层和融合层。其中，在步骤203进行的特征交叉处理具体可以通过如下方式实现。

在表征层，对所述多个特征进行嵌入处理，得到多个编码向量。表征层也可以称为嵌入(Embedding Layer)层，可以将上述多个特征中的每个特征，表征或者说嵌入为n维编码向量。由此，多个特征可以被表征为多个编码向量，其中，多个特征和多个编码向量一一对应。示例性的，n可以为2的倍数。

在特征交叉层，对多个编码向量中的各个编码向量进行多个维度的交叉处理，得到多个子向量。该多个子向量可以在融合层进行组成，得到对应第一交易的表征向量。表征向量用于后续确定第一交易的意愿度和风险度。

接下来，示例描述多个维度的交叉处理的实现过程。

在这些实施例的一个示例中，如图1所示，特征交叉层可以包括并列设置的多层感知机(Multi-layer Perceptron，MLP)、因子分解机(Factorization Machine，FM)和高维交叉层。

其中，可以利用多层感知机对多个编码向量进行线性处理，得到第一子向量。在一个例子中，多层感知机可以采用公式(1)对多个编码向量进行线性处理。

其中，w⁽¹⁾为感知机的变换矩阵，代表感知机的参数，可以通过训练得到。为多个编码向量形成的矩阵。

可以利用因子分解机对多个编码向量进行二阶交叉处理，得到第二子向量；其中二阶交叉处理包括两两向量之间的元素组合。在一个例子中，因子分解机可以采用公式(2)多个编码向量进行二阶交叉处理。

其中，代表感知机的参数，可以通过训练得到。/>为多个编码向量中第i个编码向量。d_e代表特征的个数，即多个编码向量中编码向量的个数。

可以利用高维交叉层，对多个编码向量进行高阶交叉处理，得到第三子向量；其中，高阶交叉处理包括，三个以上编码向量之间的元素组合。

在一个实施例中，可以通过对数运算，拟合三阶以上的特征交叉处理。在这样的情况下，可以采用对数神经网络(Logarithmic Neural Network，LNN)作为该高维交叉层。

采用LNN进行高阶交叉处理的过程可以包括：对多个编码向量进行拼接和非线性变换，得到第一特征向量，第一特征向量中所有元素均为正数。可以将多个编码向量拼接后得到的向量表示为x，将第一特征向量表示为则：

其中σ为非线性变换函数，使得变换之后的第一特征向量，所有元素均为正数。

在一个具体例子中，上述非线性变换，可以采用relu函数，通过下式进行：

其中，w，w₀分别为参数矩阵和参数向量。根据公式(3)，先利用参数集(参数矩阵和参数向量)对编码向量进行线性变换后，施加relu非线性函数，并添加正数小量∈。并且，通过公式(3)中d_e*d维的参数矩阵w，d维的编码向量x被转换为d。维的第一特征向量

可以理解，根据relu函数的定义relu(x)＝max(x，0)，其函数值最小为0，因此，relu函数结果后添加正数小量，可以确保最终的第一特征向量为正向量，也就是所有元素均为正数。

高阶交叉处理还包括：针对所述高阶交叉处理中任意的交叉阶数，利用与交叉阶数对应的矩阵处理第一特征向量的自然对数，得到中间向量，并基于中间向量的自然指数确定交叉阶数对应的交叉向量。具体而言，可以将高阶交叉处理中任意的交叉阶数称为阶数o，利用阶数o对应的矩阵u_o处理第一特征向量的自然对数/>得到中间向量并基于该中间向量的自然指数/>确定阶数o对应的特征交互向量。对于高阶交互处理中的每个阶数o，对应于第一特征向量中o个向量元素的相乘组合。针对高阶交叉处理中每个交叉阶数，执行上述操作，可以得到各交叉阶数对应的交叉向量。其中，也可以表示为/>

高阶交叉处理还包括：基于所述高阶交叉处理中各个交叉阶数各自对应的交叉向量，确定所述第三子向量。在一个例子中，可以采用式(4)确定第三子向量。

其中，o代表阶数。N代表高阶交叉处理中的总阶数，示例性的，N可以等于训练样本中的多个特征的个数。u₀；w_e；w_e0代表高维交叉层的参数，可通过训练得到。

如此，可以得到多个子向量，其中该多个子向量可以包括第一子向量、第二子向量和第三子向量。

上文示例介绍了特征交叉层功能的一种实现方式。接下来介绍，特征交叉层功能的另一种实现方式。

在一个示例中，在特征交叉层，对所述多个编码向量中的各个编码向量进行多个维度的交叉处理时，可以直接按照特征交叉的阶数，进行暴力运算，比如3阶，就穷举多个编码向量中任意3个编码向量的组合，对组合中的编码向量的向量元素进行相应位置的相乘……，得到3阶对应的子向量。

通过上述方式，可以得到多个子向量。然后，在所述融合层，对所述多个子向量进行组合，可以得到表征向量。

在一些实施例中，在融合层，具体可以将多个子向量进行组合，得到所述表征向量。在一个例子中，可以通过式(5)，进行子向量组合。

其中，其中，f_e为确定表征向量的函数，θ为其中的参数。σ()代表激活函数，例如Relu、Sigmoid等。

通过上述方式，可以得到训练样本所包括的多个特征的表征向量。

回到图2，在步骤205a，在第一识别层，可以基于该表征向量的第一处理结果，确定第一交易的意愿度。以及，在步骤205b，在第二识别层，可以基于该表征向量的第二处理结果，确定第一交易的风险度。其中，第一交易的意愿度用于表示第一交易符合用户意愿的可能性，越大的意愿度，表示第一交易越可能符合用户意愿。第一交易的风险度用于表示第一交易涉及交易风险的可能性，越大的风险度，表示第一交易越可能涉及交易风险。

在一些实施例中，回到图1，风险识别模型还可以包括打分模块A1、打分模块A2、打分模块Ak等多个打分模块，还可以包括第一门控层和第二门控层；所述预测处理还包括：

可以利用所述多个打分模块，基于所述表征向量分别进行打分，得到多个打分结果。

在所述第一门控层，基于所述表征向量和第一参数，确定针对所述第一识别层的多个第一权重。在一个例子中，第一权重可以通过式(6)计算得到。

g^k(x)＝softmax(W_gkx) (6)。

其中，x为表征向量。k代表第k个预测任务，可以设定当k为第一值时，k代表意愿度预测任务，当k为第二值时，k代表风险度预测任务。W_gk代表参数，当k为第一值时，W_gk代表第一参数。

可针对每个打分模块，分别计算第一权重，如此，得到多个第一权重。

然后，基于所述多个第一权重对所述多个打分结果进行加权组合的结果，作为所述第一处理结果。在一个例子中，第一处理结果可以通过式(7)计算得到。

其中，f^k(x)代表第一处理结果。g^k(x)_i代表第k个预测任务在第i个打分模块上的权重，当k为第一值时，该权重为第一权重。f_i(x)代表第i个打分模块的打分。

接着，在第一识别层，可以基于第一处理结果，确定第一交易的意愿度。在一个例子中，可以通过式(8)计算第一交易的意愿度。

y_k＝h^k(f^k(x)) (8)。

其中，y_k代表第k个预测任务的预测结果，当k为第一值时，y_k代表第一交易的意愿度。h^k代表识别层的参数，可通过训练得到，当k为第一值时，h^k代表第一识别层的参数。

同理，在第二门控层，基于所述表征向量和第二参数，确定针对所述第二识别层的多个第二权重。具体可以参考上述对第一权重的介绍，其中，在计算第二权重时，式(6)中的k为第二值。然后，可以通过式(7)计算得到第二处理结果。其中，在计算第二处理结果时，式(7)中的k为第二值。进而可以根据式(8)计算得到第一交易的风险度。其中，在计算第一交易的风险度时，式(8)中的k为第二值。

在一些实施例中，识别模型也可以不包含上述打分模块和第一/第二门控层。在这样的情况下，可以由第一识别层对表征向量进行第一处理，例如第一线性变换，得到第一处理结果。然后基于第一处理结果，确定第一交易的意愿度。相应的，在第二识别层中，可以对表征向量进行第二处理，例如第二线性变换，得到第二处理结果。然后基于第二处理结果，确定第一交易的风险度。

回到图2，训练平台可以接着执行步骤207，在预测损失减小的方向，更新所述风险识别模型的参数，其中所述预测损失包括第一损失和第二损失，所述第一损失基于所述意愿度和所述意愿标签确定，第二损失基于所述风险度和所述风险标签确定。其中，第一损失用于表示意愿度和意愿标签之间的差异，第二损失用于表示风险度和风险标签的差异。

在一些实施例中，可以将第一损失和第二损失组合，例如加权求和，得到预测损失。

如此，通过上述训练方法，可以对风险识别模型中各层或模块中的参数进行迭代训练，以训练到符合需要的风险识别模型。训练得到的风险识别模型可以根据交易双方的交叉关系，来识别交易事件的交易风险和用户意愿度，进而可以根据交易事件的交易风险和用户意愿度，来判断交易事件是否被允许，可以提高识别非法交易事件的准确率，改善用户交易支付体验。其中，非法交易事件是指不符合用户意愿的交易或涉及交易风险的交易。

本说明书提供了一种利用风险识别模型确定交易风险的方法，该方法可由任何具有计算、处理能力的装置、平台或设备集群执行。为方便描述，可以将该方法的执行主体称为推理平台，推理平台可以在推理方的触发操作下，开始执行该方法。该方法利用的风险识别模型可由图2所示的方法训练得到，在此不再赘述。参阅图3，利用风险识别模型确定交易风险的方法可以包括如下步骤。

步骤301，获取目标交易的多个交易特征，所述多个交易特征至少包括发起方特征和接收方特征。具体可以参考上述对图2中步骤201的介绍，在此不再赘述。

步骤303，将所述多个交易特征输入所述风险识别模型，通过所述第二识别层输出所述目标交易的目标风险度。具体可以参考上述对图2中步骤203和步骤205b的介绍，在此不再赘述。

步骤305，至少根据所述目标风险度，确定所述目标交易是否被允许。

在一些实施例中，当目标风险度小于预设风险门限值时，确定目标交易被允许，即确定目标交易为可信交易，进而放行目标交易。

在一些实施例中，确定交易风险的方法还包括，通过第一识别层输出所述目标交易的目标意愿度；至少根据所述目标风险度，确定所述目标交易是否被允许，包括：根据所述目标意愿度和所述目标风险度，确定所述目标交易是否被允许。

在该实施例的一个说明性示例中，可以获取目标交易所要交易的第一资源量(例如交易的金额、积分的数量)。然后，根据目标风险度和第一资源量，确定资源损失量。其中，资源损失量也可以称为资源期望损失量，其并非实际损失，而是根据目标风险度，计算出的可能的发生的损失。在一个例子中，可以通过式(9)计算资源损失量。

其中，Amt_risk代表资源损失量，Score_risk代表目标风险度，amt代表第一资源量。

可以判断资源损失量是否小于损失门限值，以及目标意愿度是否大于意愿度门限值。其中，当资源损失量小于损失门限值，且目标意愿度大于意愿度门限值时，确定目标交易被允许，即确定目标交易为可信交易，进而放行目标交易。在一个例子中，通过在验证数据集上的评估，确定满足整体资损漏放比例下的期望损失阈值。其中，期望损失阈值也可以称为损失门限值。

在该实施例的另一个说明性示例中，可以判断目标风险度是否小于风险门限值，以及目标意愿度是否大于意愿度门限值。其中，当目标风险度小于风险门限值，且目标意愿度大于意愿度门限值时，确定目标交易被允许，即确定目标交易为可信交易，进而放行目标交易。

上文示例介绍了利用风险识别模型识别交易风险的数据处理过程，更详细数据处理的过程可以参考上文对图2所示实施例的介绍，在此不再赘述。

通过本说明书提供的风险识别模型，可以高效且准确的确定目标交易是否被允许，可以在对用户打扰低、耗费机器资源少的情况下，识别出可信的目标交易。

参阅图4，本说明书还提供了一种风险识别模型更新与评估方案。示例性的，可以通过AutoRefit机制，对于风险识别模型进行定期自更新与评估。如果新训练的风险识别模型的效果好于线上正在使用的风险识别模型，则进行切换操作，将线上原来的风险识别模型下线，将新训练的风险识别模型上线。

具体如图4所示，通过步骤1，可以生成样本。具体可以参考上文对训练样本的介绍。通过步骤2，可以进行样本预处理，具体可以参考上文对数据预处理模块的介绍。通过步骤3，在表征层可以对多个特征进行嵌入处理，得到多个编码向量，具体可以参考上文对表征层的介绍。通过步骤4，在特征交叉层，可以对多个编码向量中的各个编码向量进行多个维度的交叉处理，得到多个子向量，具体可以参考上文对特征交叉层的介绍。通过步骤5，在融合层，对多个子向量进行组合，得到表征向量。在步骤6，通过打分模块和门控层，得到表征向量的第一处理结果和第二处理结果，具体可以参考上文对打分模块和门控层的介绍。在步骤7，可以确定意愿度和风险度，具体可以参考上文对第一识别层和第二识别层的介绍。在步骤8，更新模型中的各参数，进行模型训练，具体可参考上述对步骤207的介绍。

可以判断新训练的模型是否好于线上模型。在一些实施例中，可以采用精确率(precision)、召回率(recall)、F1分数(F1-score)等指标，来比较新训练的模型和线上模型的，以判断哪个模型更优。

若新训练的模型好于线上模型，可以在步骤9中，可以重新确定损失门限值。然后，在步骤10，上线新训练的模型。其中，通过步骤11，可以触发再次训练的模型和线上模型的比较操作，以进行模型自更新。

线上模型可以在确定某交易的推理结果满足风险期望资损(即资源损失量小于损失门限值)和符合用户意愿(即意愿度大于意愿门限值)的情况下，将该交易放行。若某交易的推理结果不满足风险期望资损和/或不符合用户意愿，可以将该交易的相关信息流入到交易风险确认层，对该交易是否涉及交易风险以及涉及何种交易风险进行进一步判断。交易风险确认层为风控体系中用于对不可信交易进行进一步风险识别的模块。具体可以参考现有技术的介绍。

本说明书中的模型自更新机制，可以不断优化风险交易模型，捕获实时性交易风险。

基于上文所述的方案，本说明书还提供了一种风险识别模型的训练装置500，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层。

参阅图5，所述装置500包括：

获取单元510，被配置为：获取训练样本，所述训练样本包括第一交易的意愿标签、风险标签以及多个特征，所述第一交易为第一用户和第二用户之间的交易，所述多个特征至少包括第一用户的特征和第二用户的特征；

预测单元520，被配置为：将所述多个特征输入所述风险识别模型进行预测处理，所述预测处理包括，在所述特征处理网络，对所述多个特征进行特征交叉处理，得到表征向量；

确定单元530，被配置为：在所述第一识别层，基于对所述表征向量的第一处理结果，确定所述第一交易的意愿度；在所述第二识别层，基于对所述表征向量的第二处理结果，确定所述第一交易的风险度；

更新单元540，被配置为：在预测损失减小的方向，更新所述风险识别模型的参数，其中所述预测损失包括第一损失和第二损失，所述第一损失基于所述意愿度和所述意愿标签确定，第二损失基于所述风险度和所述风险标签确定。

在一个实施例中，所述特征处理网络包括，表征层，特征交叉层和融合层，所述预测单元520被配置为：在所述表征层，对所述多个特征进行嵌入处理，得到多个编码向量；在所述特征交叉层，对所述多个编码向量中的各个编码向量进行多个维度的交叉处理，得到多个子向量；在所述融合层，对所述多个子向量进行组合，得到所述表征向量。

在一个实施例中，所述特征交叉层包括多层感知机，因子分解机和高维交叉层，所述预测单元520还被配置为：利用所述多层感知机，对所述多个编码向量进行线性处理，得到第一子向量；利用所述因子分解机，对所述多个编码向量进行二阶交叉处理，得到第二子向量；其中二阶交叉处理包括两两向量之间的元素组合；利用所述高维交叉层，对所述多个编码向量进行高阶交叉处理，得到第三子向量；其中，所述高阶交叉处理包括，三个以上向量之间的元素组合。

在一个实施例中，所述预测单元520还被配置为：对所述多个编码向量进行拼接和非线性变换，得到第一特征向量，所述第一特征向量中所有元素均为正数；针对所述高阶交叉处理中任意的交叉阶数，利用与所述交叉阶数对应的矩阵处理所述第一特征向量的自然对数，得到中间向量，并基于所述中间向量的自然指数确定所述交叉阶数对应的交叉向量；基于所述高阶交叉处理中各个交叉阶数各自对应的交叉向量，确定所述第三子向量。

在一个实施例中，所述预测单元520还被配置为：将所述多个子向量进行拼接，得到所述表征向量。

在一个实施例中，所述风险识别模型还包括多个打分模块，第一门控层和第二门控层；所述预测单元520还被配置为：利用所述多个打分模块，基于所述表征向量分别进行打分，得到多个打分结果；在所述第一门控层，基于所述表征向量和第一参数，确定针对所述第一识别层的多个第一权重；其中，基于所述多个第一权重对所述多个打分结果进行加权组合的结果，作为所述第一处理结果；在所述第二门控层，基于所述表征向量和第二参数，确定针对所述第二识别层的多个第二权重；其中，基于所述多个第二权重对所述多个打分结果进行加权组合的结果，作为所述第二处理结果。

在一个实施例中，所述获取单元510被配置为：通过以下方式确定所述意愿标签：当在所述第一交易发生后预设时长内，所述第一用户和所述第二用户之间再次发生了交易，确定所述意愿标签为符合用户意愿；和/或，当在所述第一交易发生后预设时长内，所述第一用户和所述第二用户之间没有发生交易，确定所述意愿标签为不符合用户意愿。

本说明书实施例该提供了一种利用风险识别模型确定交易风险的装置600，所述风险识别模型利用图2所示的方法训练得到，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层。

参阅图6，所述装置600包括：

获取单元610，被配置为：获取目标交易的多个交易特征，所述多个交易特征至少包括发起方特征和接收方特征；

识别单元620，被配置为：将所述多个交易特征输入所述风险识别模型，通过所述第二识别层输出所述目标交易的目标风险度；

确定单元630，被配置为：至少根据所述目标风险度，确定所述目标交易是否被允许。

在一个实施例中，识别单元还被配置为：通过所述第一识别层输出所述目标交易的目标意愿度；确定单元630还被配置为：根据所述目标意愿度和所述目标风险度，确定所述目标交易是否被允许。

在一个实施例中，确定单元630还被配置为：获取所述目标交易所要交易的第一资源量；根据所述目标风险度和所述第一资源量，确定资源损失量；当所述资源损失量小于第一阈值，且所述目标意愿度大于第二阈值时，确定所述目标交易为被允许的交易。

本说明书的实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行图2或图3所示的方法。

本说明书的实施例还提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现图2或图3所示的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种风险识别模型的训练方法，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层，所述方法包括：

获取训练样本，所述训练样本包括第一交易的意愿标签、风险标签以及多个特征，所述第一交易为第一用户和第二用户之间的交易，所述多个特征至少包括第一用户的特征和第二用户的特征；

将所述多个特征输入所述风险识别模型进行预测处理，所述预测处理包括，在所述特征处理网络，对所述多个特征进行特征交叉处理，得到表征向量；

在所述第一识别层，基于对所述表征向量的第一处理结果，确定所述第一交易的意愿度；在所述第二识别层，基于对所述表征向量的第二处理结果，确定所述第一交易的风险度；

在预测损失减小的方向，更新所述风险识别模型的参数，其中所述预测损失包括第一损失和第二损失，所述第一损失基于所述意愿度和所述意愿标签确定，第二损失基于所述风险度和所述风险标签确定。

2.根据权利要求1所述的方法，其中，所述多个特征还包括关联特征，所述关联特征用于表示所述第一用户和第二用户之间的关联关系。

3.根据权利要求1所述的方法，其中，所述特征处理网络包括，表征层，特征交叉层和融合层，所述特征交叉处理包括：

在所述表征层，对所述多个特征进行嵌入处理，得到多个编码向量；

在所述特征交叉层，对所述多个编码向量中的各个编码向量进行多个维度的交叉处理，得到多个子向量；

在所述融合层，对所述多个子向量进行组合，得到所述表征向量。

4.根据权利要求3所述的方法，其中，所述特征交叉层包括多层感知机，因子分解机和高维交叉层，所述多个维度的交叉处理包括：

利用所述多层感知机，对所述多个编码向量进行线性处理，得到第一子向量；

利用所述因子分解机，对所述多个编码向量进行二阶交叉处理，得到第二子向量；其中二阶交叉处理包括两两向量之间的元素组合；

利用所述高维交叉层，对所述多个编码向量进行高阶交叉处理，得到第三子向量；其中，所述高阶交叉处理包括，三个以上向量之间的元素组合。

5.根据权利要求4所述的方法，其中，所述高阶交叉处理包括：

对所述多个编码向量进行拼接和非线性变换，得到第一特征向量，所述第一特征向量中所有元素均为正数；

针对所述高阶交叉处理中任意的交叉阶数，利用与所述交叉阶数对应的矩阵处理所述第一特征向量的自然对数，得到中间向量，并基于所述中间向量的自然指数确定所述交叉阶数对应的交叉向量；

基于所述高阶交叉处理中各个交叉阶数各自对应的交叉向量，确定所述第三子向量。

6.根据权利要求3所述的方法，其中，对所述多个子向量进行组合包括，将所述多个子向量进行拼接，得到所述表征向量。

7.根据权利要求1所述的方法，其中，所述风险识别模型还包括多个打分模块，第一门控层和第二门控层；所述预测处理还包括：

利用所述多个打分模块，基于所述表征向量分别进行打分，得到多个打分结果；

在所述第一门控层，基于所述表征向量和第一参数，确定针对所述第一识别层的多个第一权重；其中，基于所述多个第一权重对所述多个打分结果进行加权组合的结果，作为所述第一处理结果；

在所述第二门控层，基于所述表征向量和第二参数，确定针对所述第二识别层的多个第二权重；其中，基于所述多个第二权重对所述多个打分结果进行加权组合的结果，作为所述第二处理结果。

8.根据权利要求1-7任一项所述的方法，其中，所述获取训练样本包括，通过以下方式确定所述意愿标签：

当在所述第一交易发生后预设时长内，所述第一用户和所述第二用户之间再次发生了交易，确定所述意愿标签为符合用户意愿；和/或，

当在所述第一交易发生后预设时长内，所述第一用户和所述第二用户之间没有发生交易，确定所述意愿标签为不符合用户意愿。

9.一种利用风险识别模型确定交易风险的方法，所述风险识别模型利用权利要求1-8中任一项的方法训练得到，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层，所述方法包括：

获取目标交易的多个交易特征，所述多个交易特征至少包括发起方特征和接收方特征；

将所述多个交易特征输入所述风险识别模型，通过所述第二识别层输出所述目标交易的目标风险度；

至少根据所述目标风险度，确定所述目标交易是否被允许。

10.根据权利要求9所述的方法，还包括，通过所述第一识别层输出所述目标交易的目标意愿度；

至少根据所述目标风险度，确定所述目标交易是否被允许，包括：根据所述目标意愿度和所述目标风险度，确定所述目标交易是否被允许。

11.根据权利要求10所述的方法，其中，根据所述目标意愿度和所述目标风险度，确定所述目标交易是否被允许，包括：

获取所述目标交易所要交易的第一资源量；

根据所述目标风险度和所述第一资源量，确定资源损失量；

当所述资源损失量小于第一阈值，且所述目标意愿度大于第二阈值时，确定所述目标交易为被允许的交易。

12.一种风险识别模型的训练装置，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层，所述装置包括：

获取单元，被配置为：获取训练样本，所述训练样本包括第一交易的意愿标签、风险标签以及多个特征，所述第一交易为第一用户和第二用户之间的交易，所述多个特征至少包括第一用户的特征和第二用户的特征；

预测单元，被配置为：将所述多个特征输入所述风险识别模型进行预测处理，所述预测处理包括，在所述特征处理网络，对所述多个特征进行特征交叉处理，得到表征向量；

确定单元，被配置为：在所述第一识别层，基于对所述表征向量的第一处理结果，确定所述第一交易的意愿度；在所述第二识别层，基于对所述表征向量的第二处理结果，确定所述第一交易的风险度；

更新单元，被配置为：在预测损失减小的方向，更新所述风险识别模型的参数，其中所述预测损失包括第一损失和第二损失，所述第一损失基于所述意愿度和所述意愿标签确定，第二损失基于所述风险度和所述风险标签确定。

13.根据权利要求12所述的装置，其中，所述多个特征还包括关联特征，所述关联特征用于表示所述第一用户和第二用户之间的关联关系。

14.根据权利要求12所述的装置，其中，所述特征处理网络包括，表征层，特征交叉层和融合层，所述预测单元被配置为：

15.根据权利要求14所述的装置，其中，所述特征交叉层包括多层感知机，因子分解机和高维交叉层，所述预测单元还被配置为：

16.根据权利要求15所述的装置，其中，所述预测单元还被配置为：

17.根据权利要求14所述的装置，其中，所述预测单元还被配置为：将所述多个子向量进行拼接，得到所述表征向量。

18.根据权利要求12所述的装置，其中，所述风险识别模型还包括多个打分模块，第一门控层和第二门控层；所述预测单元还被配置为：

19.根据权利要求12-18任一项所述的装置，其中，所述获取单元被配置为：通过以下方式确定所述意愿标签：

20.一种利用风险识别模型确定交易风险的装置，所述风险识别模型利用权利要求1-8中任一项的方法训练得到，所述风险识别模型至少包括特征处理网络、第一识别层、第二识别层，所述装置包括：

获取单元，被配置为：获取目标交易的多个交易特征，所述多个交易特征至少包括发起方特征和接收方特征；

识别单元，被配置为：将所述多个交易特征输入所述风险识别模型，通过所述第二识别层输出所述目标交易的目标风险度；

确定单元，被配置为：至少根据所述目标风险度，确定所述目标交易是否被允许。

21.根据权利要求20所述的装置，其中，所述识别单元还被配置为：通过所述第一识别层输出所述目标交易的目标意愿度；

所述确定单元还被配置为：根据所述目标意愿度和所述目标风险度，确定所述目标交易是否被允许。

22.根据权利要求21所述的装置，其中，所述确定单元还被配置为：

获取所述目标交易所要交易的第一资源量；

根据所述目标风险度和所述第一资源量，确定资源损失量；

23.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-8中任一项的所述的方法或权利要求9-11中任一项所述的方法。

24.一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-8中任一项的所述的方法或权利要求9-11中任一项所述的方法。