WO2021114820A1

WO2021114820A1 - 多方联合进行风险识别的方法和装置

Info

Publication number: WO2021114820A1
Application number: PCT/CN2020/118006
Authority: WO
Inventors: 宋博文; 陈帅; 顾曦
Original assignee: 支付宝(杭州)信息技术有限公司
Priority date: 2019-12-12
Filing date: 2020-09-27
Publication date: 2021-06-17
Also published as: TW202123124A; CN111046425B; TWI798550B; CN111046425A

Abstract

一种多方联合进行风险识别的方法和装置，方法包括：第一站点获取与第二站点联合训练的安全树模型的第一子模型；安全树模型还具有部署于第二站点的第二子模型；获取根据预设风险识别策略对应的树结构得到的第三子模型；树结构还具有部署于第二站点的第四子模型；当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据；将第一特征数据输入第一子模型和第三子模型，分别得到第一预测分数和第三预测分数；通过多方安全计算的方式提供第一预测分数和第三预测分数，与第二站点提供的第二预测分数和第四预测分数相结合，综合确定目标用户是否具有第一风险。能够防止泄露用户的隐私信息。

Description

多方联合进行风险识别的方法和装置

技术领域

本说明书一个或多个实施例涉及计算机领域，尤其涉及多方联合进行风险识别的方法和装置。

背景技术

当前，常常需要进行风险识别，对风控系统来说，通过对用户特征的分析，来判断用户行为的风险性，如盗用、欺诈、营销作弊等风险，这些用户特征的基础数据源在很大程度上依赖于用户的隐私信息。比如在刻画用户交易频次上会设计变量：用户在过去7天当前设备上的交易金额累计，在该变量上面，就需要用到用户使用的设备的唯一标识(ID)这个基础信息，而用户使用的设备的唯一标识就属于用户的隐私信息。

随着通用数据保护条例(general data protection regulation，GDPR)的生效，用户隐私数据所受到的管制也越来越严格。尤其是在国际场景，隐私数据不出域、用户数据可用不可见等也成为越来越多机构对数据采集使用方的要求。比如，在全球支付网络(global net，GN)场景下，发卡站和收单站分别属于不同国家，如何做到隐私数据不出域的情况下完成对网络上交易的风险防控，是当前面临的一个难题。

因此，希望能有改进的方案，通过多方联合进行风险识别，能够防止泄露用户的隐私信息。

发明内容

本说明书一个或多个实施例描述了一种多方联合进行风险识别的方法和装置，能够防止泄露用户的隐私信息。

第一方面，提供了一种多方联合进行风险识别的方法，所述多方包括第一站点和第二站点，所述第一站点存储用户的第一特征集中的特征信息，所述第二站点存储用户的第二特征集中的特征信息，所述特征信息涉及用户的隐私信息，所述方法应用于所述第一站点，包括：获取与所述第二站点联合训练的安全树模型的第一子模型；所述安全树模型还具有部署于所述第二站点的第二子模型；获取根据预设风险识别策略对应的树结构得到的第三子模型；所述树结构还具有部署于所述第二站点的第四子模型；当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据；将所述第一特征数据输入所述第一子模型，得到第一预测分数，以及输入所述第三子模型，得到第三预测分数；通过多方安全计算(multi-party computing，MPC)的方式提供所述第一预测分数和所述第三预测分数，从而与第二预测分数和第四预测分数相结合，综合确定所述目标用户是否具有第一风险；其中，所述第二预测分数为所述第二站点利用所述目标用户的第二特征集中各项特征的第二特征数据和所述第二子模型得到，所述第四预测分数为所述第二站点利用所述第二特征数据和所述第四子模型得到。

在一种可能的实施方式中，所述获取与所述第二站点联合训练的安全树模型的第一子模型，包括：通过MPC方式，与所述第二站点联合训练所述安全树模型，得到所述安全树模型的第一子模型。

在一种可能的实施方式中，所述获取与所述第二站点联合训练的安全树模型的第一子模型，包括：接收所述第一子模型对应的第一模型文件，所述第一模型文件是从通过联合训练方式得到的安全树模型的总模型文件中分拆的文件。

在一种可能的实施方式中，所述确定满足预设风险识别条件包括：接收评估请求，所述评估请求中包括所述目标用户的标识。

在一种可能的实施方式中，所述确定满足预设风险识别条件包括：接收批量处理请求，所述目标用户是批量处理请求所限定的用户集合中的任意用户。

在一种可能的实施方式中，所述MPC包括：同态加密、秘密分享之一。

在一种可能的实施方式中，所述获取与所述第二站点联合训练的安全树模型的第一子模型之前，所述方法还包括：确定与所述第二站点之间的数据交互权限；和/或，确定所述第一特征集中的特征信息和所述第二特征集中的特征信息；和/或，确定与所述第二站点之间已达成算法共识。

在一种可能的实施方式中，所述方法还包括：与所述第二站点联合训练时，记录与所述第二站点之间交互的数据。

在一种可能的实施方式中，所述第一风险包括有监督风险，所述有监督风险为用户实施第一行为后能够获得所述第一行为对应的是否具有所述第一风险的标签；所述特征信息还涉及用户的行为信息。

在一种可能的实施方式中，所述第一风险包括无监督风险；所述无监督风险为用户实施第二行为后不能够获得所述第二行为对应的是否具有所述第一风险的标签；与所述第二站点联合训练安全树模型，包括：针对所述第一风险获取第一样本集合，所述第一样本集合中各样本的标签为人工定义的，或者基于各样本的高危特征集合中的各特征的特征分布确定的；利用所述第一样本集合，与所述第二站点初步联合训练所述安全树模型，并重新确定所述高危特征集合中包含的各特征；利用重新确定的所述高危特征集合中的各特征的特征分布，更新所述第一样本集合中各样本的标签；基于更新后的标签，与所述第二站点再次联合训练所述安全树模型。

第二方面，提供了一种多方联合进行风险识别的装置，所述多方包括第一站点和第二站点，所述第一站点存储用户的第一特征集中的特征信息，所述第二站点存储用户的第二特征集中的特征信息，所述特征信息涉及用户的隐私信息，所述装置应用于所述第一站点，包括：第一获取单元，用于获取与所述第二站点联合训练的安全树模型的第一子模型；所述安全树模型还具有部署于所述第二站点的第二子模型；第二获取单元，用于获取根据预设风险识别策略对应的树结构得到的第三子模型；所述树结构还具有部署于所述第二站点的第四子模型；第三获取单元，用于当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据；预测单元，用于将所述第三获取单元获取的第一特征数据输入所述第一获取单元获取的第一子模型，得到第一预测分数，以及输入所述第二获取单元获取的第三子模型，得到第三预测分数；联合单元，用于通过多方安全计算MPC的方式提供所述预测单元得到的所述第一预测分数和所述第三预测分数，从而与第二预测分数和第四预测分数相结合，综合确定所述目标用户是否具有第一风险；其中，所述第二预测分数为所述第二站点利用所述目标用户的第二特征集中各项特征的第二特征数据和所述第二子模型得到，所述第四预测分数为所述第二站点利用所述第二特征数据和所述第四子模型得到。

第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面的方法。

第四方面，提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面的方法。

通过本说明书实施例提供的方法和装置，通过多方联合进行风险识别，对于多方中的第一站点首先获取与第二站点联合训练的安全树模型的第一子模型；所述安全树模型还具有部署于所述第二站点的第二子模型；然后获取根据预设风险识别策略对应的树结构得到的第三子模型；所述树结构还具有部署于所述第二站点的第四子模型；接着当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据；再将所述第一特征数据输入所述第一子模型，得到第一预测分数，以及输入所述第三子模型，得到第三预测分数；最后通过MPC的方式提供所述第一预测分数和所述第三预测分数，从而与第二预测分数和第四预测分数相结合，综合确定所述目标用户是否具有第一风险；其中，所述第二预测分数为所述第二站点利用所述目标用户的第二特征集中各项特征的第二特征数据和所述第二子模型得到，所述第四预测分数为所述第二站点利用所述第二特征数据和所述第四子模型得到。由上可见，本说明书实施例，通过将总的模型拆分为多个子模型，将各子模型分别部署在多方站点，从而可以结合各子模型的预测结果，综合得到最终的风险识别结果，保证了各站点不必交互用户的隐私信息，能够防止泄露用户的隐私信息；此外，不仅将通过训练得到的模型拆分部署，同样地，将预设风险识别策略也进行拆分部署，进一步防止泄露用户的隐私信息，并且增强了风险识别的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本说明书披露的一个实施例的实施场景示意图。

图2示出根据一个实施例的多方联合进行风险识别的方法流程图。

图3示出根据一个实施例的多方联合进行风险识别的体系结构示意图。

图4示出根据一个实施例的在线部署链路示意图。

图5示出根据一个实施例的离线部署链路示意图。

图6示出根据一个实施例的策略转换过程示意图。

图7示出根据一个实施例的多方模型进化闭环示意图。

图8示出根据一个实施例的多方联合进行风险识别的装置的示意性框图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及多方联合进行风险识别。参照图1，所述多方包括第一站点11和第二站点12，所述第一站点11存储用户的第一特征集中的特征信息，所述第二站点12存储用户的第二特征集中的特征信息。可以理解的是，第一特征集与第二特征集包含的特征信息不同，例如，第一特征集包含特征1、特征2，第二特征集包含特征3、特征4和特征5，其中，特征信息涉及用户的隐私信息，这其中尤其重要的是可以定位到用户个人的信息(personally identifiable information，PII)信息，如地址、邮箱、姓名、身份ID等。

本说明书实施例，基于多方安全计算(multi-party computing，MPC)的方式，由多方联合进行风险识别。其中，涉及到策略和模型的多方部署，依赖于基于树结构的部署形式，能够防止泄露用户的隐私信息。

需要说明的是，本说明书实施例，仅以两方联合进行风险识别为例进行说明，但实际上多方并限定为两方，例如，可以为三方、四方或更多方联合进行风险识别。

图2示出根据一个实施例的多方联合进行风险识别的方法流程图，该方法可以基于图1所示的实施场景，所述多方包括第一站点和第二站点，所述第一站点存储用户的第一特征集中的特征信息，所述第二站点存储用户的第二特征集中的特征信息，所述特征信息涉及用户的隐私信息，所述方法应用于所述第一站点，可以理解的是，在多方联合进行风险识别时，第一站点为多方中的任一方，第二站点与第一站点的处理过程类似，在此不做赘述。如图2所示，该实施例中多方联合进行风险识别的方法包括以下步骤：步骤21，获取与所述第二站点联合训练的安全树模型的第一子模型；所述安全树模型还具有部署于所述第二站点的第二子模型；步骤22，获取根据预设风险识别策略对应的树结构得到的第三子模型；所述树结构还具有部署于所述第二站点的第四子模型；步骤23，当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据；步骤24，将所述第一特征数据输入所述第一子模型，得到第一预测分数，以及输入所述第三子模型，得到第三预测分数；步骤25，通过多方安全计算MPC的方式提供所述第一预测分数和所述第三预测分数，从而与第二预测分数和第四预测分数相结合，综合确定所述目标用户是否具有第一风险；其中，所述第二预测分数为所述第二站点利用所述目标用户的第二特征集中各项特征的第二特征数据和所述第二子模型得到，所述第四预测分数为所述第二站点利用所述第二特征数据和所述第四子模型得到。下面描述以上各个步骤的具体执行方式。

首先在步骤21，获取与所述第二站点联合训练的安全树模型的第一子模型；所述安全树模型还具有部署于所述第二站点的第二子模型。可以理解的是，安全树模型为一个总的模型，该模型可以拆分为第一子模型和第二子模型，第一子模型和第二子模型分别部署于第一站点和第二站点。

在一个示例中，通过MPC方式，与所述第二站点联合训练所述安全树模型，得到所述安全树模型的第一子模型。可以理解的是，MPC方式即在保护数据隐私安全、数据不出域的情况下通过交换过程参数和随机数的方式完成联合训练的相关计算。

在另一个示例中，接收所述第一子模型对应的第一模型文件，所述第一模型文件是从通过联合训练方式得到的安全树模型的总模型文件中分拆的文件。

在一个示例中，在步骤21之前，所述方法还包括：确定与所述第二站点之间的数据交互权限；和/或，确定所述第一特征集中的特征信息和所述第二特征集中的特征信息；和/或，确定与所述第二站点之间已达成算法共识。

在一个示例中，所述方法还包括：与所述第二站点联合训练时，记录与所述第二站点之间交互的数据。

然后在步骤22，获取根据预设风险识别策略对应的树结构得到的第三子模型；所述树结构还具有部署于所述第二站点的第四子模型。可以理解的是，预设风险识别策略可以为人工定义的，例如，该预设风险识别策略为(x1>a or x2>b)and y3>c，可以转换成x1>a and y3>c和x2>b and y3>c两棵树，每棵树对应一个子模型。

本说明书实施例中，预设风险识别策略也被拆分为多个子模型，分别部署在多个站点，能够防止泄露用户的隐私信息。

接着在步骤23，当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据。可以理解的是，该预设风险识别条件即触发条件，可以是接收到请求后触发，也可以是定时触发。

在一个示例中，所述确定满足预设风险识别条件包括：接收评估请求，所述评估请求中包括所述目标用户的标识。

在另一个示例中，所述确定满足预设风险识别条件包括：接收批量处理请求，所述目标用户是批量处理请求所限定的用户集合中的任意用户。

再在步骤24，将所述第一特征数据输入所述第一子模型，得到第一预测分数，以及输入所述第三子模型，得到第三预测分数。可以理解的是，第一特征数据存储于第一站点，第一子模型和第三子模型也部署在第一站点，第一特征数据无需外传，能够防止泄露用户的隐私信息。

最后在步骤25，通过多方安全计算MPC的方式提供所述第一预测分数和所述第三预测分数，从而与第二预测分数和第四预测分数相结合，综合确定所述目标用户是否具有第一风险；其中，所述第二预测分数为所述第二站点利用所述目标用户的第二特征集中各项特征的第二特征数据和所述第二子模型得到，所述第四预测分数为所述第二站点利用所述第二特征数据和所述第四子模型得到。可以理解的是，各方分别利用自身存储的目标用户的特征数据确定相应的预测分数，再综合多方的预测分数确定目标用户是否具有风险，能够防止泄露用户的隐私信息。

在一个示例中，所述MPC包括：同态加密、秘密分享之一。

在一个示例中，所述第一风险包括有监督风险，所述有监督风险为用户实施第一行为后能够获得所述第一行为对应的是否具有所述第一风险的标签；所述特征信息还涉及用户的行为信息。可以理解的是，第一行为可以为交易行为，第一风险可以为盗用风险，通常这类风险在交易行为发生后会有用户报案，从而获得标签。

在另一个示例中，所述第一风险包括无监督风险；所述无监督风险为用户实施第二行为后不能够获得所述第二行为对应的是否具有所述第一风险的标签；与所述第二站点联合训练安全树模型，包括：针对所述第一风险获取第一样本集合，所述第一样本集合中各样本的标签为人工定义的，或者基于各样本的高危特征集合中的各特征的特征分布确定的；利用所述第一样本集合，与所述第二站点初步联合训练所述安全树模型，并重新确定所述高危特征集合中包含的各特征；利用重新确定的所述高危特征集合中的各特征的特征分布，更新所述第一样本集合中各样本的标签；基于更新后的标签，与所述第二站点再次联合训练所述安全树模型。

可以理解的是，第二行为可以为交易行为，第一风险可以为营销作弊风险或虚假交易风险，通常这类风险在交易行为发生后不会有用户报案，从而不能够获得标签。可以通过人工标注或特征识别确定对应的标签。

本说明书实施例提供的方法，通过将总的模型拆分为多个子模型，将各子模型分别部署在多方站点，从而可以结合各子模型的预测结果，综合得到最终的风险识别结果，保证了各站点不必交互用户的隐私信息，能够防止泄露用户的隐私信息；此外，不仅将通过训练得到的模型拆分部署，同样地，将预设风险识别策略也进行拆分部署，进一步防止泄露用户的隐私信息，并且增强了风险识别的准确性。

本说明书实施例中的MPC也可以称为联邦学习，具体地，可以采用安全树(secureboost)的联邦学习方案。

图3示出根据一个实施例的多方联合进行风险识别的体系结构示意图。参照图3，该体系结构包括配置层、定义层和部署层。

配置层主要有三部分组成：租户管理，用于提供数据提供方和使用方的管理功能，并对租户对数据的操作进行记录以及全网同步；变量管理，用于提供各基础变量的来源(来源于哪个租户)以及基础定义，线上数据来说对接到端上的数据实时接口，线下部分对接到端上的数据库；算法授权，用于提供联邦学习的算法共识部分，基于联邦学习方案的算法分为三个步骤，第一个是离线训练，通过随机数以及中间参数的交互完成模型训练；第二步是将得到的模型文件进行拆分，部署到各个端节点；第三步是在端节点上进行实时或者是离线批量预测。该运行的算法方案(如secureboost)不仅需要达到安全性的要求，同时还需要得到各个端的共识(确定了解算法不会外传内部信息)。共识后的算法需要输入签名，端数据智能在签名匹配下的算法组件上面运行。

定义层，用于产出算法文件，包括模型训练得到的算法文件，以及策略定义的算法文件。

部署层，用于将算法文件部署在多方，以提供预测服务。包括在线部署和离线部署。对于策略来说，是用and和or连起来的一些逻辑算子。通过对and和or的拆分即可将策略转化成集成树的结构从而复用模型的在线和离线部署链路。例如：策略(x1>a or x2>b)and y3>c可以转换成x1>a and y3>c和x2>b and y3>c两棵树。对每棵树来说，逻辑成立向右走(如果还有and逻辑那么继续分裂否则记为叶子节点1)，逻辑不成立向左走并记为叶子节点0。两颗不同的树来进行加和，最终结果如果大于0那么就是策略稽核，否则就是策略未稽核。转化成树结构之后可以沿用模型的部署链路来进行多方打分和预测。

图4示出根据一个实施例的在线部署链路示意图。参照图4，展示了多方模型的联邦学习过程以及在线打分过程。通过随机数和参数的交互，得到一个树模型，经过拆分之后部署在数据域A和数据域B的预测节点上。在风控实时链路上，由实时打分预测请求两边预测节点，预测节点从实时特征接口读取相应特征。预测节点在节点所有拥有的子模型上得到子结果，并汇总到预测节点得到最终打分。预测节点将最终打分返回给咨询方。

图5示出根据一个实施例的离线部署链路示意图。参照图5，展示了训练好的模型在端节点部署之后的离线跑批和定时调度的链路。该部分链路需要同端数据库打通，对数据库内部的定时跑出的数据进行批量打分。同时该部分功能也提供一次性打分服务，来对策略和模型的效能进行评估。

图6示出根据一个实施例的策略转换过程示意图。参照图6，策略转换成树之后，会通过拆分服务拆分成子模型，将子模型部署在各个端上来进行预测或者离线调度打分。

图7示出根据一个实施例的多方模型进化闭环示意图。参照图7，在联邦学习多方建模的基础上进一步提出了模型进化闭环的功能。在此基础上，多方模型体系不仅能识别有标签的监督型风险目标，同时也可以对营销作弊、虚假交易等无监督风险进行风险识别，从而一体化覆盖有监督风险、无监督风险的识别。首先通过人工定义的一些高风险标签以及人工定义的高危特征识别到的无监督风险作为标签来训练有监督模型，根据有监督模型进一步对高危特征进行优化，此处同时可以结合人工经验输入调整高危特征的特征分布。优化后的高危特征可以进一步促进无监督风险识别的精度。通过闭环结构，可以在离线训练或者建模阶段不停的迭代优化安全树模型。

综上，基于联邦学习的风控体系既可以解决多方盗用风险、欺诈风险等带标签返回的风险，同时也可以对无标签返回的比如营销作弊、虚假交易等风险进行防控。不仅可以支持模型、同时也可以兼容策略的部署。同时提供实时预测和离线打分两种功能。在模型端，有一套完整的模型优化流程。同时由于是去中心化体系，在中心只有管理功能，没有任何数据存储，该部分功能可以开放给所有接入数据共享的机构，管理机构变量以及各个机构可以使用的算法功能，对不同机构提供不同的风控服务。

根据另一方面的实施例，还提供一种多方联合进行风险识别的装置，所述多方包括第一站点和第二站点，所述第一站点存储用户的第一特征集中的特征信息，所述第二站点存储用户的第二特征集中的特征信息，所述特征信息涉及用户的隐私信息，所述装置应用于所述第一站点，用于执行本说明书实施例提供的多方联合进行风险识别的方法。图8示出根据一个实施例的多方联合进行风险识别的装置的示意性框图。如图8所示，该装置800包括第一获取单元81、第二获取单元82、第三获取单元83、预测单元84以及联合单元85。

第一获取单元81，用于获取与所述第二站点联合训练的安全树模型的第一子模型；所述安全树模型还具有部署于所述第二站点的第二子模型。

第二获取单元82，用于获取根据预设风险识别策略对应的树结构得到的第三子模型；所述树结构还具有部署于所述第二站点的第四子模型。

第三获取单元83，用于当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据。

预测单元84，用于将所述第三获取单元83获取的第一特征数据输入所述第一获取单元81获取的第一子模型，得到第一预测分数，以及输入所述第二获取单元82获取的第三子模型，得到第三预测分数。

联合单元85，用于通过多方安全计算MPC的方式提供所述预测单元84得到的所述第一预测分数和所述第三预测分数，从而与第二预测分数和第四预测分数相结合，综合确定所述目标用户是否具有第一风险；其中，所述第二预测分数为所述第二站点利用所述目标用户的第二特征集中各项特征的第二特征数据和所述第二子模型得到，所述第四预测分数为所述第二站点利用所述第二特征数据和所述第四子模型得到。

可选地，作为一个实施例，所述第一获取单元81，具体用于通过MPC方式，与所述第二站点联合训练所述安全树模型，得到所述安全树模型的第一子模型。

可选地，作为一个实施例，所述第一获取单元81，具体用于接收所述第一子模型对应的第一模型文件，所述第一模型文件是从通过联合训练方式得到的安全树模型的总模型文件中分拆的文件。

可选地，作为一个实施例，所述确定满足预设风险识别条件包括：接收评估请求，所述评估请求中包括所述目标用户的标识。

可选地，作为一个实施例，所述确定满足预设风险识别条件包括：接收批量处理请求，所述目标用户是批量处理请求所限定的用户集合中的任意用户。

可选地，作为一个实施例，所述MPC包括：同态加密、秘密分享之一。

可选地，作为一个实施例，所述装置还包括：确定单元，用于在所述第一获取单元81获取与所述第二站点联合训练的安全树模型的第一子模型之前，确定与所述第二站点之间的数据交互权限；和/或，确定所述第一特征集中的特征信息和所述第二特征集中的特征信息；和/或，确定与所述第二站点之间已达成算法共识。

可选地，作为一个实施例，所述装置还包括：记录单元，用于与所述第二站点联合训练时，记录与所述第二站点之间交互的数据。

可选地，作为一个实施例，所述第一风险包括有监督风险，所述有监督风险为用户实施第一行为后能够获得所述第一行为对应的是否具有所述第一风险的标签；所述特征信息还涉及用户的行为信息。

可选地，作为一个实施例，所述第一风险包括无监督风险；所述无监督风险为用户实施第二行为后不能够获得所述第二行为对应的是否具有所述第一风险的标签；与所述第二站点联合训练安全树模型，包括：针对所述第一风险获取第一样本集合，所述第一样本集合中各样本的标签为人工定义的，或者基于各样本的高危特征集合中的各特征的特征分布确定的；利用所述第一样本集合，与所述第二站点初步联合训练所述安全树模型，并重新确定所述高危特征集合中包含的各特征；利用重新确定的所述高危特征集合中的各特征的特征分布，更新所述第一样本集合中各样本的标签；基于更新后的标签，与所述第二站点再次联合训练所述安全树模型。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图2所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图2所描述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

一种多方联合进行风险识别的方法，所述多方包括第一站点和第二站点，所述第一站点存储用户的第一特征集中的特征信息，所述第二站点存储用户的第二特征集中的特征信息，所述特征信息涉及用户的隐私信息，所述方法应用于所述第一站点，包括：

获取与所述第二站点联合训练的安全树模型的第一子模型；所述安全树模型还具有部署于所述第二站点的第二子模型；

获取根据预设风险识别策略对应的树结构得到的第三子模型；所述树结构还具有部署于所述第二站点的第四子模型；

当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据；

将所述第一特征数据输入所述第一子模型，得到第一预测分数，以及输入所述第三子模型，得到第三预测分数；

通过多方安全计算MPC的方式提供所述第一预测分数和所述第三预测分数，从而与第二预测分数和第四预测分数相结合，综合确定所述目标用户是否具有第一风险；其中，所述第二预测分数为所述第二站点利用所述目标用户的第二特征集中各项特征的第二特征数据和所述第二子模型得到，所述第四预测分数为所述第二站点利用所述第二特征数据和所述第四子模型得到。
如权利要求1所述的方法，其中，所述获取与所述第二站点联合训练的安全树模型的第一子模型，包括：

通过MPC方式，与所述第二站点联合训练所述安全树模型，得到所述安全树模型的第一子模型。
如权利要求1所述的方法，其中，所述获取与所述第二站点联合训练的安全树模型的第一子模型，包括：

接收所述第一子模型对应的第一模型文件，所述第一模型文件是从通过联合训练方式得到的安全树模型的总模型文件中分拆的文件。
如权利要求1所述的方法，其中，所述确定满足预设风险识别条件包括：

接收评估请求，所述评估请求中包括所述目标用户的标识。
如权利要求1所述的方法，其中，所述确定满足预设风险识别条件包括：

接收批量处理请求，所述目标用户是批量处理请求所限定的用户集合中的任意用户。
如权利要求1所述的方法，其中，所述MPC包括：

同态加密、秘密分享之一。
如权利要求1所述的方法，其中，所述获取与所述第二站点联合训练的安全树模型的第一子模型之前，所述方法还包括：

确定与所述第二站点之间的数据交互权限；和/或，

确定所述第一特征集中的特征信息和所述第二特征集中的特征信息；和/或，

确定与所述第二站点之间已达成算法共识。
如权利要求1所述的方法，其中，所述方法还包括：

与所述第二站点联合训练时，记录与所述第二站点之间交互的数据。
如权利要求1所述的方法，其中，所述第一风险包括有监督风险，所述有监督风险为用户实施第一行为后能够获得所述第一行为对应的是否具有所述第一风险的标签；所述特征信息还涉及用户的行为信息。
如权利要求1所述的方法，其中，所述第一风险包括无监督风险；所述无监督风险为用户实施第二行为后不能够获得所述第二行为对应的是否具有所述第一风险的标签；

与所述第二站点联合训练安全树模型，包括：

针对所述第一风险获取第一样本集合，所述第一样本集合中各样本的标签为人工定义的，或者基于各样本的高危特征集合中的各特征的特征分布确定的；

利用所述第一样本集合，与所述第二站点初步联合训练所述安全树模型，并重新确定所述高危特征集合中包含的各特征；

利用重新确定的所述高危特征集合中的各特征的特征分布，更新所述第一样本集合中各样本的标签；

基于更新后的标签，与所述第二站点再次联合训练所述安全树模型。
一种多方联合进行风险识别的装置，所述多方包括第一站点和第二站点，所述第一站点存储用户的第一特征集中的特征信息，所述第二站点存储用户的第二特征集中的特征信息，所述特征信息涉及用户的隐私信息，所述装置应用于所述第一站点，包括：

第一获取单元，用于获取与所述第二站点联合训练的安全树模型的第一子模型；所述安全树模型还具有部署于所述第二站点的第二子模型；

第二获取单元，用于获取根据预设风险识别策略对应的树结构得到的第三子模型；所述树结构还具有部署于所述第二站点的第四子模型；

第三获取单元，用于当确定满足预设风险识别条件时，获取目标用户的第一特征集中各项特征的第一特征数据；

预测单元，用于将所述第三获取单元获取的第一特征数据输入所述第一获取单元获取的第一子模型，得到第一预测分数，以及输入所述第二获取单元获取的第三子模型，得到第三预测分数；

联合单元，用于通过多方安全计算MPC的方式提供所述预测单元得到的所述第一预测分数和所述第三预测分数，从而与第二预测分数和第四预测分数相结合，综合确定所述目标用户是否具有第一风险；其中，所述第二预测分数为所述第二站点利用所述目标用户的第二特征集中各项特征的第二特征数据和所述第二子模型得到，所述第四预测分数为所述第二站点利用所述第二特征数据和所述第四子模型得到。
如权利要求11所述的装置，其中，所述第一获取单元，具体用于通过MPC方式，与所述第二站点联合训练所述安全树模型，得到所述安全树模型的第一子模型。
如权利要求11所述的装置，其中，所述第一获取单元，具体用于接收所述第一子模型对应的第一模型文件，所述第一模型文件是从通过联合训练方式得到的安全树模型的总模型文件中分拆的文件。
如权利要求11所述的装置，其中，所述确定满足预设风险识别条件包括：

接收评估请求，所述评估请求中包括所述目标用户的标识。
如权利要求11所述的装置，其中，所述确定满足预设风险识别条件包括：

接收批量处理请求，所述目标用户是批量处理请求所限定的用户集合中的任意用户。
如权利要求11所述的装置，其中，所述MPC包括：

同态加密、秘密分享之一。
如权利要求11所述的装置，其中，所述装置还包括：

确定单元，用于在所述第一获取单元获取与所述第二站点联合训练的安全树模型的第一子模型之前，确定与所述第二站点之间的数据交互权限；和/或，确定所述第一特征集中的特征信息和所述第二特征集中的特征信息；和/或，确定与所述第二站点之间已达成算法共识。
如权利要求11所述的装置，其中，所述装置还包括：

记录单元，用于与所述第二站点联合训练时，记录与所述第二站点之间交互的数据。
如权利要求11所述的装置，其中，所述第一风险包括有监督风险，所述有监督风险为用户实施第一行为后能够获得所述第一行为对应的是否具有所述第一风险的标签；所述特征信息还涉及用户的行为信息。
如权利要求11所述的装置，其中，所述第一风险包括无监督风险；所述无监督风险为用户实施第二行为后不能够获得所述第二行为对应的是否具有所述第一风险的标签；

与所述第二站点联合训练安全树模型，包括：

针对所述第一风险获取第一样本集合，所述第一样本集合中各样本的标签为人工定义的，或者基于各样本的高危特征集合中的各特征的特征分布确定的；

利用所述第一样本集合，与所述第二站点初步联合训练所述安全树模型，并重新确定所述高危特征集合中包含的各特征；

利用重新确定的所述高危特征集合中的各特征的特征分布，更新所述第一样本集合中各样本的标签；

基于更新后的标签，与所述第二站点再次联合训练所述安全树模型。
一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-10中任一项的所述的方法。
一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-10中任一项的所述的方法。