CN112308720B

CN112308720B - 一种确定联邦学习联盟中参与方的方法及装置

Info

Publication number: CN112308720B
Application number: CN201910711772.9A
Authority: CN
Inventors: 刘洋; 于涵; 陈天健; 杨强
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2019-08-02
Filing date: 2019-08-02
Publication date: 2024-05-03
Anticipated expiration: 2039-08-02
Also published as: CN112308720A

Abstract

本申请提供一种确定联邦学习联盟中参与方的方法及装置，用于提供确定联邦学习联盟中参与方的方法。该方法包括：获取有偿信息，竞价信息，以及N个数据集质量；将所述最高单个赔偿额度与所述N候选方中每个候选方的期望收益作差，获得预算差值，并将所述预算差值与所述N个数据集质量相乘，得到所述N个候选方中每个候选方的预算剩余值，获得N个预算剩余值；将M个候选方中每个候选方的数据集质量与所述每个候选方的期望收益的相乘，获得与所述M个候选方中每个候选方的数据集质量匹配的实际收益，获得M个实际收益；根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联邦学习联盟的K个参与方。

Description

一种确定联邦学习联盟中参与方的方法及装置

技术领域

本申请涉及科技金融领域(Fintech)领域，具体涉及一种确定联邦学习联盟中参与方的方法及装置。

背景技术

联邦学习是一种新兴的机器学习方式，联邦学习的机制为：联邦学习联盟中各个参与方通过客户端把加密后的模型参数提供给联邦学习联盟中的服务器，由服务器训练出联邦模型，服务器再将联邦模型发送给各个参与方对应的客户端，使得各个参与方能够根据联邦模型更新各自的模型参数。联邦学习不仅能实现有效整合及使用数据，打破“数据孤岛”，还能保证各个参与方的数据的安全性。

目前，联邦学习应用于多个参与方已经确定合作关系，建立联邦学习联盟之后，再通过联邦学习实现数据合法共享，但是在某些应用场景下，一个发起方确定到底由哪些候选方参与该联邦学习联盟才是难题，目前急需一种确定联邦学习联盟参与方的方案。

发明内容

本申请实施例提供一种确定联邦学习联盟中参与方的方法及装置，用于提供确定联盟中参与方的方法。

第一方面，提供一种确定联邦学习联盟中参与方的方法，所述联邦学习联盟中包括请求建立联邦学习联盟的发起方，以及从N个候选方中确定出的至少一个参与方，所述方法包括：

获取有偿信息，竞价信息，以及N个数据集质量；其中，所述有偿信息包括发起方为一个参与方支付的最高单个赔偿额度，以及所述发起方支付的所有参与方的最高总赔偿额度，所述竞价信息包括所述N候选方中每个候选方的期望收益，所述N个数据集质量中每个数据集质量用于表征根据N个候选方中对应候选方的样本数据集训练出的样本模型的评价结果，N为大于或等于2的整数；

将所述最高单个赔偿额度与所述N候选方中每个候选方的期望收益作差，获得预算差值，并将所述预算差值与所述N个数据集质量相乘，得到所述N个候选方中每个候选方的预算剩余值，获得N个预算剩余值；其中，所述预算剩余值用于表示所述发起方支付对应候选方之后的剩余额度；

将M个候选方中每个候选方的数据集质量与所述每个候选方的期望收益的相乘，获得与所述M个候选方中每个候选方的数据集质量匹配的实际收益，获得M个实际收益；其中，所述M个候选方的预算剩余值大于预设值的预算剩余值；

根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联邦学习联盟的K个参与方；其中，所述K个参与方的实际收益之和小于或等于所述最高赔偿额度，K为小于或等于N的正整数。

相对于由发起方人工提前确定联盟成员的方式，本申请实施例中由服务器在本申请实施例中获取发起方的有偿信息，N个候选方的竞价信息以及数据集质量，根据发起方的有偿信息，确定N个候选方是否满足发起方的需要，从N个候选方中确定出K个参与方，提供一种确定联邦学习联盟的方式，提高确定联邦学习联盟的参与方的效率，且能够相对更公正地筛选符合发起方要求的参与方，提升候选方和参与方的用户体验。且，相对于现有的联邦学习是建立在联邦学习联盟建立之后的常规方式，本申请实施例提供了一种灵活性更高的联邦学习的方式，打破了现有认为在建立联邦学习联盟之后，才能进行联邦学习的常规思路。

在一种可能的设计中，在获取有偿信息，竞价信息，以及N个数据集质量之前，包括：

获取N个候选方中每个候选方的样本数据集；

对所述N个候选方中每个候选方的样本数据集进行训练，得到所述N个候选方中每个候选方的样本模型；

根据所述N个候选方中每个候选方的样本模型，以及预设评价函数，确定所述N个候选方中每个候选方的样本模型的评价值；

将所述N个候选方中每个候选方的样本模型的评价值进行归一化处理，得到所述N个样本数据集中每个样本数据集的数据集质量。

在本申请实施例中，获取各个候选方的样本数据集，确定出各个候选方的样本数据集的数据集质量，保证了各个候选方的数据集质量的参考价值。

在一种可能的设计中，在根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联盟的K个参与方之前，包括：

从N个候选方中确定出预算剩余值大于预设值的M个候选方，以及将所述M个候选方，按照预算剩余值从大到小的顺序排列，获得排序后的M个候选方；

基于所述排序后的M个候选方，将所述M个候选方中任一候选方的预算剩余值与后一候选方的预算剩余值作差，得到所述任一候选方与所述后一候选方之间的预算剩余值差值；其中，所述后一候选方为所述排序后的M个候选方中与所述任一候选方相邻且位于所述任一候选方之后的候选方；

将所述实际收益与所述预算剩余值差值相加，得到补偿后的所述任一候选方的实际收益。

在本申请实施例中，根据相邻两个候选方的预算剩余值差值，对靠前一个候选方的实际收益进行补偿，使得各个候选方能够得到与数据集质量匹配的期望收益的基础上，还能够通过预算剩余值差值来约束候选方上报的期望收益。

在一种可能的设计中，根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联邦学习联盟的K个参与方，包括：

对所述排序后的M个候选方中前i个候选方的实际收益进行求和；

当i从1取到K+1时，若所述M个候选方中前K个候选方的实际收益之和等于或小于所述最高总赔偿额度，所述M个候选方中前K+1个候选方的实际收益之和大于所述最高总赔偿额度，则确定所述前K个候选方为从所述M个候选方中确定出参与联邦学习联盟的K个参与方。

在本申请实施例中，按照排序后的M个候选方的顺序，对排序后的M个候选方中前i个候选方的实际收益进行求和，根据i在不同取值情况下的求和值，从M个候选方中筛选出K个参与方，不仅能够保证K个参与方的实际收益小于或等于发起方的最高赔偿额度，还能保证筛选出数据集质量是相对较好的K个参与方。

在一种可能的设计中，在根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联邦学习联盟的K个参与方之后，包括：

向所述K个参与方中每个参与方对应的客户端发送入选通知；其中，所述入选通知用于提示对应参与方已加入所述联邦学习联盟。

在本申请实施例中，在确定出K个参与方之后，通知K个参与方，便于基于该联邦学习联盟的后续处理。

第二方面，提供一种确定联邦学习联盟中参与方的装置，所述联邦学习联盟中包括请求建立联邦学习联盟的发起方，以及从N个候选方中确定出的至少一个参与方，所述装置包括：

预算模块，用于获取有偿信息；其中，所述有偿信息包括发起方为一个参与方支付的最高单个赔偿额度，以及所述发起方支付的所有参与方的最高总赔偿额度；

竞价模块，用于获取竞价信息；其中，所述竞价信息包括所述N候选方中每个候选方的期望收益；

质量评估模块，用于获取N个数据集质量；其中，所述N个数据集质量中每个数据集质量用于表征根据N个候选方中对应候选方的样本数据集训练出的样本模型的评价结果，N为大于或等于2的整数；

组织模块，用于将所述最高单个赔偿额度与所述N候选方中每个候选方的期望收益作差，获得预算差值，并将所述预算差值与所述N个数据集质量相乘，得到所述N个候选方中每个候选方的预算剩余值，获得N个预算剩余值；其中，所述预算剩余值用于表示所述发起方支付对应候选方之后的剩余额度；以及，

将M个候选方中每个候选方的数据集质量与所述每个候选方的期望收益的相乘，获得与所述M个候选方中每个候选方的数据集质量匹配的实际收益，获得M个实际收益；其中，所述M个候选方的预算剩余值大于预设值的预算剩余值；以及，

在一种可能的设计中，组织模块具体用于：

获取N个候选方中每个候选方的样本数据集；

根据所述N个候选方中每个候选方的样本模型，以及预设评价函数，确定所述N个候选方中每个候选方的样本模型的准确率；

将所述N个候选方中每个候选方的样本模型的准确率进行归一化处理，得到所述N个样本数据集中每个样本数据集的数据集质量。

在一种可能的设计中，所述组织模块还用于：

在根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联盟的K个参与方之前，从N个候选方中确定出预算剩余值大于预设值的M个候选方，以及将所述M个候选方，按照预算剩余值从大到小的顺序排列，获得排序后的M个候选方；

第三方面，提供一种确定联邦学习联盟中参与方的装置，包括：

至少一个处理器，以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述至少一个处理器通过执行所述存储器存储的指令实现如第一方面及可能的设计中任一项所述的方法。

第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如第一方面及可能的设计中任一项所述的方法。

附图说明

图1为本申请实施例的确定联邦学习联盟中参与方的方法的应用场景图；

图2为本申请实施例提供的确定联邦学习联盟中参与方的方法的流程示意图；

图3为本申请实施例提供的确定联邦学习联盟中参与方的装置的结构示意图；

图4为本申请实施例提供的确定联邦学习联盟中参与方的装置的结构示意图。

具体实施方式

为了更好的理解本申请实施例提供的技术方案，下面将结合说明书附图以及具体的实施方式进行详细的说明。

为了便于本领域技术人员更好地理解本申请的技术方案，下面对本申请中涉及的名词进行解释。

联邦学习(Federated Machine Learning)：是一种加密的分布式机器学习技术，参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。联邦双方在不用给出己方数据的情况下，也可进行模型训练得到模型参数，联邦学习通过加密机制下的参数交换方式保护用户数据隐私，数据和模型本身不会进行传输，也不能反猜对方数据，因此在数据层面不存在泄露的可能，也不违反更严格的数据保护法案如《通用数据保护条例》(General Data Protection Regulation，GDPR)等，能够在较高程度保持数据完整性的同时，保障数据隐私。

联邦学习联盟：是指本次联邦学习中的成员，联邦学习联盟中成员至少是两个。

发起方：主动请求创建此次联邦学习联盟的成员，一个联邦学习联盟中的发起方一般是一个，任意一个企业可以作为发起方。

候选方：在发起方请求创建联邦学习联盟之后，有参与该联邦学习联盟意向的成员均属于候选方。

参与方：从多个候选方中筛选出的确定参与联邦学习联盟的成员，在创建联邦学习联盟过程中，候选方的数量大于或等于参与方的数量。例如发起方为电子商务公司A，电子商务公司A想通过联邦学习吸引相应的银行加盟投资，众多想要参与该电子商务公司A的联邦学习的银行则为候选方，通过相应的处理之后，从多家银行确定出的参与本次联邦学习的银行则为参与方。

终端：可以是移动电话、智能电话、笔记本电脑、数字广播接收器、个人数字助理(PDA)、平板电脑(PAD)等用户设备(User Equipment，UE)、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备、移动台(Mobile station，MS)等。

本申请实施例提供一种确定联邦学习联盟中参与方的方法，该方法由服务器101来执行。请参照图1，图1为本申请实施例的确定联邦学习联盟中参与方的方法的应用场景图。该应用场景包括服务器101和多个终端102，多个终端102中每个终端102中安装有客户端。服务器101可以与多个客户端进行通信。图1中是以5个终端102为例，但是实际上不限制终端102的数量。

具体的，服务器101通过多个客户端获取多个候选方的竞价信息，以及多个候选方中每个候选方的数据集质量，服务器101可以通过发起方的客户端获取发起方的有偿信息，服务器101根据竞价信息、数据集质量、以及有偿信息，从多个候选方中确定出参与本次联邦学习联盟的至少一个参与方。

下面结合图1论述的应用场景，对本申请实施例中的确定联邦学习联盟中参与方的方法进行详细介绍。

发起方在需要创建联盟学习联盟的时候，可以通过客户端向服务器101发送创建联邦学习联盟的请求，服务器101在接收到发起方的创建联邦学习联盟的请求之后，请参照图2，服务器101执行步骤201，即获取有偿信息，竞价信息，以及N个数据集质量。

具体的，服务器101可以从发起方对应的客户端中获取发起方的有偿信息，有偿信息包括发起方能够为一个参与方支付的最高单个赔偿额度M_b，以及发起方能够支付所有的参与方的最高总赔偿额度B。

服务器101可以从N个候选方中每个候选方对应的客户端获取该候选方的竞价信息，竞价信息一般是加密之后发送给服务器101，N为大于或等于2的整数，该候选方的竞价信息包括该候选方的期望收益c_i。为了保证服务器101后续能够确定各个候选方的身份，竞价信息中可以包括对应候选方的身份信息。

数据集质量用于表示对应的候选方的样本数据集训练处的样本模型的评价结果，数据集质量的获取方式有多种，下面进行示例说明。

方式一：

服务器101可以从N个候选方中每个候选方对应的客户端获取样本模型的准确率，服务器101根据N个候选方中每个候选方的样本模型的准确率获得每个候选方的数据集质量。

具体的，客户端可以根据该候选方的样本数据集进行训练，训练得到该候选方对应的样本模型，根据预设评价函数，获得该样本模型的评价值。候选方的客户端将样本模型的评价值加密之后发送给服务器101，服务器101在接收N个候选方的评价值之后，对N个候选方的评价值进行归一化处理，得到各个候选方的数据集质量。归一化处理例如，将N个候选方的N个评价值中的最大的评价值确定为1，其余N-1个候选方除以1，得到每个候选方的数据集质量q_i。其中，样本数据集的具体内取决于联邦学习的具体应用场景，应用场景不同，样本数据集的具体内容可能不相同。

其中，预设评价函数不同，评价值对应的含义可能有所不同，例如预设评价函数用于评价样本模型的准确率，评价值则表示样本模型的准确率。评价值例如样本模型的准确率、召回度或M值等，M值是在机器学习领域常用于评价模型的一种指标。

方式一中，由N个候选方中每个候选方的客户端训练各自的样本模型，以及根据预设评价函数，确定出样本模型的评价值，服务器101只需在接收到N个评价值之后，对N个评价值进行归一化处理，就能获得各个候选方的数据集质量q_i。这样可以减少服务器101的处理量。

方式二：

服务器101通过从N个候选方中每个候选方对应的客户端获取样本数据集，服务器101根据各个候选方的数据样本获得各个候选方的数据集质量q_i。

具体的，N个候选方可以通过客户端将各自的样本数据集加密之后发送给服务器101，服务器101在接收到样本数据集之后，对每个候选方的样本数据集进行训练，训练得到每个候选方的样本模型，采用预设评价函数对样本模型进行评估，得到每个候选方的样本模型的评价值，对评价值进行归一化处理之后，得到每个候选方的数据集质量q_i。评价值可以参照方式一中的论述内容，此处不再赘述。

方式二中，N个候选方只需将各自的样本数据集发送给服务器101，训练以及评价过程均是由服务器101完成，避免候选方作弊，保证了数据集质量q_i的可靠性。

应当说明的是，方式一和方式二中的预设评价函数可以有很多种，本文不做具体限制。

应当说明的是，步骤201中，获取有偿信息，竞价信息，以及N个数据集质量的顺序可以是任意的，也就是说，服务器101可以同时获取这三类信息，也可以是按照任意的先后顺序获取三类信息。

服务器101在执行步骤201之后，执行步骤202，即将最高单个赔偿额度与N个候选方中每个候选方的期望收益作差，获得预算差值，并将预算差值与N个数据集质量相乘，得到N个候选方中每个候选方的预算剩余值，获得N个预算剩余值。

具体的，服务器101在获取有偿信息，竞价信息，以及N个数据集质量之后，需要根据这些信息来确定哪些候选方可能没有达到发起方的标准，排除相应的候选方。服务器101根据高单个赔偿额度、期望收益以及数据集质量，确定各个候选方的预算剩余值I_i，预算剩余值用于表示发起方支付对应候选方之后的剩余额度，确定每个计算预设剩余值的公式如下：

I_i＝(M_b-c_i)q_i

服务器101确定某个候选方的预算剩余值I_i是否小于预设阈值，如果确定预算剩余值I_i小于预设阈值，则表示候选方的要价超过发起方的标准，该候选方不符合要求，排除该候选方，排除N个候选方中预算剩余值小于预设阈值的候选方之后，获得M个候选方，M为小于或等于N的正整数。

其中，预设阈值由服务器101设定，或者由发起方设定，预设阈值例如可以为0。

服务器101执行步骤202之后，执行步骤203，即将M个候选方中每个候选方的数据集质量与每个候选方的期望收益的相乘，获得与M个候选方中每个候选方的数据集质量匹配的实际收益，获得M个实际收益。

具体的，服务器101在确定出M个候选方之后，可以将M个候选方中每个候选方的数据集质量与该候选方的期望收益相乘，从而获得每个候选方的数据集质量匹配的实际收益。具体确定与每个候选方的数据集质量匹配的实际收益的公式如下：

p_i＝c_iq_i

在一种可能的实施例中，可以根据预算剩余值，对每个候选方的实际收益进行补偿。

具体的，将M个候选方，按照预算剩余值从大到小的顺序排列，获得排序后的M个候选方。将M个候选方中任一候选方的预算剩余值与后一候选方的预算剩余值作差，得到任一候选方与后一候选方之间的预算剩余值差值，该预算剩余值差值为该任一候选方对应的实际收益补偿值。将该任一候选方的实际收益与实际收益补偿值相加，从而获得该任一候选方对应补偿后的实际收益p_i ^’。

p_i’＝p_i+I_i-I_j＝c_iq_i+I_i-I_j

其中，后一候选方为排序后的M个候选方中与该任一候选方相邻，且位于该任一候选方之后的候选方。

应当说明的是，如果该任一候选方为M个候选方中的最后一个候选方，该候选方不存在后一候选方，因此，该候选方补偿后的实际收益就是该候选方的实际收益。

例如，排序后的M个候选方依次为B，C，D，任一候选方为C，则D表示C的后一候选方。

本申请实施例中，根据相邻两个候选方的预算剩余值差值，对一个候选方的实际收益进行补偿，如果该候选方的预算剩余值较小，则对应的实际收益补偿值相对也小，如果该候选方的预算剩余值较大，则对应的实际收益补偿值相对也大，因此，本申请实施例中的预算剩余值差值能够约束各个候选方的实际收益，避免各个候选方虚报期望收益，保证各个候选方能够得到与数据集质量匹配的期望收益的情况下，鼓励候选方合理设置期望收益。

服务器101在获得补偿后的实际收益或实际收益之后，执行步骤204，即根据M个补偿后的实际收益或实际收益，以及最高总赔偿额度，从M个候选方中确定出参与联邦学习联盟的K个参与方。

具体的，服务器101可以在获得M个候选方的补偿后实际收益或实际收益之后，根据M个候选方的补偿后实际收益或实际收益，从M个候选方中确定出参与联邦学习联盟的K个参与方。K个参与方对应的实际收益小于或等于最高总赔偿额度。

服务器101也可以根据M个候选方的补偿后的实际收益，从M个候选方中确定出参与联邦学习联盟的K个参与方，只要K个参与方对应的实际收益小于或等于最高总赔偿额度即可。服务器101从M个候选方中确定出参与联邦学习联盟的K个参与方的方式有多种，下面进行示例说明。

A1：

服务器101从M个候选方随机选择出K个参与方。

具体的，服务器101从M个候选方随机选择K个候选方，确定K个候选方的实际收益小于或等于最高总赔偿额度，则确定该K个候选方为本次确定出的参与联邦学习联盟的K个参与方。

如前文所述，服务器101在获取补偿后的实际收益的情况下，服务器101从M个候选方随机选择K个候选方，确定K个候选方补偿后的实际收益小于或等于最高总赔偿额度，则确定该K个候选方为本次确定出的参与联邦学习联盟的K个参与方。

A2：

服务器101可以按照排序后的M个候选方的顺序，对排序后的M个候选方中前i个候选方的实际收益或补偿后的实际收益进行求和。

本申请实施例中，对前i个候选方的实际收益进行求和，确定K个参与方的计算公式如下：

i可以依次从1取到M，当i取值为K+1时，如果M个候选方中前K个候选方的实际收益之和等于或小于最高总赔偿额度，M个候选方中前K+1个候选方的实际收益之和大于最高总赔偿额度，则确定前K个候选方为从M个候选方中确定出参与联邦学习联盟的K个参与方。K为小于M的正整数。

对前i个候选方的补偿后的实际收益进行求和，确定K个参与方的计算公式如下：

i可以依次从1取到M，当i取值为K+1时，如果M个候选方中前K个候选方的补偿后的实际收益之和等于或小于最高总赔偿额度，M个候选方中前K+1个候选方的补偿后的实际收益之和大于最高总赔偿额度，则确定前K个候选方为从M个候选方中确定出参与联邦学习联盟的K个参与方。K为小于M的正整数。

在确定出K个参与方之后，服务器101向K个参与方对应的客户端发送入选通知，入选通知用于提示该候选方已加入联邦学习联盟。

在发送入选通知之后，服务器101对K个参与方根据前文确定出的实际收益或补偿后的实际收益，对K个参与方进行偿付，并根据本次确定联邦学习联盟中参与方的结果，更新发起方的有偿信息等。

在前文论述的一种确定联邦学习联盟中参与方的方法的基础上，本申请实施例提供一种确定联邦学习联盟中参与方的方法的装置，该装置设置于前文论述的服务器101中，请参照图3，该装置包括：

预算模块301，用于获取有偿信息；其中，有偿信息包括发起方为一个参与方支付的最高单个赔偿额度，以及发起方支付的所有参与方的最高总赔偿额度；

竞价模块302，用于获取竞价信息；其中，竞价信息包括N候选方中每个候选方的期望收益；

质量评估模块303，用于获取N个数据集质量；其中，N个数据集质量中每个数据集质量用于表征根据N个候选方中对应候选方的样本数据集训练出的样本模型的准确率，N为大于或等于2的整数；

组织模块304，用于将最高单个赔偿额度与N候选方中每个候选方的期望收益作差，获得预算差值，并将预算差值与N个数据集质量相乘，得到N个候选方中每个候选方的预算剩余值，获得N个预算剩余值；其中，预算剩余值用于表示发起方支付对应候选方之后的剩余额度；以及，

将M个候选方中每个候选方的数据集质量与每个候选方的期望收益的相乘，获得与M个候选方中每个候选方的数据集质量匹配的实际收益，获得M个实际收益；其中，M个候选方的预算剩余值大于预设值的预算剩余值；以及，

根据M个实际收益，以及最高总赔偿额度，从M个候选方中确定出参与联邦学习联盟的K个参与方；其中，K个参与方的实际收益之和小于或等于最高赔偿额度，K为小于或等于N的正整数。

在一种可能的实施例中，质量评估模块303具体用于：

在获取有偿信息，竞价信息，以及N个数据集质量之前，获取N个候选方中每个候选方的样本数据集；

对N个候选方中每个候选方的样本数据集进行训练，得到N个候选方中每个候选方的样本模型；

根据N个候选方中每个候选方的样本模型，以及预设评价函数，确定N个候选方中每个候选方的样本模型的准确率；

将N个候选方中每个候选方的样本模型的准确率进行归一化处理，得到N个样本数据集中每个样本数据集的数据集质量。

在一种可能的实施例中，组织模块304还用于：

在根据M个实际收益，以及最高总赔偿额度，从M个候选方中确定出参与联盟的K个参与方之前，从N个候选方中确定出预算剩余值大于预设值的M个候选方，以及将M个候选方，按照预算剩余值从大到小的顺序排列，获得排序后的M个候选方；

基于排序后的M个候选方，将M个候选方中任一候选方的预算剩余值与后一候选方的预算剩余值作差，得到任一候选方与后一候选方之间的预算剩余值差值；其中，后一候选方为排序后的M个候选方中与任一候选方相邻且位于任一候选方之后的候选方；

将实际收益与预算剩余值差值相加，得到补偿后的任一候选方的实际收益。

在一种可能的实施例中，组织模块304具体用于：

对排序后的M个候选方中前i个候选方的实际收益进行求和；

当i从1取到K+1时，若M个候选方中前K个候选方的实际收益之和等于或小于最高总赔偿额度，M个候选方中前K+1个候选方的实际收益之和大于最高总赔偿额度，则确定前K个候选方为从M个候选方中确定出参与联邦学习联盟的K个参与方。

在一种可能的实施例中，请继续参照图3，装置还包括通知模块305，其中：

通知模块305，用于在根据M个实际收益，以及最高总赔偿额度，从M个候选方中确定出参与联邦学习联盟的K个参与方之后，向K个参与方中每个参与方对应的客户端发送入选通知；其中，入选通知用于提示对应参与方已加入联邦学习联盟。

应对说明的是，确定联邦学习联盟中参与方的方法的装置中的通知模块305是可选的模块。

在前文论述的一种确定联邦学习联盟中参与方的方法的基础上，本申请实施例提供一种确定联邦学习联盟中参与方的装置，该装置设置于前文论述的服务器101中，请参图4，该装置包括：

至少一个处理器401，以及

与至少一个处理器401通信连接的存储器402；

其中，存储器402存储有可被至少一个处理器401执行的指令，至少一个处理器401通过执行存储器402存储的指令实现前文论述的确定联邦学习联盟中参与方的方法。

图4中是以一个处理器401为例，但是实际上不限制处理器401的数量。

作为一种实施例，图3中的预算模块301、竞价模块302、质量评估模块303、组织模块304和通知模块305可以通过图4中的处理器401实现。

在前文论述的一种确定联邦学习联盟中参与方的方法的基础上，本申请实施例提供一种计算机可读存储介质，计算机可读存储介质存储有计算机指令，当计算机指令在计算机上运行时，使得计算机执行前文论述的确定联邦学习联盟中参与方的方法。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种确定联邦学习联盟中参与方的方法，其特征在于，应用于服务器，所述联邦学习联盟中包括请求建立联邦学习联盟的发起方，以及从N个候选方中确定出的至少一个参与方，所述方法包括：

通过多个客户端获取有偿信息，竞价信息，以及N个数据集质量；其中，所述有偿信息包括发起方为一个参与方支付的最高单个赔偿额度，以及所述发起方支付的所有参与方的最高总赔偿额度，所述竞价信息包括所述N个候选方中每个候选方的期望收益，所述N个数据集质量中每个数据集质量用于表征根据N个候选方中对应候选方的样本数据集训练出的样本模型的评价结果，N为大于或等于2的整数；

将所述最高单个赔偿额度与所述N个候选方中每个候选方的期望收益作差，获得预算差值，并将所述预算差值与所述N个数据集质量相乘，得到所述N个候选方中每个候选方的预算剩余值，获得N个预算剩余值；其中，所述预算剩余值用于表示所述发起方支付对应候选方之后的剩余额度；

根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联邦学习联盟的K个参与方；其中，所述K个参与方的实际收益之和小于或等于所述最高总赔偿额度，K为小于或等于N的正整数。

2.如权利要求1所述的方法，其特征在于，在获取有偿信息，竞价信息，以及N个数据集质量之前，包括：

获取N个候选方中每个候选方的样本数据集；

将所述N个候选方中每个候选方的样本模型的评价值进行归一化处理，得到N个样本数据集中每个样本数据集的数据集质量。

3.如权利要求1或2所述的方法，其特征在于，在根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联盟的K个参与方之前，包括：

4.如权利要求3所述的方法，其特征在于，根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联邦学习联盟的K个参与方，包括：

5.如权利要求1所述的方法，其特征在于，在根据所述M个实际收益，以及所述最高总赔偿额度，从所述M个候选方中确定出参与联邦学习联盟的K个参与方之后，包括：

6.一种确定联邦学习联盟中参与方的装置，其特征在于，应用于服务器，所述联邦学习联盟中包括请求建立联邦学习联盟的发起方，以及从N个候选方中确定出的至少一个参与方，所述装置包括：

预算模块，用于通过多个客户端获取有偿信息；其中，所述有偿信息包括发起方为一个参与方支付的最高单个赔偿额度，以及所述发起方支付的所有参与方的最高总赔偿额度；

竞价模块，用于通过多个客户端获取竞价信息；其中，所述竞价信息包括所述N个候选方中每个候选方的期望收益；

质量评估模块，用于通过多个客户端获取N个数据集质量；其中，所述N个数据集质量中每个数据集质量用于表征根据N个候选方中对应候选方的样本数据集训练出的样本模型的评价结果，N为大于或等于2的整数；

组织模块，用于将所述最高单个赔偿额度与所述N个候选方中每个候选方的期望收益作差，获得预算差值，并将所述预算差值与所述N个数据集质量相乘，得到所述N个候选方中每个候选方的预算剩余值，获得N个预算剩余值；其中，所述预算剩余值用于表示所述发起方支付对应候选方之后的剩余额度；以及，

7.如权利要求6所述的装置，其特征在于，组织模块具体用于：

获取N个候选方中每个候选方的样本数据集；

将所述N个候选方中每个候选方的样本模型的准确率进行归一化处理，得到N个样本数据集中每个样本数据集的数据集质量。

8.如权利要求6或7所述的装置，其特征在于，所述组织模块还用于：

9.一种确定联邦学习联盟中参与方的装置，其特征在于，包括：

至少一个处理器，以及

与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述至少一个处理器通过执行所述存储器存储的指令实现如权利要求1-5中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如权利要求1-5中任一项所述的方法。