CN111325351A

CN111325351A - 一种确定联邦学习参与方的方法及装置

Info

Publication number: CN111325351A
Application number: CN202010103026.4A
Authority: CN
Inventors: 刘洋; 于涵; 陈天健; 杨强
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2020-02-19
Filing date: 2020-02-19
Publication date: 2020-06-23

Abstract

本发明提供一种确定联邦学习参与方的方法及装置。其中方法包括：接收申请方发送的加入请求，该加入请求中包括当前机会成本值；根据申请方的预估函数和所述申请方的当前请求加入次数，确定该申请方的预估机会成本值；其中，预估函数是根据申请方针对联邦学习的历史机会成本值和历史请求加入次数生成的；所述历史机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间；最后，在所述当前机会成本值不大于所述预估机会成本值时，确定该申请方为联邦学习的参与方。采用上述方法，可以评估参与方机会成本，防止参与方的机会成本虚报过高，维护了联邦的收益与信誉。

Description

一种确定联邦学习参与方的方法及装置

技术领域

本发明涉及人工智能技术领域，尤其涉及一种确定联邦学习参与方的方法及装置。

背景技术

随着计算机技术的发展，人工智能技术近来在金融领域中应用愈加广泛，其中，大数据是人工智能产业化中不可或缺的基石。由于行业竞争、隐私安全、行政手续复杂等问题，数据常常是以孤岛的形式存在的；甚至在同一个公司的不同部门之间实现数据集中整合也面临着重重阻力。在现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的，因此，企业目前正面临着数据隐私保护和数据孤岛这两方面的难题，为了解决这两大难题，联邦学习应运而生。

联邦学习是一种新型的通过分布式训练及加密技术帮助企业在无需公开隐私数据的情况下共同训练高质量联合机器学习模型的方法。联邦学习能有效帮助多个参与方在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模。但在横向联邦学习的场景下，参与方之间一般存在竞争关系。例如，由几家银行组成的联盟通过横向联邦学习共同训练一个向用户推荐金融产品的机器学习模型。虽然联邦学习模型可以提高参与方的模型质量，但是相对于一个本来市场份额较小、数据较少的参与方A和一个本来市场份额较大、数据较多的参与方B来说，参加这个联盟可能使参与方A和参与方B的市场总体量增大，但也可能造成参与方A的市场占有率增加，参与方B的市场占有率的下降。因此，相对来说，参与方B所付出的成本要多于参与方A所付出的成本，这种成本在这里称之为“机会成本”。如果联盟不能有效通过激励机制补偿参与方的机会成本，很有可能导致这部分拥有高质量、大数据集的参与方流失，影响联盟的长期可持续发展。

因此，现在亟需一种确定联邦学习参与方的方法及装置，用于获得更接近联邦学习参与方的真实机会成本的预估机会成本，使得联邦学习可以有效的评估参与方机会成本。

发明内容

本发明实施例提供一种确定联邦学习参与方的方法及装置，用于获得更接近联邦学习参与方的真实机会成本的预估机会成本，使得联邦学习可以有效的评估参与方机会成本。

第一方面，本发明实施例提供一种确定联邦学习参与方的方法，该方法包括：

接收申请方发送的加入请求，所述加入请求包括当前机会成本值；根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值；所述预估函数是根据所述申请方针对所述联邦学习的历史机会成本值和历史请求加入次数生成的；所述历史机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间；在所述当前机会成本值不大于所述预估机会成本值时，确定所述申请方为所述联邦学习的参与方。

采用上述方法，通过获取历史加入请求记录中的加入请求，得到历史机会成本值，通过历史机会成本值和历史请求加入次数生成预估函数，由此，预估函数的生成可以得到更接近申请方的真实机会成本值的预估机会成本值。再将获取的申请方发送的加入请求中的当前机会成本值与预估机会成本值比较，若当前机会成本值不大于预估机会成本值，则可以看做申请方此次上报的机会成本值比较接近真实机会成本值，判定申请方可以加入联邦学习；否则判定当前机会成本值过高，拒绝加入联邦学习；如此，可以有效的判断申请方上报的当前机会成本值是否飘高，防止造成联邦学习的损失。

在一种可能的设计中，所述加入请求还包括申请方标识信息，所述接收申请方发送的联邦学习加入请求之前，所述方法还包括：根据所述申请方标识信息从联邦学习历史加入请求记录中查询所述申请方的历史加入请求记录；对所述申请方的历史加入请求记录进行分析，得到所述历史机会成本值和所述历史请求加入次数；根据所述历史机会成本值的分布规律和所述历史请求加入次数，生成所述预估函数。

采用上述方法，根据申请方的加入请求中的标识信息获取历史加入请求记录中的历史机会成本值和历史请求加入次数，生成预估函数。如此，根据该申请方历史加入请求中的历史机会成本值生成的预估函数可以更准确地预估申请方真实的机会成本值。

在一种可能的设计中，所述方法还包括：在所述当前机会成本值大于所述预估机会成本值时，拒绝所述申请方的加入请求。

采用上述方法，在当前机会成本值大于预估机会成本值时，判断申请方上报的当前机会成本值过高，拒绝该申请方加入联邦学习，如此可以保证联邦学习的收益和公正性。

在一种可能的设计中，所述方法包括：根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值之前，还包括：确定所述申请方当前请求加入次数是否大于预设条件；所述根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值，包括：在确定所述申请方的当前请求加入次数大于预设条件时，根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值。

采用上述方法，通过确定申请方当前请求加入次数是否大于预设条件，进而判断该申请方的预估机会成本值是否由预估函数生成，为应用预估函数设置条件，即当前请求加入次数大于预设条件时，可以判断为生成预估函数的历史机会成本值足够多，相应的，可以保证预估函数生成的预估机会成本值更接近该申请方的真实机会成本值，因此，保证了申请方的当前机会成本值不会飘高。

在一种可能的设计中，所述当前请求加入次数与所述申请方当前的动态阈值成反向关系，所述确定所述申请方的历史请求加入次数是否小于或者等于预设条件，包括：确定所述动态阈值是否大于或者等于设定阈值；在所述动态阈值大于或者等于设定阈值时，确定所述申请方的当前请求加入次数小于或者等于预设条件。

在一种可能的设计中，所述确定所述申请方的当前请求加入次数是否大于预设条件，所述还包括：在确定所述申请方的当前请求加入次数小于或者等于预设条件时，根据所述申请方的成本区间确定随机机会成本值，所述申请方的成本区间小于或等于所述申请方历史所属的参与方类型所对应的成本区间；在所述当前机会成本值不大于所述随机机会成本值时，确定所述申请方为所述联邦学习的参与方。

采用上述方法，申请方的当前请求加入次数小于或者等于预设条件时，可以视为历史机会成本值的数据量较少，因此可以根据申请方的成本区间随机确定机会成本值；所述申请方的成本区间小于或等于所述申请方历史所属的参与方类型所对应的成本区间，如此，可以根据申请方专属的成本区间确定随机机会成本值，使得随机机会成本值更接近申请方真实机会成本值。在当前机会成本值不大于随机机会成本值时确定该申请方可以加入联邦学习，如此，即可以保证申请方的当前机会成本值不会飘高，诱导该申请方上报真实的机会成本值，又可以汇集足够的历史机会成本值数量，生成预估函数，进而得到更接近该申请方真实机会成本值的预估机会成本值。

在一种可能的设计中，在所述当前机会成本值大于所述随机机会成本值时，拒绝所述申请方的加入请求。

采用上述方法，申请方上报的当前机会成本值大于随机机会成本值，拒接申请方加入，申请方下次上报的机会成本值可能会适当调整的低于当前机会成本值，以此，起到诱导申请方上报真实机会成本值的作用。

在一种可能的设计中，所述方法还包括：在确定所述当前机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间时，将所述当前机会成本值加入所述历史加入请求记录中；根据所述随机机会成本值更新所述申请方的成本区间，所述申请方的成本区间为根据所述随机机会成本值和所述申请方历史所属的参与方类型所对应的成本区间确定的。

采用上述方法，若当前机会成本值不超过成本区间，将该当前机会成本值加入历史加入请求记录，如此可以将在成本区间外的当前机会成本值剔除，防止历史加入请求记录中包含飘高的历史机会成本值，影响预估函数的准确性。再由当前机会成本值或随机机会成本值更新成本区间，可以缩小成本区间范围，如此使得成本区间范围缩小，随机确定的随机机会成本值更接近于该申请方的真实机会成本值；进一步地，当比较随机机会成本值和该申请方的当前机会成本值时，使得联邦拒绝或接受加入的判断结果更准确合理；如此，当申请方被拒绝加入后，若希望下次可以加入联邦学习，则会适当调整上报的机会成本值，使得机会成本值更加接近真实的机会成本值。

第二方面，本发明实施例提供一种确定联邦学习参与方的装置，该装置包括：收发单元，用于接收申请方发送的加入请求，所述加入请求包括当前机会成本值；处理单元，用于根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值；所述预估函数是根据所述申请方针对所述联邦学习的历史加入请求记录生成的；所述历史机会成本值不超出所述申请方所属的参与方类型所对应的成本区间；还用于在所述当前机会成本值不大于所述预估机会成本值时，确定所述申请方为所述联邦学习的参与方。

在一种可能的设计中，所述处理单元还用于：根据所述申请方标识信息从联邦学习历史加入请求记录中查询所述申请方的历史加入请求记录；对所述申请方的历史加入请求记录进行分析，得到所述历史机会成本值和所述历史请求加入次数；根据所述历史机会成本值的分布规律和所述历史请求加入次数，生成所述预估函数。

在一种可能的设计中，所述处理单元还用于：在所述当前机会成本值大于所述预估机会成本值时，拒绝所述申请方的加入请求。

在一种可能的设计中，所述处理单元还用于：确定所述申请方的当前请求加入次数是否大于预设条件；所述根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值，包括：在确定所述申请方的当前请求加入次数大于预设条件时，根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值。

在一种可能的设计中，所述处理单元具体用于：确定所述动态阈值是否大于或者等于设定阈值；在所述动态阈值大于或者等于设定阈值时，确定所述申请方的当前请求加入次数小于或者等于预设条件。

在一种可能的设计中，所述处理单元还用于：在确定所述申请方的当前请求加入次数小于或者等于预设条件时，根据所述申请方的成本区间确定随机机会成本值，所述申请方的成本区间小于或等于所述申请方历史所属的参与方类型所对应的成本区间；在所述当前机会成本值不大于所述随机机会成本值时，确定所述申请方为所述联邦学习的参与方。

在一种可能的设计中，所述处理单元还用于：在所述当前机会成本值大于所述随机机会成本值时，拒绝所述申请方的加入请求。在一种可能的设计中，所述处理单元还用于：在确定所述当前机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间时，将所述当前机会成本值加入所述历史加入请求记录中；根据所述随机机会成本值更新所述申请方的成本区间，所述申请方的成本区间为根据所述随机机会成本值和所述申请方历史所属的参与方类型所对应的成本区间确定的。

第三方面，本发明实施例还提供一种计算设备，包括：存储器，用于存储程序指令；处理器，用于调用所述存储器中存储的程序指令，按照获得的程序执行如第一方面的各种可能的设计中所述的方法。

第四方面，本发明实施例还提供一种计算机可读非易失性存储介质，包括计算机可读指令，当计算机读取并执行所述计算机可读指令时，使得计算机执行如第一方面的各种可能的设计中所述的方法。

本发明的这些实现方式或其他实现方式在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种确定联邦学习参与方的架构示意图；

图2为本发明实施例提供的一种确定联邦学习参与方的方法的流程示意图；

图3为本发明实施例提供的又一种确定联邦学习参与方的架构示意图；

图4为本发明实施例提供的一种确定联邦学习参与方的方法的流程示意图；

图5为本发明实施例提供的一种确定联邦学习参与方的装置示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1为本发明实施例提供的一种确定联邦学习参与方的系统架构，当一个申请方1申请加入联邦学习2时，申请方1向联邦学习2发送加入请求，联邦学习2中的分析单元201接收该加入请求并分析，将分析结果发送至处理单元202，处理单元202接收分析结果后对申请方1的机会成本预估，得到预机会成本值，将预估机会成本值输出到决策单元203中，在决策单元203中比较预估机会成本值和当前机会成本值的大小，若当前机会成本值不大于预估机会成本值，则该申请方1允许加入联邦学习2，成为联邦学习2的参与方。

基于此，本发明实施例提供了一种确定联邦学习参与方的方法流程，如图2所示，包括：

步骤301、接收申请方发送的加入请求，所述加入请求包括当前机会成本值；

此处，申请方为申请加入联邦学习的相关企业或机构，也可以是企业内的相关部门。加入请求中可以包含申请方的当前机会成本值和企业名称、企业类别、所占市场率、等申请方的基本信息和相关信息。当前机会成本值为该申请方若加入该联邦学习产生的机会成本。

步骤302、根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值；所述预估函数是根据所述申请方针对所述联邦学习的历史机会成本值和历史请求加入次数生成的；所述历史机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间；

此处，预估机会成本值为根据预估函数得到的预测机会成本值，如，若该申请方在当前发送加入请求之前发送过一次加入请求，则可以将历史这一次加入请求中包含的历史机会成本值做区间函数，即历史机会成本值+/-x；若该申请方第一次发送加入请求，上报当前机会成本值为100万元、第二次发送加入请求，上报当前机会成本值为97万元、第三次发送加入请求，上报当前机会成本值为92万元…，如此得到预估函数为y＝-x²+x+100，x为发送加入请求次数，y为预估机会成本值；如此，在该申请方第六次发送加入请求时，另x＝6，得到预估机会成本值为65万元。预估函数为该申请方的历史机会成本值和历史请求加入次数确定的，预估机会成本值为该申请方的预估函数和当前请求加入次数确定的。历史机会成本值为在此次申请加入请求之前的该申请方历史加入请求中的机会成本值。也就是说，可以从历史加入请求记录中的加入请求获取历史机会成本值，根据这些历史机会成本值和历史请求加入次数可以得到预估函数，该预估函数可以是累分布函数

其中变量b表示机会成本值，变量k表示该申请方的企业类型，E[c_k]表示预估机会成本值；该预估函数也可以是根据历史机会成本值和历史请求加入次数得到的模拟函数，如，阶跃函数、分段函数、斜坡函数、抛物线函数、指数函数或三角函数等形式，此处，预估函数形式具体不做限定。

其中，由已知的联邦学习和联邦学习对应的参与方的相关数据可以得到参与方所在类型企业的机会成本范围，如此，成本区间可以为根据该申请方的企业类别得到该申请方的所在企业类型的机会成本范围，进而确定该申请方机会成本所在范围。如此，在所述当前机会成本值大于所述预估机会成本值时，拒绝所述申请方的加入请求；在确定所述当前机会成本值不超出所述申请方所属的参与方类型所对应的成本区间时，将所述当前机会成本值加入所述历史加入请求记录中。在当前机会成本值大于预估机会成本值时，在上一个示例中，预估机会成本值为65万元，该申请方上报92万元，则拒绝该申请方的加入请求，当前机会成本值92万元未超出成本区间(100-60)万元，则将该当前机会成本值92万元加入历史加入请求记录中。

另外，所述加入请求还可以包括申请方标识信息，所述接收申请方发送的联邦学习加入请求之前，所述方法还包括：根据所述申请方标识信息从联邦学习历史加入请求记录中查询所述申请方的历史加入请求记录；对所述申请方的历史加入请求记录进行分析，得到所述历史机会成本值和所述历史请求加入次数；根据所述历史机会成本值的分布规律和所述历史请求加入次数，生成所述预估函数。也就是说，生成预估函数的历史机会成本值和历史请求加入次数，可以根据当前申请方发送的加入请求中的标识信息，在历史加入请求记录中查找与该标识信息对应的历史机会成本值和历史请求加入次数，并根据历史机会成本值和历史加入请求次数的分布规律生成预估函数。

步骤303、在所述当前机会成本值不大于所述预估机会成本值时，确定所述申请方为所述联邦学习的参与方。

在上一个示例中，若该参与方上报的机会成本值为63万元，则当前机会成本值小于预估机会成本值65万元，则接受该申请方的加入请求，该申请方加入联邦学习后作为该联邦学习的参与方。

较佳的，根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值之前，还包括：确定所述申请方的当前请求加入次数是否大于预设条件；所述根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值，包括：在确定所述申请方的当前请求加入次数大于预设条件时，根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值。

此处，预设条件可以是申请方的当前加入请求次数，在当前加入请求次数大于预设加入请求次数；例如，当前请求加入次数6大于预设请求加入次数5，则通过申请方对应的预估函数生成预估机会成本值与当前机会成本值比较，确定联邦学习是否接受该申请方的加入请求。

需要说明的是，预设条件也可以是申请方的当历史机会成本值的个数，当历史机会成本值因为超出申请方的成本区间而被剔除，则可以采用临近加入请求中的历史机会成本值覆盖，以使每个加入请求都对应一个历史机会成本值；例如，第3次加入请求中的历史机会成本值被剔除，则可以将第2次，或第4次加入请求中的历史机会成本值做第3次加入请求中的历史机会成本值。如此，当历史加入请求记录中的历史机会成本值的个数大于预设历史机会成本值个数时，例如，历史加入请求记录中的历史机会成本值的个数7大于预设历史机会成本值个数6时，则通过申请方对应的预估函数生成预估机会成本值与当前机会成本值比较，确定联邦学习是否接受该申请方的加入请求。这里可以根据专业技术或专业经验确定预设条件对应的加入请求个数、历史机会成本值的个数等预设条件，这里的预设条件具体不做限定。

相应的，所述确定所述申请方的当前请求加入次数是否大于预设条件，所述还包括：在确定所述申请方的当前请求加入次数小于或者等于预设条件时，根据所述申请方的成本区间确定随机机会成本值，所述申请方的成本区间小于或等于所述申请方历史所属的参与方类型所对应的成本区间；在所述当前机会成本值不大于所述随机机会成本值时，确定所述申请方为所述联邦学习的参与方。也就是说，申请方的当前请求加入次数小于或者等于预设请求加入次数时，或者，历史加入请求记录中的历史机会成本值的个数大于预设历史机会成本值个数时，根据该申请方的成本区间确定随机机会成本值。例如，该申请方的成本区间为(100-60)万元，则随机机会成本值可以是区间(100-60)万元中的任意一个值，将该随机机会成本值与当前机会成本值作比较；假若随机机会成本值为80万元，当前机会成本值为70万元，当前机会成本值70万元不大于随机机会成本值80万元，确定该申请方为联邦学习的参与方。假若随机机会成本值为80万元，当前机会成本值为90万元，当前机会成本值90万元大于随机机会成本值80万元，拒绝该申请方参加联邦学习的加入请求。

较佳的，在该联邦学习接收到申请方的加入请求后，还可以通过另一种方式确定联邦学习是否接受该申请方请求，即对该加入请求分析，确定该申请方的加入请求次数，获得该申请方的动态阈值，所述当前请求加入次数与所述申请方当前的动态阈值成反向关系，所述确定所述申请方的历史请求加入次数是否小于或者等于预设条件，包括：确定所述动态阈值是否大于或者等于设定阈值；在所述动态阈值大于或者等于设定阈值时，确定所述申请方的当前请求加入次数小于或者等于预设条件。

其中，历史加入请求记录中记录申请方的加入请求、申请方标识信息、当前机会成本值及加入请求携带的其他相关信息；动态阈值为联邦学习针对该申请方设置的，该申请方申请加入该联邦学习的次数越多，该申请方的动态阈值越小；也就是说，历史加入请求记录中记录的加入请求越多，该申请方的动态阈值越小，动态阈值与历史加入请求记录中的加入次数成反比；可以设定阈值做为一个判断基准值，当动态阈值小于设定阈值时，联邦学习可以判定联邦学习已经汇集足够的数据生成预估函数；否则，联邦学习则可以判定联邦学习汇集的数据不足，无法生成预估函数或生成的预估函数准确性不足。

在确定所述申请方当前的动态阈值不小于所述设定阈值时，根据所述申请方的成本区间确定随机机会成本值；所述申请方的成本区间根据所述申请方所属的参与方类型所对应的成本区间确定的；在所述当前机会成本值不大于所述随机机会成本值时，确定所述申请方为所述联邦学习的参与方。在所述当前机会成本值大于所述随机机会成本值时，拒绝所述申请方的加入请求。

随机机会成本为在成本区间内随机确定的，例如，成本区间是(100-90)万元，则随机机会成本值可以是100万元-90万元间的任意一个数值。因此，申请方当前的动态阈值不小于设定阈值，也就是该申请方在这次申请加入之前没有申请加入该联邦学习或申请加入该联邦学习的次数较少，历史加入请求记录中记录的加入请求次数为零或较少；由此，联邦学习所汇集的该申请方的数据少，无法生成预估函数或生成的预估函数准确性不足。这种情况下，联邦学习在该申请方的成本区间内随机确定一个随机机会成本值，将随机机会成本值与当前机会成本值比较，若当前机会成本值不大于随机机会成本值，则该申请方可以加入联邦学习，作为该联邦学习的参与方；若当前机会成本值大于随机机会成本值，该联邦学习拒绝该申请方加入。

最后，将所述当前机会成本值加入所述历史加入请求记录中，较佳的，在确定所述当前机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间时，将所述当前机会成本值加入所述历史加入请求记录中；根据所述随机机会成本值更新所述申请方的成本区间，所述申请方的成本区间为根据所述随机机会成本值和所述申请方历史所属的参与方类型所对应的成本区间确定的。也就是说，可以将该申请方上报的当前机会成本值直接加入历史加入请求记录中；也可以判断该当前机会成本值是否属于成本区间的范围或比成本区间内的最小值更小，若是，则将该当前机会成本值保存到历史加入请求记录中；否则，判定该当前机会成本值不合理，超出了该申请方所处企业类型的机会成本值的范围，即飘高，不予保存。再根据随机机会成本值更新该申请方的成本区间，例如，设成本区间为(100-90)万元，当前机会成本值为110万元，随机机会成本值92万元，110＞92，则拒绝该申请方加入，可以将92万元看做该申请方机会成本值的最小值，更新成本区间为(100-92)，当前机会成本值为110万元，超出成本区间，不保存至历史加入请求记录中。

如此，在多次通过成本区间随机确定随机机会成本值的过程中，该申请方的成本区间变小，越来越接近真实机会成本值，该申请方则会被诱导上报出更加接近真实机会成本值的当前机会成本值，进一步地，历史加入请求记录中汇集的历史机会成本值数量增加，且越来越接近真实机会成本值，生成的预估函数作出预估的准确性越高。在动态阈值小于设定阈值，则根据预估函数判定联邦学习是否接受该申请方加入。

图3为本发明实施例提供的又一种确定联邦学习参与方的系统架构，即联邦协调单元401将该申请方的加入请求信息分析得到动态阈值，根据动态阈值判断联邦学习通过那种方式来预测该申请方的机会成本值；若小于设定阈值，则预估单元404获取知识库405中的历史机会成本值生成的预估函数生成预估机会成本值，在决策单元406中将预估机会成本值与申请方上报的当前机会成本值比较，若当前机会成本值大于预估机会成本值，则由通知单元407通知申请方申请失败，拒绝加入；否则，则由通知单元407通知申请方申请成功，邀请加入，决策单元406将当前机会成本值上报至知识库405中，若该当前机会成本值在数据库403的成本区间内，则存储，否则删除。若大于等于设定阈值，则随机单元402获取数据库中403中的成本区间，从成本区间中随机选取一个机会成本值做随机机会成本值，决策单元406将申请方上报的当前机会成本值与随机机会成本值作比较，若当前机会成本值大于随机机会成本值，通知单元407通知申请方申请失败，拒绝加入，否则，申请成功邀请加入，将随机机会成本值上报至知识库405，根据随机机会成本值及比较结果将数据库403中的成本区间更新。如此，针对一个申请方，可以使得数据库403中的成本区间越来越小，更接近申请方的真实机会成本值；可以使得推出知识库405中的预估函数的历史机会成本值越多，预估单元404中得到的预估机会成本值则更加接近申请方的真实机会成本值；有效防止申请方上报的当前机会成本值飘高，维护了联邦的收益和信誉。

本发明实施例还提供了一种确定联邦学习参与方的方法，如图4所示，包括：

步骤501、接收申请方的加入请求；

此处，接收请求加入联邦学习的申请方发送的加入请求。

步骤502、动态阈值是否大于设定阈值；

此处，设所有申请方在该联邦学习中的动态阈值的初始值为ε＝0.99，一个申请方可以多次参加一个联邦学习，每参加一次，ε＝ε*0.9，如此，当一个申请方第一次发送加入请求，ε＝0.99，第二次发送加入请求，ε＝0.99*0.9＝0.891，第三次发送加入请求，ε＝0.891*0.9＝0.8091，第四次发送加入请求，ε＝0.8091*0.9＝0.72171，第五次发送加入请求，ε＝0.72171*0.9＝0.649539…。

此处通过rand(0,1)机制随机确定设定阈值与动态阈值ε比较，例如，rand(0,1)＝0.7小于0.8091，确定下一执行步骤5031，这里确定设定阈值的方式可以通过其他方式确定，具体不做限定。

步骤5031、确定随机机会成本值；

此处，获得该申请方的画像信息，根据以往经验及行业专家建议可以确定该申请方的机会成本值的所在区间，例如上个示例中的申请方机会成本值所在成本区间为(100-60)万元。随机确定的随机机会成本值为70万元，则继续执行下一步骤5051。

步骤5032、确定预估机会成本值；

此处，在上一个示例中，该申请方在该联邦学习中经过前四次的申请方上报的机会成本值采集得到预估函数y＝-x²+x+100，x＝5，则预估机会成本值为80万元。

步骤5041、当前机会成本值是否小于随机机会成本值；

此处，在上一个示例中，该申请方第三次发送加入请求，上报当前机会成本值为92万元，92大于70,执行下一步骤5053。否则执行步骤5051，接收该申请方的加入请求，该申请方作为该联邦学习的参与方。

此处，将当前机会成本值92万元上报，积累当前机会成本值用于生成预估函数。并将92大于70的结果上报，若前两次更新后的成本区间为(97-60)，用随机机会成本值70更新成本区间(97-70)万元。

步骤5042、当前机会成本值是否小于预估机会成本值；

此处，若该申请方上报的当前机会成本值为79万元，79小于80，执行下一步骤5051，接收该申请方的加入请求，该申请方作为该联邦学习的参与方。

此处，将当前机会成本值79万元上报，积累当前机会成本值用于进一步精确预估函数；并将79小于80的结果上报，若前四次更新后的成本区间为(97-75)，用预估机会成本值80更新成本区间(80-75)万元。如此，申请方第一次申请加入联邦学习时，根据该申请方的画像信息中的企业类别、企业规模等确定的成本区间(100-60)万元，随着该申请方发送加入请求的次数增多，会生成新的，只针对于该申请方的成本区间(80-75)万元。

步骤5053、拒绝请求；

此处，当随机机会成本值小于参与方上报的当前机会成本值，则拒绝该申请方加入；或当预估机会成本值小于参与方上报的当前机会成本值，则拒绝该申请方加入。

基于同样的构思，本发明实施例提供确定联邦学习参与方的装置，图5为本发明实施例提供的确定联邦学习参与方的装置示意图，如图5示，包括：

收发单元601，用于接收申请方发送的加入请求，所述加入请求包括当前机会成本值；处理单元602，用于根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值；所述预估函数是根据所述申请方针对所述联邦学习的历史加入请求记录生成的；所述历史机会成本值不超出所述申请方所属的参与方类型所对应的成本区间；还用于在所述当前机会成本值不大于所述预估机会成本值时，确定所述申请方为所述联邦学习的参与方。

在一种可能的设计中，所述处理单元602还用于：根据所述申请方标识信息从联邦学习历史加入请求记录中查询所述申请方的历史加入请求记录；

对所述申请方的历史加入请求记录进行分析，得到所述历史机会成本值和所述历史请求加入次数；

根据所述历史机会成本值的分布规律和所述历史请求加入次数，生成所述预估函数。

在一种可能的设计中，所述处理单元602还用于：在所述当前机会成本值大于所述预估机会成本值时，拒绝所述申请方的加入请求。

在一种可能的设计中，所述处理单元602还用于：确定所述申请方的当前请求加入次数是否大于预设条件；

所述根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值，包括：

在确定所述申请方的当前请求加入次数大于预设条件时，根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值。

在一种可能的设计中，所述处理单元602具体用于：确定所述动态阈值是否大于或者等于设定阈值；

在所述动态阈值大于或者等于设定阈值时，确定所述申请方的当前请求加入次数小于或者等于预设条件。

在一种可能的设计中，所述处理单元602还用于：在确定所述申请方的当前请求加入次数小于或者等于预设条件时，根据所述申请方的成本区间确定随机机会成本值，所述申请方的成本区间小于或等于所述申请方历史所属的参与方类型所对应的成本区间；

在所述当前机会成本值不大于所述随机机会成本值时，确定所述申请方为所述联邦学习的参与方。

在一种可能的设计中，所述处理单元602还用于：在所述当前机会成本值大于所述随机机会成本值时，拒绝所述申请方的加入请求。

在一种可能的设计中，所述处理单元602还用于：在确定所述当前机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间时，将所述当前机会成本值加入所述历史加入请求记录中；

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种确定联邦学习参与方的方法，其特征在于，所述方法包括：

接收申请方发送的联邦学习加入请求，所述加入请求包括当前机会成本值；

根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值；所述预估函数是根据所述申请方针对所述联邦学习的历史机会成本值和历史请求加入次数生成的，所述历史机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间；

在所述当前机会成本值不大于所述预估机会成本值时，确定所述申请方为所述联邦学习的参与方。

2.根据权利要求1所述的方法，其特征在于，所述加入请求还包括申请方标识信息，所述接收申请方发送的联邦学习加入请求之前，所述方法还包括：

根据所述申请方标识信息从联邦学习历史加入请求记录中查询所述申请方的历史加入请求记录；

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述当前机会成本值大于所述预估机会成本值时，拒绝所述申请方的加入请求。

4.根据权利要求1所述的方法，其特征在于，根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值之前，还包括：

确定所述申请方的当前请求加入次数是否大于预设条件；

5.根据权利要求4所述的方法，其特征在于，所述当前请求加入次数与所述申请方当前的动态阈值成反向关系，所述确定所述申请方的历史请求加入次数是否小于或者等于预设条件，包括：

确定所述动态阈值是否大于或者等于设定阈值；

6.根据权利要求4所述的方法，其特征在于，所述确定所述申请方的当前请求加入次数是否大于预设条件，所述还包括：

在确定所述申请方的当前请求加入次数小于或者等于预设条件时，根据所述申请方的成本区间确定随机机会成本值，所述申请方的成本区间小于或等于所述申请方历史所属的参与方类型所对应的成本区间；

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

在所述当前机会成本值大于所述随机机会成本值时，拒绝所述申请方的加入请求。

8.根据权利要求6或7任一项所述的方法，其特征在于，所述方法还包括：

在确定所述当前机会成本值不超出所述申请方历史所属的参与方类型所对应的成本区间时，将所述当前机会成本值加入所述历史加入请求记录中；

根据所述随机机会成本值更新所述申请方的成本区间，所述申请方的成本区间为根据所述随机机会成本值和所述申请方历史所属的参与方类型所对应的成本区间确定的。

9.一种确定联邦学习参与方的装置，其特征在于，所述装置包括：

收发单元，用于接收申请方发送的联邦学习加入请求，所述加入请求包括当前机会成本值；

处理单元，用于根据所述申请方的预估函数和所述申请方的当前请求加入次数，确定所述申请方的预估机会成本值；所述预估函数是根据所述申请方针对所述联邦学习的历史机会成本值和历史请求加入次数生成的，所述历史机会成本值不超出所述申请方所属的参与方类型所对应的成本区间；

所述处理单元还用于，在所述当前机会成本值不大于所述预估机会成本值时，确定所述申请方为所述联邦学习的参与方。

10.一种计算设备，其特征在于，包括：

存储器，用于存储程序指令；

处理器，用于调用所述存储器中存储的程序指令，按照获得的程序执行权利要求1至8任一项所述的方法。

11.一种计算机可读非易失性存储介质，其特征在于，包括计算机可读指令，当计算机读取并执行所述计算机可读指令时，使得计算机执行如权利要求1至8任一项所述的方法。