WO2021197388A1

WO2021197388A1 - 一种联邦学习中用户的索引方法及联邦学习装置

Info

Publication number: WO2021197388A1
Application number: PCT/CN2021/084610
Authority: WO
Inventors: 刘洋; 于涵; 陈天健; 杨强
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2020-03-31
Filing date: 2021-03-31
Publication date: 2021-10-07
Also published as: CN111428885B; CN111428885A

Abstract

一种联邦学习中参与者权重的设置方法及装置，该方法适用于包括一个协调者和多个参与者的联邦学习；其中方法为：所述协调者将根据多个参与者上报的本地模型参数得到的联邦模型参数发送至所述多个参与者；所述协调者获取所述多个参与者反馈的模型性能测试结果；所述协调者至少根据所述多个模型性能测试结果，设置所述多个参与者的权重值，参与者的权重值用于表征参与者在后续联邦学习中的贡献度。上述方法应用于金融科技(Fintech)时，有效激励了参与者汇报真实模型性能测试结果，同时削弱了虚报模型性能测试结果对整个联邦学习模型的影响。

Description

一种联邦学习中用户的索引方法及联邦学习装置

相关申请的交叉引用

本申请要求在2020年03月31日提交中国专利局、申请号为202010244824.9、申请名称为“一种联邦学习中用户的索引方法及联邦学习装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及金融科技(Fintech)技术领域和人工智能技术领域，尤指一种联邦学习中用户的索引方法及联邦学习装置。

背景技术

作为一种新型机器学习理念，联邦学习通过分布式训练及加密技术确保用户隐私数据得到最大限度的保护，以提升用户对人工智能技术的信任。在联邦学习机制下，各参与方把加密后的数据模型贡献给联盟，联合训练一个联邦模型，再开放这个模型给各参与方使用。在这个联邦学习的训练过程中，如何提升联邦学习的参与者与联邦学习装置的交互效率，对于提升联邦学习的模型训练效率有重要意义。

目前的联邦学习中，联邦学习装置对于联邦学习的参与者主要是通过随机方法进行选择的。比如，联邦学习装置采用随机算法从满足约束条件下的用户(使用的终端设备必须满足在充电状态且使用非流量计价网络链接如WiFi等的条件的用户)中随机索引相应数目的用户来参与联邦学习。例如，若联邦学习需要选择8个参与者，那么联邦学习装置可以采用随机算法从满足约束条件下的用户中随机索引出8个用户作为联邦学习的参与者。

然而，联邦学习装置采用随机方法来索引参与联邦学习的用户，缺乏优化考虑，换言之，联邦学习装置随机索引出的用户不是联邦学习装置优化筛选出来的，因此，容易存在索引出的用户拒绝参与联邦学习的可能性比较大(即索引出的用户与联邦学习的适合度低)，而导致联邦学习装置需要反复试验联系用户参与联邦学习的现象，从而降低了联邦学习的参与者与联邦学习装置的交互效率。

发明内容

本发明提供一种联邦学习中用户的索引方法及联邦学习装置，用以解决现有技术中存在联邦学习的参与者与联邦学习装置的交互效率低的问题。

为实现上述目的，第一方面，本发明提供一种联邦学习中用户的索引方法，该方法包括：

获取多个用户历史接受联邦学习邀请后的反馈数据，以及获取所述多个用户各自的用户画像数据；

确定所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数；

根据所述多个用户各自的反馈数据、所述用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值；所述索引值用于表征所述多个用户各自参与新一轮联邦学习的适合度值；

根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习。

在一种可能的设计中，根据所述多个用户各自的反馈数据、用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值，包括：

根据所述多个用户各自的用户画像数据，确定所述多个用户各自的用户画像置信度；

根据所述多个用户各自的反馈数据、用户画像置信度和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数分别进行建模，计算得到所述多个用户各自的索引值。

在一种可能的设计中，根据所述多个用户各自的反馈数据、用户画像置信度和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数分别进行建模，计算得到所述多个用户各自的索引值，包括：

根据所述反馈数据进行建模，预测所述多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率；其中，所述第一概率在新一轮联邦学习的时间窗口中的任意一个时间点对应的数值大小，与所述多个用户各自在所述时间点的分时响应度正相关；所述分时响应度用于表征所述多个用户各自反馈接受联邦学习邀请的速度；

根据所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数进行建模，预测所述多个用户各自的体验损失；其中，所述体验损失用于表示所述多个用户各自当前时段接受参与新一轮联邦学习邀请行为的满意程度；

根据所述用户画像置信度进行建模，预测在新一轮的联邦学习中联邦学习服务器需与所述多个用户各自互动的频率；

根据所述第一概率、所述体验损失和所述频率，计算所述多个用户各自的索引值。

在一种可能的设计中，根据所述第一概率、所述体验损失和所述频率，计算所述多个用户各自的索引值，包括：

计算所述第一概率、所述体验损失和所述频率三者之间对应的平均值；将所述平均值作为所述多个用户各自的索引值；或者，

根据预设策略，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值。

在一种可能的设计中，根据预设策略，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值，包括：

将所述平均值与预设阈值进行比较，确定所述平均值是否大于或者等于所述预设阈值；

若确定所述平均值大于或者等于所述预设阈值，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值。

在一种可能的设计中，根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习，包括：

若确定优先动员被联邦学习邀请频率低于预设阈值的用户参与新一轮的联邦学习，则筛选出所述多个用户中索引值小于第一预设索引值的N个用户，邀请所述N个用户参与新一轮的联邦学习；

若确定优先动员被联邦学习邀请频率高于或者等于所述预设阈值的用户参与新一轮的联邦学习，则筛选出所述多个用户中索引值大于第二预设索引值的N个用户，邀请所述N个用户参与新一轮的联邦学习。

在一种可能的设计中，邀请所述N个用户参与新一轮的联邦学习之后，所述方法还包括：

接收所述N个用户的反馈数据，更新所述N个用户参与新一轮联邦学习邀请的概率、所述N个用户的体验损失和所述联邦学习服务器与所述N个用户互动的频率，用于计算所述N个用户各自参与下一轮联邦学习的适合度值。

第二方面，本发明提供一种联邦学习装置，所述联邦学习装置包括：

获取单元，用于获取多个用户历史接受联邦学习邀请后的反馈数据，以及获取所述多个用户各自的用户画像数据；

处理单元，用于确定所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数；根据所述多个用户各自的反馈数据、所述用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值；所述索引值用于表征所述多个用户各自参与新一轮联邦学习的适合度值；

邀请单元，用于根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习。

在一种可能的设计中，所述处理单元具体用于：

在一种可能的设计中，所述邀请单元具体用于：

在一种可能的设计中，所述处理单元还用于：

第三方面，本发明提供一种计算机设备，所述计算机设备包括：至少一个处理器和存储器；

所述存储器存储一个或多个计算机程序；

所述处理器读取所述存储器存储的一个或多个计算机程序，执行以下方法：获取多个用户历史接受联邦学习邀请后的反馈数据，以及获取所述多个用户各自的用户画像数据；确定所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数；根据所述多个用户各自的反馈数据、所述用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值；所述索引值用于表征所述多个用户各自参与新一轮联邦学习的适合度值；根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习。

可选地，所述处理器具体用于：

第四方面，本发明提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机设备上运行时，使得所述计算机设备能够执行上述第一方面或上述第一方面的任意一种可能的设计的方法。

第五方面，本发明提供一种计算机程序产品，该计算机程序产品包括存储在计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机设备执行时，使计算机设备执行上述第一方面或上述第一方面的任意一种可能的设计的方法。

本发明有益效果如下：

本发明提供的一种联邦学习中用户的索引方法，与现有技术相比，由于多个用户各自的索引值是联邦学习装置根据多个用户各自历史接受联邦学习邀请后的反馈数据、多个用户各自的用户画像数据和多个用户各自在上一个时间窗口内参与联邦学习建模的次数计算得到的，因此，多个用户各自的索引值，可以与多个用户各自在不同时段接受联邦学习邀请的概率、多个用户各自参与新一轮联邦学习的概率、多个用户各自在上一个时间窗口参与联邦学习建模的满意程度相关，从而可以提高联邦学习装置根据索引值从多个用户中选出的满足预设条件的用户与联邦学习的适合度，降低了索引出的用户拒绝参与联邦学习的可能性，无需反复试验联系用户参与联邦学习，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

附图说明

图1为本发明实施例提供的一种联邦学习中用户的索引方法的流程示意图；

图2为本发明实施例提供的一种联邦学习装置的结构示意图；

图3为本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

附图中各部件的形状和大小不反映真实比例，目的只是示意说明本发明内容。

本发明实施例中，“第一”、“第二”是用于区别不同对象，而非用于描述特定顺序。此外，术语“包括”以及它们任何变形，意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例中，“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本发明实施例中的字符“/”，一般表示前后关联对象是一种“或”的关系。

本发明实施例中，“多个”可以表示至少两个，例如可以是两个、三个或者更多，本发明实施例不限定。

由前述内容可知，目前联邦学习装置采用随机方法来索引参与联邦学习的用户，缺乏优化考虑，容易存在索引出的用户与联邦学习的适合度低，导致出现联邦学习装置需要反复试验联系用户参与联邦学习的现象，降低了联邦学习的参与者与联邦学习装置的交互效率。为了解决该问题，本发明实施例提供了一种联邦学习中用户的索引方法，以提高联邦学习的参与者与联邦学习装置的交互效率。

下面具体介绍本发明实施例中联邦学习装置索引参与联邦学习的用户的具体过程。

示例性的，请参考图1所示，为本发明实施例提供的一种联邦学习中用户的索引方法的流程示意图。其中，该方法可以应用于联邦学习装置。如图1所示，该方法流程包括：

S101、获取多个用户历史接受联邦学习邀请后的反馈数据，以及获取所述多个用户各自的用户画像数据。

通常，由于工作时间或者作息时间等因素的不同，不同的用户使用终端的时间段一般也不同，因此，用户满足参与联邦学习的基本条件(如使用的终端必须满足在充电状态且使用非流量计价网络链接如WiFi等条件)在不同时段上的概率分布也有所区别，换言之，多个用户在不同时间段接受联邦学习邀请的概率分布也有所区别。

在本发明实施例中，联邦学习装置通过获取多个用户历史接受联邦学习邀请的反馈数据，可以了解多个用户在不同时间段接受联邦学习邀请的概率分布。

比如，以多个用户中的用户a为例。联邦学习装置在上一轮联邦学习中邀请了用户a参与联邦学习，之后，用户a接受上一轮联邦学习邀请后可以向联邦学习装置反馈数据，用于告知联邦学习装置用户a在某个时间点接受了上一轮联邦学习的邀请，例如，用户a的反馈数据可以表示为：用户a在14:05接受了上一轮联邦学习的邀请。示例性的，若历史联邦学习的轮回次数为20，用户a在8：00-9：00之间参与第11轮、第16轮联邦学习，在11：00-12：00之间参与第12轮至第15轮联邦学习，在14：00-15：00之间参与第1轮至第10轮联邦学习和第20轮(即上一轮)联邦学习，在16：00-17：00之间参与第17轮至第19轮联邦学习。那么，用户在8：00-9：00接受联邦学习邀请的概率为10％，在11：00-12：00接受联邦学习邀请的概率为20％，在14：00-15：00接受联邦学习邀请的概率为55％，在16：00-17：00接受联邦学习邀请的概率为15％，在其余时间段接受联邦学习的概率为0。

当然，联邦学习装置还可以通过获取多个用户历史拒绝联邦学习邀请后的反馈数据，以便了解多个用户在不同时段拒绝联邦学习邀请的概率分布，其具体实现方式可以参见上述联邦学习装置确定多个用户在不同时段接受联邦学习邀请的概率分布的方式，在此不再赘述。

可选地，联邦学习装置还可以获取多个用户各自的用户画像数据。比如，联邦学习装置可以获取服务器存储的用户的画像数据，和/或，获取终端中存储的用户画像数据。其中，用户画像数据可以包括多个用户各自的基本属性(如年龄、性别、地域等)、社会属性(如职业、收入等)、行为属性(如购物偏好、观影偏好等)、心理属性(如注重性价比、喜爱自然等)数据，等等。终端可以为平板、手机、笔记本电脑等任何可以参与联邦学习的设备，本发明实施例不做具体限定。

在本发明实施例中，联邦学习装置通过获取多个用户各自的用户画像数据，可以分析确定多个用户各自未来的需求，以便了解多个用户各自未来的需求，如理财需求、产品需求、娱乐需求等。

S102、确定所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数。

通常，终端除了可以用于参与联邦学习之外，还可以有其他用途，如播放视频、浏览网页等。由于用户使用终端参与联邦学习建模时，终端的运行速度和网络加载速度等会暂时受到联邦学习模型参数的传输的影响而降低，因此，终端被使用参与联邦学习建模的同时，还运行其他应用(如视频应用等)时，会在一定程度上降低用户使用该终端的其他应用的体验。因此，在某个时间窗口中的某个时间段，用户为了提高使用该终端的其他应用的体验，可能会在该时间段中不参与联邦学习建模。其中，时间窗口可以表示为一轮联邦学习或者多轮联邦学习所需的时长。

在本发明实施例中，联邦学习装置通过确定多个用户各自在上一个时间窗口内参与联邦学习建模的次数，可以了解多个用户各自在上一个时间窗口参与联邦学习建模的满意程度。比如，以多个用户中的用户b为例。若上一个时间窗口联邦学习建模的次数为10次，而用户b使用终端参与联邦学习建模的次数只有一次，那么，用户b在上一个时间窗口参与联邦学习建模的满意程度为10％，即用户b在上一个时间窗口参与联邦学习建模的满意程度较低。

需要说明的是，上述S101和S102的执行顺序，本发明实施例不作具体限定，比如，联邦学习装置可以先执行S101，后执行S102，或者，先执行S102，后执行S101，或者同时执行S101和S102。

S103、根据所述多个用户各自的反馈数据、所述用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值；所述索引值用于表征所述多个用户各自参与新一轮联邦学习的适合度值。

可选地，联邦学习装置获取多个用户各自的用户画像数据后，可以确定多个用户各自的用户画像置信度，即确定多个用户各自参与新一轮联邦学习的概率。换言之，联邦学习装置可以通过多个用户各自的用户画像数据，确定多个用户各自未来的需求，之后，联邦学习装置可以根据多个用户各自未来的需求，确定多个用户各自参与新一轮联邦学习的概率。

可选地，联邦学习确定多个用户各自的用户画像置信度后，可以根据多个用户各自的反馈数据、用户画像置信度和多个用户各自在上一个时间窗口内参与联邦学习建模的次数分别进行建模，计算得到多个用户各自的索引值。在本发明实施例中，由于联邦学习装置通过多个用户各自的反馈数据，可以了解多个用户各自在不同时段接受联邦学习邀请的概率分布，通过多个用户各自的用户画像置信度，可以确定多个用户各自参与新一轮联邦学习的概率，通过多个用户各自在上一个时间窗口内参与联邦学习建模的次数，可以了解多个用户各自在上一个时间窗口参与联邦学习建模的满意程度，因此，联邦学习装置计算得到的多个用户各自的索引值，可以与多个用户各自在不同时段接受联邦学习邀请的概率、多个用户各自参与新一轮联邦学习的概率、多个用户各自在上一个时间窗口参与联邦学习建模的满意程度相关，有助于提高联邦学习装置后续根据索引值从多个用户中选出满足预设条件的用户与联邦学习的适合度，从而可以避免出现联邦学习装置需要反复试验联系用户参与联邦学习的现象，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

在具体的实现过程中，联邦学习装置根据多个用户各自的反馈数据进行建模，可以用于预测多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率。其中，第一概率在新一轮联邦学习的时间窗口中的任意一个时间点对应的数值大小，与多个用户各自在时间点的分时响应度正相关，即多个用户各自在时间点的分时响应度越高，多个用户各自在相同时间点参与新一轮联邦学习邀请的第一概率越大，其中，分时响应度用于表征多个用户各自反馈接受联邦学习邀请的速度。比如，以多个用户中的用户a为例，若用户a在新一轮联邦学习的时间窗口中的时间点a(位于时间段a内)对应的分时响应度为4，用户a在新一轮联邦学习的时间窗口中的时间点b(位于时间段b内)对应的分时响应度为2，那么，联邦学习装置可以确定用户a在时间点a参与新一轮联邦学习邀请的第一概率大于在时间点b参与新一轮联邦学习邀请的第一概率，即确定用户a在时间段a参与新一轮联邦学习邀请的第一概率大于在时间段b参与新一轮联邦学习邀请的第一概率。

在本发明实施中，联邦学习装置通过根据多个用户各自的反馈数据进行建模，预测多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率，可以了解多个用户在不同时段参与新一轮联邦学习的概率，从而可以避免出现联邦学习装置在用户参与联邦学习的概率较低的时间段内邀请用户参与联邦学习的现象，降低了被邀请的用户拒绝参与联邦学习的可能性，进而可以提高索引出的用户参与联邦学习的适合度，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

在具体的实现过程中，联邦学习装置根据多个用户各自在上一个时间窗口内参与联邦学习建模的次数进行建模，可以用于预测多个用户各自的体验损失；其中，体验损失用于表示多个用户各自当前时段接受参与新一轮联邦学习邀请行为的满意程度。比如，以多个用户中的用户a为例，若上一个时间窗口内联邦学习建模的次数为20，用户a在上一个时间窗口内参与联邦学习建模的次数为2，且分别处于时间段e和时间段f内，联邦学习装置可以确定用户a在上一个时间窗口参与联邦学习建模总的体验损失为((20-2)/20)％，即90％，也即满意程度为10％，在上一个时间窗口中的时间段e和时间段f参与联邦学习建模的体验损失均为体验损失为((20-1)/20)％，即95％，也即满意程度为5％。那么，当联邦学习装置可以根据用户a在上一个时间窗口内参与联邦学习建模的次数进行建模时，可以预测用户a在未来的多个时间窗口中的时间段e、时间段f以及其它时间段的体验损失。

在本发明实施中，联邦学习装置通过根据多个用户各自在上一个时间窗口内参与联邦学习建模的次数进行建模，预测多个用户各自的体验损失，可以了解多个用户在不同时段参与联邦学习建模的满意程度，从而可以避免出现联邦学习装置在用户参与联邦学习建模的满意程度较低的时间段内邀请用户参与联邦学习建模的现象，降低了被邀请的用户拒绝参与联邦学习的可能性，进而可以提高索引出的用户与联邦学习的适合度，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

在具体的实现过程中，联邦学习装置根据用户画像置信度进行建模，可以用于预测在新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率。比如，以多个用户中的用户b为例。若用户b的用户画像数据量较少或者用户画像数据分歧较大(例如行为属性数据量远大于心理属性数据量)，则可能会存在用户b的用户画像置信度不高，而导致联邦学习装置未来预测用户b使用终端参与新一轮联邦学习的准确性不高的现象。因此，当联邦学习装置根据用户b的用户画像置信度进行建模，确定用户b参与新一轮联邦学习的概率较低时，联邦学习装置可以确定联邦学习服务器需与用户b互动的频率较高，以提高联邦学习装置后续预测用户b参与新一轮联邦学习的概率的准确性。

在本发明实施例中，联邦学习装置通过根据多个用户各自的用户画像置信度进行建模，预测在新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率，可以提高用户画像数据量少或者用户画像数据分歧较大的用户的用户画像置信度，从而可以提高联邦学习装置未来预测用户画像数据量少或者用户画像数据分歧较大的用户参与新一轮联邦学习的概率的准确性，进而可以避免出现由于用户画像数据的因素而导致对多个用户各自参与联邦学习机会的不均的现象。

因此，当联邦学习装置通过根据上述预测得到的多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率、多个用户各自的体验损失和新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率，来计算多个用户各自的索引值时，可以提高多个用户各自的索引值与多个用户之间的关联性，从而可以提高联邦学习装置根据索引值从多个用户选出参与联邦学习的用户与联邦学习的适合度，从而可以避免出现联邦学习装置需要反复试验联系用户参与联邦学习的现象，降低了被邀请的用户拒绝参与联邦学习的可能性，可以有效提高联邦学习的参与者与联邦学习装置的交互效率，另外，还可以降低联邦学习装置的通讯负担。

可选地，在具体的实现过程中，联邦学习装置根据多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率、多个用户各自的体验损失和新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率，计算多个用户各自的索引值的方式可以有多种。比如：

方式1，联邦学习装置可以计算多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率、多个用户各自的体验损失和新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率三者之间对应的平均值，之后，将计算得到的平均值作为多个用户各自的索引值。

在方式1中，通过将多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率、多个用户各自的体验损失和新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率三者之间对应的平均值，作为多个用户各自的索引值，可以平衡多个用户各自的索引值，与多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率、多个用户各自的体验损失和新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率三者之间的关系，避免出现将当前时段参与新一轮联邦学习邀请的第一概率、体验损失和新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率三者中最低的作为多个用户各自的索引值，而导致多个用户各自的索引值与多个用户的关联性较低的现象，从而可以提高联邦学习装置根据索引值从多个用户选出参与联邦学习的用户与联邦学习的适合度，避免了出现联邦学习装置需要反复试验联系用户参与联邦学习的现象，无需反复试验联系用户参与联邦学习，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

方式2，联邦学习装置可以根据预设策略，将多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率、多个用户各自的体验损失和新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率的最大数值作为多个用户各自的索引值。比如，联邦学习装置可以计算得到的平均值与预设阈值进行比较，确定平均值是否大于或者等于预设阈值；若确定平均值大于或者等于预设阈值，将所述第一概率、所述体验损失和所述频率中的最大数值作为多个用户各自的索引值。否则，将所述平均值作为多个用户各自的索引值。

在方式2中，通过在计算得到的多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率、多个用户各自的体验损失和新一轮的联邦学习中联邦学习服务器需与多个用户各自互动的频率的三者之间的平均值大于或者等于预设阈值时，将三者之间的最大数值作为多个用户各自的索引值，或者，在三者之间的平均值小于预设阈值时，将该平均值作为多个用户各自的索引值，可以提高多个用户各自的索引值与多个用户的关联性，从而可以提高联邦学习装置根据索引值从多个用户选出参与联邦学习的用户与联邦学习的适合度，避免了出现联邦学习装置需要反复试验联系用户参与联邦学习的现象，无需反复试验联系用户参与联邦学习，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

S104、根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习。

可选地，联邦学习装置计算得到多个用户各自的索引值后，可以根据不同的预设条件，邀请所述多个用户中满足预设条件的用户参与联邦学习。比如：

示例1，若预设条件为优先动员被联邦学习邀请频率低于预设阈值的用户参与新一轮的联邦学习，那么，联邦学习装置则可以筛选出所述多个用户中索引值小于第一预设索引值的N个用户，邀请所述N个用户参与新一轮的联邦学习。比如，联邦学习装置可以将多个用户各自的索引值按照从小到大的顺序进行排序，基于该排序邀请前N个用户参与新一轮的联邦学习，或者，可以将多个用户各自的索引值按照从大到小的顺序进行排序，基于该排序邀请后N个用户参与新一轮的联邦学习，其中，N个用户各自的索引值均小于第一预设索引值。

在示例1中，联邦学习可以提高筛选出的多个用户为参与联邦学习频率低的用户的准确性，从而可以提高联邦学习装置根据索引值从多个用户选出参与联邦学习的用户与联邦学习的适合度，避免了出现联邦学习装置需要反复试验联系用户参与联邦学习的现象，无需反复试验联系用户参与联邦学习，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

示例2，若预设条件为优先动员被联邦学习邀请频率高于或者等于所述预设阈值的用户参与新一轮的联邦学习，那么，联邦学习装置则可以筛选出所述多个用户中索引值大于第二预设索引值的N个用户，邀请所述N个用户参与新一轮的联邦学习。比如，联邦学习装置可以将多个用户各自的索引值按照从小到大的顺序进行排序，基于该排序邀请后N个用户参与新一轮的联邦学习，或者，可以将多个用户各自的索引值按照从大到小的顺序进行排序，基于该排序邀请前N个用户参与新一轮的联邦学习，其中，N个用户各自的索引值均大于第二预设索引值。

在示例2中，联邦学习可以提高筛选出的多个用户为参与联邦学习频率高的用户的准确性，从而可以提高联邦学习装置根据索引值从多个用户选出参与联邦学习的用户与联邦学习的适合度，无需反复试验联系用户参与联邦学习，避免了出现联邦学习装置需要反复试验联系用户参与联邦学习的现象，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

可选地，联邦学习装置可以在邀请多个用户中N个用户参与新一轮的联邦学习之后，可以接收N个用户的反馈数据，并根据N个用户的反馈数据更新N个用户参与新一轮联邦学习邀请的概率、N个用户的体验损失和联邦学习服务器与N个用户互动的频率，用于计算N个用户各自参与下一轮联邦学习的适合度值，以提高N个用户各自参与下一轮联邦学习的适合度，可以有效提高下一轮联邦学习的N个用户中的参与者与联邦学习装置的交互效率。

需要说明的是，上述第一预设索引值和第二预设索引值可以相同，也可以不同，本发明实施例不做具体限定。

需要说明的是，上述N的数值可由联邦学习装置的系统管理员设定，也可由预设索引值上限，或者预设索引值下限决定，本发明实施例不做具体限定。

通过以上描述可知，本发明实施例提供的技术方案中，与现有技术相比，由于多个用户各自的索引值是联邦学习装置根据多个用户各自历史接受联邦学习邀请后的反馈数据、多个用户各自的用户画像数据和多个用户各自在上一个时间窗口内参与联邦学习建模的次数计算得到的，因此，多个用户各自的索引值，可以与多个用户各自在不同时段接受联邦学习邀请的概率、多个用户各自参与新一轮联邦学习的概率、多个用户各自在上一个时间窗口参与联邦学习建模的满意程度相关，从而可以提高联邦学习装置根据索引值从多个用户中选出的满足预设条件的用户与联邦学习的适合度，降低了索引出的用户拒绝参与联邦学习的可能性，无需反复试验联系用户参与联邦学习，可以有效提高联邦学习的参与者与联邦学习装置的交互效率。

基于同一发明构思下，本发明还提供了一种联邦学习装置。请参考图2所示，为本发明实施例提供的一种联邦学习装置的结构示意图。

如图2所示，联邦学习装置200包括：

获取单元201，用于获取多个用户历史接受联邦学习邀请后的反馈数据，以及获取所述多个用户各自的用户画像数据；

处理单元202，用于确定所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数；根据所述多个用户各自的反馈数据、所述用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值；所述索引值用于表征所述多个用户各自参与新一轮联邦学习的适合度值；

邀请单元203，用于根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习。

在一种可能的设计中，所述处理单元202具体用于：

在一种可能的设计中，所述邀请单元203具体用于：

在一种可能的设计中，所述处理单元202还用于：

本发明实施例中的联邦学习装置200与前述图1所示的联邦学习中用户的索引方法是基于同一构思下的发明，通过前述对联邦学习中用户的索引方法的详细描述，本领域技术人员可以清楚的了解本实施例中联邦学习装置200的实施过程，所以为了说明书的简洁，在此不再赘述。

基于同一发明构思下，本发明还提供了一种计算机设备。请参考图3所示，为本发明实施例提供的一种计算机设备的结构示意图。

如图3所示，计算机设备300包括：存储器301和至少一个处理器302。其中，所述存储器301存储一个或多个计算机程序；当所述存储器301存储的一个或多个计算机程序被所述至少一个处理器302执行时，使得所述计算机设备300执行上述联邦学习中用户的索引方法的步骤。

可选地，所述存储器301可以包括高速随机存取存储器，还可以包括非易失存储器，例如磁盘存储器件、闪存器件或其他非易失性固态存储器件等，本发明实施例不作限定。

可选地，所述处理器302可以是通用的处理器(central processing unit，CPU)，或ASIC，或FPGA，也可以是一个或多个用于控制程序执行的集成电路。

在一些实施例中，所述存储器301和所述处理器302可以在同一芯片上实现，在另一些实施例中，它们也可以在独立的芯片上分别实现，本发明实施例不作限定。

基于同一发明构思下，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令被计算机设备执行时，使所述计算机设备可以执行上述联邦学习中用户的索引方法的步骤。

基于同一发明构思下，本发明还提供了一种计算机程序产品，该计算机程序产品包括存储在计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机设备执行时，使计算机设备执行上述联邦学习中用户的索引方法的步骤。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

一种联邦学习中用户的索引方法，其特征在于，包括：

获取多个用户历史接受联邦学习邀请后的反馈数据，以及获取所述多个用户各自的用户画像数据；

确定所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数；

根据所述多个用户各自的反馈数据、所述用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值；所述索引值用于表征所述多个用户各自参与新一轮联邦学习的适合度值；

根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习。
如权利要求1所述的方法，其特征在于，根据所述多个用户各自的反馈数据、用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值，包括：

根据所述多个用户各自的用户画像数据，确定所述多个用户各自的用户画像置信度；

根据所述多个用户各自的反馈数据、用户画像置信度和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数分别进行建模，计算得到所述多个用户各自的索引值。
如权利要求2所述的方法，其特征在于，根据所述多个用户各自的反馈数据、用户画像置信度和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数分别进行建模，计算得到所述多个用户各自的索引值，包括：

根据所述反馈数据进行建模，预测所述多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率；其中，所述第一概率在新一轮联邦学习的时间窗口中的任意一个时间点对应的数值大小，与所述多个用户各自在所述时间点的分时响应度正相关；所述分时响应度用于表征所述多个用户各自反馈接受联邦学习邀请的速度；

根据所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数进行建模，预测所述多个用户各自的体验损失；其中，所述体验损失用于表示所述多个用户各自当前时段接受参与新一轮联邦学习邀请行为的满意程度；

根据所述用户画像置信度进行建模，预测在新一轮的联邦学习中联邦学习服务器需与所述多个用户各自互动的频率；

根据所述第一概率、所述体验损失和所述频率，计算所述多个用户各自的索引值。
如权利要求3所述的方法，其特征在于，根据所述第一概率、所述体验损失和所述频率，计算所述多个用户各自的索引值，包括：

计算所述第一概率、所述体验损失和所述频率三者之间对应的平均值；将所述平均值作为所述多个用户各自的索引值；或者，

根据预设策略，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值。
如权利要求4所述的方法，其特征在于，根据预设策略，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值，包括：

将所述平均值与预设阈值进行比较，确定所述平均值是否大于或者等于所述预设阈值；

若确定所述平均值大于或者等于所述预设阈值，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值。
如权利要求1-5任一项所述的方法，其特征在于，根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习，包括：

若确定优先动员被联邦学习邀请频率低于预设阈值的用户参与新一轮的联邦学习，则筛选出所述多个用户中索引值小于第一预设索引值的N个用户，邀请所述N个用户参与新一轮的联邦学习；

若确定优先动员被联邦学习邀请频率高于或者等于所述预设阈值的用户参与新一轮的联邦学习，则筛选出所述多个用户中索引值大于第二预设索引值的N个用户，邀请所述N个用户参与新一轮的联邦学习。
如权利要求6所述的方法，其特征在于，邀请所述N个用户参与新一轮的联邦学习之后，所述方法还包括：

接收所述N个用户的反馈数据，更新所述N个用户参与新一轮联邦学习邀请的概率、所述N个用户的体验损失和所述联邦学习服务器与所述N个用户互动的频率，用于计算所述N个用户各自参与下一轮联邦学习的适合度值。
一种联邦学习装置，其特征在于，包括：

获取单元，用于获取多个用户历史接受联邦学习邀请后的反馈数据，以及获取所述多个用户各自的用户画像数据；

处理单元，用于确定所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数；根据所述多个用户各自的反馈数据、所述用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值；所述索引值用于表征所述多个用户各自参与新一轮联邦学习的适合度值；

邀请单元，用于根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习。
如权利要求8所述的装置，其特征在于，所述处理单元具体用于：

根据所述多个用户各自的用户画像数据，确定所述多个用户各自的用户画像置信度；

根据所述多个用户各自的反馈数据、用户画像置信度和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数分别进行建模，计算得到所述多个用户各自的索引值。
如权利要求9所述的装置，其特征在于，所述处理单元具体用于：

根据所述反馈数据进行建模，预测所述多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率；其中，所述第一概率在新一轮联邦学习的时间窗口中的任意一个时间点对应的数值大小，与所述多个用户各自在所述时间点的分时响应度正相关；所述分时响应度用于表征所述多个用户各自反馈接受联邦学习邀请的速度；

根据所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数进行建模，预测所述多个用户各自的体验损失；其中，所述体验损失用于表示所述多个用户各自当前时段接受参与新一轮联邦学习邀请行为的满意程度；

根据所述用户画像置信度进行建模，预测在新一轮的联邦学习中联邦学习服务器需与所述多个用户各自互动的频率；

根据所述第一概率、所述体验损失和所述频率，计算所述多个用户各自的索引值。
如权利要求10所述的装置，其特征在于，所述处理单元具体用于：

计算所述第一概率、所述体验损失和所述频率三者之间对应的平均值；将所述平均值作为所述多个用户各自的索引值；或者，

根据预设策略，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值。
如权利要求11所述的装置，其特征在于，所述处理单元具体用于：

将所述平均值与预设阈值进行比较，确定所述平均值是否大于或者等于所述预设阈值；

若确定所述平均值大于或者等于所述预设阈值，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值。
如权利要求8-12任一项所述的装置，其特征在于，所述邀请单元具体用于：

若确定优先动员被联邦学习邀请频率低于预设阈值的用户参与新一轮的联邦学习，则筛选出所述多个用户中索引值小于第一预设索引值的N个用户，邀请所述N个用户参与新一轮的联邦学习；

若确定优先动员被联邦学习邀请频率高于或者等于所述预设阈值的用户参与新一轮的联邦学习，则筛选出所述多个用户中索引值大于第二预设索引值的N个用户，邀请所述N个用户参与新一轮的联邦学习。
如权利要求13所述的装置，其特征在于，所述处理单元还用于：

接收所述N个用户的反馈数据，更新所述N个用户参与新一轮联邦学习邀请的概率、所述N个用户的体验损失和所述联邦学习服务器与所述N个用户互动的频率，用于计算所述N个用户各自参与下一轮联邦学习的适合度值。
一种计算机设备，其特征在于，所述计算机设备包括至少一个处理器和存储器；

所述存储器存储一个或多个计算机程序；

所述处理器读取所述存储器存储的一个或多个计算机程序，执行以下方法：获取多个用户历史接受联邦学习邀请后的反馈数据，以及获取所述多个用户各自的用户画像数据；确定所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数；根据所述多个用户各自的反馈数据、所述用户画像数据和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数，计算所述多个用户各自的索引值；所述索引值用于表征所述多个用户各自参与新一轮联邦学习的适合度值；根据所述多个用户各自的索引值，邀请所述多个用户中满足预设条件的用户参与联邦学习。
如权利要求15所述的计算机设备，其特征在于，所述处理器具体用于：

根据所述多个用户各自的用户画像数据，确定所述多个用户各自的用户画像置信度；

根据所述多个用户各自的反馈数据、用户画像置信度和所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数分别进行建模，计算得到所述多个用户各自的索引值。
如权利要求16所述的计算机设备，其特征在于，所述处理器具体用于：

根据所述反馈数据进行建模，预测所述多个用户各自在当前时段参与新一轮联邦学习邀请的第一概率；其中，所述第一概率在新一轮联邦学习的时间窗口中的任意一个时间点对应的数值大小，与所述多个用户各自在所述时间点的分时响应度正相关；所述分时响应度用于表征所述多个用户各自反馈接受联邦学习邀请的速度；

根据所述多个用户各自在上一个时间窗口内参与联邦学习建模的次数进行建模，预测所述多个用户各自的体验损失；其中，所述体验损失用于表示所述多个用户各自当前时段接受参与新一轮联邦学习邀请行为的满意程度；

根据所述用户画像置信度进行建模，预测在新一轮的联邦学习中联邦学习服务器需与所述多个用户各自互动的频率；

根据所述第一概率、所述体验损失和所述频率，计算所述多个用户各自的索引值。
如权利要求17所述的计算机设备，其特征在于，所述处理器具体用于：

计算所述第一概率、所述体验损失和所述频率三者之间对应的平均值；将所述平均值作为所述多个用户各自的索引值；或者，

根据预设策略，将所述第一概率、所述体验损失和所述频率中的最大数值作为所述多个用户各自的索引值。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机设备上运行时，使得所述计算机设备执行如权利要求1-7任一项所述的方法的步骤。
一种计算机程序产品，其特征在于，该计算机程序产品包括存储在计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机设备执行时，使计算机设备执行如权利要求1-7任一项所述的方法的步骤。