CN113837368A

CN113837368A - 一种在联邦学习中评估各参与方数据价值的控制方法及装置

Info

Publication number: CN113837368A
Application number: CN202111137154.1A
Authority: CN
Inventors: 黄文韬
Original assignee: China Pacific Insurance Group Co Ltd CPIC
Current assignee: China Pacific Insurance Group Co Ltd CPIC
Priority date: 2021-09-27
Filing date: 2021-09-27
Publication date: 2021-12-24

Abstract

本发明提供了一种在联邦学习中评估各参与方数据价值的控制方法，包括如下步骤：a.确定其中一个参与方以不同顺序加入联合模型的数学期望V；b.确定参与方加入联合模型的所有梯度的贡献分值总和W；c.基于数学期望V以及贡献分值总和W确定所述参与方数据价值；d.重复执行步骤a至步骤c，直至确定所有参与方的数据价值。本发明综合考虑影响各参与方数据贡献的两个角度：各参与方数据实际价值和边际效应对各参与方贡献的影响，能够更公正地衡量各参与方的数据贡献。同时考虑了各参与方数据维度或数量不同的问题，根据抽样统计学的思路，不断更新各参与方在不同顺序进入联合模型的概率。本发明流程简单，使用方便，功能强大，具有极高的价值。

Description

一种在联邦学习中评估各参与方数据价值的控制方法及装置

技术领域

本发明属于计算机应用领域，具体地，涉及一种在联邦学习中评估各参与方数据价值的控制方法及装置。

背景技术

现实生活中，除了少数巨头公司能够满足，绝大多数企业都存在数据量少，数据质量差的问题，不足以支撑人工智能技术的实现；同时国内外监管环境也在逐步加强数据保护，陆续出台相关政策，如欧盟最近引入的新法案《通用数据保护条例》(GDPR)，我国国家互联网信息办公室起草的《数据安全管理办法(征求意见稿)》，因此数据在安全合规的前提下自由流动，成了大势所趋；在用户和企业角度下，商业公司所拥有的数据往往都有巨大的潜在价值。两个公司甚至公司间的部门都要考虑利益的交换，往往这些机构不会提供各自数据与其他公司做与单的聚合，导致即使在同一个公司内，数据也往往以孤岛形式出现。

由于该领域还处在研究阶段，有很多相关论文提出不同的思路。同时，大多数算法直接根据算法分配权重(FL-IJCAI 2020最佳论文<collabarative fairness infederated learning>)、分配惩罚项(CMU Tian li Fedprox法,<Federated Optimizationin Heterogeneous Network>，q-ffl法,<fair resource allocation in federatedlearning>)、将参与方分组(将参与方分成三、六、九等。NTU Jingfeng Zhang、Cheng li<Hierarchically Fair Federated Learning>)等方式在联合模型中相对公平地分配各参数在模型中的系数，数据质量越好的参与方在联合模型中起到的效果越大。手段还包括套用经济模型来衡量数据价值等。

现有思路大多数并不输出具体分值，往往根据多个循环不断调配参与方权重、加惩罚项控制成本函数等方式来动态划分各参与方在模型中的贡献。这些思路并不会输出具体分值来评估参与方贡献。同时，即使输出最终联合模型各参与方的权重等信息，评价的维度也比较单一。以<Collaborative Fairness in Federated Learning>提供的思路举例，文章提出可以用联合模型在各参与方的检验集上进行检验得到的准确率来计算分值，不断调配各参与方权重，以此修正联合模型。因此，如果我们希望评估数据价值，也只能采取循环接近收敛后各参与方的权重，联合模型与各参与方单机模型的相关性等角度来考虑问题，缺乏客观性。而如果套用经济模型来解决数据贡献，可解释性较强，但数据贡献很难直接套用单一的经济模型解决问题，需要花费大量时间建模和调整参数。同时，经济模型常用于解释现实中的问题，经济模型应用于数据价值评估是否合理还有待商榷。

而目前，市场上并没有一种能够有效解决上述问题的具体办法，尤其涉及一种在联邦学习中评估各参与方数据价值的控制方法及装置。

发明内容

针对现有技术存在的技术缺陷，本发明的目的是提供一种在联邦学习中评估各参与方数据价值的控制方法及装置，根据本发明的一个方面，提供了一种在联邦学习中评估各参与方数据价值的控制方法，包括如下步骤：

a.确定其中一个参与方以不同顺序加入联合模型的数学期望V；

b.确定所述参与方加入联合模型的所有梯度的贡献分值总和W；

c.基于所述数学期望V以及所述贡献分值总和W确定所述参与方数据价值；

d.重复执行步骤a至步骤c，直至确定所有参与方的数据价值。

优选地，所述步骤a包括如下步骤：

a1：将所述参与方加入联合模型的不同顺序标记S1、S2、S3…Sn，其中，所述n为M！，所述M为参与方的个数；

a2：确定所述参与方以不同顺序加入联合模型的参与方收益V1、V2、V3…Vn；

a3：基于所述参与方收益V1、V2、V3…Vn确定所述数学期望V。

优选地，通过如下公式确定所述数学期望V：

Vx＝P1-P2，其中，所述x为所述参与方加入联合模型的不同顺序，所述x的数量为n，所述P1为参与方自身获得的准确率提升，所述P2为联合模型获得的准确率提升，其中，

所述P1为联合模型的准确率与单机模型的准确率之差，所述P2为新一轮联合模型的准确率减去上一轮联合模型的准确率。

优选地，在所述步骤b中，通过如下方式确定所述参与方的贡献分值总和W：

b1：通过梯度下降的方式获得最优解；

b2：确定以起始点及最优点相连的综合模型向量，其中，所述起始点为选择的起点，所述最优点为使得cost function最低的点；

b3：基于所述单位下降梯度以及所述综合模型向量计算所述梯度的偏移度；

b4：基于所述偏移度、模长以及惩罚函数确定所述梯度的贡献分值w1；

b5：重复执行步骤b1至b4，直至确定所有梯度的贡献分值wy，其中，所述y为所述参与方中梯度的数量；

b6：将所述参与方所有所述梯度的贡献分值wy的贡献分值累加并确定所述贡献分值总和W。

优选地，在所述步骤b1中，所述单位下降梯度通过如下公式确定：

其中，所述

为向量AB，所述|AB|为向量AB的模长，所述b为单位下降梯度。

优选地，在所述步骤b4中，所述梯度的贡献分值w1通过如下公式确定：

w1＝sinh(α*x)，其中，所述x为偏移度，所述α为系数，所述sinh(α*x)为惩罚函数，其中，

其中，

所述

其中，所述a为综合模型向量，所述b为单位下降梯度，其中，

所述

其中，所述Vn为x轴，y轴，z轴…n轴的坐标。

优选地，在建立联合模型过程中，通过采用指定投放参与方梯度或者随机选择梯度的方式进行优化。

优选地，在所述步骤c中，通过如下公式确定所述参与方数据价值：

T＝(gV+hW)*100，其中，所述V为数学期望，所述W为所述贡献分值总和，所述g以及所述h为权重参数。

优选地，在所述步骤a之前，还包括步骤：

i：将各参与方中每个梯度的模长按照从大到小的形式进行排序；

ii：计算各参与方中每个梯度模长相对优异的梯度比例，并确定所述参与方的选取阈值，其中，各参与方计算所得梯度获得模长分布，对每个模长分布进行归一化处理，所述选取阈值的取值范围为0～100％：

iii：基于各参与方的在所述选取阈值范围内的所述梯度建立联合模型。

根据本发明的另一个方面，提供了一种在联邦学习中评估各参与方数据价值的控制装置，其采用所述的控制方法，包括：

第一确定装置：确定其中一个参与方以不同顺序加入联合模型的数学期望V；

第二确定装置：确定所述参与方加入联合模型的所有梯度的贡献分值总和W；

第三确定装置：基于所述数学期望V以及所述贡献分值总和W确定所述参与方数据价值；

第一处理装置：确定所有参与方的数据价值。

优选地，所述第一确定装置包括：

第二处理装置：将所述参与方加入联合模型的不同顺序标记S1、S2、S3…Sn，其中，所述n为M！，所述M为参与方的个数；

第四确定装置：确定所述参与方以不同顺序加入联合模型的参与方收益V1、V2、V3…Vn；

第五确定装置：基于所述参与方收益V1、V2、V3…Vn确定所述数学期望V。

优选地，所述第二确定装置包括：

第三处理装置：通过梯度下降的方式获得最优解；

第六确定装置：确定以起始点及最优点相连的综合模型向量，其中，所述起始点为选择的起点，所述最优点为使得cost function最低的点；

第一计算装置：基于所述单位下降梯度以及所述综合模型向量计算所述梯度的偏移度；

第二计算装置：基于所述偏移度、模长以及惩罚函数确定所述梯度的贡献分值w1；

第四处理装置：直至确定所有梯度的贡献分值wy；

第三计算装置：将所述参与方所有所述梯度的贡献分值wy的贡献分值累加并确定所述贡献分值总和W。

优选地，还包括：

第五处理装置：将各参与方中每个梯度的模长按照从大到小的形式进行排序；

第四计算装置：计算各参与方中每个梯度模长相对优异的梯度比例，并确定所述参与方的选取阈值，其中，各参与方计算所得梯度获得模长分布，对每个模长分布进行归一化处理，所述选取阈值的取值范围为0～100％；

第六处理装置：基于各参与方的在所述选取阈值范围内的所述梯度建立联合模型。

本发明从两个角度综合考虑各参与方在联合模型中的贡献。第一个角度为参与方本身的数据质量，通过衡量各参与方深度学习中代表数据信息的梯度对模型的影响来衡量每个参与方。第二个角度为各参与方的数据以不同的顺序加入联合模型训练时，对模型的影响有所不同，可理解为经济学上的边际效用。通过博弈论中的Shapley Value来衡量，同时还可以将经典的评分卡模型作为Shapley Value计算的指标，在考虑边际效应时，使用经典的评分卡作为效用函数，可解释性较强，适合金融场景。另外，本发明还可以根据样本数计算概率，运用全概率公式实时更新概率，并用N叉树储存，由于这是一个排列组合问题，通过树模型来储存信息，使结果非常直观。本发明综合考虑影响各参与方数据贡献的两个角度：各参与方数据实际价值和边际效应对各参与方贡献的影响，能够更公正地衡量各参与方的数据贡献。同时考虑了各参与方数据维度或数量不同的问题，根据抽样统计学的思路，不断更新各参与方在不同顺序进入联合模型的概率。

本发明公开了一种在联邦学习中评估各参与方数据价值的控制方法，包括如下步骤：a.确定其中一个参与方以不同顺序加入联合模型的数学期望V；b.确定所述参与方加入联合模型的所有梯度的贡献分值总和W；c.基于所述数学期望V以及所述贡献分值总和W确定所述参与方数据价值；d.重复执行步骤a至步骤c，直至确定所有参与方的数据价值。本发明流程简单，使用方便，功能强大，具有极高的价值。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出了本发明的具体实施方式的，一种在联邦学习中评估各参与方数据价值的控制方法的具体流程示意图；

图2示出了本发明的第一实施例的，确定其中一个参与方以不同顺序加入联合模型的数学期望V的具体流程示意图；

图3示出了本发明的第二实施例的，确定所述参与方加入联合模型的所有梯度的贡献分值总和W的具体流程示意图；

图4示出了本发明的第三实施例的，一种在联邦学习中评估各参与方数据价值的控制方法的具体流程示意图；以及

图5示出了本发明的另一具体实施方式的，一种在联邦学习中评估各参与方数据价值的控制装置的模块连接示意图。

具体实施方式

为了更好的使本发明的技术方案清晰的表示出来，下面结合附图对本发明作进一步说明。

图1示出了本发明的具体实施方式的，一种在联邦学习中评估各参与方数据价值的控制方法的具体流程示意图,本发明综合考虑影响各参与方数据贡献的两个角度：各参与方数据实际价值和边际效应对各参与方贡献的影响，能够更公正地衡量各参与方的数据贡献。在考虑边际效应时，使用经典的评分卡作为效用函数，可解释性较强，适合金融场景。同时考虑了各参与方数据维度或数量不同的问题，根据抽样统计学的思路，不断更新各参与方在不同顺序进入联合模型的概率。

进一步地，本发明公开了一种在联邦学习中评估各参与方数据价值的控制方法，包括如下步骤：

首先，进入步骤S101，确定其中一个参与方以不同顺序加入联合模型的数学期望V，在这样的实施例中，因为当参与方的梯度加入模型的顺序不同时，他们对模型的影响会有不同。因此，我们需要考虑一个参与方以各种顺序加入模型综合的贡献，在这里我们用博弈论中的Shapely value来衡量。在本申请中的Shapley value为数学期望V，在这里的计算公式为参与方自身获得的准确率提升(联合模型的准确率与单机模型的准确率之差)减去联合模型获得的准确率提升(新一轮联合模型的准确率减去上一轮联合模型的准确率)。当然，我们可以构建更复杂的评分卡模型，评分卡模型为经济学上的效用函数，作为期望计算的基底，通过准确率，召回率，正确率，AUC值，F-1值等评估指标运用线性回归、逻辑回归等手段进行评分建模。

更进一步地，评分卡模型可根据自身需求进行设计，通过统计机器学习、深度学习等方式，提取数据信息，输出分值。如蚂蚁信用分，微信信用分即为评分卡模型的应用。在一个优选地实施例中，本发明给出了一种简单的在联邦学习场景下的评分卡模型公式：y＝a1*f(x1)+a2*g(x2)+a3*h(x3)，这里使用广义相加模型，对于不同的变量我们可以采用不同的函数f(x1),g(x2),h(x3)来来定义。根据实际数据情况选择函数。此处的x1、x2、x3等指标可以为准确率、召回率、AUC、F1值等评估数据的值。

本领域技术人员理解，加入联合模型进行联合建模的过程是目前现有技术，在建模过程中，我们需要记录信息。其中一种联合建模方式，参照论文<collaborativefairness in federated learning>，我们根据联邦模型在各参与方检验集中的准确率来不断动态调配各参与方的梯度在联合模型中的权重，从而实现联合建模，在此不予赘述。

然后，进入步骤S102，确定所述参与方加入联合模型的所有梯度的贡献分值总和W，在梯度下降和深度学习中，我们将海量的信息归结为梯度。数据质量可以通过衡量梯度的质量来判断。当我们运用梯度下降的方式获得最优模型(使成本函数cost function最小化)时，每一次下降都沿梯度的方向下降单位长度。建模过程中，我们可以采用每批投放一个参与方的梯度，或者每轮随机选择梯度进行优化的方式。最后，我们可以将起始点和取得的最优点相连，形成一个综合模型的向量。根据每次下降的梯度与综合模型的梯度的偏移度乘以梯度模长来衡量各参与方的数据质量。对于每个参与方，可以将参与方拥有的每个梯度(向量)与起始点和最终点形成的向量计算偏移度，偏移度乘上梯度的模长，再通过双曲函数(sinh函数)作为惩罚函数，计算贡献分值，并将同属一个参与方的分值进行累加。本领域技术人员理解，所述步骤S101与所述步骤S102可以同时执行，也可以存在先后顺序，具体地，可以先执行步骤S101，再执行步骤S102，也可以先执行步骤S102，再执行步骤S101，在此不予赘述。

紧接着，进入步骤S103，基于所述数学期望V以及所述贡献分值总和W确定所述参与方数据价值，在所述步骤S103中，通过如下公式确定所述参与方数据价值：T＝gV+hW，其中，所述V为数学期望，所述W为所述贡献分值总和，所述g以及所述h为权重参数。即所述g以及所述h可以取0.5，也可以所述g取2，所述h取10等等，在分别评估完上述步骤S102以及步骤S103这两个方面后，我们可以给上述两个方面的数据各分配一个系数，我们可以根据实际情况分配系数，对数据的价值进行合理的评估。

最后，作为本发明的一个优选地实施例，我们可以根据际情况分配系数，对数据的价值进行合理的评估，但在另一个实施例中，还可以进入步骤S104，重复执行步骤S101至步骤S103，直至确定所有参与方的数据价值，在这样的实施例中，经过步骤S101至步骤S103可以确定其中一方参与方的数据价值，而通过这一系列手段，遍历所有参与方，我们就能较为全面的评估各参与方的数据价值。

图2示出了本发明的第一实施例的，确定其中一个参与方以不同顺序加入联合模型的数学期望V的具体流程示意图，所述图2是对步骤S101的详细描述，具体地，所述步骤S101包括如下步骤：

首先，进入步骤S1011：将所述参与方加入联合模型的不同顺序标记S1、S2、S3…Sn，其中，所述n为M！，所述M为参与方的个数，在这样的实施例中，若存在M个参与方，则按照不同顺序进行排列组合，共存在M！个顺序，记为n，故将所述参与方加入联合模型的不同顺序标记S1、S2、S3…Sn。

然后，进入步骤S1012，确定所述参与方以不同顺序加入联合模型的参与方收益V1、V2、V3…Vn，本发明通过如下公式确定所述数学期望V：

所述P1为联合模型的准确率与单机模型的准确率之差，所述P2为新一轮联合模型的准确率减去上一轮联合模型的准确率，每个参与方都会划分训练集和测试集。P1即为该轮所得联合模型在每个参与方通过将数据代入模型验算得到的准确率减去参与方单机用自己的数据得到的模型通过检验获得的准确率。P2为新一轮联合模型在各参与方的准确率减去上一轮联合模型在各参与方的准确率差值。

最后，进入步骤S1013，基于所述参与方收益V1、V2、V3…Vn确定所述数学期望V，在这里，Shapley value即为参与方自身的评分提升减去联合模型的评分提升。同时，对于每个参与方，不同的计算顺序会得到不同的Shapley value。每个参与方的Shapley value应为数学期望，即所有顺序得到的Shapley value乘上它的概率的和，将每个参与方拥有的梯度都带有该参与方的标签，依次添加。由于排列顺序是一个排列组合问题，我们可以用N叉树结构去储存模型效果。同时，由于各参与方数据量的不同，选到该参与方的概率也有不同，因此各种顺序的概率也有不同。具体流程为，在每一个循环的开始，抽取一个梯度，根据标签我们可以发现该梯度属于哪一个参与方，然后我们将该参与方的所有梯度全部入模进行建模。上述中计算所述数学期望V时的概率是不断更新的，树的每个节点，相应的概率都在更新，更为具体地，所述概率的获取同样存在公式，在一个优选地实施例中，各参与方中的梯度被抽到的概率为该参与方的梯度个数和未入模的所有参与方的梯度数量总和，每个循环，该概率都需要运用全概率公式计算，实时更新。

而在另一个优选地实施例中，不同的顺序可以用树结构来储存，可以通过广度优秀搜索或深度优先搜索等计算机算法方式进行遍历。由于各参与方样本容量的不同，需要考虑选得不同参与方的概率，并且需要实时更新。

图3示出了本发明的第二实施例的，确定所述参与方加入联合模型的所有梯度的贡献分值总和W的具体流程示意图，进一步地，在所述步骤S102中，通过如下方式确定所述参与方的贡献分值总和W：

首先，进入步骤S1021，通过梯度下降的方式获得最优解，通过梯度下降确定所述参与方的其中一个梯度在成本函数cost function最小化模型的形态下每一次下沿梯度方向下降的单位下降梯度，在所述步骤S1021中，所述单位下降梯度通过如下公式确定：

其中，所述

为向量AB，所述|AB|为向量AB的模长，所述b为单位下降梯度。

然后，进入步骤S1022，确定以起始点及最优点相连的综合模型向量，其中，所述起始点为选择的起点，所述最优点为使得cost function最低的点，梯度下降就是求成本函数最小值的一种方式。求函数最小值不是一个模型，而是数学研究的一个方向，包括凸优化、梯度下降、牛顿法等常用方式。

紧接着，进入步骤S1023，基于所述单位下降梯度以及所述综合模型向量计算所述梯度的偏移度，所述x为偏移度，所述

其中，所述a为综合模型向量，所述b为单位下降梯度，其中，梯度下降法可以理解为爬山或是下山。对于一个函数，需要找到最优点，就对函数进行求导，根据导数方向移动单位长度，并更新位置，直到找到最优解。

再然后，进入步骤S1024，基于所述偏移度、模长以及惩罚函数确定所述梯度的贡献分值w1，在所述步骤S1024中，所述梯度的贡献分值w1通过如下公式确定：

所述a可以取0.5、0.7或0.9，更为具体地，应根据实际情况选取a的取值。

再然后，进入步骤S1025，重复执行步骤S1021至步骤S1024，直至确定所有梯度的贡献分值wy，其中，所述y为所述参与方中梯度的数量，在一个优选地实施例中，所述y为4，则重复执行步骤S1021至步骤S1024，直至确定所有梯度的贡献分值w1、w2、w3以及w4。

最后，进入步骤S1026，将所述参与方所有所述梯度的贡献分值wy的贡献分值累加并确定所述贡献分值总和W，所述W为w1、w2、w3以及w4之和。

进一步地，在建立联合模型过程中，通过采用指定投放参与方梯度或者随机选择梯度的方式进行优化。

图4示出了本发明的第三实施例的，一种在联邦学习中评估各参与方数据价值的控制方法的具体流程示意图，作为本发明的第三实施例，在所述步骤S102之前，还包括步骤：

首先，进入步骤S201，将各参与方中每个梯度的模长按照从大到小的形式进行排序，梯度的本意是一个向量(矢量)，表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向(此梯度的方向)变化最快，变化率最大(为该梯度的模)。

然后，进入步骤S202，计算各参与方中每个梯度模长相对优异的梯度比例，并确定所述参与方的选取阈值，其中，各参与方计算所得梯度获得模长分布，对每个模长分布进行归一化处理，所述选取阈值的取值范围为0％～100％，本领域技术人员理解，每个参与方计算所得梯度可以获得模长的分布，对每个分布进行归一化处理。比如根据z-score标准化的方式，公式为x＝(x-u)/σ，其中，所述u为所有样本数据的均值，所述σ为所有样本数据的标准差。根据各参与方标准化的分布，我们选取入模的比例。比如，各参与方排名前45％的梯度进入联合模型。

进一步地，阈值根据多次训练结果更新，可不断调整。阈值相当于筛选的指标，当各参与方计算所得的梯度达到标准，我们才让其进入联合模型。

最后，进入步骤S203，基于各参与方的在所述选取阈值范围内的所述梯度建立联合模型。各参与方单机计算每个参与方的梯度(gradient)，梯度即为微积分中的斜率。可以采用梯度下降等方式获得本地模型，并储存。同时，我们计算各梯度的模长，排序。计算每个参与方梯度模长相对优异的梯度比例，计算平均值得到一个选取率。选取各参与方中梯度从大到小排序后，在选取率内的所有梯度进入联合模型。

图5示出了本发明的另一具体实施方式的，一种在联邦学习中评估各参与方数据价值的控制装置的模块连接示意图，本申请除了公开了一种在联邦学习中评估各参与方数据价值的控制方法，还公开了一种在联邦学习中评估各参与方数据价值的控制装置，其采用所述的控制方法，包括：第一确定装置1：确定其中一个参与方以不同顺序加入联合模型的数学期望V，所述第一确定装置1的工作原理可以参考前述步骤S101，在此不予赘述。

进一步地，所述控制装置还包括第二确定装置2：确定所述参与方加入联合模型的所有梯度的贡献分值总和W，所述第二确定装置2的工作原理可以参考前述步骤S102，在此不予赘述。

进一步地，所述控制装置还包括第三确定装置3：基于所述数学期望V以及所述贡献分值总和W确定所述参与方数据价值，所述第三确定装置3的工作原理可以参考前述步骤S103，在此不予赘述。

进一步地，所述控制装置还包括第一处理装置4：确定所有参与方的数据价值，所述第一处理装置4的工作原理可以参考前述步骤S104，在此不予赘述。

进一步地，所述第一确定装置1包括第二处理装置11：将所述参与方加入联合模型的不同顺序标记S1、S2、S3…Sn，其中，所述n为M！，所述M为参与方的个数，所述第二处理装置11的工作原理可以参考前述步骤S1011，在此不予赘述。

进一步地，所述第一确定装置1包括第四确定装置12：确定所述参与方以不同顺序加入联合模型的参与方收益V1、V2、V3…Vn，所述第四确定装置12的工作原理可以参考前述步骤S1012，在此不予赘述。

进一步地，所述第一确定装置1包括第五确定装置13：基于所述参与方收益V1、V2、V3…Vn确定所述数学期望V，所述第五确定装置13的工作原理可以参考前述步骤S1013，在此不予赘述。

进一步地，所述第二确定装置2包括第三处理装置21：通过梯度下降的方式获得最优解，所述第三处理装置21的工作原理可以参考前述步骤S1021，在此不予赘述。

进一步地，所述第二确定装置2还包括第六确定装置22：确定以起始点及最优点相连的综合模型向量，其中，所述起始点为选择的起点，所述最优点为使得cost function最低的点，所述第六确定装置22的工作原理可以参考前述步骤S1022，在此不予赘述。

进一步地，所述第二确定装置2还包括第一计算装置23：基于所述单位下降梯度以及所述综合模型向量计算所述梯度的偏移度，所述第一计算装置23的工作原理可以参考前述步骤S1023，在此不予赘述。

进一步地，所述第二确定装置2还包括第二计算装置24：基于所述偏移度、模长以及惩罚函数确定所述梯度的贡献分值w1，所述第二计算装置24的工作原理可以参考前述步骤S1024，在此不予赘述。

进一步地，所述第二确定装置2还包括第四处理装置25：直至确定所有梯度的贡献分值wy，所述第四处理装置25的工作原理可以参考前述步骤S1025，在此不予赘述。

进一步地，所述第二确定装置2还包括第三计算装置26：将所述参与方所有所述梯度的贡献分值wy的贡献分值累加并确定所述贡献分值总和W，所述第三计算装置26的工作原理可以参考前述步骤S1026，在此不予赘述。

进一步地，所述控制装置还包括第五处理装置5：将各参与方中每个梯度的模长按照从大到小的形式进行排序，所述第五处理装置5的工作原理可以参考前述步骤S201，在此不予赘述。

进一步地，所述控制装置还包括第四计算装置6：计算各参与方中每个梯度模长相对优异的梯度比例，并确定所述参与方的选取阈值，其中，各参与方计算所得梯度获得模长分布，对每个模长分布进行归一化处理，所述选取阈值的取值范围为0～100％，所述第四计算装置6的工作原理可以参考前述步骤S202，在此不予赘述。

进一步地，所述控制装置还包括第六处理装置7：基于各参与方的在所述选取阈值范围内的所述梯度建立联合模型，所述第六处理装置7的工作原理可以参考前述步骤S203，在此不予赘述。

需要说明的是，上述各装置实施例的具体实施方式与前述对应方法实施例的具体实施方式相同，在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述，构造这类装置所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实施例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

此外，本领域技术人员理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域技术人员理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。词语“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质内容。

Claims

1.一种在联邦学习中评估各参与方数据价值的控制方法，其特征在于，包括如下步骤：

c.基于所述数学期望V以及所述贡献分值总和W确定所述参与方数据价值。

2.根据权利要求1所述的控制方法，其特征在于，所述步骤a包括如下步骤：

a3：基于所述参与方收益V1、V2、V3…Vn确定所述数学期望V。

3.根据权利要求2所述的控制方法，其特征在于，通过如下公式确定所述数学期望V：

4.根据权利要求1所述的控制方法，其特征在于，在所述步骤b中，通过如下方式确定所述参与方的贡献分值总和W：

b1：通过梯度下降的方式获得最优解；

5.根据权利要求4所述的控制方法，其特征在于，在所述步骤b1中，所述单位下降梯度通过如下公式确定：

其中，所述

为向量AB，所述|AB|为向量AB的模长，所述b为单位下降梯度。

6.根据权利要求4所述的控制方法，其特征在于，在所述步骤b4中，所述梯度的贡献分值w1通过如下公式确定：

其中，

所述

所述

其中，所述Vn为x轴，y轴，z轴…n轴的坐标。

7.根据权利要求4所述的控制方法，其特征在于，在建立联合模型过程中，通过采用指定投放参与方梯度或者随机选择梯度的方式进行优化。

8.根据权利要求1所述的控制方法，其特征在于，在所述步骤c中，通过如下公式确定所述参与方数据价值：

T＝gV+hW，其中，所述V为数学期望，所述W为所述贡献分值总和，所述g以及所述h为权重参数。

9.根据权利要求1-8中任一项所述的控制方法，其特征在于，在所述步骤a之前，还包括步骤：

ii：计算各参与方中每个梯度模长相对优异的梯度比例，并确定所述参与方的选取阈值，其中，各参与方计算所得梯度获得模长分布，对每个模长分布进行归一化处理，所述选取阈值的取值范围为0～100％；

10.根据权利要求1所述的控制方法，其特征在于，在所述步骤c之后，还包括步骤d：重复执行步骤a至步骤c，直至确定所有参与方的数据价值。

11.一种在联邦学习中评估各参与方数据价值的控制装置，其采用如权利要求1-10中任一项所述的控制方法，其特征在于，包括：

第一确定装置(1)：确定其中一个参与方以不同顺序加入联合模型的数学期望V；

第二确定装置(2)：确定所述参与方加入联合模型的所有梯度的贡献分值总和W；

第三确定装置(3)：基于所述数学期望V以及所述贡献分值总和W确定所述参与方数据价值；

第一处理装置(4)：确定所有参与方的数据价值。

12.根据权利要求11所述的控制装置，其特征在于，所述第一确定装置(1)包括：

第二处理装置(11)：将所述参与方加入联合模型的不同顺序标记S1、S2、S3…Sn，其中，所述n为M！，所述M为参与方的个数；

第四确定装置(12)：确定所述参与方以不同顺序加入联合模型的参与方收益V1、V2、V3…Vn；

第五确定装置(13)：基于所述参与方收益V1、V2、V3…Vn确定所述数学期望V。

13.根据权利要求11所述的控制装置，其特征在于，所述第二确定装置(2)包括：

第三处理装置(21)：通过梯度下降的方式获得最优解；

第六确定装置(22)：确定以起始点及最优点相连的综合模型向量，其中，所述起始点为选择的起点，所述最优点为使得cost function最低的点；

第一计算装置(23)：基于所述单位下降梯度以及所述综合模型向量计算所述梯度的偏移度；

第二计算装置(24)：基于所述偏移度、模长以及惩罚函数确定所述梯度的贡献分值w1；

第四处理装置(25)：直至确定所有梯度的贡献分值wy；

第三计算装置(26)：将所述参与方所有所述梯度的贡献分值wy的贡献分值累加并确定所述贡献分值总和W。

14.根据权利要求11所述的控制装置，其特征在于，还包括：

第五处理装置(5)：将各参与方中每个梯度的模长按照从大到小的形式进行排序；

第四计算装置(6)：计算各参与方中每个梯度模长相对优异的梯度比例，并确定所述参与方的选取阈值，其中，各参与方计算所得梯度获得模长分布，对每个模长分布进行归一化处理，所述选取阈值的取值范围为0～100％；

第六处理装置(7)：基于各参与方的在所述选取阈值范围内的所述梯度建立联合模型。