CN114925854A - 一种基于梯度相似性度量的联邦学习节点选择方法及系统 - Google Patents

一种基于梯度相似性度量的联邦学习节点选择方法及系统 Download PDF

Info

Publication number
CN114925854A
CN114925854A CN202210349578.2A CN202210349578A CN114925854A CN 114925854 A CN114925854 A CN 114925854A CN 202210349578 A CN202210349578 A CN 202210349578A CN 114925854 A CN114925854 A CN 114925854A
Authority
CN
China
Prior art keywords
similarity
nodes
node
gradients
gradient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210349578.2A
Other languages
English (en)
Inventor
赵生捷
涂成武
邓浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202210349578.2A priority Critical patent/CN114925854A/zh
Publication of CN114925854A publication Critical patent/CN114925854A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于梯度相似性度量的联邦学习节点选择方法及系统,方法包括以下步骤:各个节点获取最新的模型,进行本地训练,得到各自本地更新的梯度;各个节点将其本地更新的梯度递交至中心服务器;中心服务器接收各个节点的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,所述相似性矩阵中的元素值为两个节点的梯度之间的相似度;通过相似度筛选得到可靠节点集合,对可靠节点集合中节点的梯度进行聚合,更新模型,将更新后的模型下发至各个节点,完成一轮联邦学习。与现有技术相比,本发明对联邦学习节点进行了筛选,避免在单轮联邦学习中选择过多的具有低质量数据集的节点,从而提高了联邦学习的收敛效率和全局模型的性能。

Description

一种基于梯度相似性度量的联邦学习节点选择方法及系统
技术领域
本发明涉及机器学习技术领域,尤其是涉及一种基于梯度相似性度量的联邦学习节点选择方法及系统。
背景技术
联邦学习,本质上是一种分布式机器学习技术,其目标是在保证数据隐私安全及合法合规的基础上,实现共同建模,提升机器学习模型的效果。联邦学习的目的是解决不同数据拥有方在不交换数据的情况下进行协作的问题,旨在让分散的各参与方在满足不向其他参与者披露隐私数据的前提下,协作进行机器学习的模型训练。经典联邦学习框架的训练过程可以简单概括为以下步骤:协调方建立基本模型,并将模型的基本结构与参数告知各参与方;各参与方利用本地数据进行模型训练,并将结果返回给协调方;协调方汇总各参与方的模型,构建更精准的全局模型,以整体提升模型性能和效果。
但按照传统联邦学习的流程,每一轮联邦学习中,均需要选择全部的节点或随机选择给定比例的节点进行本地的学习,之后产生本地的更新上传至中心服务器,由中心服务器进行合并,合并后下发至各个节点。然而,参与联邦学习的节点很难保证自身具有的数据均包含所有类别的样本且样本分布较为均匀,这导致参与联邦学习的节点中难以避免地会包含一些样本数据集非独立同分布的节点,这些节点具有的数据集是质量较差的。而在一轮联邦学习中若选择此类节点进行本地学习,其产生的本地更新可能会对全局模型造成负提升,从而导致全局模型的收敛变慢,性能降低。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于梯度相似性度量的联邦学习节点选择方法及系统。
本发明的目的可以通过以下技术方案来实现:
一种基于梯度相似性度量的联邦学习节点选择方法,包括以下步骤:
各个节点获取最新的模型,进行本地训练,得到各自本地更新的梯度;
各个节点将其本地更新的梯度递交至中心服务器;
中心服务器接收各个节点的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,所述相似性矩阵中的元素值为两个节点的梯度之间的相似度;
通过相似度筛选得到可靠节点集合,对可靠节点集合中节点的梯度进行聚合,更新模型,将更新后的模型下发至各个节点,完成一轮联邦学习。
进一步的,所述梯度的格式为向量,两个本地更新的梯度A和B之间的相似度为向量A和向量B之间的余弦相似度,计算公式为:
Figure BDA0003579031860000021
其中,similarity表示余弦相似度,取值范围为[-1,1],similarity=1表示两个向量的指向完全相同,相似度最高,similarity=-1表示两个向量的指向完全相反,相似度最低,similarity=0表示两个向量之间相互独立,Ai和Bi分别代表向量A和向量B的各分量,n表示向量的维度。
进一步的,通过相似度筛选得到可靠节点集合具体为:
预先设定相似阈值,若两个节点的梯度的相似度达到相似阈值,则这两个节点互为相似节点;预先设定可靠度阈值,检查每个节点的相似节点的数量,若一个节点的相似节点的数量达到可靠度阈值,则将该节点放入可靠节点集合。
进一步的,通过相似度筛选得到可靠节点集合具体为:
预先设定第一阈值,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将大小达到第一阈值的相似度值所对应的节点放入可靠节点集合,N表示节点的总数。
进一步的,通过相似度筛选得到可靠节点集合具体为:
预先设定第二阈值k,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将相似度值按照大小排序,将相似度值最大的前k个相似度值所对应的节点放入可靠节点集合,N表示节点的总数。
进一步的,通过相似度筛选得到可靠节点集合具体为:
预先设定第一阈值,预先设定第二阈值k,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将相似度值按照大小排序,将大小达到第一阈值的相似度值所对应的节点放入第一集合,将相似度值最大的前k个相似度值所对应的节点放入第二集合,将第一集合和第二集合的交集作为可靠节点集合,N表示节点的总数。
一种基于梯度相似性度量的联邦学习节点选择系统,包括中心服务器和至少一个节点,节点与中心服务器之间通信连接;
在一轮联邦学习中,各个节点用于:获取最新的模型,进行本地训练,得到各自本地更新的梯度,各个节点将其本地更新的梯度递交至中心服务器;中心服务器用于:接收各个节点的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,通过相似度筛选得到可靠节点集合,对可靠节点集合中节点的梯度进行聚合,更新模型,将更新后的模型下发至各个节点;
所述相似性矩阵中的元素值为两个节点的梯度之间的相似度。
进一步的,所述梯度的格式为向量,两个本地更新的梯度A和B之间的相似度为向量A和向量B之间的余弦相似度,计算公式为:
Figure BDA0003579031860000031
其中,similarity表示余弦相似度,取值范围为[-1,1],similarity=1表示两个向量的指向完全相同,相似度最高,similarity=-1表示两个向量的指向完全相反,相似度最低,similarity=0表示两个向量之间相互独立,Ai和Bi分别代表向量A和向量B的各分量,n表示向量的维度。
进一步的,所述节点与中心服务器之间采用web技术进行通信,节点与中心服务器上均搭建有web服务器并提供api接口。
进一步的,所述中心服务器上的api接口负责接收各个节点的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,通过相似度筛选得到可靠节点集合,对可靠节点集合中节点的梯度进行聚合,更新模型,并请求节点上的api接口同步更新后的模型,所述节点上的api接口负责接收模型并以此为信号开始进行本地训练,得到各自本地更新的梯度,并请求中心服务器上的api接口接收梯度。
与现有技术相比,本发明具有以下有益效果:
(1)对联邦学习节点进行了筛选,避免在单轮联邦学习中选择过多的具有低质量数据集的节点,从而提高了联邦学习的收敛效率和全局模型的性能。
(2)即插即用:使用余弦相似度计算梯度相似性,从而进行节点筛选,无需进行额外的模型学习,可以直接嵌入在传统联邦学习的执行流程中。
(3)高扩展性:可以在不同节点数量,不同数据集,不同数据分布下进行可靠的节点筛选。
附图说明
图1为基于梯度相似性度量的联邦学习节点选择方法的流程图;
图2为实施例中节点相似度计算和筛选的示例;
图3为基于梯度相似性度量的联邦学习节点选择系统的架构图;
图4为基于梯度相似性度量的联邦学习节点选择策略的伪代码;
图5为100用户非iid分布准确率变化图(无节点选择);
图6为100用户非iid分布准确率变化图(有节点选择);
附图标记:1、中心服务器,2、节点。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
在附图中,结构相同的部件以相同数字标号表示,各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的,本发明并没有限定每个组件的尺寸和厚度。为了使图示更清晰,附图中有些地方适当夸大了部件。
实施例1:
本实施例以物联网领域的多个设备节点为例,随着物联网的深入发展,物联网设备产生了越来越多的数据,联邦学习可以保证在确保这些物联网数据的隐私权的前提下,高效学习这些物联网数据中的蕴含的知识。设备节点数量较多时,每一轮联邦学习中需要选择给定比例的节点进行本地的学习,而物联网设备本地产生的数据质量难以保证,受设备的类型、安装位置、数据采集时间段等因素影响。而不平衡的数据集参与模型训练可能会对全局模型造成负提升,从而导致全局模型的收敛变慢,性能降低。
本申请为解决上述问题提供了一种基于梯度相似性度量的联邦学习节点选择方法,在一轮联邦学习中,对节点产生的本地更新梯度进行两两之间的相似性度量,得到节点的梯度之间的相似性矩阵,之后筛选出可靠节点集合,将集合中的本地更新进行合并汇总,对模型进行更新。该策略保留了传统联邦学习可以保留数据隐私权的优秀特性(在知识共享过程中,参与节点无需对自身具有的数据进行共享,保证了物联网节点的数据安全),并且可以根据参与节点的数据集质量进行动态地选择参与合并的节点。并且实现较为简单,仅需要在传统的联邦学习过程中添加一个计算相似性并进行可靠节点筛选的模块即可。
在一轮联邦学习中,一种基于梯度相似性度量的联邦学习节点选择方法,如图1所示,包括以下步骤:
(1)各个节点获取最新的模型,进行本地训练,得到各自本地更新的梯度;
(2)各个节点将其本地更新的梯度递交至中心服务器;
(3)中心服务器接收各个节点的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,相似性矩阵中的元素值为两个节点的梯度之间的相似度;
梯度的格式为向量,两个本地更新的梯度A和B之间的相似度为向量A和向量B之间的余弦相似度,计算公式为:
Figure BDA0003579031860000051
其中,similarity表示余弦相似度,取值范围为[-1,1],similarity=1表示两个向量的指向完全相同,相似度最高,similarity=-1表示两个向量的指向完全相反,相似度最低,similarity=0表示两个向量之间相互独立,Ai和Bi分别代表向量A和向量B的各分量,n表示向量的维度。
(4)通过相似度筛选得到可靠节点集合,对可靠节点集合中节点的梯度进行聚合,更新模型,将更新后的模型下发至各个节点,完成一轮联邦学习,如图2所示,以6个节点为例,先计算两两的梯度的余弦相似度,再筛选,得到3个节点作为可靠节点,合并这3个节点的梯度进行模型更新。
可以理解的是,通过相似度筛选得到可靠节点集合的方式有多种筛选标准,本实施例中提供了以下四种筛选标准,当然,本领域技术人员还可以根据实际情况进行调整,设计新的筛选标准。
①通过相似度筛选得到可靠节点集合具体为:
预先设定相似阈值,若两个节点的梯度的相似度达到相似阈值,则这两个节点互为相似节点;预先设定可靠度阈值,检查每个节点的相似节点的数量,若一个节点的相似节点的数量达到可靠度阈值,则将该节点放入可靠节点集合。这样的筛选标准可以确保可靠节点集合中的节点,具有多个相似度较高的相似节点,保证参与合并和模型更新的节点的质量较优。
②通过相似度筛选得到可靠节点集合具体为:
可以理解的是,相似性矩阵中,对角线元素的值均为1,关于对角线对称的两个元素的值是相同且含义一致的。预先设定第一阈值,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将大小达到第一阈值的相似度值所对应的节点放入可靠节点集合,N表示节点的总数。
③通过相似度筛选得到可靠节点集合具体为:
预先设定第二阈值k,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将相似度值按照大小排序,将相似度值最大的前k个相似度值所对应的节点放入可靠节点集合,N表示节点的总数。
④通过相似度筛选得到可靠节点集合具体为:
预先设定第一阈值,预先设定第二阈值k,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将相似度值按照大小排序,将大小达到第一阈值的相似度值所对应的节点放入第一集合,将相似度值最大的前k个相似度值所对应的节点放入第二集合,将第一集合和第二集合的交集作为可靠节点集合,N表示节点的总数。
本发明还提供一种基于梯度相似性度量的联邦学习节点选择系统,如图3所示,包括中心服务器1和至少一个节点2,节点2与中心服务器1之间通信连接;
在一轮联邦学习中,各个节点2用于:获取最新的模型,进行本地训练,得到各自本地更新的梯度,各个节点2将其本地更新的梯度递交至中心服务器1;中心服务器1用于:接收各个节点2的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,通过相似度筛选得到可靠节点集合,对可靠节点集合中节点2的梯度进行聚合,更新模型,将更新后的模型下发至各个节点2;相似性矩阵中的元素值为两个节点2的梯度之间的相似度。
一种基于梯度相似性度量的联邦学习节点选择系统与方法实施例基于相同的发明构思,相似度的计算以及通过相似度筛选得到可靠节点集合的相关内容见方法的描述。
节点2与中心服务器1之间采用web技术进行通信,节点2与中心服务器1上均搭建有web服务器并提供api接口;中心服务器1上的api接口负责接收各个节点2的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,通过相似度筛选得到可靠节点集合,对可靠节点集合中节点2的梯度进行聚合,更新模型,并请求节点2上的api接口同步更新后的模型,节点2上的api接口负责接收模型并以此为信号开始进行本地训练,得到各自本地更新的梯度,并请求中心服务器1上的api接口接收梯度。
可以使用python等编程语言编写联邦学习与节点筛选程序,从而方便地移植到各个操作系统平台上,训练得到的模型也可以在各个平台上加载。
为了验证本申请的基于梯度相似性度量的节点选择策略的有效性,在mnist和cifar-10数据集上进行了实验,得到了该策略可以有效减少到达特定准确率所需的联邦学习轮数的结论,涉及的伪代码如图4所示,其中,St代表需要进行筛选的节点集合,
Figure BDA0003579031860000071
表示节点i在第t轮时的更新量,v表示相似度阈值,
Figure BDA0003579031860000072
表示梯度,w表示权重。具体步骤如下:
(1)获取数据集,对数据集进行分割,将分割后的数据集分配到联邦学习的各个节点中,模拟各个节点的本地数据。
此处选择mnist与cifar-10数据集,分别包含60000个训练样本,均为图像分类数据集。对mnist与cifar-10数据集进行iid与non-iid分割,iid分割后各个节点的数据种类均匀,满足独立同分布,non-iid分割后数据集在数量上均匀分布在各个节点上,但各个节点上的数据种类可能并不均匀。将分割后的数据集分配到联邦学习的各个节点中,节点的数量设定为100。
(2)使用余弦相似度对各个联邦学习节点产生的本地更新梯度进行计算,筛选得到可靠节点集合。
在每个物联网节点上进行本地模型的训练。对应两个数据集,采用的机器学习是类似的,均为两个卷积层加上两个全连接,激活函数均使用Relu函数。对上述模型的网络结构,使用pytorch进行构建,pytorch版本为1.2.0及以上。
为了实现节点的合理筛选及模型聚合分发,需要提前规定好上传节点本地更新的数据结构和请求规范,节点需要上传中心服务器的信息包括:节点本身的编号(1-100);节点本轮学习产生的本地更新向量。上述信息需以json的格式进行组织并且作为请求参数进行上传。
中心服务器计算相似度,在具体实现中,计算的是向量两两之间的余弦相似度,所以采用sklearn库中的方法cosine_similarity,该方法传入一个向量组,返回的是向量之间的相似性矩阵。
之后采用上述方法实施例中的筛选标准①,预先设定相似阈值,若两个节点的梯度的相似度达到相似阈值,则这两个节点互为相似节点;预先设定可靠度阈值,检查每个节点的相似节点的数量,若一个节点的相似节点的数量达到可靠度阈值,则将该节点放入可靠节点集合,得到可靠节点集合。
实际实现时,可以统计矩阵每行超过规定相似阈值的元素,再统计每个节点的相似节点数量,就可以得到符合要求的可靠节点集合。
(3)根据筛选得到的可靠节点集合对集合中节点提交的本地更新梯度进行合并得到更新后的全局模型。
选择mnist数据集上的100用户非iid分布情形作为测试用例之一。即mnist数据集在数量上均匀分布在100个节点上,但每个节点上的数据种类可能并不均匀。
准确率反映了一个机器学习模型的性能,在每一轮联邦学习后,使用mnist数据集中提供的验证集的部分测试模型的准确率,并在每一轮联邦学习后记录全局模型的准确率。准确率越高,该模型的性能就越好。
在是否使用梯度相似性节点选择的情况下分别进行实验,得到并绘制准确率曲线,期望得到的效果是,使用梯度相似性节点选择策略的组的峰值准确率要高于不使用的组,且达到基准准确率所花费的联邦学习轮数少于不使用的组。
设置如表1所示的两个用例,并在用例条件下统计准确率峰值并统计达到规定准确率(iid:99%,non-iid:97%)所花费的轮数。结果表明,使用节点选择策略后峰值准确率有一定的提高,收敛速度有一定提高,且在非iid数据分布情形下收敛速度显著提高。
表1测试用例及结果
Figure BDA0003579031860000081
100用户非iid分布条件下,两者的准确率变化图像分别由图5与图6表示,可以看出,在引入节点选择策略后,非iid数据分布下的准确率变化幅度明显减小,这说明在节点选择中排除了大部分对抗性的节点。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种基于梯度相似性度量的联邦学习节点选择方法,其特征在于,包括以下步骤:
各个节点获取最新的模型,进行本地训练,得到各自本地更新的梯度;
各个节点将其本地更新的梯度递交至中心服务器;
中心服务器接收各个节点的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,所述相似性矩阵中的元素值为两个节点的梯度之间的相似度;
通过相似度筛选得到可靠节点集合,对可靠节点集合中节点的梯度进行聚合,更新模型,将更新后的模型下发至各个节点,完成一轮联邦学习。
2.根据权利要求1所述的一种基于梯度相似性度量的联邦学习节点选择方法,其特征在于,所述梯度的格式为向量,两个本地更新的梯度A和B之间的相似度为向量A和向量B之间的余弦相似度,计算公式为:
Figure FDA0003579031850000011
其中,similarity表示余弦相似度,取值范围为[-1,1],similarity=1表示两个向量的指向完全相同,相似度最高,similarity=-1表示两个向量的指向完全相反,相似度最低,similarity=0表示两个向量之间相互独立,Ai和Bi分别代表向量A和向量B的各分量,n表示向量的维度。
3.根据权利要求1所述的一种基于梯度相似性度量的联邦学习节点选择方法,其特征在于,通过相似度筛选得到可靠节点集合具体为:
预先设定相似阈值,若两个节点的梯度的相似度达到相似阈值,则这两个节点互为相似节点;预先设定可靠度阈值,检查每个节点的相似节点的数量,若一个节点的相似节点的数量达到可靠度阈值,则将该节点放入可靠节点集合。
4.根据权利要求1所述的一种基于梯度相似性度量的联邦学习节点选择方法,其特征在于,通过相似度筛选得到可靠节点集合具体为:
预先设定第一阈值,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将大小达到第一阈值的相似度值所对应的节点放入可靠节点集合,N表示节点的总数。
5.根据权利要求1所述的一种基于梯度相似性度量的联邦学习节点选择方法,其特征在于,通过相似度筛选得到可靠节点集合具体为:
预先设定第二阈值k,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将相似度值按照大小排序,将相似度值最大的前k个相似度值所对应的节点放入可靠节点集合,N表示节点的总数。
6.根据权利要求1所述的一种基于梯度相似性度量的联邦学习节点选择方法,其特征在于,通过相似度筛选得到可靠节点集合具体为:
预先设定第一阈值,预先设定第二阈值k,获取梯度两两之间的相似度,得到0.5×N×(N-1)个相似度值,将相似度值按照大小排序,将大小达到第一阈值的相似度值所对应的节点放入第一集合,将相似度值最大的前k个相似度值所对应的节点放入第二集合,将第一集合和第二集合的交集作为可靠节点集合,N表示节点的总数。
7.一种基于梯度相似性度量的联邦学习节点选择系统,其特征在于,包括中心服务器和至少一个节点,节点与中心服务器之间通信连接;
在一轮联邦学习中,各个节点用于:获取最新的模型,进行本地训练,得到各自本地更新的梯度,各个节点将其本地更新的梯度递交至中心服务器;中心服务器用于:接收各个节点的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,通过相似度筛选得到可靠节点集合,对可靠节点集合中节点的梯度进行聚合,更新模型,将更新后的模型下发至各个节点;
所述相似性矩阵中的元素值为两个节点的梯度之间的相似度。
8.根据权利要求7所述的一种基于梯度相似性度量的联邦学习节点选择系统,其特征在于,所述梯度的格式为向量,两个本地更新的梯度A和B之间的相似度为向量A和向量B之间的余弦相似度,计算公式为:
Figure FDA0003579031850000021
其中,similarity表示余弦相似度,取值范围为[-1,1],similarity=1表示两个向量的指向完全相同,相似度最高,similarity=-1表示两个向量的指向完全相反,相似度最低,similarity=0表示两个向量之间相互独立,Ai和Bi分别代表向量A和向量B的各分量,n表示向量的维度。
9.根据权利要求7所述的一种基于梯度相似性度量的联邦学习节点选择系统,其特征在于,所述节点与中心服务器之间采用web技术进行通信,节点与中心服务器上均搭建有web服务器并提供api接口。
10.根据权利要求9所述的一种基于梯度相似性度量的联邦学习节点选择系统,其特征在于,所述中心服务器上的api接口负责接收各个节点的梯度,将梯度两两之间进行相似度计算,得到相似性矩阵,通过相似度筛选得到可靠节点集合,对可靠节点集合中节点的梯度进行聚合,更新模型,并请求节点上的api接口同步更新后的模型,所述节点上的api接口负责接收模型并以此为信号开始进行本地训练,得到各自本地更新的梯度,并请求中心服务器上的api接口接收梯度。
CN202210349578.2A 2022-04-02 2022-04-02 一种基于梯度相似性度量的联邦学习节点选择方法及系统 Pending CN114925854A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210349578.2A CN114925854A (zh) 2022-04-02 2022-04-02 一种基于梯度相似性度量的联邦学习节点选择方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210349578.2A CN114925854A (zh) 2022-04-02 2022-04-02 一种基于梯度相似性度量的联邦学习节点选择方法及系统

Publications (1)

Publication Number Publication Date
CN114925854A true CN114925854A (zh) 2022-08-19

Family

ID=82805615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210349578.2A Pending CN114925854A (zh) 2022-04-02 2022-04-02 一种基于梯度相似性度量的联邦学习节点选择方法及系统

Country Status (1)

Country Link
CN (1) CN114925854A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115145966A (zh) * 2022-09-05 2022-10-04 山东省计算中心(国家超级计算济南中心) 一种面向异构数据的对比联邦学习方法及系统
CN115775026A (zh) * 2022-12-27 2023-03-10 重庆大学 一种基于组织相似度的联邦学习方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115145966A (zh) * 2022-09-05 2022-10-04 山东省计算中心(国家超级计算济南中心) 一种面向异构数据的对比联邦学习方法及系统
CN115775026A (zh) * 2022-12-27 2023-03-10 重庆大学 一种基于组织相似度的联邦学习方法

Similar Documents

Publication Publication Date Title
TWI698808B (zh) 模型測試的方法及裝置
CN114925854A (zh) 一种基于梯度相似性度量的联邦学习节点选择方法及系统
CN110610242A (zh) 一种联邦学习中参与者权重的设置方法及装置
CN112416986B (zh) 基于分层个性化联邦学习的用户画像实现方法及系统
WO2022257730A1 (zh) 实现隐私保护的多方协同更新模型的方法、装置及系统
CN112632013A (zh) 一种基于联邦学习的数据安全可信共享方法和装置
CN112990478B (zh) 联邦学习数据处理系统
CN107633257B (zh) 数据质量评估方法及装置、计算机可读存储介质、终端
CN112365007B (zh) 模型参数确定方法、装置、设备及存储介质
CN113379071B (zh) 一种基于联邦学习的噪声标签修正方法
CN112817563B (zh) 目标属性配置信息确定方法、计算机设备和存储介质
CN115391561A (zh) 图网络数据集的处理方法、装置、电子设备、程序及介质
CN114021188A (zh) 一种联邦学习协议交互安全验证方法、装置及电子设备
CN113947133A (zh) 小样本图像识别的任务重要性感知元学习方法
CN117828377B (zh) 一种基于公平加权因子的教育感知聚类方法及系统
CN117350373B (zh) 一种基于局部自注意力机制的个性化联邦聚合算法
CN107679766B (zh) 一种群智任务动态冗余调度方法及装置
CN112101528B (zh) 基于反向传播的终端贡献度量方法
CN113850669A (zh) 用户分群方法、装置、计算机设备及计算机可读存储介质
CN116258923A (zh) 图像识别模型训练方法、装置、计算机设备和存储介质
CN111126860A (zh) 任务分配方法、任务分配装置和电子设备
CN107688582B (zh) 资源推荐模型的获取方法及装置
CN114550737A (zh) 一种基于神经通路的图垂直联邦数据增强方法与装置
CN114677535A (zh) 域适应图像分类网络的训练方法、图像分类方法及装置
CN111598390B (zh) 服务器高可用性评估方法、装置、设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination