CN113344220B - 一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质 - Google Patents

一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113344220B
CN113344220B CN202110677368.1A CN202110677368A CN113344220B CN 113344220 B CN113344220 B CN 113344220B CN 202110677368 A CN202110677368 A CN 202110677368A CN 113344220 B CN113344220 B CN 113344220B
Authority
CN
China
Prior art keywords
local model
gradient
point
users
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110677368.1A
Other languages
English (en)
Other versions
CN113344220A (zh
Inventor
郭帅帅
史高鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202110677368.1A priority Critical patent/CN113344220B/zh
Publication of CN113344220A publication Critical patent/CN113344220A/zh
Application granted granted Critical
Publication of CN113344220B publication Critical patent/CN113344220B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质,当服务器接收到各个用户传输过来的局部模型梯度矩阵后,首先将各个用户的局部模型梯度矩阵按行或按列展开成一个向量,然后利用PCA对向量进行降维,再利用DBSCAN聚类方法进行聚类,得到聚类结果中数量最多的一类,再求得此类中所有降维局部模型梯度的几何中心点,最后根据每个用户的降维局部模型梯度与上述几何中心点的距离选择用户,选择离中心点最近的部分用户的梯度用来更新全局模型。该筛选方法能够有效筛选基于高质量数据计算的局部模型梯度,提高联邦学习系统的鲁棒性。

Description

一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设 备及存储介质
技术领域
本发明涉及一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质,属于分布式机器学习领域。
背景技术
传统的机器学习方法要求将训练所用的数据集中在一台设备或一个数据中心,然而,由于对数据隐私的保护和无线通信资源的限制,将所有用于学习的数据传输到中心设备或数据中心对用户来说是不切实际的。这促使了分布式机器学习的出现,如图1所示,联邦学习是一种分布式机器学习算法,它可以使用户在本地收集数据,训练模型,只需要把局部模型参数传输给中央服务器,由中央服务器完成模型的整合,再广播给所有用户,训练过程一共进行t代,直至模型收敛。[S.A.Rahman,H.Tout,H.Ould-Slimane,A.Mourad,C.Talhiand M.Guizani,"A Survey on Federated Learning:The Journey from Centralized toDistributed On-Site Learning and Beyond,"in IEEE Internet of Things Journal,doi:10.1109/JIOT.2020.3030072.]。
然而,某些用户可能会由于特殊原因采集到受噪声或干扰的数据用来计算本地模型更新,或者受限与传输信道质量的影响,向服务器传输本地模型更新时也可能出现丢包或误码的现象;此外,由于服务器无法观测到用户数据,联邦学习很容易受到恶意攻击,如多个恶意用户将虚假训练样本注入自己的训练样本中用于本地模型的训练,这些虚假样本包括:训练数据被加入高斯噪声,训练标签被恶意修改等,这些具有噪声的局部模型更新参数和恶意攻击可能对联邦学习的过程产生严重影响。[D.Cao,S.Chang,Z.Lin,G.Liu andD.Sun,"Understanding Distributed Poisoning Attack in Federated Learning,"2019IEEE 25th International Conference on Parallel and Distributed Systems(ICPADS),Tianjin,China,2019,pp.233-239,doi:10.1109/ICPADS47876.2019.00042.]。
发明内容
针对现有技术的不足,本发明提供了一种联邦学习中基于局部模型梯度的用户筛选方法,该方法能够通过对用户传递到服务器的局部模型梯度进行用户数据质量测评,从而在训练过程中选择基于高质量数据计算的局部模型,用来进一步更新全局模型。当服务器接收到各个用户传输过来的局部模型梯度矩阵后,首先将各个用户的局部模型梯度矩阵按行或按列展开成一个向量,然后利用PCA对展开的局部模型梯度的向量形式进行降维,接下来对所有降维的局部模型梯度利用DBSCAN聚类方法进行聚类,得到聚类结果中数量最多的一类,再求得此类中所有降维局部模型梯度的几何中心点,最后根据每个用户的降维局部模型梯度与上述几何中心点的距离选择用户,选择离中心点最近的部分用户的梯度用来更新全局模型。该筛选方法能够有效筛选基于高质量数据计算的局部模型梯度,提高联邦学习系统的鲁棒性。
术语解释:
1.联邦学习:令N个数据所有者为{F1,…,FN},他们都希望整合各自的数据{D1,…,DN}来训练出一个机器学习模型。传统的方法是把所有的数据放在一起并使用D=D1∪…∪DN来训练一个模型MSUM。联邦学习系统是一个学习过程,数据所有者共同训练一个模型MFED(即全局模型),在此过程中,任何数据所有者Fi都不会向其他人公开其数据Di,而是自己在本地利用自己的数据训练模型(即局部模型)并将局部模型梯度交给中央服务器来整合。
联邦学习的流程:
1)中央服务器初始化全局模型参数;
2)中央服务器将模型参数广播给所有参与联邦学习的用户;
3)用户将收到的模型作为自己新的模型(此时所有用户的模型都是全局模型);
4)用户利用自己的数据集训练模型(局部模型),并计算局部模型梯度;
5)用户将局部模型梯度上传到中央服务器;
6)中央服务器将所有用户的局部模型梯度进行整合,计算新的全局模型;
7)重复步骤2)到步骤6)(此为联邦学习过程中的一代),直至模型收敛。
2.PCA:Principal Component Analysis的缩写,主成分分析法,是一种非监督机器学习方法,其主要思想是将n维特征映射到k(k<n)维上,新的k维特征是重新构造出来的正交特征,而不是简单地将原来的n维特征剔除n-k维。PCA主成分分析法的所用到的理论是最大方差理论,即映射得到的k维特征在每一维上的样本方差尽可能大。
3.DBSCAN聚类方法:Density—Based Spatial Clustering of Applicationwith Noise的缩写,是一种基于密度的聚类算法,这种算法假设样本类别可以通过样本分布的紧密程度来决定,同一类型的样本在空间上是比较紧密的,即他们之间的距离较短,也就是说,对于属于一个类别的样本,在这个样本的不远处很大可能有同一类别的样本。此聚类算法可以将样本密度高的区域检测出来。
4.随机梯度下降法:是一种神经网络更新模型参数的方法,训练神经网络旨在最小化损失函数(反应网络模型性能的函数),而损失函数需要用样本点来计算梯度(模型参数更新的反方向),而一次性输入所有样本点会浪费大量资源和时间,因此采取随机选取部分样本点来计算梯度的方法。
本发明的技术方案为:
一种联邦学习中基于局部模型梯度的用户筛选方法,通过分析用户梯度的分布选择更准确的局部模型,联邦学习中包括服务器和N个用户,该用户筛选方法的具体步骤包括:
(1)服务器初始化全局模型参数,并将全局模型参数广播给所有参与到联邦学习过程的N个用户;
(2)用户接收到全局模型参数后,利用用户持有的数据集更新局部模型参数,然后将用户的局部模型梯度传输给服务器;
(3)服务器将N个局部模型梯度
Figure BDA0003121330410000031
均按行或按列展开成为向量形式,向量的维数与局部模型的参数
Figure BDA0003121330410000032
中的元素个数相同;
(4)为了方便依据展开的向量对用户数据进行测评,服务器利用PCA算法对步骤(3)得到的展开的局部模型梯度的向量形式进行降维,从而减小展开的向量的长度;
(5)服务器利用DBSCAN聚类方法对步骤(4)得到的N个降维局部模型梯度进行聚类,然后求聚类结果中数量最多的一类降维局部模型梯度的平均值,即降维局部模型梯度中心
Figure BDA0003121330410000041
(6)计算每个用户的降维局部模型梯度到降维局部模型梯度中心
Figure BDA0003121330410000042
的欧式距离;
(7)根据步骤(6)计算得到的欧式距离,选取距离最近的M个用户;M为用户数量N的60%到80%;
(8)利用选取的M个用户的局部模型梯度
Figure BDA0003121330410000043
更新本代联邦学习训练过程的全局模型
Figure BDA0003121330410000044
并将更新的全局模型广播给用户,全局模型
Figure BDA0003121330410000045
满足:
Figure BDA0003121330410000046
式(I)中,
Figure BDA0003121330410000047
表示第t-1代联邦学习的全局模型,
Figure BDA0003121330410000048
表示第t代联邦学习的全局模型;
(9)重复执行步骤(2)-步骤(8),直至模型收敛。
根据本发明优选的,步骤(2)中,利用用户持有的数据集,使用随机梯度下降法得到用户的局部模型梯度。
根据本发明优选的,步骤(4)中,服务器利用PCA算法对步骤(3)得到的展开的局部模型梯度的向量形式进行降维,具体过程包括:
4-1、输入数据集X={x1,x2,x3…xN},xi表示第i个用户的局部模型梯度对应的展开的向量,i=1,2,3,…N;
4-2、去中心化:计算数据集X的均值Xmean,然后将X的每个元素减去Xmean得到去中心化数据集Xnew
4-3、求去中心化数据集Xnew的协方差矩阵Cov
4-4、计算协方差矩阵Cov的特征值及特征值对应的特征向量;
4-5、选取从大到小的k个特征值对应的特征向量分别作为列向量组成特征向量矩阵W,k表示维度数;
4-6、计算XnewW,即把去中心化数据集Xnew投影到所选取的特征向量上,得到的XnewW即为降为k维特征的数据集。
根据本发明优选的,步骤(4)中,利用PCA算法将步骤(3)得到的展开的局部模型梯度的向量形式降维到二维或者三维,即k的取值为2或3。
根据本发明优选的,步骤(5)中,DBSCAN聚类方法的具体的过程为:
1)找到所有核心点,点为N个经过PCA降维后的k维向量:
当点的局部密度大于设定阈值时,则该点为核心点,然后进行步骤2);
2)对于一个未处理的核心点,将未处理的核心点与其邻域内的点形成一个新的类C;
3)将邻域内的点插入队列中;
4)判断队列是否为空:
当队列不为空,则从队列中任意删除一个点,然后进行步骤5);
当队列为空,则进行步骤6);
5)判断删除的点是否为核心点:
当删除的点的局部密度大于设定阈值,则标记删除点为核心点,并将该删除点邻域内未分配的点分配给类C,并插入队列中;然后,重复步骤4)至步骤5),直至队列为空;
当删除的点的局部密度小于设定阈值,则删除的点为边界点;然后,重复步骤4)至步骤5),直至队列为空;
6)判断所有核心点是否均已处理完毕:
当所有核心点判断完毕,则将所有未处理的点标记为噪声点,然后结束;如果点不属于核心点也不属于边界点,称点为噪声点;
否则,重复步骤2)-6),直至所有点处理完毕。
应用DBSCAN算法时,需要估计数据集中特定点的密度,特定点的密度是通过计算该点在指定半径下数据点个数(包括特定点),这种计算得到的某个点的密度也被称为局部密度。计算数据集中每个点的密度时,我们需要把每个点归为以下三类:1.如果点的局部密度大于某个阈值,称这个点为核心点。2.如果点的局部密度小于某个阈值,但是它落在核心点的邻域内,称这个点为边界点。3.如果点不属于核心点也不属于边界点,称点为噪声点。除了标记数据集中每个点的类别,我们要做的是根据类别将每个样本进行聚类。对于同一个还未分配的核心点,我们将它邻域内的所有点归为一个新的类,如果邻域内有其他核心点的话,我们将重复上面相同情况的动作。
一种联邦学习中基于局部模型梯度的用户筛选系统,包括向量展开模块、降维模块、聚类模块;
向量展开模块用于将局部模型梯度按行或按列展开成为向量形式;
降维模块用于利用PCA算法对向量展开模块展开的局部模型梯度的向量形式进行降维;
聚类模块用于利用DBSCAN聚类方法对降维模块得到的降维局部模型梯度进行聚类,根据欧式距离选取距离最近的M个用户更新本代联邦学习训练过程的全局模型,并将更新的全局模型广播给用户。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现联邦学习中基于局部模型梯度的用户筛选方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现联邦学习中基于局部模型梯度的用户筛选方法的步骤。
本发明的有益效果为:
本发明针对联邦学习中可能出现的用户数据质量良莠不齐或存在恶意攻击的情况,提出了一种基于局部梯度模型分析用户数据质量进而进行用户筛选的方法,服务器通过对用户传输过来的局部模型梯度参数进行展开、降维、聚类,能够有效选择基于高质量数据训练的局部模型梯度,识别并消除噪声用户和恶意用户的局部模型模型梯度的影响,增强系统的鲁棒性,提升模型的收敛速度,提高模型的识别或预测的准确度。利用本发明提供的筛选用户方法,联邦学习的性能能够达到无噪声用户和恶意用户干扰情况下的水平。
附图说明
图1是联邦学习训练过程的系统示意图;
图2是DBSCAN聚类方法的流程框图;
图3是实施例1中联邦学习第1代所有用户需要传输给服务器的梯度的PCA降维到两维的结果分布图;
图4是实施例1中联邦学习第10代所有用户需要传输给服务器的梯度的PCA降维到两维的结果分布图;
图5是实施例中联邦学习第20代所有用户需要传输给服务器的梯度的PCA降维到两维的结果分布图;
图6是实施例中联邦学习第30代所有用户需要传输给服务器的梯度的PCA降维到两维的结果分布图;
图7是训练MNIST数据集时分别在无噪声用户和恶意用户,有噪声用户和恶意用户但不识别,有噪声用户和恶意用户且利用本发明的提供的方法识别的平均训练损失曲线对比图;
图8是训练MNIST数据集时分别在无噪声用户和恶意用户,有噪声用户和恶意用户但随机选择,有噪声用户和恶意用户且利用本发明的提供的方法识别的平均训练准确度曲线对比图。
具体实施方式
下面结合实施例和说明书附图对本发明做进一步说明,但不限于此。
实施例1
一种联邦学习中基于局部模型梯度的用户筛选方法,通过分析用户梯度的分布选择更准确的局部模型,联邦学习中包括服务器和N个用户,每个用户分别与服务器相连接,该用户筛选方法的具体步骤包括:
(1)服务器初始化全局模型参数,并将全局模型参数广播给所有参与到联邦学习过程的N个用户;
(2)用户接收到全局模型参数后,利用用户持有的数据集更新局部模型参数,然后将用户的局部模型梯度传输给服务器;
步骤(2)中,利用用户持有的数据集,使用随机梯度下降法得到用户的局部模型梯度。
(3)服务器将N个局部模型梯度
Figure BDA0003121330410000081
均按行或按列展开成为向量形式,向量的维数与局部模型的参数
Figure BDA0003121330410000082
中的元素个数相同;
(4)为了方便依据展开的向量对用户数据进行测评,服务器利用PCA算法对步骤(3)得到的展开的局部模型梯度的向量形式进行降维,从而减小展开的向量的长度;
具体过程包括:
4-1、输入数据集X={x1,x2,x3…xN},xi表示第i个用户的局部模型梯度对应的展开的向量,i=1,2,3,…N;
4-2、去中心化:计算数据集X的均值Xmean,然后将X的每个元素减去Xmean得到去中心化数据集Xnew
4-3、求去中心化数据集Snew的协方差矩阵Cov
4-4、计算协方差矩阵Cov的特征值及特征值对应的特征向量;
4-5、选取从大到小的k个特征值对应的特征向量分别作为列向量组成特征向量矩阵W,k表示维度数;
4-6、计算XnewW,即把去中心化数据集Xnew投影到所选取的特征向量上,得到的XnewW即为降为k维特征的数据集。
为了减少计算量,k可以在不影响识别的前提下尽可能的小,本实施例中,k等于2。
(5)服务器利用DBSCAN聚类方法对步骤(4)得到的N个降维局部模型梯度进行聚类,然后求聚类结果中数量最多的一类降维局部模型梯度的平均值,即降维局部模型梯度中心
Figure BDA0003121330410000083
步骤(5)中,DBSCAN聚类方法的具体的过程为:
1)找到所有核心点,点为N个经过PCA降维后的k维向量:
当点的局部密度大于设定阈值时,则该点为核心点,然后进行步骤2);
2)对于一个未处理的核心点,将未处理的核心点与其邻域内的点形成一个新的类C;
3)将邻域内的点插入队列中;
4)判断队列是否为空:
当队列不为空,则从队列中任意删除一个点,然后进行步骤5);
当队列为空,则进行步骤6);
5)判断删除的点是否为核心点:
当删除的点的局部密度大于设定阈值,则标记删除点为核心点,并将该删除点邻域内未分配的点分配给类C,并插入队列中;然后,重复步骤4)至步骤5),直至队列为空;
当删除的点的局部密度小于设定阈值,则删除的点为边界点;然后,重复步骤4)至步骤5),直至队列为空;
6)判断所有核心点是否均已处理完毕:
当所有核心点判断完毕,则将所有未处理的点标记为噪声点,然后结束;如果点不属于核心点也不属于边界点,称点为噪声点;
否则,重复步骤2)-6),直至所有点处理完毕。
应用DBSCAN算法时,需要估计数据集中特定点的密度,特定点的密度是通过计算该点在指定半径下数据点个数(包括特定点),这种计算得到的某个点的密度也被称为局部密度。计算数据集中每个点的密度时,我们需要把每个点归为以下三类:1.如果点的局部密度大于某个阈值,称这个点为核心点。2.如果点的局部密度小于某个阈值,但是它落在核心点的邻域内,称这个点为边界点。3.如果点不属于核心点也不属于边界点,称点为噪声点。除了标记数据集中每个点的类别,我们要做的是根据类别将每个样本进行聚类。对于同一个还未分配的核心点,我们将它邻域内的所有点归为一个新的类,如果邻域内有其他核心点的话,我们将重复上面相同情况的动作。
(6)计算每个用户的降维局部模型梯度到降维局部模型梯度中心
Figure BDA0003121330410000091
的欧式距离;
(7)根据步骤(6)计算得到的欧式距离,选取距离最近的M个用户;M为用户数量N的60%到80%;
(8)利用选取的M个用户的局部模型梯度
Figure BDA0003121330410000101
更新本代联邦学习训练过程的全局模型
Figure BDA0003121330410000102
并将更新的全局模型广播给用户,全局模型
Figure BDA0003121330410000103
满足:
Figure BDA0003121330410000104
式(I)中,
Figure BDA0003121330410000105
表示第t-1代联邦学习的全局模型,
Figure BDA0003121330410000106
表示第t代联邦学习的全局模型;
(9)重复执行步骤(2)-步骤(8),直至模型收敛。
本实例中所用到的数据集是MNIST手写数据集,用联邦学习的方法训练用于分类MNIST手写数据集的卷积神经网络,该卷积神经网络包含依次连接的两个卷积池化层和两个全连接层。
联邦学习中包括服务器和N个用户;本实施例中,用户总数N为25个,正常用户的个数Na=15,噪声用户的个数Nb=5,恶意用户的个数Nc=5,噪声用户持有的数据集图片是存在噪声干扰的图片,恶意用户持有的数据集图片是纯高斯噪声图片。每个用户持有1000张用于训练的MNIST手写数据集图片,并且数据服从独立同分布。
局部模型采用随机梯度下降法更新模型,学习率lr=0.01;
全局模型是利用降维局部梯度离聚类中心最近的10个用户的平均梯度来更新,共进行30代。
图3、图4、图5、图6是实例中联邦学习第1、10、20、30代所有用户需要传输给服务器的局部模型梯度经过PCA降维到两维的结果分布图,横纵坐标表示局部模型梯度利用PCA降维得到的两维特征,加号表示正常用户的局部模型梯度,圆点表示噪声用户的局部模型梯度,方点表示恶意用户的局部模型梯度。
在利用PCA进行降维后,正常用户、噪声用户以及恶意用户的局部模型梯度在空间上存在明显的差异,因此比较适合利用本发明进行用户选择。
表1为联邦学习中每一代利用本发明方法筛选用户的结果,由于真实情况下噪声用户和恶意用户可能出现在联邦学习的任意一代,因此为了模拟真实情况,在此实例中每一代都有15个正常用户和5个噪声用户,5个恶意用户,更新全局模型时只用降维局部梯度离聚类中心最近的10个用户的局部模型梯度。
表1
Figure BDA0003121330410000111
由表1可知,利用本发明提供的筛选方法筛选用户时,对噪声用户的剔除率达到了平均67%,对恶意用户的剔除率达到了100%。
图7给出了联邦学习实例中训练MNIST数据集时分别在无噪声用户和恶意用户,有噪声模型和恶意用户但随机选择,有噪声模型和恶意用户且利用本发明选择用户的平均训练损失曲线图;横坐标是联邦学习代数,纵坐标是平均训练损失。图8给出了联邦学习实例中训练MNIST数据集时分别在无噪声用户和恶意用户,有噪声模型和恶意用户但随机选择,有噪声模型和恶意用户且利用本发明选择用户的平均训练准确度曲线图;横坐标是联邦学习代数,纵坐标是平均训练准确度。由图7和图8看出,当存在噪声用户和恶意用户影响训练过程时,利用本发明筛选用户,联邦学习的性能能够达到无噪声用户和恶意用户干扰情况下的水平。
实施例2
一种联邦学习中基于局部模型梯度的用户筛选系统,用于实现实施例1提供的一种联邦学习中基于局部模型梯度的用户筛选方法,包括向量展开模块、降维模块、聚类模块;
向量展开模块用于将局部模型梯度按行或按列展开成为向量形式;
降维模块用于利用PCA算法对向量展开模块展开的局部模型梯度的向量形式进行降维;
聚类模块用于利用DBSCAN聚类方法对降维模块得到的降维局部模型梯度进行聚类,根据欧式距离选取距离最近的M个用户更新本代联邦学习训练过程的全局模型,并将更新的全局模型广播给用户。
实施例3
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现实施例1提供的联邦学习中基于局部模型梯度的用户筛选方法的步骤。
实施例4
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现实施例1提供的联邦学习中基于局部模型梯度的用户筛选方法的步骤。

Claims (8)

1.一种联邦学习中基于局部模型梯度的用户筛选方法,其特征在于,联邦学习中包括服务器和N个用户,该用户筛选方法的具体步骤包括:
(1)服务器初始化全局模型参数,并将全局模型参数广播给所有参与到联邦学习过程的N个用户;
(2)用户接收到全局模型参数后,利用用户持有的数据集更新局部模型参数,然后将用户的局部模型梯度传输给服务器;
(3)服务器将N个局部模型梯度
Figure FDA0003782336120000019
i=1,2……N,均按行或按列展开成为向量形式,向量的维数与局部模型的参数
Figure FDA00037823361200000110
中的元素个数相同;
(4)服务器利用PCA算法对步骤(3)得到的展开的局部模型梯度的向量形式进行降维;
(5)服务器利用DBSCAN聚类方法对步骤(4)得到的N个降维局部模型梯度进行聚类,然后求聚类结果中数量最多的一类降维局部模型梯度的平均值,即降维局部模型梯度中心
Figure FDA0003782336120000011
(6)计算每个用户的降维局部模型梯度到降维局部模型梯度中心
Figure FDA0003782336120000012
的欧式距离;
(7)根据步骤(6)计算得到的欧式距离,选取距离最近的M个用户;
(8)利用选取的M个用户的局部模型梯度
Figure FDA0003782336120000013
j=1,2……M,更新本代联邦学习训练过程的全局模型
Figure FDA0003782336120000014
并将更新的全局模型广播给用户,全局模型
Figure FDA0003782336120000015
满足:
Figure FDA0003782336120000016
式(I)中,
Figure FDA0003782336120000017
表示第t-1代联邦学习的全局模型,
Figure FDA0003782336120000018
表示第t代联邦学习的全局模型;
(9)重复执行步骤(2)-步骤(8),直至模型收敛。
2.根据权利要求1所述的一种联邦学习中基于局部模型梯度的用户筛选方法,其特征在于,步骤(2)中,利用用户持有的数据集,使用随机梯度下降法得到用户的局部模型梯度。
3.根据权利要求1所述的一种联邦学习中基于局部模型梯度的用户筛选方法,其特征在于,步骤(4)中,服务器利用PCA算法对步骤(3)得到的展开的局部模型梯度的向量形式进行降维,具体过程包括:
4-1、输入数据集X={x1,x2,x3…xN},xi表示第i个用户的局部模型梯度对应的展开的向量,i=1,2,3,...N;
4-2、去中心化:计算数据集X的均值Xmean,然后将X的每个元素减去Xmean得到去中心化数据集Xnew
4-3、求去中心化数据集Xnew的协方差矩阵Cov
4-4、计算协方差矩阵Cov的特征值及特征值对应的特征向量;
4-5、选取从大到小的k个特征值对应的特征向量分别作为列向量组成特征向量矩阵W,k表示维度数;
4-6、计算XnewW,即把去中心化数据集Xnew投影到所选取的特征向量上,得到的XnewW即为降为k维特征的数据集。
4.根据权利要求3述的一种联邦学习中基于局部模型梯度的用户筛选方法,其特征在于,步骤(4)中,利用PCA算法将步骤(3)得到的展开的局部模型梯度的向量形式降维到二维或者三维,即k的取值为2或3。
5.根据权利要求1所述的一种联邦学习中基于局部模型梯度的用户筛选方法,其特征在于,步骤(5)中,DBSCAN聚类方法的具体的过程为:
1)找到所有核心点,点为N个经过PCA降维后的k维向量:
当点的局部密度大于设定阈值时,则该点为核心点,然后进行步骤2);
2)对于一个未处理的核心点,将未处理的核心点与其邻域内的点形成一个新的类C;
3)将邻域内的点插入队列中;
4)判断队列是否为空:
当队列不为空,则从队列中任意删除一个点,然后进行步骤5);
当队列为空,则进行步骤6);
5)判断删除的点是否为核心点:
当删除的点的局部密度大于设定阈值,则标记删除点为核心点,并将该删除点邻域内未分配的点分配给类C,并插入队列中;然后,重复步骤4)至步骤5),直至队列为空;
当删除的点的局部密度小于设定阈值,则删除的点为边界点;然后,重复步骤4)至步骤5),直至队列为空;
6)判断所有核心点是否均已处理完毕:
当所有核心点判断完毕,则将所有未处理的点标记为噪声点,然后结束;
否则,重复步骤2)-6),直至所有点处理完毕。
6.一种联邦学习中基于局部模型梯度的用户筛选系统,其特征在于,包括向量展开模块、降维模块、聚类模块;
向量展开模块用于将局部模型梯度按行或按列展开成为向量形式;
降维模块用于利用PCA算法对向量展开模块展开的局部模型梯度的向量形式进行降维;
聚类模块用于利用DBSCAN聚类方法对降维模块得到的降维局部模型梯度进行聚类,选取降维局部模型梯度到降维局部模型梯度中心
Figure FDA0003782336120000031
的欧式距离中最近的M个用户更新本代联邦学习训练过程的全局模型,并将更新的全局模型广播给用户。
7.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5任一项所述的联邦学习中基于局部模型梯度的用户筛选方法的步骤。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的联邦学习中基于局部模型梯度的用户筛选方法的步骤。
CN202110677368.1A 2021-06-18 2021-06-18 一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质 Active CN113344220B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110677368.1A CN113344220B (zh) 2021-06-18 2021-06-18 一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110677368.1A CN113344220B (zh) 2021-06-18 2021-06-18 一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113344220A CN113344220A (zh) 2021-09-03
CN113344220B true CN113344220B (zh) 2022-11-11

Family

ID=77476349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110677368.1A Active CN113344220B (zh) 2021-06-18 2021-06-18 一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113344220B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114821143B (zh) * 2022-05-11 2024-05-03 国网上海市电力公司 一种基于K-Means模型的充电桩用户画像方法
CN115545215B (zh) * 2022-10-18 2023-10-27 上海零数众合信息科技有限公司 一种去中心化的联邦聚类学习方法、装置、设备及介质
CN117596592A (zh) * 2023-12-01 2024-02-23 广西大学 一种基于区块链的无人机联邦学习的梯度选择方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969198A (zh) * 2019-11-24 2020-04-07 广东浪潮大数据研究有限公司 深度学习模型的分布式训练方法、装置、设备及存储介质
CN112256874A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 模型训练方法、文本分类方法、装置、计算机设备和介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528862A (zh) * 2016-11-30 2017-03-22 四川用联信息技术有限公司 基于改进的均值中心算法实现搜索引擎关键词优化
WO2020229684A1 (en) * 2019-05-16 2020-11-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concepts for federated learning, client classification and training data similarity measurement
CN112235384B (zh) * 2020-10-09 2023-10-31 腾讯科技(深圳)有限公司 分布式系统中的数据传输方法、装置、设备及存储介质
CN112465626B (zh) * 2020-11-24 2023-08-29 平安科技(深圳)有限公司 基于客户端分类聚合的联合风险评估方法及相关设备
CN112364943B (zh) * 2020-12-10 2022-04-22 广西师范大学 一种基于联邦学习的联邦预测方法
CN112434758B (zh) * 2020-12-17 2024-02-13 浙江工业大学 基于聚类的联邦学习搭便车攻击防御方法
CN112712182B (zh) * 2021-03-29 2021-06-01 腾讯科技(深圳)有限公司 一种基于联邦学习的模型训练方法、装置及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969198A (zh) * 2019-11-24 2020-04-07 广东浪潮大数据研究有限公司 深度学习模型的分布式训练方法、装置、设备及存储介质
CN112256874A (zh) * 2020-10-21 2021-01-22 平安科技(深圳)有限公司 模型训练方法、文本分类方法、装置、计算机设备和介质

Also Published As

Publication number Publication date
CN113344220A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN113344220B (zh) 一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
CN110532859B (zh) 基于深度进化剪枝卷积网的遥感图像目标检测方法
CN109271960B (zh) 一种基于卷积神经网络的人数统计方法
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN111479231B (zh) 一种用于毫米波大规模mimo系统的室内指纹定位方法
CN110852267B (zh) 基于光流融合型深度神经网络的人群密度估计方法及装置
Zhao et al. Band-subset-based clustering and fusion for hyperspectral imagery classification
CN109671070B (zh) 一种基于特征加权和特征相关性融合的目标检测方法
WO2020114378A1 (zh) 视频水印的识别方法、装置、设备及存储介质
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN112910811A (zh) 基于联合学习的噪声水平未知条件下的盲调制识别方法和装置
CN107194344A (zh) 自适应骨骼中心的人体行为识别方法
CN107277773B (zh) 联合多种情景模式的自适应定位方法
CN112329784A (zh) 一种基于时空感知及多峰响应的相关滤波跟踪方法
CN115393666A (zh) 图像分类中基于原型补全的小样本扩充方法及系统
Haindl et al. Model-based texture segmentation
CN116980824B (zh) 一种轻量化的加权集成学习室内csi定位方法
CN114973350B (zh) 一种源域数据无关的跨域人脸表情识别方法
CN114724245B (zh) 基于csi的增量学习人体动作识别方法
CN113963178A (zh) 地空背景下红外弱小目标检测方法、装置、设备及介质
CN109545201B (zh) 基于深层混合因子分析的声学模型的构建方法
CN103093184A (zh) 一种基于列向量展开二维主成分分析的人脸识别方法
CN112287989B (zh) 一种基于自注意力机制的航空影像地物分类方法
CN113327461B (zh) 一种协作式无人机检测方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant