CN113762533A - 无线边缘网络中对数据污染具有鲁棒性的联邦学习方法 - Google Patents
无线边缘网络中对数据污染具有鲁棒性的联邦学习方法 Download PDFInfo
- Publication number
- CN113762533A CN113762533A CN202111052964.7A CN202111052964A CN113762533A CN 113762533 A CN113762533 A CN 113762533A CN 202111052964 A CN202111052964 A CN 202111052964A CN 113762533 A CN113762533 A CN 113762533A
- Authority
- CN
- China
- Prior art keywords
- client
- global
- parameters
- order momentum
- momentum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
Description
技术领域
本发明属于联邦学习领域,具体涉及无线边缘网络中客户端数据集受污染时的联邦学习方法,在客户端数据受污染时具有鲁棒性,仍能使模型获得较好的性能。
背景技术
数据是机器学习的基础,作为人工智能的主要方向,机器学习需要数据去训练人工智能模型。而在大多数行业中,由于行业竞争、隐私安全、行政手续复杂等问题,数据常常是以孤岛的形式存在的,而只利用数据孤岛内的数据训练所得的人工智能模型性能往往不能满足任务需求。针对数据孤岛和数据隐私的两难问题,联邦学习方法框架应运而生。
在联邦学习方法框架下,有多个相互独立的客户端和一个中心服务器,客户端有不同且不可共享的本地数据。训练过程中,服务器向客户端广播全局参数,客户端将更新下载得到的全局模型参数用于自己的数据集上进行训练,然后只上传本地参数到服务器进行聚合,经过多次“下载-训练-上传-聚合”的过程得到最终模型参数。显然,在联邦学习框架下客户端的数据得到了保护,数据孤岛的问题也得以解决。
联邦学习方法的经典方法是联邦平均,在每个客户端上传参数至服务器后,服务器对局部参数进行加权平均,得到全局参数后服务器再将全局参数广播给各客户端。Adam算法作为SGD的一种变形,具有收敛速度快、超参数易调整的优点。利用梯度信息求取一阶、二阶动量可以使参数快速收敛,并且使学习率自适应调整,因此Adam算法被广泛应用于联邦学习方法的本地训练中。但是,在实际场景中,本地客户端的数据集若由于网络攻击或其他原因受到污染,训练过程中计算得到的随机梯度必然有异常值产生。而Adam算法在参数更新时由于一阶、二阶动量对梯度值的依赖性,使其对异常值的鲁棒性极差。此外,不同的客户端训练生成的本地模型通常具有差异性,在这种差异性下聚合得到的全局模型性能不稳定。
发明内容
有鉴于此,本发明提供一种无线边缘网络中的对数据污染具有鲁棒性的联邦学习方法,以提高算法面对有毒数据时的鲁棒性,并减少由本地模型差异性造成的性能影响。
具体技术方案如下:
一种无线边缘网络中对数据污染具有鲁棒性的联邦学习方法,包括以下步骤:
步骤一:搭建用于学习的模型结构,并初始化全局参数,包括:全局模型参数、全局一阶动量、全局二阶动量;
步骤二:中心服务器将全局参数广播至无线边缘网络的客户端,客户端以全局参数作为本轮训练的初始值;
步骤七:重复步骤三至步骤六,直至迭代次数达到预设迭代阈值;
步骤九:中心服务器接收所述客户端的本地参数并进行参数聚合,得到更新后的全局参数xt、mt、vt;
步骤十:重复步骤二至步骤九,直至全局模型性能达到要求。
步骤二中所述客户端以全局参数作为本轮训练的初始值表示如下:
其中,下标i表示第i个客户端,上标t′表示本轮训练的初始时刻,xt′为初始时刻全局模型参数,mt′为初始时刻全局一阶动量,vt′为初始时刻全局二阶动量。
其中,下标i表示第i个客户端,上标t表示当前迭代时刻,d为向量维度,下标j表示向量的第j个分量,g表示梯度值,m表示一阶动量,v表示二阶动量,梯度值 为t时刻第i个客户端的随机采样数据,Di为第i个客户端的本地数据集,为t-1时刻第i个客户端的模型参数,fi为第i个客户端的本地损失函数。
其中γ为预设常数。
其中,vt′为初始时刻全局二阶动量,α为预设全局学习率。
其中,pi为第i个客户端的权重,N为客户端的数量。
本发明与现有技术相比所具有的有益效果:
1.本发明利用偏差系数对异常梯度值进行检测,并且在出现异常值时对更新方向进行控制。具体表现为:当为异常值时,趋近于1,则进而使模型参数更新方向不受异常值影响,体现了本发明对异常梯度值的鲁棒性,从而降低了有毒数据对模型性能的影响。
2.本发明利用使算法在迭代后期计算二阶动量并利用其调整学习率时减少对梯度值的依赖,训练后期趋近于1,使二阶动量满足保证了训练后期梯度值较小造成学习率过大的问题,同时也排除了异常值的影响,体现了本发明对异常梯度值的鲁棒性,并提高了模型的性能。
3.本发明将全局二阶动量作为更新步长的分母,在不同的客户端的本地训练过程中使用相同的学习率,更新过程中本地模型差异变小,使模型性能更稳定。
附图说明
图1为本发明无线边缘网络的结构示意图。
图2为本发明无线边缘网络中的对数据污染具有鲁棒性的联邦学习方法的流程图。
图3为本发明方法与现有技术实验结果对比。
具体实施方式
下面结合附图和实施例对本发明进行进一步的详细介绍。
图1为本发明无线边缘网络的系统结构图,包括一个中心服务器和N个客户端,数据分布在N个客户端中,客户端与服务器只传递参数不传递数据,其中服务器采用全局模型,客户端采用本地模型;为获得性能更好的全局模型,采用联邦学习进行模型训练。
图2为本发明无线边缘网络中的对数据污染具有鲁棒性的联邦学习方法的流程图。开始时对全局参数进行初始化并进行广播,N个客户端利用下载到的参数在本地数据集上进行本地训练。经过本地训练后,客户端将本地参数上传至服务器进行参数的加权平均,并对此时所得全局模型进行评估,若满足性能要求则算法结束,否则继续循环。具体包括以下步骤:
步骤一:搭建用于学习的模型结构,并初始化全局参数,包括:全局模型参数、全局一阶动量、全局二阶动量;
步骤二:中心服务器将全局参数广播至无线边缘网络的客户端设备,客户端以全局参数作为本轮训练的初始值;
步骤七:重复步骤三至步骤六,直至迭代次数达到预设迭代阈值;
步骤九:中心服务器接收各客户端的本地参数并进行参数聚合,得到更新后的全局参数xt、mt、vt;
步骤十:重复步骤二至步骤九,直至全局模型性能达到要求。
以下对本地训练的过程进行说明:
本地训练开始时客户端获取全局参数,包括全局模型参数、全局一阶动量、全局二阶动量,作为本地训练的初始参数值:
其中,下标i表示第i个客户端,上标t′表示本轮训练的初始时刻,xt′为初始时刻全局模型参数,mt′为初始时刻全局一阶动量,vt′为初始时刻全局二阶动量。。
以第i个客户端为例,在每次迭代开始时在本地数据集内进行随机采样得到部分数据,并计算梯度值 为t时刻第i个客户端的随机采样数据,Di为第i个客户端的本地数据集,为t-1时刻第i个客户端的模型参数,fi为第i个客户端的本地损失函数。利用此梯度值与上一步一阶动量构建下式得到
由此可见,当异常梯度值出现时,与差异性增大,则趋近于1,此时受影响减小,保证了更新方向不受异常值影响,故异常值得以控制。同时,当训练步入后期,趋近于1,这保证了在参数接近最优值时学习率不会因异常值出现而过大或过小,也增强了算法鲁棒性。
在更新本地参数时,采用全局二阶动量作为学习率的分母,这保证了不同客户端有相同的更新步长,使不同客户端的本地模型差异性减小,进而提升全局模型的性能。
当本地迭代次数达到预设值时上传本地参数并进行模型融合:
其中,pi为第i个客户端的权重。
实际中,将MNIST手写数字训练集平均分配至十个客户端,同时以50%的概率在每张图片one-hot标签加上均值为0、方差为0.4的高斯噪声,训练逻辑回归模型。全局模型在测试集上的结果如图3所示,本发明所提出的方法准确度与稳定性都优于现有技术。通过本实例所述方法,实现了在受污染数据集下进行模型训练,最大程度的消除了有毒数据对模型性能的影响,精度高并具有稳定性。
以上所述仅为本发明的具体实施方式,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种无线边缘网络中对数据污染具有鲁棒性的联邦学习方法,其特征在于,包括以下步骤:
步骤一:搭建用于学习的模型结构,并初始化全局参数,包括:全局模型参数、全局一阶动量、全局二阶动量;
步骤二:中心服务器将全局参数广播至无线边缘网络的客户端,客户端以全局参数作为本轮训练的初始值;
步骤七:重复步骤三至步骤六,直至迭代次数达到预设迭代阈值;
步骤九:中心服务器接收所述客户端的本地参数并进行参数聚合,得到更新后的全局参数xt、mt、vt;
步骤十:重复步骤二至步骤九,直至全局模型性能达到要求。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111052964.7A CN113762533B (zh) | 2021-09-07 | 2021-09-07 | 无线边缘网络中对数据污染具有鲁棒性的联邦学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111052964.7A CN113762533B (zh) | 2021-09-07 | 2021-09-07 | 无线边缘网络中对数据污染具有鲁棒性的联邦学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113762533A true CN113762533A (zh) | 2021-12-07 |
CN113762533B CN113762533B (zh) | 2023-06-06 |
Family
ID=78794099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111052964.7A Active CN113762533B (zh) | 2021-09-07 | 2021-09-07 | 无线边缘网络中对数据污染具有鲁棒性的联邦学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113762533B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114422605A (zh) * | 2022-01-12 | 2022-04-29 | 重庆邮电大学 | 一种基于联邦学习的通信梯度自适应压缩方法 |
CN114925829A (zh) * | 2022-07-18 | 2022-08-19 | 山东海量信息技术研究院 | 一种神经网络训练方法、装置、电子设备及存储介质 |
CN116204925A (zh) * | 2023-03-13 | 2023-06-02 | 无锡学院 | 一种强鲁棒性智慧城市边缘计算数据安全系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200027033A1 (en) * | 2018-07-19 | 2020-01-23 | Adobe Inc. | Updating Machine Learning Models On Edge Servers |
CN112532451A (zh) * | 2020-11-30 | 2021-03-19 | 安徽工业大学 | 基于异步通信的分层联邦学习方法、装置、终端设备及存储介质 |
CN112637883A (zh) * | 2020-12-09 | 2021-04-09 | 深圳智芯微电子科技有限公司 | 电力物联网中对无线环境变化具有鲁棒性的联邦学习方法 |
CN113011599A (zh) * | 2021-03-23 | 2021-06-22 | 上海嗨普智能信息科技股份有限公司 | 基于异构数据的联邦学习系统 |
-
2021
- 2021-09-07 CN CN202111052964.7A patent/CN113762533B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200027033A1 (en) * | 2018-07-19 | 2020-01-23 | Adobe Inc. | Updating Machine Learning Models On Edge Servers |
CN112532451A (zh) * | 2020-11-30 | 2021-03-19 | 安徽工业大学 | 基于异步通信的分层联邦学习方法、装置、终端设备及存储介质 |
CN112637883A (zh) * | 2020-12-09 | 2021-04-09 | 深圳智芯微电子科技有限公司 | 电力物联网中对无线环境变化具有鲁棒性的联邦学习方法 |
CN113011599A (zh) * | 2021-03-23 | 2021-06-22 | 上海嗨普智能信息科技股份有限公司 | 基于异构数据的联邦学习系统 |
Non-Patent Citations (1)
Title |
---|
董业;侯炜;陈小军;曾帅;: "基于秘密分享和梯度选择的高效安全联邦学习", 计算机研究与发展, no. 10 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114422605A (zh) * | 2022-01-12 | 2022-04-29 | 重庆邮电大学 | 一种基于联邦学习的通信梯度自适应压缩方法 |
CN114925829A (zh) * | 2022-07-18 | 2022-08-19 | 山东海量信息技术研究院 | 一种神经网络训练方法、装置、电子设备及存储介质 |
CN116204925A (zh) * | 2023-03-13 | 2023-06-02 | 无锡学院 | 一种强鲁棒性智慧城市边缘计算数据安全系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113762533B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113762533A (zh) | 无线边缘网络中对数据污染具有鲁棒性的联邦学习方法 | |
CN113011599B (zh) | 基于异构数据的联邦学习系统 | |
CN112344944B (zh) | 一种引入人工势场的强化学习路径规划方法 | |
CN109496305B (zh) | 一种社交网络舆论演变方法 | |
CN113470089B (zh) | 一种基于三维点云的跨域协同定位和建图方法及系统 | |
CN104616060B (zh) | 基于bp神经网络和模糊逻辑的绝缘子污秽度预测方法 | |
Martinez-Gil et al. | Multi-agent reinforcement learning for simulating pedestrian navigation | |
CN107301657B (zh) | 一种考虑目标运动信息的视频目标跟踪方法 | |
CN106447674A (zh) | 一种视频的背景去除方法 | |
CN112766603B (zh) | 一种交通流量预测方法、系统、计算机设备及存储介质 | |
CN111935303A (zh) | 空地一体化车联网中基于意图感知的任务卸载方法 | |
CN112468230A (zh) | 一种基于深度学习的无线紫外光散射信道估计方法 | |
US7529651B2 (en) | Accurate linear parameter estimation with noisy inputs | |
CN109000638A (zh) | 一种小视场星敏感器量测延时滤波方法 | |
Cicek et al. | Off-policy correction for deep deterministic policy gradient algorithms via batch prioritized experience replay | |
CN114494771B (zh) | 一种可防御后门攻击的联邦学习图像分类方法 | |
CN108810823A (zh) | 针对无线传感网络协作定位的协同修正信息筛选方法 | |
Notsu et al. | Optimization of learning cycles in online reinforcement learning systems | |
CN115685128B (zh) | 一种机动目标场景下的雷达目标跟踪算法及电子设备 | |
CN116259057A (zh) | 基于联盟博弈解决联邦学习中数据异质性问题的方法 | |
CN113591716B (zh) | 基于分数阶蚁群算法优化神经网络的法庭监控人脸识别方法 | |
US20240014953A1 (en) | Method for estimating bit error probability using error rate ratio of frame synchronization word | |
CN115510986A (zh) | 一种基于AdvGAN的对抗样本生成方法 | |
CN104134091B (zh) | 一种神经网络训练方法 | |
CN110501903B (zh) | 机器人免逆解控制系统参数的自调节及优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |