CN115713009A - 一种基于卫星和地面站连接密度的动态聚合联邦学习方法 - Google Patents
一种基于卫星和地面站连接密度的动态聚合联邦学习方法 Download PDFInfo
- Publication number
- CN115713009A CN115713009A CN202211487222.1A CN202211487222A CN115713009A CN 115713009 A CN115713009 A CN 115713009A CN 202211487222 A CN202211487222 A CN 202211487222A CN 115713009 A CN115713009 A CN 115713009A
- Authority
- CN
- China
- Prior art keywords
- satellite
- model
- local
- ground station
- aggregation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Radio Relay Systems (AREA)
Abstract
本发明公开了一种基于卫星和地面站连接密度的动态聚合联邦学习方法,包括以下步骤:在第i轮,当卫星与地面站首次建立连接时,地面站发送全局模型wi;所述卫星在本地训练模型,并在下次连接时将本地的局部模型返回给地面站;当采集到的所述局部模型数量超过缓冲容量V或到预定义的时间周期T0时,所述地面站采用加权平均法更新所述全局模型。发明可以充分利用卫星的计算资源、提高了模型的鲁棒性、增加了全局模型聚合的数量或增加了聚合梯度的数量,有效地提高了模型的预测精度。
Description
技术领域
本发明涉及卫星技术领域,尤其涉及一种基于卫星和地面站连接密度的动态聚合联邦学习方法。
背景技术
近年来卫星技术的进步降低了卫星部署成本,促进了近地轨道(LEO)卫星的大规模发展。LEO卫星收集的大量图像数据增强了机器学习能力,有助于解决一些全球性问题,如气候变化、疾病传播等。
传统的基于卫星图像的机器学习通常需要地面站下载卫星生成的图像,然后地面站将数据传输到云计算平台上,训练机器学习模型。然而,从卫星上下载所有生成的原始图像数据正变得越来越不可行。
这主要是因为:(1)与地球同步卫星不同,低轨道卫星每天只与地面站通信几次,每次通信时间有限;(2)由于建立地面站的数百万美元成本和扩大的难度,下行带宽有限;(3)卫星图像通常是高分辨率的,其中可能包含了隐私信息,被下载后可能会造成隐私泄露。
为了应对这些挑战,一些学者将FL(联邦学习)应用于卫星星座。FL是一个“服务器-客户端”体系结构,其中只需要在服务器和客户端之间交换模型参数,而不需要从客户端传递原始数据。FL的概念是由McMahan等人所提出,与此同时它们将FL结合SGD(随机梯度下降)进而提出了FedAvg(the FederatedAveraging Algorithm)的概念,它是一种同步FL,简单来说FedAvg地的实现过程就是在每一轮中选择一部分客户端执行SGD,然后由中央服务器聚合该部分客户端执行后产生的结果,进而实现全局模型优化的结果。同时为了提高灵活性和可拓展性,Cong Xie等人在FL的基础上提出了一种新的异步联邦优化算法—FedAsync,它与同步联邦学习的区别在于服务器和客户端可以随时进行更新而无需同步,这在设备具有异构条件时是有利的。而针对异步FL中聚合单个客户端时可能存在的隐私安全问题,John Nguyen等人提出了一种新颖的缓冲异步聚合方法FedBuff,它与优化器的选择无关,并结合了同步和异步FL的最佳特性。在FedBuff中,客户端异步进入和完成本地训练。但是,服务器模型不会在收到每个客户端更新后立即更新。相反,客户端更新存储在缓冲区中。只有当缓冲区中所存储的更新的客户端数量满足缓冲区大小时,服务器更新才会发生,其中缓冲区的大小是一个可调参数。
在面向卫星星座的FL中,根据地面站和卫星在FL中扮演的角色不同可以将其主要分为以下两种:
(1)卫星作为客户端的联邦学习框架
Jinhyun So等学者提出了FedSpace,一个在卫星和地面站之间运行的高效FL框架。他们制定了一个优化问题,根据地面站的全局模型聚合时间表最大化模型收敛速度,该问题捕捉了该环境中卫星空闲和局部模型陈旧之间的独特权衡。为了解决这个优化问题,FedSpace首先使用卫星轨道和地球自转来计算确定性和时变卫星连接性,然后使用此信息来确定全局模型聚合计划,以便更好地在空闲和陈旧之间进行权衡。该模型使用真实世界的卫星网络和卫星图像数据集凭经验证明了他们解决方案的有效性,并且实验结果表明,与同步FL(McMahan等人,2017年)和最先进的缓冲异步FL(Nguyen等人,2021年)相比,FedSpace的训练时间在达到相同的精度下显著减少了训练时间。Nasrin Razmi和BhoMatthiesen等人考虑了LEO星座中的FL,其中卫星在不共享本地数据集的情况下协作训练ML模型。在FedAvg和FedAsync的基础上提出了一种新颖的FedAvg异步变体适应此设置,识别并解决了与地面网络相比的独特挑战。Zubair Md Fadlullah和Ne iKato为边缘节点的联邦学习模型提出了异步更新,以构建具有森林火灾检测场景的智能遥感本地AI模型。他们的提议消除了与相邻节点和/或云显式交换数据的需要。因此,他们提出的方法共同保护数据隐私,并通过有效调度深层和浅层模型参数来减轻网络开销。使用真实数据集进行了实验,通过在所考虑的集成网络的不同层模拟几个边缘节点来证明我们提出的异步联邦学习模型的性能。结果表明,与当代方法相比,他们的提议不仅在高遥感精度、低收敛时间和显著低带宽开销方面是可行的。
(2)卫星作为服务器的联邦学习框架
Quoc-VietPham、Ming Zeng等人通过集成AAN(Aeria laccess networks)、FL(federated learning),产生了一个新颖的概念,即空中FL。他们讨论了AAN在移动边缘网络中的FL应用。具体来说,我们概述了空中FL,并展示了其与固定部署AS的传统FL网络相比的优势,并分别介绍了天空模型聚合、空中中继、空中FL用户和FANET的重要应用。无线通信网络上的FL可以显着提高学习性能,以满足未来6G网络中对数据隐私和通信开销不断增长的要求。Hao Chen,Ming Xiao,和Zhibo Pang等人讨论了FL在应对基于LEO的卫星通信挑战中的作用,提出了一种在卫星上部署参数服务器而将用户设备作为客户端的联邦学习模型。通过实验评估表明,所提出的LEO卫星星座下的FL在集成MNIST数据集上具有实用的准确性,并且基于FL的方法的通信开销远小于基于CL(centralized learning)的方法。此外,我们注意到未来研究中在隐私和安全、资源管理和通信开销方面的一些挑战。
在面向卫星星座的FL中,主要存在的问题是:1.当卫星与地面站之间因连接密度过于稀疏时,会导致出现其他卫星花费大量时间等待的问题;2.当卫星和地面站的连接过于密集时,则会出现大量卫星处于空闲状态,从而导致计算资源的浪费。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于卫星和地面站连接密度的动态聚合联邦学习方法,可防止当卫星和地面站连接密集大量卫星处于空闲状态,浪费计算资源。
为了解决上述技术问题,本发明实施例提供了一种基于卫星和地面站连接密度的动态聚合联邦学习方法,该方法是在同步周期性聚合策略(SPA)的基础上具体实现的,而SPA的实施具体包括以下步骤:
S1:在第i轮,当卫星与地面站首次建立连接时,地面站发送全局模型wi;
S2:所述卫星在本地训练模型,并在下次连接时将本地的局部模型返回给地面站;
S3:当采集到的所述局部模型数量到预定义的时间周期T0时,所述地面站采用加权平均法更新所述全局模型。
其中,所述更新所述全局模型表示为:
式子中B表示本轮返回本地模型的卫星索引集,V为缓冲区的缓冲容量,a(B)为聚合指标,其中a(B)的下标SPA是Synchronous Periodic Aggregation的缩写,意为同步周期聚合;a(B)SPA=1,表示地面站可以进行本地更新聚合。
通过在SPA的基础上结合缓冲异步聚合方法FedBuff,本发明完整实现,包括以下步骤:
S1:在第i轮,当卫星与地面站首次建立连接时,地面站发送全局模型wi;
S2:所述卫星在本地训练模型,并在下次连接时将本地的局部模型返回给地面站;
S3:当采集到的所述局部模型数量超过缓冲容量V或到预定义的时间周期T0时,所述地面站采用加权平均法更新所述全局模型。
其中,所述更新所述全局模型表示为:
式子中B表示本轮返回本地模型的卫星索引集,V为缓冲区的缓冲容量,a(B)为聚合指标,其中a(B)的下标SDA是Synchronous Dynamic Aggregation的缩写,意为同步动态聚合,即本专利所提出的动态聚合联邦学习方法;a(B)SDA=1,表示地面站可以进行本地更新聚合。
3.根据权利要求2所述的基于卫星和地面站连接密度的动态聚合联邦学习方法,其特征在于,所述加权平均法包括将将全局模型在每个卫星上的本地数据集上的损失函数加权求和得到最终损失函数F(w):
其中,所述S2具体包括步骤:
所述卫星接收到全局模型后,将使用全局模型初始化局部模型,然后使用局部数据集训练模型:
其中,所述卫星使用本地数据集训练多个时期的本地模型,用于减少收敛所需的通信轮数。
其中,所述S3还包括步骤:
S31:所述地面站从所述卫星聚合局部模型参数/梯度,当满足更新条件时更新全局模型,表达式为:
其中s代表卫星下标,Β表示本轮返回本地模型的卫星索引集,|Ds|是私有数据集Ds中的记录数,H=∑S∈β|DS|则表示本轮返回本地模型的卫星索引集中的所有卫星的数据集的记录数之和,a(B)为聚合指标(a(B)=1,表示地面站可以进行本地更新聚合;
S32:所述地面站更新全球模型后,协调卫星进行下一轮训练,并发送最新的全球模型。
实施本发明实施例,具有如下有益效果:1、本发明使用同步动态聚合(SDA)结合了同步周期性聚合和同步缓冲聚合,它过在一个预先设定的时间周期内聚合本地模型一次,从而缩短了卫星连接稀疏而导致的过长更新等待时间;而在卫星连接比较密集的情况,则通过同步缓冲聚合策略充分利用起在卫星连接密集时处于空闲状态的大量卫星,充分利用卫星的计算资源;2、本发明能够更快地进行第一次全局模型的更新,提高了模型的鲁棒性;3、本发明在目标准确度所需的训练时间方面均优于其他方法;4、本发明采用动态聚合策略的同步动态聚合(SDA)增加了全局模型聚合的数量或增加了聚合梯度的数量,有效地提高了模型的预测精度。
附图说明
图1是本发明同步动态聚合的示意图;
图2是四种联邦学习方法在两种数据集分布下达到设定精度所需的最短时间的对比;
图3是独立同分布设置下的联邦学习方法在测试集上准确率随训练时间的变化图;
图4是非独立同分布设置下的联邦学习方法在测试集上准确率随训练时间的变化图;
图5是四种FL算法的全局模型更新次数和局部模型梯度数量的比较图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
结合图1所示,本发明实施例的一种基于卫星和地面站连接密度的动态聚合联邦学习方法,通过以下方法实施。
S1:在第i轮,当卫星与地面站首次建立连接时,地面站发送全局模型wi;
S2:所述卫星在本地训练模型,并在下次连接时将本地的局部模型返回给地面站;
所述卫星接收到全局模型后,将使用全局模型初始化局部模型,然后使用局部数据集训练模型:
卫星可以使用本地数据集训练多个时期的本地模型,以减少收敛所需的通信轮数。本地训练完成后,卫星在下次与地面站建立连接时上传本地模型参数/梯度到地面站。
S3:当采集到的所述局部模型数量超过缓冲容量V或到预定义的时间周期T0时,所述地面站采用加权平均法更新所述全局模型,这一过程表示为以下等式:
式子中Β表示本轮返回本地模型的卫星索引集,V为缓冲区的缓冲容量,a(B)为聚合指标,其中a(B)的下标SDA是Synchronous Dynamic Aggregation的缩写,意为同步动态聚合,即本专利所提出的动态聚合联邦学习方法;a(B)SDA=1,表示地面站可以进行本地更新聚合。
所述加权平均法包括将将全局模型在每个卫星上的本地数据集上的损失函数加权求和得到最终损失函数F(w):
其中|Ds|是私有数据集Ds中的记录数,s代表卫星下标、S代表该FL系统中所含卫星集合;fs(w)是全局模型在本地数据集|DS|上的损失函数,l(w,x)是模型w对数据样本x的训练损失,需要注意的是,地面站之间的通信延迟比星地通信延迟要低。
当卫星对地面站可见时,卫星可以与地面站建立连接。此外,由于卫星是按照给定的轨道运行的,因此可以准确地预测卫星与地面站的连接和断开时刻,通过以下通信模型实现:
设卫星轨迹为rs(t),地面站轨迹为rg(t)。当地面站g在最小仰角αmin内可以看到卫星s时,即αs,g(t)=∠(rg(t),rs(t)-rg(t))≤π/2-αmin。
其中rs(t)和rg(t)是指在地心惯性坐标系(地心惯性坐标系是指在空间保持静止或匀速直线运动(无加速度)的坐标系,它的原点取在地球中心,Z轴与地球自转轴重合,X、Y轴位于赤道平面内,分别指向本初子午线和东经90°的子午线)中的卫星轨迹和地面站轨迹,其中t是一个连续的挂钟时间。故∠(rg(t),rs(t)-rg(t))代表地面站轨迹与卫星轨迹所形成的轨迹差和地面站轨迹两者之间形成的夹角,as,g(t)与∠(rg(t),rs(t)-rg(t))之间划等号,也代表卫星与地面站之间的夹角,αmin代表地面站的最小仰角,故上式表示卫星与地面站之间夹角小于等于π/2-amin,即地面站在最小仰角内可以看见卫星s。
地面站的FL任务分为两个步骤,(1)从卫星聚合局部模型参数/梯度,当满足更新条件时更新全局模型;(2)将全球模型发送到卫星。当地面站从卫星接收到本地模型时,需要判断是否满足更新条件。如果条件满足,地面站将使用本轮收集的所有局部模型更新全局模型。相反,地面站将继续等待卫星上传本地更新。可以将上述过程表示如下:
其中s代表卫星下标,Β表示本轮返回本地模型的卫星索引集,|Ds|是私有数据集Ds中的记录数,H=∑S∈β|DS|则表示本轮返回本地模型的卫星索引集中的所有卫星的数据集的记录数之和,a(B)为聚合指标(a(B)=1,表示地面站可以进行本地更新聚合)。地面站更新全球模型后,协调卫星进行下一轮训练,发送最新的全球模型。
本发明实施例具有如下优点:
1.同步动态聚合(SDA)结合了同步周期性聚合和同步缓冲聚合,它过在一个预先设定的时间周期内聚合本地模型一次,从而缩短了卫星连接稀疏而导致的过长更新等待时间;而在卫星连接比较密集的情况,则通过同步缓冲聚合策略充分利用起在卫星连接密集时处于空闲状态的大量卫星,充分利用卫星的计算资源。
2.如图2所示,本专利所提出的同步动态聚合(SDA)能够更快地进行第一次全局模型的更新,提高了模型的鲁棒性(其中Non-IID表示非独立同分布设置,IID表示独立同分布设置)。
3.如图3、4所示在不同数据集分布设置下达到目标准确度所需的训练时间方面,同步动态聚合(SDA)优于其他方法。具体来说,在IID(独立同分布)设置中,同步动态聚合(SDA)只需6.10小时即可达到92%的准确度(比FedBuff少4倍;比FedAvg少10倍)。在非IID(非独立同分布)设置中,同步动态聚合(SDA)在12.40小时内达到78%的准确度(比FedBuff少2倍;比FedAvg少5倍)。
4.如图5所示,同步动态聚合(SDA)比同步周期聚合(SPA)具有更多的全局模型更新和更多的聚合梯度。此外,同步动态聚合(SDA)的全局模型更新数量比FedBuff高得多(大约高12%),而聚合局部梯度的数量比FedBuff略低(大约少1%)。采用动态聚合策略的同步动态聚合(SDA)增加了全局模型聚合的数量或增加了聚合梯度的数量,有效地提高了模型的预测精度。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (6)
1.一种基于卫星和地面站连接密度的动态聚合联邦学习方法,其特征在于,包括以下步骤:
S1:在第i轮,当卫星与地面站首次建立连接时,地面站发送全局模型wi;
S2:所述卫星在本地训练模型,并在下次连接时将本地的局部模型返回给地面站;
S3:当采集到的所述局部模型数量超过缓冲容量V或到预定义的时间周期T0时,所述地面站采用加权平均法更新所述全局模型。
5.根据权利要求4所述的基于卫星和地面站连接密度的动态聚合联邦学习方法,其特征在于,所述卫星使用本地数据集训练多个时期的本地模型,用于减少收敛所需的通信轮数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211487222.1A CN115713009A (zh) | 2022-11-24 | 2022-11-24 | 一种基于卫星和地面站连接密度的动态聚合联邦学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211487222.1A CN115713009A (zh) | 2022-11-24 | 2022-11-24 | 一种基于卫星和地面站连接密度的动态聚合联邦学习方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115713009A true CN115713009A (zh) | 2023-02-24 |
Family
ID=85234646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211487222.1A Pending CN115713009A (zh) | 2022-11-24 | 2022-11-24 | 一种基于卫星和地面站连接密度的动态聚合联邦学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115713009A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117411683A (zh) * | 2023-10-17 | 2024-01-16 | 中国人民解放军国防科技大学 | 基于分布式联邦学习的识别低轨卫星网络攻击方法及装置 |
CN117914382A (zh) * | 2024-01-04 | 2024-04-19 | 上海科技大学 | 一种基于星地协同传输的卫星联邦边缘学习方法 |
-
2022
- 2022-11-24 CN CN202211487222.1A patent/CN115713009A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117411683A (zh) * | 2023-10-17 | 2024-01-16 | 中国人民解放军国防科技大学 | 基于分布式联邦学习的识别低轨卫星网络攻击方法及装置 |
CN117914382A (zh) * | 2024-01-04 | 2024-04-19 | 上海科技大学 | 一种基于星地协同传输的卫星联邦边缘学习方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115713009A (zh) | 一种基于卫星和地面站连接密度的动态聚合联邦学习方法 | |
CN107343025B (zh) | 分布式卫星云雾网络架构及能耗约束下的时延优化方法 | |
CN113346944B (zh) | 空天地一体化网络中时延最小化计算任务卸载方法及系统 | |
Hashash et al. | Towards a decentralized metaverse: Synchronized orchestration of digital twins and sub-metaverses | |
US11507905B2 (en) | Satellite scheduling system | |
CN113660681B (zh) | 一种应用于无人机集群辅助传输的多智能体资源优化方法 | |
CN113518007B (zh) | 一种基于联邦学习的多物联网设备异构模型高效互学习方法 | |
Sada et al. | A distributed video analytics architecture based on edge-computing and federated learning | |
CN114584581A (zh) | 面向智慧城市物联网信物融合的联邦学习系统及联邦学习训练方法 | |
CN112469047B (zh) | 一种天地一体化智能网络卫星节点部署方法 | |
CN113312177B (zh) | 一种基于联邦学习的无线边缘计算系统、优化方法 | |
CN114710196B (zh) | 一种软件定义卫星网络虚拟网络功能迁移方法 | |
Gong et al. | Computation offloading for rechargeable users in space-air-ground networks | |
Lin et al. | Federated learning with dynamic aggregation based on connection density at satellites and ground stations | |
CN114866545B (zh) | 一种基于空中计算的半异步分层联邦学习方法及系统 | |
CN110691396B (zh) | 一种采用灰色马尔科夫模型的无人机自组网路由选择方法与系统 | |
Yapp et al. | Communication-efficient and Scalable Decentralized Federated Edge Learning. | |
Mao et al. | Digital twin satellite networks towards 6G: Motivations, challenges, and future perspectives | |
CN117829307A (zh) | 一种面向数据异构性的联邦学习方法及系统 | |
KR102416342B1 (ko) | 3차원 셀룰러 네트워크에서 간헐적 인식 연합 학습 방법 | |
Si et al. | UAV-assisted Semantic Communication with Hybrid Action Reinforcement Learning | |
CN114268966B (zh) | 一种无人机辅助mec网络低时延多任务分配方法及系统 | |
CN112738225B (zh) | 基于人工智能的边缘计算方法 | |
Seid et al. | HDFRL-empowered Energy Efficient Resource Allocation for Aerial MEC-enabled Smart City Cyber Physical System in 6G | |
Ji et al. | Research on Offloading Strategy of Twin UAVs Edge Computing Tasks for Emergency Communication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |