CN114665952A - 一种基于星地融合架构下低轨卫星网络跳波束优化方法 - Google Patents

一种基于星地融合架构下低轨卫星网络跳波束优化方法 Download PDF

Info

Publication number
CN114665952A
CN114665952A CN202210301225.5A CN202210301225A CN114665952A CN 114665952 A CN114665952 A CN 114665952A CN 202210301225 A CN202210301225 A CN 202210301225A CN 114665952 A CN114665952 A CN 114665952A
Authority
CN
China
Prior art keywords
satellite
user
cell
network
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210301225.5A
Other languages
English (en)
Other versions
CN114665952B (zh
Inventor
梁承超
麻世庆
段瑞吉
唐伦
陈前斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202210301225.5A priority Critical patent/CN114665952B/zh
Publication of CN114665952A publication Critical patent/CN114665952A/zh
Application granted granted Critical
Publication of CN114665952B publication Critical patent/CN114665952B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/185Space-based or airborne stations; Stations for satellite systems
    • H04B7/1851Systems using a satellite or space-based relay
    • H04B7/18513Transmission in a satellite or space-based system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/185Space-based or airborne stations; Stations for satellite systems
    • H04B7/1851Systems using a satellite or space-based relay
    • H04B7/18519Operations control, administration or maintenance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Astronomy & Astrophysics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Radio Relay Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种基于星地融合架构下低轨卫星网络跳波束优化方法,属于卫星移动通信技术。该方法包括:S1:在星地融合架构下,建立最大化卫星用户业务处理公平性的随机优化模型,并拆分为波束级资源分配问题和用户级资源分配问题;S2:将波束级资源分配问题转化为马尔可夫博弈,并采用基于多智能体架构行动者‑评判家算法的集中式训练和分布式执行机制,使得各智能体只需要观察本地状态并执行本地决策;S3:基于凸优化理论将用户级资源分配问题转化为拉格朗日问题进行求解。本发明能够在满足卫星网络对地干扰的前提下,降低用户业务服务拒绝量,优化用户处理公平性,并提高系统的吞吐量和星上资源利用率。

Description

一种基于星地融合架构下低轨卫星网络跳波束优化方法
技术领域
本发明属于卫星移动通信技术领域,涉及一种基于星地融合架构下低轨卫星网络跳波束优化方法。
背景技术
卫星通信系统可以覆盖到海域空域以及偏远地势复杂地区等地面网络无法覆盖的区域,因此卫星通信网络可以作为地面5G/6G网络强有力的补充,可以和地面无线网络取长补短,共同形成无缝的空天地一体化通信系统网络,是业内对卫星通信产业5G/6G时代的主流展望。与GEO卫星系统不同的是,LEO卫星具有传输时延短、功率损耗小、网络扩展迅速等特点,针对全球物联网和紧急通信业务具有更突出的优势。由于LEO卫星体积小、重量轻,其星载资源严重受限,且由于其快速移动性和各区域业务需求不均的特点,针对LEO卫星的资源分配方案设计极其困难。在无线通信的发展历史中,有限的频谱资源一直是限制通信容量增长的重要因素。而随着越来越多的LEO卫星被布置到太空,可用的频谱资源来越来紧缺,为了提升频谱资源利用率,星地一体化网络会采用星地频谱共享技术,则LEO卫星在服务卫星用户期间不可避免地对地面无线网络系统造成干扰,因此需要设计灵活的资源分配机制和高效的无线资源管理策略,满足星地融合系统的干扰要求,地面网络和卫星网络之间的频谱共享技术在未来无线通信中起到重要作用。
与此同时,在传统的LEO卫星资源分配方案中,星上功率和频谱资源均匀分配,未考虑网络拓扑的动态变化、区域间的业务量差异以及相邻波束间可能的强干扰问题,使得星上资源利用率低下。跳波束技术通过灵活地改变波束指向和星上资源分配,为用户终端动态配置通信资源,可以实现通信资源与业务需求的高效匹配。
当前LEO卫星跳波束的资源分配场景既没有考虑环境的动态变化特性,也没有考虑分配方案对地面系统的影响,而目前星地融合场景下的资源分配多为固定资源分配,严重缺乏灵活性,因此在星地融合架构下的低轨卫星跳波束资源分配方案是一个值得研究的方向。然而,对于传统的动态环境下的算法,如动态规划算法不能解决维度灾难问题,且动态规划算法需要先验信息,但是在实际的应用中,系统状态通常很难用某一精确的分布去刻画它的统计特性。
因此,亟需一种新的低轨卫星网络跳波束优化方法来解决上述问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于星地融合架构下低轨卫星网络跳波束优化方法,在满足卫星网络对地干扰的前提下,降低用户业务服务拒绝量,优化用户处理公平性,并提高系统的吞吐量和星上资源利用率。
为达到上述目的,本发明提供如下技术方案:
一种基于星地融合架构下低轨卫星网络跳波束优化方法,考虑有源波束限制、通信资源限制、融合系统干扰约束和用户资源分配约束,为达到长期性能优化的目的,以最小化卫星用户的业务拒绝量,即最大化用户公平性为目标,提出一个多星协作的联合波束调度、功率分配和子载波分配的决策方案。具体包括以下步骤:
S1:在星地融合架构下,通过考虑低轨卫星下行无线资源分配问题,同时满足星载资源限制、功耗要求限制、对地干扰要求和变量可行域限制,建立最大化卫星用户业务处理公平性的随机优化模型,并拆分为波束级资源分配问题和用户级资源分配问题;
S2:将波束级资源分配问题转化为马尔可夫博弈,并采用基于多智能体架构行动者-评判家算法的集中式训练和分布式执行机制,从而使得各智能体只需要观察本地状态并执行本地决策;
S3:基于凸优化理论将用户级资源分配问题转化为拉格朗日问题进行求解,将复杂的用户功率和子载波分配问题凸性化,从而简化用户级资源分配复杂程度。
进一步,步骤S1中,星地融合架构包括多个低轨卫星、地面网络、信关站和卫星用户;地面网络主要为城市等人口密集区域提供移动通信服务,而卫星主要为郊区、山区等人口稀疏、五基站服务的区域提供移动通信服务。假设有L个低轨卫星服务当前区域,则低轨卫星集合为S={sl|l=1,2,...,L};每个卫星均有K个有源波束;被服务区域划分为N个小区,且N<L·K,小区集合表示为C={cn|n=1,2,...,N};在每个小区内存在一个地面基站,该基站可能在小区的任何位置,则基站集合表示为B={bn|n=1,2,...,N},即bn表示在小区cn内的基站;
在每个小区内存在多个卫星用户和地面用户,小区cn的卫星用户集为
Figure BDA0003562978230000021
其中Kn表示小区cn的用户数;假设共有D个决策时刻,时间集合T={td|d=1,2,...,D};每个卫星的星载总功率一致,但是卫星会给波束分配不同的功率以提高资源利用率,假设当前时刻网络小区获得的波束功率集合为
Figure BDA0003562978230000022
Figure BDA0003562978230000023
为指向小区cn的波束获得的功率;同时,为了提高频谱的利用效率,每个卫星的波束均使用相同的频带W,而在波束内,为了有效地避免干扰,采用分配子载波的形式;划分的子载波个数为M,为了保证获得波束调度的小区内的用户至少能获得一个子载波分配,有
Figure BDA0003562978230000031
则划分的子载波集合为W={wm|m=1,2,...,M};当多个卫星服务某特定区域时,每个小区都最多只能被某个卫星的一个波束服务,表示该小区获得该卫星的波束调度,波束调度情况可以表示为
Figure BDA0003562978230000032
Figure BDA0003562978230000033
时表示当前时刻小区cn获得卫星sl的波束调度,反之则没有;
进一步,步骤S1中,由于基站的覆盖范围远远小于卫星波束的覆盖范围和小区半径,因此对于卫星来说,可以假设基站服务的所有用户均集中于基站处,则卫星对地面网络所有用户的信道增益可以表示为卫星对基站处用户的信道增益;因此对于某个地面网络用户来说,其受到的干扰为当前时刻td能覆盖到基站的波束干扰之和,公式可以表示为:
Figure BDA0003562978230000034
其中,
Figure BDA0003562978230000035
表示指向小区cn中心的波束对基站bn的信道增益;由于在不同时刻系统的波束调度和功率分配决策不同,导致了不同基站受到的干扰情况均不同,选取不同的资源分配组合能有效地减少对地面通信系统的干扰。
进一步,步骤S1中,建立最大化卫星用户业务处理公平性的随机优化模型,具体包括:通过考虑低轨卫星下行无线资源分配问题,拟最大化用户业务处理的公平性,即优化目标是使得卫星未完成或超额完成的用户业务量最小,同时满足星载资源限制、功耗要求限制、干扰要求和变量可行域限制;并采用两步分配方案,将优化问题分解为波束级资源分配问题和用户级资源分配问题;
波束级资源分配可以根据信道条件和各小区的总体流量需求,对星载有源波束指向和功率进行优化;通过解决子该问题,可以确定在当前时刻有哪些小区获得波束调度以及波束获得的功率。然后,根据用户级资源分配问题的结果,在获得波束调度的小区组里分配用户功率和子载波,完成用户公平性的最大化。
进一步,步骤S2中,决策算法是:基于多智能体架构的强化学习算法,并联合波束调度和功率分配的决策算法,最大化波束级的业务处理公平性;该算法需要确定3个元素集,包括状态集、动作集和奖励,相应的定义如下:
状态空间sl(td):对于智能体l在td时隙的环境状态定义为:信道增益集合Hl(td),满足
Figure BDA0003562978230000036
其中
Figure BDA0003562978230000037
表示服务小区cq的波束到小区cn中心处的信道增益,以及所有小区业务剩余需求量集合
Figure BDA0003562978230000038
因此,在td时隙智能体l的状态定义为sl(td)=(Hl(td),G(td));
动作空间al(td):在td时隙,智能体l的动作定义为波束调度决策Xl(td)和功率分配决策Pl(td),波束调度满足
Figure BDA0003562978230000041
其中
Figure BDA0003562978230000042
Figure BDA0003562978230000043
表示小区cn获得低轨卫星sl的波束调度,功率分配决策为
Figure BDA0003562978230000044
其中
Figure BDA0003562978230000045
表示服务小区cn的波束的功率,若小区cn未获得波束调度,则不能分配到的功率,满足
Figure BDA0003562978230000046
因此智能体l在td时隙的动作定义为al(td)=(Xl(td),Pl(td));
奖励函数rl(td):由优化问题可知,优化目标旨在最大化小区间的业务处理公平性,因此奖励函数可以设定为
Figure BDA0003562978230000047
其中,
Figure BDA0003562978230000048
表示小区在td时隙的剩余业务需求量,
Figure BDA0003562978230000049
表示小区在td时隙的业务处理量。该奖励函数表明未处理的最大剩余业务需求量越小,网络得到的奖励越大,通过设置该奖励函数促使智能体下一时刻选择减小最大剩余业务需求量的动作,达到提高小区间业务处理公平性的目的。
进一步,步骤S2中,基于多智能体架构行动者-评判家算法的集中式训练和分布式执行机制中,每个低轨卫星作为一个智能体,评判家部分收集全局信息,行动者部分只需要局部信息;该机制具体包括以下步骤:
S21:信关站初始化行动者网络和评判家网络的参数;
S22:低轨卫星作为智能体观察当前环境并获取状态;
S23:所有智能体根据当前策略选择行为,获取回报并观察局部环境的新状态,将四元组上传并存储到信关站的网络经验池中;
S24:信关站通过策略目标函数更新行动者网络参数和批判家网络参数;
S25:信关站不断重复训练过程,直至网络收敛;
S26:所有智能体从信关站下载参数到行动者网络,完成波束调度和功率分配。
进一步,步骤S3中,由于考虑不同的用户干扰,该问题是一个非线性规划问题,每个小区内分配给与用户的功率和带宽是相互耦合的,因此很难获得原问题的全局最优解,但可以通过对偶分解的方法求出局部最优解。基于凸优化理论将用户级资源分配问题转化为拉格朗日问题进行求解,具体包括以下步骤:
S31:初始化对偶变量,相应迭代步长,最大迭代次数和精度;
S32:初始化各个用户的子载波分配情况,功率分配情况和迭代次数;
S33:求解各用户的功率分配值;
S34:求解子载波分配情况;
S35:利用子梯度法对对偶变量进行迭代更新;
S36:进行迭代终止条件判断;
S37:返回各点波束的最优资源分配方案。
进一步,步骤S33中,求解各用户的功率分配值,具体包括:在给定各波束子载波分配情况和非负对偶变量的初始值的情况下,对任意
Figure BDA0003562978230000051
求拉格朗日函数关于功率的偏导,令
Figure BDA0003562978230000052
可得:
Figure BDA0003562978230000053
通过数值计算得到每个服务卫星用户的分配功率值
Figure BDA0003562978230000054
当计算所得结果小于0时,取
Figure BDA0003562978230000055
其中,
Figure BDA0003562978230000056
表示子载波分配情况,
Figure BDA0003562978230000057
表示在td时刻用户
Figure BDA0003562978230000058
剩余的未处理需求,
Figure BDA0003562978230000059
表示服务小区ce的卫星到用户
Figure BDA00035629782300000510
的信道增益,
Figure BDA00035629782300000511
表示用户
Figure BDA00035629782300000512
受到的使用相同子载波的用户的干扰总和,N0表示噪声功率谱密度,
Figure BDA00035629782300000513
表示对偶变量;
步骤S34中,将步骤S33求解出的功率分配值
Figure BDA00035629782300000514
代入拉格朗日函数式,求拉格朗日函数式关于子载波分配得偏导,令
Figure BDA00035629782300000515
可得:
Figure BDA00035629782300000516
其中,
Figure BDA00035629782300000517
表示待求的对偶变量;对上式进行求解,得到子载波的分配结果,其中,为满足子载波分配需求,设计
Figure BDA00035629782300000518
的还原规则,有:
Figure BDA00035629782300000519
其中,
Figure BDA0003562978230000061
表示子载波分配情况,wm表示第m段子载波,
Figure BDA0003562978230000062
则表示用户
Figure BDA0003562978230000063
在td时刻获得子载波wm的使用权。
本发明的有益效果在于:本发明针对当前LEO卫星跳波束的资源分配场景既没有考虑环境的动态变化特性,也没有考虑分配方案对地面系统的影响,且目前星地融合场景下的资源分配多为固定资源分配,严重缺乏灵活性的问题,提出了一种基于星地融合架构下低轨卫星网络跳波束优化方法。本发明优化方法能够在满足卫星网络对地干扰的前提下,降低用户业务服务拒绝量,优化用户处理公平性,并提高系统的吞吐量和星上资源利用率。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明优化方法中应用环境的场景图;
图2为基于多智能体架构AC算法的动态资源分配方案示意图;
图3为用户级功率子载波联合优化分配算法的流程图;
图4为本发明基于星地融合架构下低轨卫星网络跳波束优化方法流程图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图4,图1为本发明中应用环境的场景图,该场景架构模型包括多个低轨卫星、地面网络、信关站和卫星用户。地面网络主要为城市等人口密集区域提供移动通信服务,而卫星主要为郊区、山区等人口稀疏、五基站服务的区域提供移动通信服务。假设有L个低轨卫星服务当前区域,则低轨卫星集合为S={sl|l=1,2,...,L}。每一个卫星均有K个有源波束。被服务区域划分为N个小区,且N<L·K,小区集合可以表示为C={cn|n=1,2,...,N}。在每个小区内存在1个地面基站,该基站可能在小区的任何位置,则基站集合可以表示为B={bn|n=1,2,...,N},即bn表示在小区cn内的基站。
图2为基于多智能体架构AC算法的动态资源分配方案示意图,每个低轨卫星作为一个智能体,评判家部分收集全局信息,行动者部分只需要局部信息。由于在多智体AC算法的训练过程需要大量的计算开销,而低轨卫星载荷有限,存储能力和数据处理能力不足,因此将训练过程放置地面的信关站处,信关站可部署服务器提高数据训练速率,智能体只需将观测到的历史状态信息反映给信关站。信关站地理位置固定,其与卫星间的传输链路相较于星间链路更为稳定,在完成集中式训练的过程中,保证每个智能体可以获得其他智能体的信息。当集中式训练完成之后,每个卫星从信关站处下载已经训练好的参数,从而在执行的过程中,每个智能体的行动者只需要根据当前时隙的状态及策略独立地执行波束调度和功率分配决策。
在多智体AC架构中,每个智能体主要包含两个部分:评判家部分和行动者部分。其中,评判家部分主要通过计算状态-行为值函数评估策略地好坏。定义S表示所有智能体的联合状态集合,即S={S1,...,SL},其中Sl={sl(t1),...,sl(tD)}。由于不同的智能体在选择动作的时候可能会存在冲突,例如卫星之间会选择服务相同的小区,该情况不仅会造成资源的浪费,也会给卫星和地面通信系统带来严重的干扰。本文考虑次序性的动作选择,令al(td)表示智能体l在td时隙采取的动作,则A-l(td)表示该时刻除了智能体l外其他智能体选择的联合动作集合,即A-l(td)={a1(td),...,al-1(td),al+1(td),...,aL(td)}。因此对于智能体l,其状态-动作值函数定义为:
Ql(S,al,A-l)=E{Rl(S,al,A-l)+γl·E[Ql(S',a'l,A'-l)]}
然而上式的Q函数不能在无限值状态和动作下进行计算,因此考虑使用神经网络来近似智能体l的本地Q函数,即使用神经网络通过参数
Figure BDA0003562978230000071
来近似智能体l的动作值函数Ql(S,al,A-l),因此有
Figure BDA0003562978230000072
通过最小化损失函数来更新参数
Figure BDA0003562978230000073
智能体的损失函数定义为:
Figure BDA0003562978230000074
其中:
Figure BDA0003562978230000075
已有文献说明,由于在更新评判家网络Ql(S,al,A-l)时,目标值yl和Ql(S,al,A-l)同时更新,导致算法难以收敛。因此在评判家部分采用两个神经网络,分别为在线网络
Figure BDA0003562978230000076
和目标网络
Figure BDA0003562978230000077
其中
Figure BDA0003562978230000078
是目标网络的参数。在线网络用来更新参数计算
Figure BDA0003562978230000079
目标网络用来计算目标值yl。因此上述目标函数表达式重写为:
Figure BDA0003562978230000081
行动者网络主要进行策略更新,通过采用神经网络拟合参数化的行动函数来训练策略,其可以根据当前的系统状态采取某个确定的动作,而不是某个动作的概率,因此对于式的Q值可以写为:
Ql(S,al,A-l)=E[Rl(S,al)+γl·Ql(S',al(S'),A-l(S'))]
智能体l使用神经网络通过参数
Figure BDA0003562978230000082
来拟合策略πl,行动者部分最大化策略目标函数来更新参数
Figure BDA0003562978230000083
策略目标函数表达式为:
Figure BDA0003562978230000084
基于梯度上升算法根据策略目标函数梯度调整参数
Figure BDA0003562978230000085
则策略目标函数梯度表达式为:
Figure BDA0003562978230000086
类似的,行动者部分也采用两个网络,分别是在线网络
Figure BDA0003562978230000087
和目标网络
Figure BDA0003562978230000088
在线网络用来选择行为,目标网络的输出用来计算评判者部分的目标值yl。目标网络的参数更新使用“软”更新算法,有:
Figure BDA0003562978230000089
Figure BDA00035629782300000810
其中表示软更新因子,将其定义为0.01。
由于评判家部分可以通过智能体之间的交互得到所有智能体的状态和动作值信息,而批量连续时间的样本数据存在相关性,因此使用经验池存放数据,在训练时随机批量抽取一部分样本数据以打破数据的相关性。讲经验回放池定义为D,存储四元组样本数据<S,A,R,S'>,当经验池没有存储容量时,智能体从D中随机抽取F个样本,其中每个样本由所有智能体的四元组组成,即对于样本Df,其表达式为:
Df=(<s1,f,a1,f,R1,f,s'1,f>,...,<sL,f,aL,f,RL,f,s'L,f>)
由于多智体AC框架分为行动者部分和评判家部分,因此,没个智能体可以将训练部分和执行部分分离,在训练部分,所有智能体集中在信关站完成计算,而每个低轨卫星只需要下载训练好的参数并使用行动者部分分布式执行行为。每个智能体只需要从信关站下载已经训练好的参数,并观察当前时隙的状态从作为输入通过行动者部分选择行为。
参见图3,图3为用户级功率子载波联合优化分配算法的流程图,步骤如下:
步骤1:初始化对偶变量的初始值为
Figure BDA00035629782300000811
相应迭代步长Δλ、Δμ,最大迭代次数Niter和精度ε;
步骤2:初始化各个用户的子载波分配情况
Figure BDA0003562978230000091
和功率分配情况
Figure BDA0003562978230000092
令迭代次数i=1;
步骤3:求解功率分配值。在给定各波束子载波分配情况和非负对偶变量的初始值的情况下,对任意
Figure BDA0003562978230000093
求拉格朗日函数关于功率的偏导,令
Figure BDA0003562978230000094
可得:
Figure BDA0003562978230000095
通过数值计算可以得到每个服务卫星用户的分配功率值
Figure BDA0003562978230000096
当计算所得结果小于0时,取
Figure BDA0003562978230000097
步骤4:求解子载波分配情况。将求解出的功率分配值
Figure BDA0003562978230000098
代入拉格朗日函数式,求拉格朗日函数式关于子载波分配得偏导,令
Figure BDA0003562978230000099
可得:
Figure BDA00035629782300000910
对该式进行求解,可得子载波的分配结果,其中,为满足子载波分配需求,设计
Figure BDA00035629782300000911
的还原规则,有:
Figure BDA00035629782300000912
步骤5:对非负对偶变量的更新,在得到P'和β'后,此时对偶问题的优化变量仅有对偶变量ρ,λ,μ,可以利用子梯度法对对偶变量进行迭代更新,迭代过程如下:
Figure BDA0003562978230000101
Figure BDA0003562978230000102
Figure BDA0003562978230000103
其中,[x]+=max{0,x},n表示迭代次数,Δn表示标量步长序列。只要选择迭代步长合理,用子梯度法就能保证对偶变量收敛在最优值,从而保证该优化问题的收敛性。
图4为本发明的基于星地融合架构下低轨卫星网络跳波束优化方法流程图,参见图4,该优化方法的步骤为:
步骤1:初始化网络环境、卫星参数、小区参数、用户参数;
步骤2:卫星获取本地环境的状态,将存储的四元组样本上传到地面信关站;
步骤3:信关站完成多智体算法参数的训练,将参数下载到各个低轨卫星的行动者网络中,行动者网络完成波束级资源调度;
步骤4:根据波束级资源调度的结果,利用凸优化算法完成用户级资源分配;
步骤5:获得波束调度、用户功率和用户子载波资源分配结果。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种基于星地融合架构下低轨卫星网络跳波束优化方法,其特征在于,该方法具体包括以下步骤:
S1:在星地融合架构下,通过考虑低轨卫星下行无线资源分配问题,同时满足星载资源限制、功耗要求限制、对地干扰要求和变量可行域限制,建立最大化卫星用户业务处理公平性的随机优化模型,并拆分为波束级资源分配问题和用户级资源分配问题;
S2:将波束级资源分配问题转化为马尔可夫博弈,并采用基于多智能体架构行动者-评判家算法的集中式训练和分布式执行机制,使得各智能体只需要观察本地状态并执行本地决策;
S3:基于凸优化理论将用户级资源分配问题转化为拉格朗日问题进行求解。
2.根据权利要求1所述的低轨卫星网络跳波束优化方法,其特征在于,步骤S1中,星地融合架构包括多个低轨卫星、地面网络、信关站和卫星用户;假设有L个低轨卫星服务当前区域,则低轨卫星集合为S={sl|l=1,2,...,L};每个卫星均有K个有源波束;被服务区域划分为N个小区,且N<L·K,小区集合表示为C={cn|n=1,2,...,N};在每个小区内存在一个地面基站,该基站在小区的任何位置,则基站集合表示为B={bn|n=1,2,...,N},即bn表示在小区cn内的基站;
在每个小区内存在多个卫星用户和地面用户,小区cn的卫星用户集为
Figure FDA0003562978220000011
其中Kn表示小区cn的用户数;假设共有D个决策时刻,时间集合T={td|d=1,2,...,D};假设当前时刻网络小区获得的波束功率集合为
Figure FDA0003562978220000012
Figure FDA0003562978220000013
为指向小区cn的波束获得的功率;每个卫星的波束均使用相同的频带W,在波束内,采用分配子载波的形式;划分的子载波个数为M,为了保证获得波束调度的小区内的用户至少能获得一个子载波分配,有M≥max|Ucn|,则划分的子载波集合为W={wm|m=1,2,...,M};当多个卫星服务某特定区域时,每个小区都最多只能被某个卫星的一个波束服务,表示该小区获得该卫星的波束调度,波束调度情况表示为
Figure FDA0003562978220000014
Figure FDA0003562978220000015
时表示当前时刻小区cn获得卫星sl的波束调度,反之则没有。
3.根据权利要求2所述的低轨卫星网络跳波束优化方法,其特征在于,步骤S1中,假设基站服务的所有用户均集中于基站处,则卫星对地面网络所有用户的信道增益表示为卫星对基站处用户的信道增益;对于某个地面网络用户来说,其受到的干扰为当前时刻td能覆盖到基站的波束干扰之和表示为:
Figure FDA0003562978220000016
其中,
Figure FDA0003562978220000017
表示指向小区cn中心的波束对基站bn的信道增益。
4.根据权利要求3所述的低轨卫星网络跳波束优化方法,其特征在于,步骤S1中,建立最大化卫星用户业务处理公平性的随机优化模型,具体包括:通过考虑低轨卫星下行无线资源分配问题,拟最大化用户业务处理的公平性,即优化目标是使得卫星未完成或超额完成的用户业务量最小,同时满足星载资源限制、功耗要求限制、干扰要求和变量可行域限制;并采用两步分配方案,将优化问题分解为波束级资源分配问题和用户级资源分配问题;
波束级资源分配可以根据信道条件和各小区的总体流量需求,对星载有源波束指向和功率进行优化;然后,根据用户级资源分配问题的结果,在获得波束调度的小区组里分配用户功率和子载波,完成用户公平性的最大化。
5.根据权利要求2所述的低轨卫星网络跳波束优化方法,其特征在于,步骤S2中,决策算法是:基于多智能体架构的强化学习算法,并联合波束调度和功率分配的决策算法,最大化波束级的业务处理公平性;该算法需要确定3个元素集,包括状态集、动作集和奖励,相应的定义如下:
状态空间sl(td):对于智能体l在td时隙的环境状态定义为:信道增益集合Hl(td),满足
Figure FDA0003562978220000021
其中
Figure FDA0003562978220000022
表示服务小区cq的波束到小区cn中心处的信道增益,以及所有小区业务剩余需求量集合
Figure FDA0003562978220000023
因此,在td时隙智能体l的状态定义为sl(td)=(Hl(td),G(td));
动作空间al(td):在td时隙,智能体l的动作定义为波束调度决策Xl(td)和功率分配决策Pl(td),波束调度满足
Figure FDA0003562978220000024
其中
Figure FDA0003562978220000025
Figure FDA0003562978220000026
表示小区cn获得低轨卫星sl的波束调度,功率分配决策为
Figure FDA0003562978220000027
其中
Figure FDA0003562978220000028
表示服务小区cn的波束的功率,若小区cn未获得波束调度,则不能分配到的功率,满足
Figure FDA0003562978220000029
因此智能体l在td时隙的动作定义为al(td)=(Xl(td),Pl(td));
奖励函数rl(td):
Figure FDA00035629782200000210
其中,
Figure FDA00035629782200000211
表示小区在td时隙的剩余业务需求量,
Figure FDA00035629782200000212
表示小区在td时隙的业务处理量。
6.根据权利要求1所述的低轨卫星网络跳波束优化方法,其特征在于,步骤S2中,基于多智能体架构行动者-评判家算法的集中式训练和分布式执行机制中,每个低轨卫星作为一个智能体,评判家部分收集全局信息,行动者部分只需要局部信息;该机制具体包括以下步骤:
S21:信关站初始化行动者网络和评判家网络的参数;
S22:低轨卫星作为智能体观察当前环境并获取状态;
S23:所有智能体根据当前策略选择行为,获取回报并观察局部环境的新状态,将四元组上传并存储到信关站的网络经验池中;
S24:信关站通过策略目标函数更新行动者网络参数和批判家网络参数;
S25:信关站不断重复训练过程,直至网络收敛;
S26:所有智能体从信关站下载参数到行动者网络,完成波束调度和功率分配。
7.根据权利要求2所述的低轨卫星网络跳波束优化方法,其特征在于,步骤S3中,基于凸优化理论将用户级资源分配问题转化为拉格朗日问题进行求解,具体包括以下步骤:
S31:初始化对偶变量,相应迭代步长,最大迭代次数和精度;
S32:初始化各个用户的子载波分配情况,功率分配情况和迭代次数;
S33:求解各用户的功率分配值;
S34:求解子载波分配情况;
S35:利用子梯度法对对偶变量进行迭代更新;
S36:进行迭代终止条件判断;
S37:返回各点波束的最优资源分配方案。
8.根据权利要求5所述的低轨卫星网络跳波束优化方法,其特征在于,步骤S33中,求解各用户的功率分配值,具体包括:在给定各波束子载波分配情况和非负对偶变量的初始值的情况下,对任意
Figure FDA0003562978220000031
求拉格朗日函数关于功率的偏导,令
Figure FDA0003562978220000032
可得:
Figure FDA0003562978220000033
通过数值计算得到每个服务卫星用户的分配功率值
Figure FDA0003562978220000034
当计算所得结果小于0时,取
Figure FDA0003562978220000035
其中,
Figure FDA0003562978220000036
表示子载波分配情况,
Figure FDA0003562978220000037
表示在td时刻用户
Figure FDA0003562978220000038
剩余的未处理需求,
Figure FDA0003562978220000039
表示服务小区ce的卫星到用户
Figure FDA00035629782200000310
的信道增益,
Figure FDA00035629782200000311
表示用户
Figure FDA00035629782200000312
受到的使用相同子载波的用户的干扰总和,N0表示噪声功率谱密度,
Figure FDA00035629782200000313
表示对偶变量;
步骤S34中,将步骤S33求解出的功率分配值
Figure FDA00035629782200000314
代入拉格朗日函数式,求拉格朗日函数式关于子载波分配得偏导,令
Figure FDA00035629782200000315
可得:
Figure FDA0003562978220000041
其中,
Figure FDA0003562978220000042
表示待求的对偶变量;对上式进行求解,得到子载波的分配结果,其中,为满足子载波分配需求,设计
Figure FDA0003562978220000043
的还原规则,有:
Figure FDA0003562978220000044
其中,wm表示第m段子载波,
Figure FDA0003562978220000045
则表示用户
Figure FDA0003562978220000046
在td时刻获得子载波wm的使用权。
CN202210301225.5A 2022-03-24 2022-03-24 一种基于星地融合架构下低轨卫星网络跳波束优化方法 Active CN114665952B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210301225.5A CN114665952B (zh) 2022-03-24 2022-03-24 一种基于星地融合架构下低轨卫星网络跳波束优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210301225.5A CN114665952B (zh) 2022-03-24 2022-03-24 一种基于星地融合架构下低轨卫星网络跳波束优化方法

Publications (2)

Publication Number Publication Date
CN114665952A true CN114665952A (zh) 2022-06-24
CN114665952B CN114665952B (zh) 2023-07-18

Family

ID=82030714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210301225.5A Active CN114665952B (zh) 2022-03-24 2022-03-24 一种基于星地融合架构下低轨卫星网络跳波束优化方法

Country Status (1)

Country Link
CN (1) CN114665952B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114978295A (zh) * 2022-07-29 2022-08-30 中国人民解放军战略支援部队航天工程大学 一种面向卫星互联网的跨层抗干扰方法和系统
CN115103449A (zh) * 2022-08-24 2022-09-23 椭圆时空(北京)科技有限公司 一种多波束低轨卫星空间能源分配方法、装置和电子设备
CN115483960A (zh) * 2022-08-23 2022-12-16 爱浦路网络技术(南京)有限公司 低轨卫星的跳波束调度方法、系统、装置及存储介质
CN115483964A (zh) * 2022-09-30 2022-12-16 中国人民解放军陆军工程大学 一种空天地一体化物联网通信资源联合分配方法
CN116567762A (zh) * 2023-07-12 2023-08-08 成都本原星通科技有限公司 一种基于多QoS优化的星地协同选择接入控制方法
CN117375706A (zh) * 2023-12-04 2024-01-09 成都本原星通科技有限公司 一种面向接收端的低轨卫星星间干扰优化方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210036768A1 (en) * 2018-02-13 2021-02-04 Satixfy Israel Ltd. A Method for Implementing Beam Hopping in a Satellite Communications Network
CN113162682A (zh) * 2021-05-13 2021-07-23 重庆邮电大学 一种基于pd-noma的多波束leo卫星系统资源分配方法
CN113258988A (zh) * 2021-05-13 2021-08-13 重庆邮电大学 一种基于dqn的多业务低轨卫星资源分配方法
CN113543342A (zh) * 2021-07-05 2021-10-22 南京信息工程大学滨江学院 基于noma-mec强化学习资源分配与任务卸载方法
CN113572517A (zh) * 2021-07-30 2021-10-29 哈尔滨工业大学 基于深度强化学习的跳波束资源分配方法、系统、存储介质及设备
US20220052756A1 (en) * 2018-09-10 2022-02-17 Telesat Technology Corporation Resource deployment optimizer for non-geostationary and/or geostationary communications satellites

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210036768A1 (en) * 2018-02-13 2021-02-04 Satixfy Israel Ltd. A Method for Implementing Beam Hopping in a Satellite Communications Network
US20220052756A1 (en) * 2018-09-10 2022-02-17 Telesat Technology Corporation Resource deployment optimizer for non-geostationary and/or geostationary communications satellites
CN113162682A (zh) * 2021-05-13 2021-07-23 重庆邮电大学 一种基于pd-noma的多波束leo卫星系统资源分配方法
CN113258988A (zh) * 2021-05-13 2021-08-13 重庆邮电大学 一种基于dqn的多业务低轨卫星资源分配方法
CN113543342A (zh) * 2021-07-05 2021-10-22 南京信息工程大学滨江学院 基于noma-mec强化学习资源分配与任务卸载方法
CN113572517A (zh) * 2021-07-30 2021-10-29 哈尔滨工业大学 基于深度强化学习的跳波束资源分配方法、系统、存储介质及设备

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
"try" *
CHUNMEI XU; SHENGHENG LIU; CHENG ZHANG; YONGMING HUANG; ZHAOHUA LU; LUXI YANG: "Multi-Agent Reinforcement Learning Based Distributed Transmission in Collaborative Cloud-Edge Systems", 《 IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY》, vol. 70, no. 2, pages 1658, XP011841350, DOI: 10.1109/TVT.2021.3055511 *
FENG TIAN; LILING HUANG; GUANG LIANG; XINGLONG JIANG; SIYUE SUN; JINTAO MA: "An Efficient Resource Allocation Mechanism for Beam-hopping Based LEO Satellite Communication System", 《2019 IEEE INTERNATIONAL SYMPOSIUM ON BROADBAND MULTIMEDIA SYSTEMS AND BROADCASTING (BMSB)》 *
JINGYU TANG; DONGMING BIAN; GUANGXIA LI; JING HU; JIAN CHENG: "Optimization Method of Dynamic Beam Position for LEO Beam-Hopping Satellite Communication Systems", 《IEEE ACCESS》, vol. 9, pages 57578, XP011850817, DOI: 10.1109/ACCESS.2021.3072104 *
YUANPENG LI; YILE FAN; SHUAIJUN LIU; LIXIANG LIU; WENGE YANG: "Overview of Beam Hopping Algorithms in Large Scale LEO Satellite Constellation", 《2021 IEEE 20TH INTERNATIONAL CONFERENCE ON TRUST, SECURITY AND PRIVACY IN COMPUTING AND COMMUNICATIONS (TRUSTCOM)》, pages 1345 - 1351 *
唐璟宇;李广侠;边东明;胡婧: "卫星跳波束资源分配综述", 《移动通信》, no. 5, pages 21 - 26 *
曹晖; 陈前斌; 梁承超; 唐伦: "低轨卫星移动性管理仿真平台研究及实现", 《重庆邮电大学学报(自然科学版)》, vol. 33, no. 6, pages 912 - 920 *
赵凌开: "低轨卫星网络基于跳波束的资源分配算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, vol. 2022, no. 03 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114978295A (zh) * 2022-07-29 2022-08-30 中国人民解放军战略支援部队航天工程大学 一种面向卫星互联网的跨层抗干扰方法和系统
CN115483960A (zh) * 2022-08-23 2022-12-16 爱浦路网络技术(南京)有限公司 低轨卫星的跳波束调度方法、系统、装置及存储介质
CN115483960B (zh) * 2022-08-23 2023-08-29 爱浦路网络技术(南京)有限公司 低轨卫星的跳波束调度方法、系统、装置及存储介质
CN115103449A (zh) * 2022-08-24 2022-09-23 椭圆时空(北京)科技有限公司 一种多波束低轨卫星空间能源分配方法、装置和电子设备
CN115103449B (zh) * 2022-08-24 2022-11-15 椭圆时空(北京)科技有限公司 一种多波束低轨卫星空间能源分配方法、装置和电子设备
CN115483964A (zh) * 2022-09-30 2022-12-16 中国人民解放军陆军工程大学 一种空天地一体化物联网通信资源联合分配方法
CN115483964B (zh) * 2022-09-30 2024-03-08 中国人民解放军陆军工程大学 一种空天地一体化物联网通信资源联合分配方法
CN116567762A (zh) * 2023-07-12 2023-08-08 成都本原星通科技有限公司 一种基于多QoS优化的星地协同选择接入控制方法
CN117375706A (zh) * 2023-12-04 2024-01-09 成都本原星通科技有限公司 一种面向接收端的低轨卫星星间干扰优化方法和系统
CN117375706B (zh) * 2023-12-04 2024-03-12 成都本原星通科技有限公司 一种面向接收端的低轨卫星星间干扰优化方法和系统

Also Published As

Publication number Publication date
CN114665952B (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN114665952A (zh) 一种基于星地融合架构下低轨卫星网络跳波束优化方法
CN114362810B (zh) 一种基于迁移深度强化学习的低轨卫星跳波束优化方法
Liu et al. Deep reinforcement learning based latency minimization for mobile edge computing with virtualization in maritime UAV communication network
Hu et al. Deep reinforcement learning‐based beam Hopping algorithm in multibeam satellite systems
Hu et al. Multi-agent deep reinforcement learning-based flexible satellite payload for mobile terminals
Liu et al. Energy-efficient space–air–ground integrated edge computing for internet of remote things: A federated DRL approach
CN111555795A (zh) 一种基于用户分组调度的网络资源分配方法和装置
CN115276756B (zh) 一种保障服务质量的低轨卫星星座优化设计方法
Zheng et al. Leo satellite channel allocation scheme based on reinforcement learning
Lyu et al. Optimal computation offloading in collaborative leo-iot enabled mec: A multi-agent deep reinforcement learning approach
Chen et al. Learning-based computation offloading for IoRT through Ka/Q-band satellite–terrestrial integrated networks
CN114866133B (zh) 一种卫星云边协同计算的计算卸载方法
CN111884703B (zh) 一种基于通信卫星间协同计算的业务请求分配方法
CN113922865A (zh) 一种多波束低轨卫星在高纬度场景下的能量优化方法
Wang et al. Time-expanded graph-based dispersed computing policy for LEO space satellite computing
Zuo et al. Deep reinforcement learning based load balancing routing for LEO satellite network
Wang et al. LEO satellite network routing algorithm based on reinforcement learning
Sun et al. Edge intelligence assisted resource management for satellite communication
Huang et al. Sequential dynamic resource allocation in multi-beam satellite systems: A learning-based optimization method
He et al. Balancing total energy consumption and mean makespan in data offloading for space-air-ground integrated networks
CN116886172A (zh) 基于机器学习的多波束卫星通信用户选择和频谱划分方法
CN117236561A (zh) 一种基于sac的多无人机辅助移动边缘计算方法、装置及存储介质
Wei et al. Dynamic beam scheduling of multibeam low earth orbit satellites based on an enhanced artificial bee colony algorithm
Nguyen et al. Utility optimization for blockchain empowered edge computing with deep reinforcement learning
CN113342514B (zh) 一种基于近地轨道的边缘计算模型及其服务放置方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant