CN115173922A - 基于cmaddqn网络的多波束卫星通信系统资源分配方法 - Google Patents

基于cmaddqn网络的多波束卫星通信系统资源分配方法 Download PDF

Info

Publication number
CN115173922A
CN115173922A CN202210769747.8A CN202210769747A CN115173922A CN 115173922 A CN115173922 A CN 115173922A CN 202210769747 A CN202210769747 A CN 202210769747A CN 115173922 A CN115173922 A CN 115173922A
Authority
CN
China
Prior art keywords
satellite
modeling
resource allocation
network
communication system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210769747.8A
Other languages
English (en)
Other versions
CN115173922B (zh
Inventor
柴蓉
杨国荣
刘磊
陈前斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hongyue Information Technology Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202210769747.8A priority Critical patent/CN115173922B/zh
Publication of CN115173922A publication Critical patent/CN115173922A/zh
Application granted granted Critical
Publication of CN115173922B publication Critical patent/CN115173922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/185Space-based or airborne stations; Stations for satellite systems
    • H04B7/1851Systems using a satellite or space-based relay
    • H04B7/18513Transmission in a satellite or space-based system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/185Space-based or airborne stations; Stations for satellite systems
    • H04B7/1851Systems using a satellite or space-based relay
    • H04B7/18519Operations control, administration or maintenance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Astronomy & Astrophysics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Radio Relay Systems (AREA)

Abstract

本发明涉及一种基于CMADDQN网络的多波束卫星通信系统资源分配方法,属于无线通信技术领域。该方法包括:S1:建模多波束卫星通信场景;S2:建模卫星子信道分配变量、卫星载波功率分配和卫星信道;S3:建模卫星传输速率和卫星业务模型;S4:计算业务公平性系数;S5:建模卫星通信系统资源分配限制条件;S6:建模系统状态及动作;S7:建模系统回报函数;S8:构建并训练CMADDQN网络;S9:基于CMADDQN网络优化确定卫星通信系统资源分配策略。本发明通过联合波束分配、子信道分配及卫星发送功率阶数选择,实现期望累计奖励最大化,从而提高系统综合性能。

Description

基于CMADDQN网络的多波束卫星通信系统资源分配方法
技术领域
本发明属于无线通信技术领域,涉及多波束卫星通信技术领域,具体涉及一种基于CMADDQN网络的多波束卫星通信系统资源分配方法。
背景技术
近年来,卫星通信系统作为对地面通信网络基础结构的一种补充,以其全球覆盖能力强、通信距离远、抗重大自然灾害、可提供固定及移动通信业务等优点,得到了广泛应用。为提升卫星系统频谱资源利用率及系统传输性能,可采用多波束卫星,通过使用多个高增益窄波束提升用户的覆盖能力,实现频谱复用增益。然而,针对多波束卫星通信系统用户需求多样化以及卫星通信系统拓扑动态性与时空分布不均匀性等特点,如何设计高效波束分配、子信道分配及发送功率分配策略,实现用户服务质量保障及系统性能提升成为重要的研究课题。现有研究已经考虑了多波束卫星通信系统的资源分配问题,但是很少有工作研究针对地面用户业务随机动态到达场景,研究基于长期性能优化的资源分配策略。
发明内容
有鉴于此,本发明的目的在于提供一种基于CMADDQN网络的多波束卫星通信系统资源分配方法,针对包含一个多波束低地球轨道卫星(Low Earth Orbit,LEO)及N个汇聚设备的多波束卫星通信系统,建模系统期望累计奖励为优化目标,实现波束分配、子信道分配及发送功率阶数选择策略,提高系统综合性能。
为达到上述目的,本发明提供如下技术方案:
一种基于CMADDQN网络的多波束卫星通信系统资源分配方法,针对包含一个多波束LEO及N个汇聚设备的多波束卫星通信系统,该方法具体包括以下步骤:
S1:建模多波束卫星通信场景;
S2:建模卫星子信道分配变量、卫星载波功率分配和卫星信道;
S3:建模卫星传输速率和卫星业务模型;
S4:计算业务公平性系数;
S5:建模卫星通信系统资源分配限制条件;
S6:建模系统状态及动作;
S7:建模系统回报函数;
S8:构建并训练多智能体协作双深度Q学习(Cooperative Multi-Agent DoubleDeep Q-Learning,CMADDQN)网络;
S9:基于CMADDQN网络优化确定卫星通信系统资源分配策略。
进一步,步骤S1中,建模多波束卫星通信场景,具体包括:多波束卫星的最大波束数为K,系统总带宽为B0,将总带宽分为M个等长的子信道,每个子信道带宽为B=B0/M,每个波束可以使用的最大子信道数目为M,Cm为第m个子信道的载波频率;令N表示卫星服务的小区数目,Un为小区n的汇聚设备,该设备汇聚小区的通信流量需求;系统总时间为T,将T分为等长的时隙,每个时隙长度为τ;卫星以等长数据包形式发送用户数据至各小区,令λn,t为t时隙小区n的数据包平均到达率,数据包长度为F,各数据包到达后需在J个时隙内发送,否则丢弃数据包。
进一步,步骤S2中,建模卫星子信道分配变量,具体包括:令xn,t=[xn,1,t xn,2,t…xn,m,t…xn,M,t]T表示t时隙小区n的子信道分配标识,xn,m,t∈{0,1},若t时隙卫星地面小区分配到子信道m,xn,m,t=1,若t时隙小区n没有分配到子信道m,xn,m,t=0;
建模卫星载波功率分配,具体包括:令pn,t=[pn,1,t pn,2,t…pn,m,t…pn,M,t]T表示t时隙卫星发送数据至小区n时的发送功率,其中pn,m,t表示t时隙卫星占用子信道m发送数据至小区n对应的发送功率,pn,m,t可建模为
Figure BDA0003723492390000021
其中S为功率量化数目,ps为第s阶量化功率,即
Figure BDA0003723492390000022
ptot为每个波束的最大发送功率,δn,m,t,s为发送功率阶数选择变量,若t时隙卫星占用子信道m发送数据至小区n时选择发送功率ps,δn,m,t,s=1,否则,δn,m,t,s=0;
建模卫星信道,具体包括:令hn,m,t表示t时隙卫星与Un在子信道的信道增益,hn,m,t可以建模为
Figure BDA0003723492390000023
其中
Figure BDA0003723492390000024
表示Un接收天线增益,
Figure BDA0003723492390000025
可以建模为
Figure BDA0003723492390000026
其中J1(·)表示第一类一阶贝塞尔函数,J3(·)表示第一类三阶贝塞尔函数;un,t=2.07123sin(θn,t)/sin(θ3dB),θn,t表示t时隙卫星与Un接收天线的离轴角,θ3dB为3dB波束带宽对应的角度,gmax,r为接收天线最大增益;
Figure BDA0003723492390000027
表示卫星发送天线增益,可表示为:
Figure BDA0003723492390000031
其中gmax,t为卫星发送天线最大增益,θn,t为t时隙Un到卫星的仰角,Ln,m为卫星与Un之间链路在子信道m的自由损耗,
Figure BDA0003723492390000032
其中c为光速,dn为Un与卫星之间的距离;
Figure BDA0003723492390000033
为t时隙信道雨衰,hn,t表示t时隙卫星到Un之间链路的随机衰落特性。
进一步,步骤S3中,建模卫星传输速率,具体包括:令
Figure BDA0003723492390000034
其中Rn,t表示t时隙卫星与Un之间的传输速率,In,m,t为t时隙Un受到的干扰,
Figure BDA0003723492390000035
σn 2为噪声功率,σn 2=BN0,N0为噪声功率谱密度;
建模卫星业务模型,具体包括:令qn,t表示t时隙末卫星需发送至小区n的数据包数量,qn,t的更新公式为
Figure BDA0003723492390000036
进一步,步骤S4中,计算业务公平性系数,表达式为:
Figure BDA0003723492390000037
其中,ρt表示用户业务公平性系数;dn,t,j表示截至t时隙,前j时隙小区n请求但未服务的数据包数量。
进一步,步骤S5中,建模卫星通信系统资源分配限制条件,具体包括:
1)卫星波束分配限制
令yt={yn,t,1≤n≤N}为t时隙波束分配集合,其中yn,t表示波束分配变量,yn,t∈{0,1},若t时隙卫星波束点亮小区n,yn,t=1,否则,yn,t=0,每个时隙最多只有K个小区被卫星波束覆盖,则有
Figure BDA0003723492390000041
子信道分配与波束分配变量需满足如下限制:
Figure BDA0003723492390000042
2)卫星发送功率限制
卫星在t时隙的总发送功率需满足最大功率限制,则有
Figure BDA0003723492390000043
其中,pmax为卫星最大发送功率;每一个波束的发送功率需小于卫星波束最大发送功率,则有
Figure BDA0003723492390000044
其中,ptot为卫星波束最大发送功率;每个载波发送功率需满足波束分配变量的限制,则有
Figure BDA0003723492390000045
3)卫星发送功率阶数选择限制
卫星发送功率阶数选择变量应满足:
Figure BDA0003723492390000046
进一步,步骤S6中,建模系统状态及动作,具体包括:令st为t时隙的状态,可建模为st={hn,m,t,Dn,t},其中Dn,t=[dn,t,0 dn,t,1…dn,t,J-1];令At为t时隙的动作空间,At可建模为At={yn,t,xn,m,tn,m,t,s}。
进一步,步骤S7中,建模建模系统回报函数,具体包括:令rt为t时隙系统回报函数,rt可建模为
Figure BDA0003723492390000047
其中ω1,ω2,ω3为加权系数,r1,t表示系统t时隙系统吞吐量回报函数,建模为
Figure BDA0003723492390000048
进一步,步骤S8中,构建并训练CMADDQN网络,具体包括:构建K个波束选择智能体和MK个功率选择智能体,每个波束拥有一个波束选择智能体和M个功率选择智能体,每个波束选择智能体选择一个小区并提供服务;每个功率选择智能体为子信道选择发送功率阶数,每个智能体包含一个Q网络和一个目标Q网络;训练阶段首先初始化经验回放缓冲区
Figure BDA0003723492390000051
1≤α≤(M+1)K;设定折扣因子γ,0≤γ≤1;初始化Q网络参数πt和目标Q网络参数
Figure BDA0003723492390000052
初始化每个智能体观察环境状态sα,t;令ε为噪声参数,对于每一个智能体的Q网络,以概率P<ε从动作空间Aα,t中随机选取动作aα,t,否则选取动作
Figure BDA0003723492390000053
各智能体执行联合动作at=(a1,t,a2,t,…,aα,t,…,a(M+1)K,t),环境状态转移到st+1,每个Vα智能体得到全局奖励rt,将四元组(st,aα,t,rt,sα,t+1)存入经验回放缓冲区;对于每一个智能体的目标Q网络,从经验回放缓冲区Vα中随机抽取小批量的数据样本计算目标Q网络的Q值
Figure BDA0003723492390000054
其中Qα,t(sα,t+1,aα,tt)表示从Vα抽取的小批量的数据样本中观察状态为st+1时的Q值;计算损失函数
Figure BDA0003723492390000055
利用梯度下降算法基于Lα(sα,t,aα,tt)最小化更新Q网络的参数πt,并更新相应的
Figure BDA0003723492390000056
进一步,步骤S8中,基于CMADDQN网络优化确定卫星通信系统资源分配策略,具体包括:令
Figure BDA0003723492390000057
表示期望累计奖励,在满足多波束卫星波束分配,子信道分配,发送功率分配和发送功率阶数选择的限制条件下,以最大化期望累计奖励为目标,优化确定波束调度和资源分配策略,即:
Figure BDA0003723492390000058
其中
Figure BDA0003723492390000059
Figure BDA00037234923900000510
分别是最优波束分配变量、最优子信道分配变量和最优卫星发送功率阶数选择变量。
本发明的有益效果在于:本发明能够有效保障通信业务时空分布不均匀的情况下,基于波束分配、子信道分配及卫星发送功率阶数选择,实现期望累计奖励最大化,提高系统综合性能。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明涉及的多波束卫星通信系统场景示意图;
图2为本发明多波束卫星通信系统资源分配方法的流程示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图2,图1为本发明采用的多波束卫星通信系统场景示意图,如图1所示,该通信系统包含一个LEO卫星及N个汇聚设备,通过联合设计最优波束分配、子信道分配及卫星发送功率阶数选择策略可实现系统期望累计奖励最大化。
图2为本发明多波束卫星通信系统资源分配方法的流程示意图,如图2所示,该方法具体包括以下步骤:
步骤1:多波束卫星通信场景建模;
多波束卫星通信场景建模,具体为:多波束卫星的最大波束数为K,系统总带宽为B0,将总带宽分为M个等长的子信道,每个子信道带宽为B=B0/M,每个波束可以使用的最大子信道数目为M,Cm为第m个子信道的载波频率;令N表示卫星服务的小区数目,Un为小区n的汇聚设备,该设备汇聚小区的通信流量需求;系统总时间为T,将T分为等长的时隙,每个时隙长度为τ;卫星以等长数据包形式发送用户数据至各小区,令λn,t为t时隙小区n的数据包平均到达率,数据包长度为F,各数据包到达后需在J个时隙内发送,否则丢弃数据包。
步骤2:卫星子信道分配变量建模;
卫星子信道分配变量建模,具体为:令xn,t=[xn,1,t xn,2,t…xn,m,t…xn,M,t]T表示t时隙小区n的子信道分配标识,xn,m,t∈{0,1},若t时隙卫星地面小区分配到子信道m,xn,m,t=1,若t时隙小区n没有分配到子信道m,xn,m,t=0。
步骤3:卫星载波功率分配建模;
卫星载波功率分配建模,具体为:令pn,t=[pn,1,t pn,2,t…pn,m,t…pn,M,t]T表示t时隙卫星发送数据至小区n时的发送功率,其中pn,m,t表示t时隙卫星占用子信道m发送数据至小区n对应的发送功率,pn,m,t可建模为
Figure BDA0003723492390000071
其中S为功率量化数目,ps为第s阶量化功率,即
Figure BDA0003723492390000072
ptot为每个波束的最大发送功率,δn,m,t,s为发送功率阶数选择变量,若t时隙卫星占用子信道m发送数据至小区n时选择发送功率ps,δn,m,t,s=1,否则,δn,m,t,s=0。
步骤4:卫星信道建模;
卫星信道建模,具体为:令hn,m,t表示t时隙卫星与Un在子信道的信道增益,hn,m,t可以建模为
Figure BDA0003723492390000073
其中
Figure BDA0003723492390000074
表示Un接收天线增益,
Figure BDA0003723492390000075
可以建模为
Figure BDA0003723492390000076
其中un,t=2.07123sin(θn,t)/sin(θ3dB),θn,t表示t时隙卫星与Un接收天线的离轴角,θ3dB为3dB波束带宽对应的角度,gmax,r为接收天线最大增益,
Figure BDA0003723492390000077
表示卫星发送天线增益,可表示为:
Figure BDA0003723492390000078
其中gmax,t为卫星发送天线最大增益,θn,t为t时隙Un到卫星的仰角,Ln,m为卫星与Un之间链路在子信道m的自由损耗,
Figure BDA0003723492390000079
其中c为光速,dn为Un与卫星之间的距离,
Figure BDA00037234923900000710
为t时隙信道雨衰,hn,t表示t时隙卫星到Un之间链路的随机衰落特性。
步骤5:卫星传输速率建模;
卫星传输速率建模,具体为:令
Figure BDA00037234923900000711
其中In,m,t为t时隙Un受到的干扰,
Figure BDA00037234923900000712
σn 2为噪声功率,σn 2=BN0,N0为噪声功率谱密度。
步骤6:卫星业务模型建模;
卫星业务模型建模,具体为:令qn,t表示t时隙末卫星需发送至小区n的数据包数量,qn,t的更新公式为
Figure BDA0003723492390000081
步骤7:业务公平性建模;
业务公平性建模,具体为:令dn,t,j表示截至t时隙,前j时隙小区n请求但未服务的数据包数量,ρt表示用户业务公平性系数,ρt可以建模为
Figure BDA0003723492390000082
步骤8:卫星通信系统资源分配限制条件建模,具体包括:
1)卫星波束分配限制
令yt={yn,t,1≤n≤N}为t时隙波束分配集合,其中yn,t表示波束分配变量,yn,t∈{0,1},若t时隙卫星波束点亮小区n,yn,t=1,否则,yn,t=0,每个时隙最多只有K个小区被卫星波束覆盖,则有
Figure BDA0003723492390000083
子信道分配与波束分配变量需满足如下限制:
Figure BDA0003723492390000084
2)卫星发送功率限制
卫星在t时隙的总发送功率需满足最大功率限制,则有
Figure BDA0003723492390000085
其中,pmax为卫星最大发送功率;每一个波束的发送功率需小于卫星波束最大发送功率,则有
Figure BDA0003723492390000086
其中,ptot为卫星波束最大发送功率;每个载波发送功率需满足波束分配变量的限制,则有
Figure BDA0003723492390000087
3)卫星发送功率阶数选择限制
卫星发送功率阶数选择变量应满足:
Figure BDA0003723492390000091
步骤9:系统状态和动作建模;
系统状态和动作建模,具体为:令st为t时隙的状态,可建模为st={hn,m,t,Dn,t},其中Dn,t=[dn,t,0 dn,t,1…dn,t,J-1];令At为t时隙的动作空间,At可建模为At={yn,t,xn,m,tn,m,t,s}。
步骤10:系统回报函数建模;
系统回报函数建模,具体为:令rt为t时隙系统回报函数,rt可建模为
Figure BDA0003723492390000092
其中ω1,ω2,ω3为加权系数,r1,t表示系统t时隙系统吞吐量回报函数,建模为
Figure BDA0003723492390000093
步骤11:构建并训练CMADDQN网络;
构建并训练CMADDQN网络,具体为:构建K个波束选择智能体和MK个功率选择智能体,每个波束拥有一个波束选择智能体和M个功率选择智能体,每个波束选择智能体选择一个小区并提供服务;每个功率选择智能体为子信道选择发送功率阶数,每个智能体包含一个Q网络和一个目标Q网络;训练阶段首先初始化经验回放缓冲区
Figure BDA0003723492390000094
1≤α≤(M+1)K;设定折扣因子γ,0≤γ≤1;初始化Q网络参数πt和目标Q网络参数
Figure BDA0003723492390000095
初始化每个智能体观察环境状态sα,t=st;令ε为噪声参数,对于每一个智能体的Q网络,以概率P<ε从动作空间At中随机选取动作aα,t,否则选取动作
Figure BDA0003723492390000096
各智能体执行联合动作at=(a1,t,a2,t,…,aα,t,…,a(M+1)K,t),环境状态转移到st+1,每个智能体得到全局奖励rt,将四元组(st,aα,t,rt,sα,t+1)存入经验回放缓冲区Vα;对于每一个智能体的目标Q网络,从经验回放缓冲区Vα中随机抽取小批量的数据样本计算Q值
Figure BDA0003723492390000097
计算损失函数
Figure BDA0003723492390000098
利用梯度下降算法基于Lα(sα,t,aα,tt)最小化更新Q网络的参数πt,并更新相应的
Figure BDA0003723492390000099
步骤12:基于CMADDQN算法优化确定卫星通信系统资源分配策略,具体为:
Figure BDA00037234923900000910
表示期望累计奖励,在满足多波束卫星波束分配,子信道分配,发送功率分配和发送功率阶数选择的限制条件下,以最大化期望累计奖励为目标,优化确定波束调度和资源分配策略,即:
Figure BDA0003723492390000101
其中
Figure BDA0003723492390000102
Figure BDA0003723492390000103
分别是最优波束分配变量、最优子信道分配变量和最优卫星发送功率阶数选择变量。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于CMADDQN网络的多波束卫星通信系统资源分配方法,其特征在于,该方法具体包括以下步骤:
S1:建模多波束卫星通信场景;
S2:建模卫星子信道分配变量、卫星载波功率分配和卫星信道;
S3:建模卫星传输速率和卫星业务模型;
S4:计算业务公平性系数;
S5:建模卫星通信系统资源分配限制条件;
S6:建模系统状态及动作;
S7:建模系统回报函数;
S8:构建并训练多智能体协作双深度Q学习(Cooperative Multi-Agent Double DeepQ-Learning,CMADDQN)网络;
S9:基于CMADDQN网络优化确定卫星通信系统资源分配策略。
2.根据权利要求1所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S1中,建模多波束卫星通信场景,具体包括:多波束卫星的最大波束数为K,系统总带宽为B0,将总带宽分为M个等长的子信道,每个子信道带宽为B=B0/M,每个波束使用的最大子信道数目为M,Cm为第m个子信道的载波频率;令N表示卫星服务的小区数目,Un为小区n的汇聚设备,该设备汇聚小区的通信流量需求;系统总时间为T,将T分为等长的时隙,每个时隙长度为τ;卫星以等长数据包形式发送用户数据至各小区,令λn,t为t时隙小区n的数据包平均到达率,数据包长度为F,各数据包到达后需在J个时隙内发送,否则丢弃数据包。
3.根据权利要求2所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S2中,建模卫星子信道分配变量,具体包括:令xn,t=[xn,1,t xn,2,t…xn,m,t…xn,M,t]T表示t时隙小区n的子信道分配标识,xn,m,t∈{0,1},若t时隙卫星地面小区分配到子信道m,xn,m,t=1,若t时隙小区n没有分配到子信道m,xn,m,t=0;
建模卫星载波功率分配,具体包括:令pn,t=[pn,1,t pn,2,t…pn,m,t…pn,M,t]T表示t时隙卫星发送数据至小区n时的发送功率,其中pn,m,t表示t时隙卫星占用子信道m发送数据至小区n对应的发送功率,pn,m,t建模为
Figure FDA0003723492380000011
其中S为功率量化数目,ps为第s阶量化功率,即
Figure FDA0003723492380000012
ptot为每个波束的最大发送功率,δn,m,t,s为发送功率阶数选择变量,若t时隙卫星占用子信道m发送数据至小区n时选择发送功率ps,δn,m,t,s=1,否则,δn,m,t,s=0;
建模卫星信道,具体包括:令hn,m,t表示t时隙卫星与Un在子信道的信道增益,hn,m,t建模为
Figure FDA0003723492380000021
其中
Figure FDA0003723492380000022
表示Un接收天线增益,
Figure FDA0003723492380000023
建模为
Figure FDA00037234923800000211
其中J1(·)表示第一类一阶贝塞尔函数,J3(·)表示第一类三阶贝塞尔函数;un,t=2.07123sin(θn,t)/sin(θ3dB),θn,t表示t时隙卫星与Un接收天线的离轴角,θ3dB为3dB波束带宽对应的角度,gmax,r为接收天线最大增益;
Figure FDA0003723492380000024
表示卫星发送天线增益,表示为:
Figure FDA0003723492380000025
其中gmax,t为卫星发送天线最大增益,
Figure FDA00037234923800000212
为t时隙Un到卫星的仰角,Ln,m为卫星与Un之间链路在子信道m的自由损耗,
Figure FDA0003723492380000026
其中c为光速,dn为Un与卫星之间的距离;
Figure FDA0003723492380000027
为t时隙信道雨衰,hn,t表示t时隙卫星到Un之间链路的随机衰落特性。
4.根据权利要求3所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S3中,建模卫星传输速率,具体包括:令
Figure FDA0003723492380000028
其中Rn,t表示t时隙卫星与Un之间的传输速率,In,m,t为t时隙Un受到的干扰,
Figure FDA0003723492380000029
σn 2为噪声功率,σn 2=BN0,N0为噪声功率谱密度;
建模卫星业务模型,具体包括:令qn,t表示t时隙末卫星需发送至小区n的数据包数量,qn,t的更新公式为
Figure FDA00037234923800000210
5.根据权利要求4所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S4中,计算业务公平性系数,表达式为:
Figure FDA0003723492380000031
其中,ρt表示用户业务公平性系数;dn,t,j表示截至t时隙,前j时隙小区n请求但未服务的数据包数量。
6.根据权利要求5所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S5中,建模卫星通信系统资源分配限制条件,具体包括:
1)卫星波束分配限制
令yt={yn,t,1≤n≤N}为t时隙波束分配集合,其中yn,t表示波束分配变量,yn,t∈{0,1},若t时隙卫星波束点亮小区n,yn,t=1,否则,yn,t=0,每个时隙最多只有K个小区被卫星波束覆盖,则有
Figure FDA0003723492380000032
子信道分配与波束分配变量需满足如下限制:
Figure FDA0003723492380000033
2)卫星发送功率限制
卫星在t时隙的总发送功率需满足最大功率限制,则有
Figure FDA0003723492380000034
其中,pmax为卫星最大发送功率;每一个波束的发送功率需小于卫星波束最大发送功率,则有
Figure FDA0003723492380000035
其中,ptot为卫星波束最大发送功率;每个载波发送功率需满足波束分配变量的限制,则有
Figure FDA0003723492380000036
3)卫星发送功率阶数选择限制
卫星发送功率阶数选择变量应满足:
Figure FDA0003723492380000037
7.根据权利要求6所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S6中,建模系统状态及动作,具体包括:令st为t时隙的状态,建模为st={hn,m,t,Dn,t},其中Dn,t=[dn,t,0 dn,t,1…dn,t,J-1];令At为t时隙的动作空间,At建模为At={yn,t,xn,m,tn,m,t,s}。
8.根据权利要求7所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S7中,建模建模系统回报函数,具体包括:令rt为t时隙系统回报函数,rt建模为
Figure FDA0003723492380000041
其中ω1,ω2,ω3为加权系数,r1,t表示系统t时隙系统吞吐量回报函数,建模为
Figure FDA0003723492380000042
9.根据权利要求8所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S8中,构建并训练CMADDQN网络,具体包括:构建K个波束选择智能体和MK个功率选择智能体,每个波束拥有一个波束选择智能体和M个功率选择智能体,每个波束选择智能体选择一个小区并提供服务;每个功率选择智能体为子信道选择发送功率阶数,每个智能体包含一个Q网络和一个目标Q网络;训练阶段首先初始化经验回放缓冲区
Figure FDA0003723492380000043
1≤α≤(M+1)K;设定折扣因子γ,0≤γ≤1;初始化Q网络参数πt和目标Q网络参数
Figure FDA0003723492380000044
初始化每个智能体观察环境状态sα,t=st;令ε为噪声参数,对于每一个智能体的Q网络,以概率P<ε从动作空间At中随机选取动作aα,t,否则选取动作
Figure FDA0003723492380000045
各智能体执行联合动作at=(a1,t,a2,t,…,aα,t,…,a(M+1)K,t),环境状态转移到st+1,每个智能体得到全局奖励rt,将四元组(st,aα,t,rt,sα,t+1)存入经验回放缓冲区Vα;对于每一个智能体的目标Q网络,从经验回放缓冲区Vα中随机抽取小批量的数据样本计算目标Q网络的Q值
Figure FDA0003723492380000046
其中Qα(sα,t+1,aα,tα,t)表示从Vα抽取的小批量的数据样本中观察状态为st+1时的Q值;计算损失函数
Figure FDA0003723492380000047
利用梯度下降算法基于Lα(sα,t,aα,tt)最小化更新Q网络的参数πt,并更新相应的
Figure FDA0003723492380000048
10.根据权利要求9所述的多波束卫星通信系统资源分配方法,其特征在于,步骤S8中,基于CMADDQN网络优化确定卫星通信系统资源分配策略,具体包括:令
Figure FDA0003723492380000049
表示期望累计奖励,在满足多波束卫星波束分配,子信道分配,发送功率分配和发送功率阶数选择的限制条件下,以最大化期望累计奖励为目标,优化确定波束调度和资源分配策略,即:
Figure FDA0003723492380000051
其中
Figure FDA0003723492380000052
Figure FDA0003723492380000053
分别是最优波束分配变量、最优子信道分配变量和最优卫星发送功率阶数选择变量。
CN202210769747.8A 2022-06-30 2022-06-30 基于cmaddqn网络的多波束卫星通信系统资源分配方法 Active CN115173922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210769747.8A CN115173922B (zh) 2022-06-30 2022-06-30 基于cmaddqn网络的多波束卫星通信系统资源分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210769747.8A CN115173922B (zh) 2022-06-30 2022-06-30 基于cmaddqn网络的多波束卫星通信系统资源分配方法

Publications (2)

Publication Number Publication Date
CN115173922A true CN115173922A (zh) 2022-10-11
CN115173922B CN115173922B (zh) 2024-03-15

Family

ID=83490028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210769747.8A Active CN115173922B (zh) 2022-06-30 2022-06-30 基于cmaddqn网络的多波束卫星通信系统资源分配方法

Country Status (1)

Country Link
CN (1) CN115173922B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117528784A (zh) * 2023-11-09 2024-02-06 中国人民解放军军事科学院系统工程研究院 一种多波束卫星通信网络多域跨层协同控制方法及装置
CN117833997A (zh) * 2024-03-01 2024-04-05 南京控维通信科技有限公司 一种基于强化学习的noma多波束卫星通信系统多维资源分配方法
CN117833997B (zh) * 2024-03-01 2024-05-31 南京控维通信科技有限公司 一种基于强化学习的noma多波束卫星通信系统多维资源分配方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104639307A (zh) * 2015-01-23 2015-05-20 重庆邮电大学 无线网络虚拟化中的资源分配方法
CN108112082A (zh) * 2017-12-18 2018-06-01 北京工业大学 一种基于无状态q学习的无线网络分布式自主资源分配方法
CN108307511A (zh) * 2018-03-07 2018-07-20 重庆邮电大学 无线自回传小基站接入控制与资源分配联合优化方法
CN109729528A (zh) * 2018-12-21 2019-05-07 北京邮电大学 一种基于多智能体深度强化学习的d2d资源分配方法
CN109787696A (zh) * 2018-12-11 2019-05-21 杭州电子科技大学 基于案例推理与合作q学习的认知无线电资源分配方法
US20190268894A1 (en) * 2018-02-28 2019-08-29 Korea Advanced Institute Of Science And Technology Resource allocation method and apparatus for wireless backhaul network based on reinforcement learning
CN112486690A (zh) * 2020-12-11 2021-03-12 重庆邮电大学 一种适用于工业物联网的边缘计算资源分配方法
CN114553299A (zh) * 2022-02-17 2022-05-27 重庆邮电大学 一种卫星系统波束调度和资源分配方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104639307A (zh) * 2015-01-23 2015-05-20 重庆邮电大学 无线网络虚拟化中的资源分配方法
CN108112082A (zh) * 2017-12-18 2018-06-01 北京工业大学 一种基于无状态q学习的无线网络分布式自主资源分配方法
US20190268894A1 (en) * 2018-02-28 2019-08-29 Korea Advanced Institute Of Science And Technology Resource allocation method and apparatus for wireless backhaul network based on reinforcement learning
CN108307511A (zh) * 2018-03-07 2018-07-20 重庆邮电大学 无线自回传小基站接入控制与资源分配联合优化方法
CN109787696A (zh) * 2018-12-11 2019-05-21 杭州电子科技大学 基于案例推理与合作q学习的认知无线电资源分配方法
CN109729528A (zh) * 2018-12-21 2019-05-07 北京邮电大学 一种基于多智能体深度强化学习的d2d资源分配方法
CN112486690A (zh) * 2020-12-11 2021-03-12 重庆邮电大学 一种适用于工业物联网的边缘计算资源分配方法
CN114553299A (zh) * 2022-02-17 2022-05-27 重庆邮电大学 一种卫星系统波束调度和资源分配方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JIANJUN NI: "A Multiagent Q-Learning-Based Optimal Allocation Approach for Urban Water Resource Management System", 《 IEEE TRANSACTIONS ON AUTOMATION SCIENCE AND ENGINEERING》, vol. 11, no. 1, XP011536519, DOI: 10.1109/TASE.2012.2229978 *
唐伦: "非正交多址接入系统中基于受限马尔科夫决策过程的网络切片虚拟资源分配算法", 《万方数据库》 *
汪萧萧: "基于Q学习的星地融合协作传输中继选择策略", 《应用科学学报》, pages 250 - 260 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117528784A (zh) * 2023-11-09 2024-02-06 中国人民解放军军事科学院系统工程研究院 一种多波束卫星通信网络多域跨层协同控制方法及装置
CN117528784B (zh) * 2023-11-09 2024-05-24 中国人民解放军军事科学院系统工程研究院 一种多波束卫星通信网络多域跨层协同控制方法及装置
CN117833997A (zh) * 2024-03-01 2024-04-05 南京控维通信科技有限公司 一种基于强化学习的noma多波束卫星通信系统多维资源分配方法
CN117833997B (zh) * 2024-03-01 2024-05-31 南京控维通信科技有限公司 一种基于强化学习的noma多波束卫星通信系统多维资源分配方法

Also Published As

Publication number Publication date
CN115173922B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN112737837B (zh) 一种高动态网络拓扑下无人机群带宽资源分配方法
CN108834080B (zh) 异构网络中基于多播技术的分布式缓存和用户关联方法
CN111565419B (zh) 一种超密集网络中面向延迟优化的协作式边缘缓存方法
CN112601284B (zh) 基于多智能体深度强化学习的下行多小区ofdma资源分配方法
CN106454920A (zh) 一种lte与d2d混合网络中基于时延保证的资源分配优化算法
CN115441939B (zh) 基于maddpg算法的多波束卫星通信系统资源分配方法
Elsayed et al. Deep reinforcement learning for reducing latency in mission critical services
GB2456127A (en) Scheduling transmissions between base station and mobile stations based upon service performance parameters
Wang et al. Dynamic beam hopping of multi-beam satellite based on genetic algorithm
Qiao et al. Video quality provisioning for millimeter wave 5G cellular networks with link outage
Zheng et al. Leo satellite channel allocation scheme based on reinforcement learning
CN104703270A (zh) 适用于异构无线蜂窝网络的用户接入和功率分配方法
CN109788540A (zh) D2d系统中基于能量采集的功率控制和信道分配方法
CN113873658B (zh) 一种以用户服务权重增益为目标函数的跳波束资源分配方法
CN115173922A (zh) 基于cmaddqn网络的多波束卫星通信系统资源分配方法
CN117412391A (zh) 一种基于增强型双深度q网络的车联网无线资源分配方法
Rajendra et al. Optimal rate and distance based bandwidth slicing in uav assisted 5g networks
CN116981091A (zh) 一种星地融合网络资源分配方法
Lan et al. Mobile-edge computation offloading and resource allocation in heterogeneous wireless networks
Fu et al. Joint speed and bandwidth optimized strategy of UAV-assisted data collection in post-disaster areas
CN115767703A (zh) 面向swipt辅助去蜂窝大规模mimo网络的长期功率控制方法
CN115633402A (zh) 一种面向混合业务吞吐量优化的资源调度方法
CN115226231A (zh) 一种基于信息新鲜度的高铁通信无线资源分配方法
Dai et al. Heuristic computing methods for contact plan design in the spatial-node-based Internet of Everything
Wu et al. QoE-Driven UAV Video Transmission in a Multi-UAV Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240202

Address after: 518000 1104, Building A, Zhiyun Industrial Park, No. 13, Huaxing Road, Henglang Community, Longhua District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Hongyue Information Technology Co.,Ltd.

Country or region after: China

Address before: 400065 Chongqing Nan'an District huangjuezhen pass Chongwen Road No. 2

Applicant before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

Country or region before: China

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant