CN111970047A - 一种基于强化学习的leo卫星信道分配方法 - Google Patents

一种基于强化学习的leo卫星信道分配方法 Download PDF

Info

Publication number
CN111970047A
CN111970047A CN202010860531.3A CN202010860531A CN111970047A CN 111970047 A CN111970047 A CN 111970047A CN 202010860531 A CN202010860531 A CN 202010860531A CN 111970047 A CN111970047 A CN 111970047A
Authority
CN
China
Prior art keywords
channel
allocation
resource
user
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010860531.3A
Other languages
English (en)
Other versions
CN111970047B (zh
Inventor
郑飞
皮昭
周陬
仇洪冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202010860531.3A priority Critical patent/CN111970047B/zh
Publication of CN111970047A publication Critical patent/CN111970047A/zh
Application granted granted Critical
Publication of CN111970047B publication Critical patent/CN111970047B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/185Space-based or airborne stations; Stations for satellite systems
    • H04B7/1853Satellite systems for providing telephony service to a mobile station, i.e. mobile satellite service
    • H04B7/18539Arrangements for managing radio, resources, i.e. for establishing or releasing a connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/185Space-based or airborne stations; Stations for satellite systems
    • H04B7/1853Satellite systems for providing telephony service to a mobile station, i.e. mobile satellite service
    • H04B7/18539Arrangements for managing radio, resources, i.e. for establishing or releasing a connection
    • H04B7/18543Arrangements for managing radio, resources, i.e. for establishing or releasing a connection for adaptation of transmission parameters, e.g. power control

Abstract

本发明公开了一种基于强化学习的LEO卫星信道资源分配方法,包括如下步骤:(1)星上集中式资源池给各波束小区预分配信道资源;(2)若预分配资源富余,则将其回收到资源池,若预分配资源无法满足用户需求,以动态分配的方式调度信道资源;(3)系统利用Q‑Learning算法进行训练以寻找最优分配策略,训练结束后根据分配策略进行动态信道调度;(4)系统进入下一业务请求时间间隔,以固定信道预分配和动态信道调度相结合的方式分配信道。本发明通过集中式资源池管理信道资源以适应波束间业务差异性,采用强化学习解决信道分配过中的时间关联性问题,从而实现LEO卫星系统高效信道资源分配。

Description

一种基于强化学习的LEO卫星信道分配方法
技术领域
本发明涉及LEO卫星应用技术领域,具体涉及一种基于强化学习的LEO卫星信道分配方法。
背景技术
在各种类型的卫星中,低轨道卫星有着路径损耗小、通信时延短、轨道位置灵活等特点,通过低轨卫星星座可以实现全球区域的无缝覆盖。然而卫星系统可用的频谱、功率、时隙等资源都极为稀缺宝贵,合理高效地分配卫星网络资源成为亟需解决的问题。
由于卫星运动而引起覆盖区域的动态变化以及地面用户的非均匀分布特性,业务量载荷时刻都在发生变化,而低轨卫星的星上资源在出厂设置时已经固化,传统的固定信道分配方式难以适应波束间业务差异性。动态信道分配技术能实现资源的跨波束调度,相对于固定分配技术具有更高的资源利用率。通信网络中业务请求是一个离散的动态过程,当前时刻资源分配结果会影响后续时刻资源分配决策,现有的动态资源分配算法关注了系统瞬时性能,而忽略了信道分配过程中的时间关联性。
发明内容
本发明提供一种基于强化学习的LEO卫星信道分配方法,可实现LEO卫星信道资源的跨波束调度,从而适应波束间业务差异性,利用Q-Learning算法来学习最优信道分配策略并进行动态信道分配,解决系统信道分配过程中的时间关联问题。
本发明一种基于强化学习的LEO卫星信道分配方法,具体步骤如下:
(1)初始化LEO卫星系统相关参数,在用户接入LEO卫星网络之前,星上集中式资源池给各波束小区预分配固定数量的信道资源;
(2)在用户接入LEO卫星网络之后,若系统预分配的信道资源有富余,则系统回收富余信道到资源池;若系统预分配的信道资源无法满足用户需求,资源池将以动态分配的方式进行信道资源调度;
(3)在动态信道资源调度中,系统根据当前信道状况和用户接入情况构建状态空间、动作空间、奖励函数,利用Q-Learning算法进行训练以寻找最优分配策略,训练结束后根据分配策略进行动态信道调度;
(4)系统进入下一业务请求时间间隔,以上述固定信道预分配和动态信道调整相结合的方式进行信道资源分配。
在步骤(1)中,星上集中式资源池是整个系统的核心部分,集信息处理、资源分配、资源收集于一体,各卫星间的资源通过交换结构相连并实时调配资源,交换结构下的中央管理单元集中管理BBU,集中式资源池不仅要对用户的发出业务请求进行处理并分配资源,同时还要根据各波束内资源的占用情况来进行相应的调度,以适应业务请求的非均匀分布特性。
在步骤(1)中,初始化LEO卫星系统相关参数,需要根据当前系统状况构建信道分配状态矩阵和信道功率分配矩阵,具体方法是:
LEO卫星系统通过相控阵天线在地面上形成N个波束,用集合X={xn|n=1,2,…,N}表示,系统可用信道个数为M,信道用集合Y={ym|m=1,2,…,M}表示,用户集合用U={un,k|n=1,2,…,N,k=1,2,…,K}表示,第n个波束内的第k个用户表示为un,k
系统采用波束间频率复用的方式分配信道资源,定义系统的信道分配状态矩阵V和信道功率分配矩阵P分别为:
Figure BDA0002647907510000021
其中,vn,m和pn,m分别表示第n个波束中第m个信道分配状态和发射功率,vn,m∈{0,1},vn,m=1表示信道ym在波束xn中被使用,否则未使用;
为衡量系统的信道分配性能,定义
Figure BDA0002647907510000022
为系统提供速率与用户请求业务速率之比,即供需比
Figure BDA0002647907510000023
为:
Figure BDA0002647907510000024
其中
Figure BDA0002647907510000025
系统提供的信道速率,
Figure BDA0002647907510000026
为用户请求业务速率;系统根据实时状况初始化参数,资源池给各波束预分配信道。
在步骤(3)中,所述构建状态空间、动作空间、奖励函数的具体方法是:
1)根据系统内用户的信道分配情况来构建状态空间st
Figure BDA0002647907510000031
其中矩阵行数为各个波束中最大用户数,由于各波束内用户数量不同,所以取单波束最大用户数来重构矩阵;矩阵列数为系统波束个数,其中,wn,k为第n个波束下第k个用户的信道分配状况,该矩阵内任意一项wn,k∈{-1,0,1},wn,k=-1表示存在用户请求但未分配资源、wn,k=0表示当前状态下无用户请求,wn,k=1表示存在用户请求且已分配资源,当所有请求用户均已分配资源或者系统无可用资源时即达到终止状态,该次分配结束;
2)系统根据当前的状态从可用信道集合A(s)中选取合适的动作,将信道分配定义为动作空间at
Figure BDA0002647907510000032
式中,m为系统给用户分配的信道,动作的选取规则是从可用信道集合A(s)中以概率ε随机选取动作进行探索,以概率1-ε选取最大Q值的动作进行利用;
3)当系统资源丰富时,在保证各个信道不被堵塞的前提下,系统尽量给各用户分配更多的带宽来提高系统吞吐量,即最大化吞吐量准则,将奖励函数设置为:
Figure BDA0002647907510000033
当系统资源匮乏时,系统要在用户服务不中断的情况下响应更多用户的请求,因此此时的信道分配原则是最小化系统供需方差,将奖励函数设置为:
Figure BDA0002647907510000034
其中
Figure BDA0002647907510000035
系统提供的信道速率,
Figure BDA0002647907510000036
为用户请求业务速率;
4)将上述构建的状态空间、动作空间和奖励函数输入到Q-Learning算法中训练,利用训练得出的Q值表引导系统进行动态信道调度。
在步骤(3)中,所述Q-Learning算法进行训练以寻找最优分配策略,是利用指数梯度下降和信息强度更新策略来加快算法收敛,其步骤包括:
1)在动作选择过程中,随机探索概率ε随训练步数的增加呈指数下降,即
Figure BDA0002647907510000041
其中l0为最大训练步数,l为训练步数,ε0为初始探索概率,e为自然指数;
2)只有当动作产生的奖励rt大于Q值表记录最大奖励rmax才更新Q值表,定义动作的信息强度为:
Figure BDA0002647907510000042
式中Δ默认为1,利用启发式函数更新Q值表,定义启发式函数为:
Figure BDA0002647907510000043
其中Q(st,at)为状态st下动作at的Q值,J(st,at)为状态st下动作at的信息强度,∑iJ(st,ai)为状态st下所有动作的信息强度和。
与现有技术相比,本发明的有益效果:通过集中式资源池统一管理信道资源,解决由于卫星运动引起覆盖区域的动态变化以及地面用户的非均匀分布特性造成的波束间业务差异性问题;制定固定信道预分配与动态信道调度相结合的两步分配方案,根据波束小区的业务量调用或回收信道资源;采用强化学习的方式进行动态信道分配加强系统资源分配过程中的决策能力;利用指数梯度下降与信息强度更新策略来加快算法收敛。
附图说明
图1是本发明的星上集中式资源池结构示意图;
图2是本发明的单星下资源分配映射模式示意图;
图3是本发明的卫星系统与地面用户的交互过程示意图;
图4是本发明的LEO卫星信道分配方法流程。
具体实施方式
为了更好地理解本发明技术方案,下面结合附图和实施例对本发明内容作进一步的说明。
参照图1,本发明的星上集中式资源池结构示意图,集中式资源池集信息处理、资源分配、资源收集于一体,各卫星间的资源通过交换结构相连并实时调配资源,交换结构下的中央管理单元集中管理BBU。
参照图2,本发明的单星下资源分配映射模式示意图,集中式资源池不仅要对用户的发出业务请求进行处理并分配资源,同时还要根据各波束内资源的利用情况来进行相应的调度,以适应业务请求的非均匀分布特性。
参照图3,本发明的卫星系统与地面用户的交互过程示意图,通过卫星系统和当前通信环境的交互,不断对卫星系统的决策能力进行强化,从而达到提高资源利用率的目的。
实施例
本发明提出一种基于强化学习的LEO卫星信道分配方法,其流程如图4所示,具体步骤如下:
(1)初始化LEO卫星系统相关参数,预分配信道数量重置为0,根据系统具体参数重置波束集合X、系统信道集合Y以及用户集合U;
(2)系统给每一波束预分配固定数量的信道资源,本实施例中设置为10个;
(3)在每个业务请求时间间隔T内,系统对用户分配一次资源,若预分配的信道资源已经能够满足用户需求,系统将回收富余的信道资源到资源池;若预分配信道无法满足用户需求,资源池调度信道资源,通过强化学习训练出最优分配策略;
(4)在训练动态分配策略过程中,首先初始化Q-Learning算法的相关参数,具体步骤如下:
1)学习速率α,本实施例中取α=0.1;
2)折扣因子γ,本实施例中取γ=0.9;
3)初始探索概率ε0,本实施例中取ε0=0.9;
4)Q值表,Q值表各元素在训练之前重置为0;
(5)在训练动态分配策略过程中,首先初始化Q-Learning算法的状态空间、动作空间以及奖励函数,具体步骤如下:
1)根据系统内用户的信道分配情况来构建状态空间st
Figure BDA0002647907510000061
取各波束中最大用户数为矩阵的行,系统波束个数为矩阵的列,矩阵内任意一项wn,k∈{-1,0,1},wn,k=-1表示存在用户请求但未分配资源、wn,k=0表示当前状态下无用户请求,wn,k=1表示存在用户请求且已分配资源;
2)根据系统信道集合定义动作空间at
Figure BDA0002647907510000062
A(s)为当前系统可用的信道集合,m为系统给用户分配的信道;
3)定义奖励函数:当系统资源丰富时,在保证各个信道不被堵塞的前提下,尽量给各信道分配更多的带宽来提高系统吞吐量,即最大化吞吐量准则,将奖励函数设置为:
Figure BDA0002647907510000063
当系统资源匮乏时,系统要在用户服务不中断的情况下响应更多用户的请求,此时的信道分配原则是最小化系统供需方差,将奖励函数设置为:
Figure BDA0002647907510000064
(6)在训练动态分配策略过程中,Q-Learning算法训练具体步骤如下:
1)系统观察当前时刻状态st
2)系统根据当前状态st选择动作at
3)系统在做出动作之后进入下一状态st+1,同时系统获得奖励反馈rt
4)系统更新当前状态-动作的Q值,并记录在Q值表中,同时更新随机探索概率;
5)当系统无可用信道资源或到达最终状态时,该次训练结束;
6)重复训练,直至Q值表收敛,利用Q值表指导动态信道分配。
系统进入下一业务请求时间间隔,重复上述步骤进行信道分配。
本发明提供一种基于强化学习的LEO卫星信道分配方法,利用Q-Learning算法来学习最优信道分配策略并进行动态信道分配,解决系统信道分配过程中的时间关联问题。

Claims (5)

1.一种基于强化学习的LEO卫星信道分配方法,其特征在于,包括以下步骤:
(1)初始化LEO卫星系统相关参数,在用户接入LEO卫星网络之前,星上集中式资源池给各波束小区预分配固定数量的信道资源;
(2)在用户接入LEO卫星网络之后,若系统预分配的信道资源有富余,则系统回收富余信道到资源池;若系统预分配的信道资源无法满足用户需求,资源池将以动态分配的方式进行信道资源调度;
(3)当采取动态信道资源调度时,系统根据当前信道状况和用户接入情况构建状态空间、动作空间、奖励函数,利用Q-Learning算法进行训练以寻找最优分配策略,训练结束后根据分配策略进行动态信道调度;
(4)系统进入下一业务请求时间间隔,以上述固定信道预分配和动态信道资源调度相结合的方式进行信道资源分配。
2.根据权利要求1所述的基于强化学习的LEO卫星信道分配方法,其特征在于:在步骤(1)中,星上集中式资源池是整个系统的核心部分,集信息处理、资源分配、资源收集于一体,各卫星间的资源通过交换结构相连并实时调配资源,交换结构下的中央管理单元集中管理BBU,集中式资源池不仅要对用户发出的业务请求进行处理并分配资源,同时还要根据各波束内资源的占用情况来进行相应的调度,以适应业务请求的非均匀分布特性。
3.根据权利要求1所述的基于强化学习的LEO卫星信道分配方法,其特征在于:在步骤(1)中,初始化LEO卫星系统相关参数,需要根据当前系统状况构建信道分配状态矩阵和信道功率分配矩阵,具体方法是:
LEO卫星系统通过相控阵天线在地面上形成N个波束,用集合
Figure FDA0002647907500000011
表示,系统可用信道个数为M,信道用集合Y={ym|m=1,2,…,M}表示,用户集合用U={un,k|n=1,2,…,N,k=1,2,…,K}表示,第n个波束内的第k个用户表示为un,k
系统采用波束间频率复用的方式分配信道资源,定义系统的信道分配状态矩阵V和信道功率分配矩阵P分别为:
Figure FDA0002647907500000021
Figure FDA0002647907500000022
其中,vn,m和pn,m分别表示第n个波束中第m个信道分配状态和发射功率,vn,m∈{0,1},vn,m=1表示信道ym在波束xn中被使用,否则未使用;
为衡量系统的信道分配性能,定义
Figure FDA0002647907500000023
为系统提供速率与用户请求业务速率之比,即供需比
Figure FDA0002647907500000024
为:
Figure FDA0002647907500000025
其中
Figure FDA0002647907500000026
系统提供的信道速率,
Figure FDA0002647907500000027
为用户请求业务速率;系统根据实时状况初始化参数,资源池给各波束预分配信道。
4.根据权利要求1所述的基于强化学习的LEO卫星信道分配方法,其特征在于,在步骤(3)中,所述构建状态空间、动作空间、奖励函数的具体方法是:
1)根据系统内用户的信道分配情况来构建状态空间st
Figure FDA0002647907500000028
矩阵行数为各个波束中最大用户数,由于各波束内用户数量不同,所以取单波束最大用户数来重构矩阵;矩阵列数为系统波束个数,其中,wn,k为第n个波束下第k个用户的信道分配状况,该矩阵内任意一项wn,k∈{-1,0,1},wn,k=-1表示存在用户请求但未分配资源,wn,k=0表示当前状态下无用户请求,wn,k=1表示存在用户请求且已分配资源,当所有请求用户均已分配资源或者系统无可用资源时即达到终止状态,该次分配结束;
2)系统根据当前的状态从可用信道集合A(s)中选取合适的动作,将信道分配定义为动作空间at:
Figure FDA0002647907500000036
式中,m为系统给用户分配的信道,动作的选取规则是从可用信道集合A(s)中以概率ε随机选取动作进行探索,以概率1-ε选取最大Q值的动作进行利用;
3)当系统资源丰富时,在保证各个信道不被堵塞的前提下,系统尽量给各用户分配更多的带宽来提高系统吞吐量,即最大化吞吐量准则,将奖励函数设置为:
Figure FDA0002647907500000031
当系统资源匮乏时,系统要在用户服务不中断的情况下响应更多用户的请求,此时的信道分配原则是最小化系统供需方差,将奖励函数设置为:
Figure FDA0002647907500000032
其中
Figure FDA0002647907500000033
系统提供的信道速率,
Figure FDA0002647907500000034
为用户请求业务速率;
4)将上述构建的状态空间、动作空间和奖励函数输入到Q-Learning算法中训练,利用训练得出的Q值表引导系统进行动态信道调度。
5.根据权利要求1所示的基于强化学习的LEO卫星信道分配方法,其特征在于,在步骤(3)中,所述Q-Learning算法进行训练以寻找最优分配策略,是利用指数梯度下降和信息强度更新策略来加快算法收敛,其步骤包括:
1)在动作选择过程中,随机探索概率ε随训练步数的上升呈指数下降,即
Figure FDA0002647907500000035
其中l0为最大训练步数,l训练步数,ε0为初始探索概率,e为自然指数;
2)只有当动作产生的奖励rt大于Q值表记录最大奖励rmax时才更新Q值表,定义动作的信息强度为:
Figure FDA0002647907500000041
式中Δ默认为1,利用启发式函数更新Q值表,定义启发式函数为:
Figure FDA0002647907500000042
其中Q(st,at)为状态st下动作at的Q值,J(st,at)为状态st下动作at的信息强度,∑iJ(st,ai)为状态st下所有动作的信息强度和。
CN202010860531.3A 2020-08-25 2020-08-25 一种基于强化学习的leo卫星信道分配方法 Active CN111970047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010860531.3A CN111970047B (zh) 2020-08-25 2020-08-25 一种基于强化学习的leo卫星信道分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010860531.3A CN111970047B (zh) 2020-08-25 2020-08-25 一种基于强化学习的leo卫星信道分配方法

Publications (2)

Publication Number Publication Date
CN111970047A true CN111970047A (zh) 2020-11-20
CN111970047B CN111970047B (zh) 2022-03-25

Family

ID=73390053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010860531.3A Active CN111970047B (zh) 2020-08-25 2020-08-25 一种基于强化学习的leo卫星信道分配方法

Country Status (1)

Country Link
CN (1) CN111970047B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112887005A (zh) * 2021-01-06 2021-06-01 成都天奥集团有限公司 一种消解卫星切换影响的全交换方法及装置
CN113038387A (zh) * 2021-03-12 2021-06-25 重庆邮电大学 低轨卫星网络中基于q学习的切换判决方法
CN113162682A (zh) * 2021-05-13 2021-07-23 重庆邮电大学 一种基于pd-noma的多波束leo卫星系统资源分配方法
CN113258988A (zh) * 2021-05-13 2021-08-13 重庆邮电大学 一种基于dqn的多业务低轨卫星资源分配方法
CN113541768A (zh) * 2021-07-06 2021-10-22 桂林电子科技大学 一种基于noma的leo卫星通信系统频点分配方法
CN113572517A (zh) * 2021-07-30 2021-10-29 哈尔滨工业大学 基于深度强化学习的跳波束资源分配方法、系统、存储介质及设备
CN113613301A (zh) * 2021-08-04 2021-11-05 北京航空航天大学 一种基于dqn的空天地一体化网络智能切换方法
CN114362810A (zh) * 2022-01-11 2022-04-15 重庆邮电大学 一种基于迁移深度强化学习的低轨卫星跳波束优化方法
CN114553299A (zh) * 2022-02-17 2022-05-27 重庆邮电大学 一种卫星系统波束调度和资源分配方法
CN114710200A (zh) * 2022-04-07 2022-07-05 中国科学院计算机网络信息中心 一种基于强化学习的卫星网络资源编排方法及系统
CN114900225A (zh) * 2022-04-24 2022-08-12 南京大学 一种基于低轨巨星座的民航互联网业务管理与接入资源分配方法
CN115001611A (zh) * 2022-05-18 2022-09-02 西安交通大学 一种基于强化学习的跳波束卫星频谱共享系统的资源分配方法
CN115001570A (zh) * 2022-08-03 2022-09-02 中电防务科技有限公司 一种基于多波束卫星移动通信系统的应急通信方法
CN115483960A (zh) * 2022-08-23 2022-12-16 爱浦路网络技术(南京)有限公司 低轨卫星的跳波束调度方法、系统、装置及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917728A (zh) * 2010-08-13 2010-12-15 西安空间无线电技术研究所 一种星载处理资源池的动态分配实现结构
CN103441790A (zh) * 2012-12-07 2013-12-11 南京邮电大学 适用于卫星网络的多业务信道资源管理方法
CN107241134A (zh) * 2017-06-28 2017-10-10 东北大学 一种低轨卫星通信系统的信道分配方法
US20180234168A1 (en) * 2012-09-04 2018-08-16 Viasat, Inc. Paired-beam transponder satellite communication
CN108966352A (zh) * 2018-07-06 2018-12-07 北京邮电大学 基于深度增强学习的动态波束调度方法
CN108989099A (zh) * 2018-07-02 2018-12-11 北京邮电大学 基于软件定义天地一体化网络的联合资源分配方法和系统
CN109743735A (zh) * 2018-12-18 2019-05-10 北京邮电大学 一种卫星通信系统中基于深度增强学习的动态信道分配方法
CN111163520A (zh) * 2019-12-27 2020-05-15 东方红卫星移动通信有限公司 一种低轨卫星通信系统的动态资源分配方法
CN111211831A (zh) * 2020-01-13 2020-05-29 东方红卫星移动通信有限公司 一种多波束低轨卫星智能动态信道资源分配方法
CN111491382A (zh) * 2020-04-09 2020-08-04 清华大学 卫星容量分配方法、装置和电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917728A (zh) * 2010-08-13 2010-12-15 西安空间无线电技术研究所 一种星载处理资源池的动态分配实现结构
US20180234168A1 (en) * 2012-09-04 2018-08-16 Viasat, Inc. Paired-beam transponder satellite communication
CN103441790A (zh) * 2012-12-07 2013-12-11 南京邮电大学 适用于卫星网络的多业务信道资源管理方法
CN107241134A (zh) * 2017-06-28 2017-10-10 东北大学 一种低轨卫星通信系统的信道分配方法
CN108989099A (zh) * 2018-07-02 2018-12-11 北京邮电大学 基于软件定义天地一体化网络的联合资源分配方法和系统
CN108966352A (zh) * 2018-07-06 2018-12-07 北京邮电大学 基于深度增强学习的动态波束调度方法
CN109743735A (zh) * 2018-12-18 2019-05-10 北京邮电大学 一种卫星通信系统中基于深度增强学习的动态信道分配方法
CN111163520A (zh) * 2019-12-27 2020-05-15 东方红卫星移动通信有限公司 一种低轨卫星通信系统的动态资源分配方法
CN111211831A (zh) * 2020-01-13 2020-05-29 东方红卫星移动通信有限公司 一种多波束低轨卫星智能动态信道资源分配方法
CN111491382A (zh) * 2020-04-09 2020-08-04 清华大学 卫星容量分配方法、装置和电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BAOKANG ZHAO,ETC.: "A Deep Reinforcement Learning Based Approach for Energy-Efficient Channel Allocation in Satellite Internet of Things", 《IEEE ACCESS》 *
刘召: "多波束卫星动态信道资源分配算法", 《移动通信》 *
韩永锋,等: "基于深度强化学习的卫星动态资源管理研究综述", 《第十六届卫星通信学术年会论文集》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112887005A (zh) * 2021-01-06 2021-06-01 成都天奥集团有限公司 一种消解卫星切换影响的全交换方法及装置
CN113038387A (zh) * 2021-03-12 2021-06-25 重庆邮电大学 低轨卫星网络中基于q学习的切换判决方法
CN113038387B (zh) * 2021-03-12 2024-02-20 深圳泓越信息科技有限公司 低轨卫星网络中基于q学习的切换判决方法
CN113258988B (zh) * 2021-05-13 2022-05-20 重庆邮电大学 一种基于dqn的多业务低轨卫星资源分配方法
CN113162682A (zh) * 2021-05-13 2021-07-23 重庆邮电大学 一种基于pd-noma的多波束leo卫星系统资源分配方法
CN113258988A (zh) * 2021-05-13 2021-08-13 重庆邮电大学 一种基于dqn的多业务低轨卫星资源分配方法
CN113162682B (zh) * 2021-05-13 2022-06-24 重庆邮电大学 一种基于pd-noma的多波束leo卫星系统资源分配方法
CN113541768A (zh) * 2021-07-06 2021-10-22 桂林电子科技大学 一种基于noma的leo卫星通信系统频点分配方法
CN113572517A (zh) * 2021-07-30 2021-10-29 哈尔滨工业大学 基于深度强化学习的跳波束资源分配方法、系统、存储介质及设备
CN113572517B (zh) * 2021-07-30 2022-06-24 哈尔滨工业大学 基于深度强化学习的跳波束资源分配方法、系统、存储介质及设备
CN113613301A (zh) * 2021-08-04 2021-11-05 北京航空航天大学 一种基于dqn的空天地一体化网络智能切换方法
CN114362810A (zh) * 2022-01-11 2022-04-15 重庆邮电大学 一种基于迁移深度强化学习的低轨卫星跳波束优化方法
CN114553299A (zh) * 2022-02-17 2022-05-27 重庆邮电大学 一种卫星系统波束调度和资源分配方法
CN114553299B (zh) * 2022-02-17 2024-03-29 深圳泓越信息科技有限公司 一种卫星系统波束调度和资源分配方法
CN114710200A (zh) * 2022-04-07 2022-07-05 中国科学院计算机网络信息中心 一种基于强化学习的卫星网络资源编排方法及系统
CN114900225A (zh) * 2022-04-24 2022-08-12 南京大学 一种基于低轨巨星座的民航互联网业务管理与接入资源分配方法
CN115001611B (zh) * 2022-05-18 2023-09-26 西安交通大学 一种基于强化学习的跳波束卫星频谱共享系统的资源分配方法
CN115001611A (zh) * 2022-05-18 2022-09-02 西安交通大学 一种基于强化学习的跳波束卫星频谱共享系统的资源分配方法
CN115001570A (zh) * 2022-08-03 2022-09-02 中电防务科技有限公司 一种基于多波束卫星移动通信系统的应急通信方法
CN115001570B (zh) * 2022-08-03 2022-10-25 中电防务科技有限公司 一种基于多波束卫星移动通信系统的应急通信方法
CN115483960B (zh) * 2022-08-23 2023-08-29 爱浦路网络技术(南京)有限公司 低轨卫星的跳波束调度方法、系统、装置及存储介质
CN115483960A (zh) * 2022-08-23 2022-12-16 爱浦路网络技术(南京)有限公司 低轨卫星的跳波束调度方法、系统、装置及存储介质

Also Published As

Publication number Publication date
CN111970047B (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN111970047B (zh) 一种基于强化学习的leo卫星信道分配方法
CN113258988B (zh) 一种基于dqn的多业务低轨卫星资源分配方法
CN112134916B (zh) 一种基于深度强化学习的云边协同计算迁移方法
Lei et al. Beam illumination pattern design in satellite networks: Learning and optimization for efficient beam hopping
CN114362810B (zh) 一种基于迁移深度强化学习的低轨卫星跳波束优化方法
Hu et al. Deep reinforcement learning‐based beam Hopping algorithm in multibeam satellite systems
CN110267338A (zh) 一种d2d通信中联合资源分配和功率控制方法
US7945269B2 (en) Method of carrier allocation to a plurality of cells in a cellular communication system
CN111867104B (zh) 一种低轨卫星下行链路的功率分配方法及功率分配装置
CN115021799B (zh) 一种基于多智能体协同的低轨卫星切换方法
CN113572517B (zh) 基于深度强化学习的跳波束资源分配方法、系统、存储介质及设备
US20050007991A1 (en) Bandwidth allocation method and apparatus for fixed wireless networks
CN109743735A (zh) 一种卫星通信系统中基于深度增强学习的动态信道分配方法
CN112418719B (zh) 一种基于解集构造和信息素沉积的卫星资源动态调度方法
CN114071528B (zh) 基于业务需求预测的多波束卫星波束资源适配方法
CN111526592B (zh) 一种用于无线干扰信道中的非协作多智能体功率控制方法
GB2582165A (en) Managing satellite bearer resources
CN113541768B (zh) 一种基于noma的leo卫星通信系统频点分配方法
CN115173922A (zh) 基于cmaddqn网络的多波束卫星通信系统资源分配方法
CN114845310A (zh) 一种基于人工蜂群算法的leo卫星信道分配方法
Li et al. A Lightweight Transmission Parameter Selection Scheme Using Reinforcement Learning for LoRaWAN
Ma et al. Deep reinforcement learning for dynamic bandwidth allocation in multi-beam satellite systems
CN111555794B (zh) 一种用于天基信息系统的资源分配方法
CN116546624B (zh) 跳波卫星业务预测与多维链路动态资源分配方法及装置
CN115276765B (zh) 一种面向业务优先级的atdm卫星通信调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20201120

Assignee: Guilin Hongtian Technology Co.,Ltd.

Assignor: GUILIN University OF ELECTRONIC TECHNOLOGY

Contract record no.: X2022450000441

Denomination of invention: A Channel Allocation Method for LEO Satellite Based on Reinforcement Learning

Granted publication date: 20220325

License type: Common License

Record date: 20221229