CN113038387A - 低轨卫星网络中基于q学习的切换判决方法 - Google Patents

低轨卫星网络中基于q学习的切换判决方法 Download PDF

Info

Publication number
CN113038387A
CN113038387A CN202110267062.9A CN202110267062A CN113038387A CN 113038387 A CN113038387 A CN 113038387A CN 202110267062 A CN202110267062 A CN 202110267062A CN 113038387 A CN113038387 A CN 113038387A
Authority
CN
China
Prior art keywords
user terminal
satellite
switching
value
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110267062.9A
Other languages
English (en)
Other versions
CN113038387B (zh
Inventor
李云
刘梦梦
吴广富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hongyue Information Technology Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202110267062.9A priority Critical patent/CN113038387B/zh
Publication of CN113038387A publication Critical patent/CN113038387A/zh
Application granted granted Critical
Publication of CN113038387B publication Critical patent/CN113038387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W36/00Hand-off or reselection arrangements
    • H04W36/0005Control or signalling for completing the hand-off
    • H04W36/0083Determination of parameters used for hand-off, e.g. generation or modification of neighbour cell lists
    • H04W36/0085Hand-off measurements
    • H04W36/0094Definition of hand-off measurement parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W36/00Hand-off or reselection arrangements
    • H04W36/16Performing reselection for specific purposes
    • H04W36/22Performing reselection for specific purposes for handling the traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W36/00Hand-off or reselection arrangements
    • H04W36/24Reselection being triggered by specific parameters
    • H04W36/30Reselection being triggered by specific parameters by measured or perceived connection quality data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明属于移动通信技术领域,涉及一种低轨卫星网络中基于Q学习的切换判决方法;所述判决方法包括采用高斯马尔科夫模型和卫星的星历信息预测出用户终端可能的切换路径,并确定所述用户终端所对应的候选卫星;基于候选卫星的接收信号强度、服务时间、信道利用率以及中继开销制定出用户终端关联不同候选卫星的收益函数;计算出用户终端在当前状态下选择不同决策动作所获得的收益奖赏值;根据所述收益奖赏值,用户终端采用Q学习算法计算出对应的Q值;用户终端根据Q值表对进行切换判决,使得用户终端关联到对应卫星;本发明不仅极大地降低了用户终端的切换失败率,而且有效地均衡了网络负载。

Description

低轨卫星网络中基于Q学习的切换判决方法
技术领域
本发明属于移动通信技术领域,涉及一种低轨卫星网络中基于Q学习的切换判决方法。
背景技术
由于基站部署困难等问题的限制,地面蜂窝网络不能提供偏远山区、海洋、高原等地区的移动业务。卫星通信通过多颗卫星进行联合组网形成卫星星座,具有覆盖范围广、不受地域和空域限制的特点引起人们的关注。卫星通信网络与地面移动通信网络的融合将成为移动通信的重要发展方向。其中低轨卫星系统因具有低时延、路径损耗小以及覆盖面积广等特点而受到人们的广泛关注,然而由于卫星相对地面的高速移动以及用户终端的移动性,单颗低轨卫星对地面终端的覆盖时间有限,用户终端在进行通信时需要进行频繁地切换。常见的卫星切换包括星间切换和波束切换。波束切换主要涉及到卫星的信道分配问题,常用的信道分配包括排队切换、信道预留等技术,相关研究已经很成熟。本发明内容主要针对星间切换中的星地链路切换。
目前,星间切换中都是基于仰角、服务时间、空闲信道数、接收信号强度这些因素进行单属性或多属性决策,都是基于当前时刻下做出的最优切换判决;但是这些切换策略都没有考虑终端的运动特性对切换过程的影响,且当前时刻的最优选择在用户的整个通信时长内未必是最优;此外,并未将卫星拓扑结构对切换过程造成的影响考虑在内,导致了用户切换失败率和新呼叫阻塞率较高。
发明内容
基于现有技术存在的问题,本发明的目的在于提供一种低轨卫星网络中基于Q-learning的切换判决方法。该算法首先考虑用户终端的移动性,运用高斯马尔可夫模型和卫星的星历信息预测出用户终端可能的切换路径。然后考虑候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子制定用户终端关联不同卫星的收益函数。最后用户终端根据Q值表来进行切换判决,使得用户终端关联到合适的卫星。
本发明提供如下解决方案以解决上述技术问题:
一种低轨卫星网络中基于Q学习的切换判决方法,所述方法包括以下步骤:
S1、采用高斯马尔科夫模型和卫星的星历信息预测出用户终端可能的切换路径,并确定所述用户终端所对应的候选卫星;
S2、基于候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子,制定出用户终端关联不同候选卫星的收益函数;
S3、计算出用户终端在当前状态下选择不同决策动作所获得的收益奖赏值;
S4、根据所述收益奖赏值,用户终端采用Q学习算法计算出对应的Q值;
S5、用户终端根据Q值表对进行切换判决,使得用户终端关联到对应卫星。
本发明的有益效果:
本发明考虑用户终端的移动性,首先运用高斯马尔可夫模型对终端轨迹进行预测,然后结合卫星的星历信息,可获得在终端的整个通信时长内可能的切换路径;其次,考虑候选卫星集中候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子,通过层次分析法确定不用因子的权重,设置终端关联不同卫星的收益函数,运用Q学习(Q-learning)算法进行切换判决,得到在终端的通信时长内最优的切换路径。本发明不仅极大地降低了用户终端的切换失败率,而且有效地均衡了网络负载。
附图说明
图1是本发明实施例中低轨卫星网络中基于Q学习的切换判决方法流程图;
图2是本发明实施例中的低轨卫星网络中的切换场景;
图3是本发明实施例中卫星的覆盖时间图;
图4是本发明实施例中预测到的终端可能的切换路径;
图5是本发明实施例中所采用的中继开销图;
图6是本发明实施例的切换失败率;
图7是本发明实施例的新呼叫阻塞率。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例中的一种低轨卫星网络中基于Q学习的切换判决方法流程图,如图1所示,所述方法包括:
S1、采用高斯马尔科夫模型和卫星的星历信息预测出用户终端可能的切换路径,并确定所述用户终端所对应的候选卫星;
由于低轨卫星和终端的移动特性,单颗卫星对地面提供服务的时间有限,终端需要不断地接入切换到新的卫星中去保证持续的通信过程。假设用户终端的通信时长t满足均值为T的指数分布,则其概率密度函数可表示为:
Figure BDA0002972503520000031
终端的运动模式可通过终端的运动速度和方向描述,因此在终端的通信时长t内,采用高斯马尔科夫模型对其行为模式进行建模:
Figure BDA0002972503520000032
Figure BDA0002972503520000033
其中,vi、di分别表示i时刻用户终端的运动速度和方向;vi-1、di-1分别表示i-1时刻用户终端的运动速度和方向;k∈(0,1)是一个随机性参数,可对速度和方向进行调整;
Figure BDA0002972503520000034
分别表示某段时间内用户终端速度和方向的平均值;{δi-1}、{γi-1}是两个服从均值为零,方差为1的不相关高斯过程;用户终端在i时刻的坐标为(xi,yi),在i-1时刻的坐标为(xi-1,yi-1),两者之间的关系表示为:
xi=xi-1+vi-1tcosdi-1
yi=yi-1+vi-1tsindi-1
根据上述分析可得到预测到的终端的运动轨迹,如图2中实线所示。
由于低轨卫星运行的角速度较大,卫星对地面的覆盖是有限的,具体覆盖情况如图3所示。不同卫星之间覆盖时间有重叠表示用户终端可在两颗卫星之间进行切换,如图3中,处于卫星1服务下的用户终端进行切换时可选择切换到卫星2或卫星3。
由于低轨卫星的运动具备周期性的特点,因此结合卫星的星历信息和预测到的终端轨迹,可以得到在用户终端的通信时长内可提供服务的候选卫星。同时图3中各卫星对地面终端的覆盖情况可通过一个有向图表示,如图4所示。本方法的目的是将用户终端建模为智能体,运用Q-learning算法找到在用户终端的通信时长内的最优的切换判决集,最大化用户终端的服务体验。
S2、基于候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子,制定出用户终端关联不同候选卫星的收益决策;
为了将状态空间定义为有限的,本发明将卫星的特性映射为量化之后的值,具体可描述为S(t)={{s1,t1,u1,d1},{s2,t2,u2,d2},...,{sk,tk,uk,dk}},其中,si表示接收信号强度值;ti表示服务时间;ui表示信道利用率;di表示中继开销,i∈{1,2,...,k},k表示状态个数。
在卫星的切换决策中,智能体的动作表示用户可关联的候选卫星,动作集合可表示为a(t)∈{1,2,...,k},k表示用户终端可关联的候选卫星编号。本方法研究的是用户切换卫星的决策问题,进而提高用户的切换成功率,以及均衡卫星网络负载。因此把用户从当前服务卫星采取动作a切换到另一个卫星时,用户的体验质量定义为用户采取某个动作获得的奖赏值。
为了保证用户终端的服务体验和卫星网络负载均衡。因此,本发明考虑采用卫星的接收信号强度、服务时间、卫星负载状态以及中继开销四个切换因子来进行切换卫星的决策,具体如下。
A.接收信号强度
卫星信号在传输的过程中会经历各种损耗,包括自由空间传播损耗、大气损耗、云层损耗、降雨损耗等。无线电波从天线发射后在自由空间中传播,无线电波携带的能量会扩散到地球表面。卫星离地球越远,信号在传输工程中的损耗越大,信号强度越低。其中,自由空间传播损耗是传输过程中的主要损耗。自由空间传播损耗LF可定义为:
Figure BDA0002972503520000051
若以分贝为单位,则
Figure BDA0002972503520000052
其中频率的单位为MHz,距离的单位为km。
用La表示大气、降雨等产生的信号损耗,则信号在传输过程中的总损耗Lp可以表示为:
Lp=LF+La
基于上述分析,用户终端的接收信号强度可以表示为:
S=PT+GT+GR-LP
其中,PT是卫星的传输功率,GT是发射机增益,GR是接收机增益,Lp是传输损耗,PN是噪声功率。
B.卫星服务时间
卫星的服务时间影响用户终端切换次数,在用户终端的通信过程中,服务时间越长的卫星,用户终端的切换次数越低。因此卫星的服务时间被选为切换因子。将卫星的服务时间定义为卫星对地面终端的可视时间,用ts表示卫星可视的开始时刻,te表示卫星可视的最后时刻,则卫星的可视时间为(ts,te)。卫星i的服务时间表示为
Figure BDA0002972503520000053
卫星j的服务时间为
Figure BDA0002972503520000054
Figure BDA0002972503520000055
用户终端可从卫星i切换到卫星j;若
Figure BDA0002972503520000056
表示两个卫星之间没有重叠覆盖的时间段,处于卫星j服务的用户终端不能切换到卫星i。
C.卫星负载状态
卫星的负载状态描述了卫星的空闲信道数,卫星空闲信道数越多,表明卫星处于轻负载状态,能够给用户终端带来更好的服务体验;卫星空闲信道数越少,表明该卫星更容易发生拥塞。本方法考虑采用信道利用率来衡量卫星的负载状态。Ntotal是卫星的全部信道数,N是卫星的空闲信道数,U是卫星信道信用率,可表示为:
Figure BDA0002972503520000061
N≤Ntotal
空闲信道数较多的卫星的信道利用率较低,这表示该卫星可接纳更多的用户终端,用户终端的切换成功率更高;信道利用率较高的卫星表明其空闲信道数较少,选择该卫星进行切换时可能造成切换失败或者网络拥塞。
D.中继开销
如图5所示,在用户终端关联卫星的过程中,为了提高用户终端的切换成功率,用户终端会倾向于选择负载较轻的候选卫星进行切换,但这有可能增加用户终端的切换时延,因此将切换代价作为切换决策的一个因子。
如图6所示,由于终端和卫星的移动,处于S1覆盖下的终端在下一时刻的候选卫星集为{S2,S3},其中S2与上一时刻的服务卫星S1处于同一轨道,S3是其它轨道上的可覆盖终端的卫星。将终端和卫星i之间的切换代价ti定义为:
Figure BDA0002972503520000062
to是卫星到终端的传输时延,ts表示同一轨道平面上的卫星之间的链路时延,td是不同轨道平面上的卫星之间的链路时延。
因此,本方法考虑采用卫星的接收信号强度、服务时间、卫星负载状态以及终极开销四个切换因子来进行切换卫星的决策。
R(s,a)=w1N(ui)+w2N(ti)+w3N(si)+w4N(di)
其中,R(s,a)表示在状态s下选择决策动作a的收益奖赏;N(ui)表示信道利用率的归一化函数,w1表示信道利用率的权重;N(ti)表示服务时间的归一化函数;w2表示服务时间的权重;N(si)表示接收信号强度值的归一化函数;w3表示接收信号强度值的权重;N(di)表示中继开销的归一化函数;w4表示中继开销的权重。
S3、计算出用户终端在当前状态下选择不同决策动作所获得的收益奖赏值;
按照上述公式R(s,a)=w1N(ui)+w2N(ti)+w3N(si)+w4N(di),可以求得用户终端在当前状态选择不同候选卫星的收益奖赏值。
卫星的信道利用率U越高,表示卫星的可用资源越少,用户选择该卫星进行切换时更容易造成网络拥塞,故信道利用率的归一化函数定义为:
Figure BDA0002972503520000071
本文假设在上一时刻卫星的截止时刻用户切换到候选卫星中,则该候选卫星可为用户提供通信的时长为
Figure BDA0002972503520000072
故服务时间的归一化函数为:
Figure BDA0002972503520000073
tmax是卫星的最长服务时间,
Figure BDA0002972503520000074
γmax为终端到星下点的弧长对应的最大地心角,
Figure BDA0002972503520000075
w是在地心地固坐标系中卫星相对于终端运动的角速度,ws是地心惯性坐标系(ECI)中卫星运功的角速度,等价于其星下点在ECI下的角速度,we是ECI下地球自转的角速度,wt是ECI下终端运动的角速度,i0是卫星轨道的倾角,β终端运动方向与卫星运动方向的夹角。
接收信号强度越大的候选卫星,表示切换到该卫星后,该卫星能提供给用户更好的服务质量,将接收信号强度值的函数定义为:
Figure BDA0002972503520000076
si≤smax
smax是某一时刻候选卫星集中接收信号强度的最大值。
中继开销主要指的是用户的切换时延,为了提高用户的服务体验,切换过程中的时延要尽可能的低,因此将中继开销的函数定义为:
Figure BDA0002972503520000081
di≤dmax
切换因子的权重可通过层次分析法(AHP,analytic hierarchy process)来确定。该方法主要包含以下步骤:
步骤1:构造判断矩阵,构造判断矩阵采用的方法是一致矩阵法,即将切换因子两两相互比较,来提高准确度。
在所有切换因子中,空闲信道数决定切换能否成功,用户难以接受通信的被迫中断,故认为空闲信道数是影响用户服务体检(QoE)的最重要因素;服务时间影响切换次数,故将其作为第二重要的切换因子;接收信号强度影响用户的通信质量,将其作为第三重要的因子;中继开销主要影响了用户的时延,将其作为第四重要的切换因子。
判断矩阵的标度方法如表1所示:
表1判断矩阵的标度方法
Figure BDA0002972503520000082
根据上述对切换因子的重要性分析,可以构造出判断矩阵A:
Figure BDA0002972503520000083
步骤2:各因子的权重计算。与判断矩阵最大特征根λmax对应的特征向量AW=λmaxW,经过归一化处理之后的向量即为权重向量W。W=[0.5694,0.2546,0.1100,0.0600]T
即w1=0.5694,w2=0.2546,w3=0.1100,w4=0.0660。
经过上述分析,可将用户选择切换卫星的奖赏函数可用下式表示:
R(s,a)=0.5694N(ui)+0.2546N(ti)+0.11N(si)+0.0660N(di)。
在另一些实施例中,本发明还可以采用基于信息熵冗余度的方式来计算这四个切换因子的权重,具体可以包括:
根据这四个切换因子的重要性标度确定出判断矩阵;
对初始判断矩阵进行归一化处理;
计算出每个切换因子的信息熵,表示为
Figure BDA0002972503520000091
IEj表示第j个切换因子的信息熵;pij表示第j个切换因子下做出切换到第i个候选卫星的概率;I表示候选卫星总数。
按照所述信息熵所对应的冗余度REj=1-LEj确定每个切换因子的具体权重;
具体的权重公式表示为:
Figure BDA0002972503520000092
本实施例考虑多个切换因子来解决卫星的切换问题,可有效减少不必要的切换次数以及无线链路失败率;本发明通过信息熵冗余度的方式获取各个切换因子的权重,使得赋权结果更具合理性。
S4、根据所述收益奖赏值,用户终端采用Q学习算法计算出对应的Q值;
基于上述分析,可得到基于Q-learning的切换判决方法如表2所示:
Figure BDA0002972503520000093
Figure BDA0002972503520000101
这里状态集合S={{s1,t1,u1,d1},{s2,t2,u2,d2},...,{sk,tk,uk,dk}},其中,si表示接收信号强度值;ti表示服务时间;ui表示信道利用率;di表示中继开销,i∈{1,2,3,...,k},k表示状态个数;动作集合a(t)∈{1,2,...,k}。
S5、用户终端根据Q值表对进行切换判决,使得用户终端关联到对应卫星。
在本发明实施例中,可以根据奖赏值R和Q值更新公式,可以计算出不同状态下采取不同动作获得的Q值,这些Q值构成的是一个Q值表,有几个状态就是几阶矩阵,用户终端按照Q值表进行具体的判决,从而让对应的用户终端关联到卫星。
仿真:
假设终端的速度为60m/s,通话时长为25min。用户终端的学习率α=1,折扣率γ=0.8。其余仿真参数如表2所示。
表2仿真参数
Figure BDA0002972503520000102
Figure BDA0002972503520000111
图6比较了本发明所提算法与最大仰角策略的切换失败率进行对比。由图可知,随着用户终端数量的增加,两种算法的切换失败率均增加,但本发明所提算法的切换失败率仍然低于最大仰角策略,这是因为基于最大仰角策略选择切换卫星时,用户终端仅考虑候选卫星的仰角,而忽略了候选卫星的负载情况,因此用户终端的切换失败率较高;本发明所提的基于q-learning的切换算法,考虑候选卫星的多个属性,找出通信过程中最佳的切换路径,有效地降低了用户终端的切换失败率。
图7比较了本发明所提算法与最大仰角策略的新呼叫阻塞率。由图可知,随着新呼叫用户终端数量的增加,两种算法的阻塞率均增加,但本发明所提算法的新呼叫阻塞率仍然低于最大仰角策略,这是因为本发明所提算法考虑了候选卫星的多个属性,综合判断候选卫星的特性,然后利用q-learning进行最优决策,可有效地降低新呼叫阻塞率。
在本发明的描述中,需要理解的是,术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (7)

1.一种低轨卫星网络中基于Q学习的切换判决方法,其特征在于,所述方法包括以下步骤:
S1、采用高斯马尔科夫模型和卫星的星历信息预测出用户终端可能的切换路径,并确定所述用户终端所对应的候选卫星;
S2、基于候选卫星的接收信号强度、服务时间、信道利用率以及中继开销四个切换因子,制定出用户终端关联不同候选卫星的收益函数;
S3、计算出用户终端在当前状态下选择不同决策动作所获得的收益奖赏值;
S4、根据所述收益奖赏值,用户终端采用Q学习算法计算出对应的Q值;
S5、用户终端根据Q值表进行切换判决,使得用户终端关联到对应卫星。
2.根据权利要求1所述的一种低轨卫星网络中基于Q学习的切换判决方法,其特征在于,确定所述用户终端所对应的候选卫星包括采用高斯马尔科夫模型对用户终端的运动速度和运动方向进行建模,预测出用户终端的运动轨迹:确定出所述运动轨迹下有重叠覆盖时间的卫星;在卫星的星历信息约束下,得到处于用户终端的通信时长内可提供服务的候选卫星。
3.根据权利要求2所述的一种低轨卫星网络中基于Q学习的切换判决方法,其特征在于,所述采用高斯马尔科夫模型对用户终端的运动速度和运动方向进行建模包括:
Figure FDA0002972503510000011
Figure FDA0002972503510000012
其中,vi、di分别表示i时刻用户终端的运动速度和方向;vi-1、di-1分别表示i-1时刻用户终端的运动速度和方向;k∈(0,1)是一个随机性参数,可对速度和方向进行调整;
Figure FDA0002972503510000013
分别表示某段时间内用户终端速度和方向的平均值;{δi-1}、{γi-1}是两个服从均值为零,方差为1的不相关高斯过程;用户终端在i时刻的坐标为(xi,yi),在i-1时刻的坐标为(xi-1,yi-1),两者之间的关系表示为:
Figure FDA0002972503510000021
4.根据权利要求1所述的一种低轨卫星网络中基于Q学习的切换判决方法,其特征在于,所述用户终端关联不同候选卫星的收益决策表示为:
R(s,a)=w1N(ui)+w2N(ti)+w3N(si)+w4N(di)
其中,R(s,a)表示在状态s下选择决策动作a获得的收益奖赏;N(ui)表示信道利用率的归一化函数,w1表示信道利用率的权重;N(ti)表示服务时间的归一化函数;w2表示服务时间的权重;N(si)表示接收信号强度值的归一化函数;w3表示接收信号强度值的权重;N(di)表示中继开销的归一化函数;w4表示中继开销的权重。
5.根据权利要求4所述的一种低轨卫星网络中基于Q学习的切换判决方法,其特征在于,各个权重通过层次分析法进行求解,具体包括对各个切换因子进行重要性分析,采用一致矩阵法构建出判断矩阵;计算出所述判断矩阵的最大特征根对应的特征向量,将所述特征向量进行归一化处理,将归一化后的向量作为权重向量,即各个切换因子的权重值所对应的向量。
6.根据权利要求1所述的一种低轨卫星网络中基于Q学习的切换判决方法,其特征在于,所述Q学习算法计算出对应的Q值的计算公式表示为:
Figure FDA0002972503510000022
其中,Qt+1(s,a)表示t+1时刻用户终端在当前状态s下采用决策动作a获得的Q值;α表示学习率;γ表示折扣率;Qt(s,a)表示t时刻用户终端在当前状态s下采用决策动作a获得的Q值;R(s,a)表示在当前状态s下选择决策动作a后智能体获得的即时奖励值;
Figure FDA0002972503510000023
表示智能体通过训练累积的经验中获知的最大收益。
7.根据权利要求1所述的一种低轨卫星网络中基于Q学习的切换判决方法,其特征在于,所述用户终端根据Q值表进行切换判决包括判断下一状态是否为终止状态,若为终止状态,则输出对应的用户终端在当前状态s下采用决策动作a的Q值,否则继续更新用户终端在不同状态下的Q值,根据该Q值让用户终端关联到对应卫星。
CN202110267062.9A 2021-03-12 2021-03-12 低轨卫星网络中基于q学习的切换判决方法 Active CN113038387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110267062.9A CN113038387B (zh) 2021-03-12 2021-03-12 低轨卫星网络中基于q学习的切换判决方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110267062.9A CN113038387B (zh) 2021-03-12 2021-03-12 低轨卫星网络中基于q学习的切换判决方法

Publications (2)

Publication Number Publication Date
CN113038387A true CN113038387A (zh) 2021-06-25
CN113038387B CN113038387B (zh) 2024-02-20

Family

ID=76469737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110267062.9A Active CN113038387B (zh) 2021-03-12 2021-03-12 低轨卫星网络中基于q学习的切换判决方法

Country Status (1)

Country Link
CN (1) CN113038387B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113660679A (zh) * 2021-07-30 2021-11-16 南京邮电大学 基于跳波束场景下卫星移动终端的切换方法
CN113890592A (zh) * 2021-10-27 2022-01-04 广州爱浦路网络技术有限公司 通信卫星切换方法、天地一体化信息网络、装置和介质
CN114050855A (zh) * 2021-09-27 2022-02-15 南京邮电大学 一种面向信道信息自适应的低轨卫星间智能协作传输方法
CN114301555A (zh) * 2022-01-04 2022-04-08 烽火通信科技股份有限公司 信道切换方法、装置、设备及可读存储介质
CN114449604A (zh) * 2022-02-14 2022-05-06 哈尔滨工业大学(深圳) 基于图论和多属性决策联合的低轨卫星切换方法和装置
CN114584196A (zh) * 2022-01-07 2022-06-03 大连大学 一种基于二阶Markov预测的星地链路切换方法
CN114698045A (zh) * 2022-03-30 2022-07-01 西安交通大学 大规模leo卫星网络下的串行q学习分布式切换方法及系统
CN114928401A (zh) * 2022-05-17 2022-08-19 重庆邮电大学 一种基于多智能体强化学习的leo星间链路的动态规划方法
CN115441932A (zh) * 2022-08-30 2022-12-06 中国电信股份有限公司 针对接入卫星的切换控制方法、装置、介质及电子设备
WO2023035116A1 (zh) * 2021-09-07 2023-03-16 北京小米移动软件有限公司 一种无线资源控制rrc状态切换方法、装置、用户设备、基站及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106558219A (zh) * 2016-10-20 2017-04-05 深圳市元征科技股份有限公司 车辆轨迹预测方法及装置
CN106651169A (zh) * 2016-12-19 2017-05-10 国家电网公司 基于模糊综合评价的配电自动化终端状态评价方法及系统
CN108366400A (zh) * 2018-01-24 2018-08-03 北京邮电大学 一种基于时间演进图的空天网络切换实时预测方法
CN111211831A (zh) * 2020-01-13 2020-05-29 东方红卫星移动通信有限公司 一种多波束低轨卫星智能动态信道资源分配方法
CN111314983A (zh) * 2020-03-31 2020-06-19 四川九强通信科技有限公司 一种基于天地一体化网络的跨域无缝切换方法
US20200234167A1 (en) * 2019-01-23 2020-07-23 Royal Bank Of Canada System and method for tree-based machine learning
CN111970047A (zh) * 2020-08-25 2020-11-20 桂林电子科技大学 一种基于强化学习的leo卫星信道分配方法
CN112132424A (zh) * 2020-09-07 2020-12-25 国网河北省电力有限公司经济技术研究院 一种大规模储能多属性决策选型方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106558219A (zh) * 2016-10-20 2017-04-05 深圳市元征科技股份有限公司 车辆轨迹预测方法及装置
CN106651169A (zh) * 2016-12-19 2017-05-10 国家电网公司 基于模糊综合评价的配电自动化终端状态评价方法及系统
CN108366400A (zh) * 2018-01-24 2018-08-03 北京邮电大学 一种基于时间演进图的空天网络切换实时预测方法
US20200234167A1 (en) * 2019-01-23 2020-07-23 Royal Bank Of Canada System and method for tree-based machine learning
CN111211831A (zh) * 2020-01-13 2020-05-29 东方红卫星移动通信有限公司 一种多波束低轨卫星智能动态信道资源分配方法
CN111314983A (zh) * 2020-03-31 2020-06-19 四川九强通信科技有限公司 一种基于天地一体化网络的跨域无缝切换方法
CN111970047A (zh) * 2020-08-25 2020-11-20 桂林电子科技大学 一种基于强化学习的leo卫星信道分配方法
CN112132424A (zh) * 2020-09-07 2020-12-25 国网河北省电力有限公司经济技术研究院 一种大规模储能多属性决策选型方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHAO QIU: "Deep Q-Learning Aided Networking, Caching, and Computing Resources Allocation in Software-Defined Satellite-Terrestrial Networks", 《IEEEXPLORE》 *
刘召等: "多波束卫星动态信道资源分配算法", 《移动通信》 *
熊超等: "星载BDS/GPS低轨卫星自主定轨精度分析", 《导航定位学报》 *
王廷银等: "基于北斗RDSS的核辐射监测应急通讯方法", 《计算机系统应用》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113660679B (zh) * 2021-07-30 2022-12-02 南京邮电大学 基于跳波束场景下卫星移动终端的切换方法
CN113660679A (zh) * 2021-07-30 2021-11-16 南京邮电大学 基于跳波束场景下卫星移动终端的切换方法
WO2023035116A1 (zh) * 2021-09-07 2023-03-16 北京小米移动软件有限公司 一种无线资源控制rrc状态切换方法、装置、用户设备、基站及存储介质
CN114050855A (zh) * 2021-09-27 2022-02-15 南京邮电大学 一种面向信道信息自适应的低轨卫星间智能协作传输方法
CN114050855B (zh) * 2021-09-27 2023-12-12 南京邮电大学 一种面向信道信息自适应的低轨卫星间智能协作传输方法
CN113890592A (zh) * 2021-10-27 2022-01-04 广州爱浦路网络技术有限公司 通信卫星切换方法、天地一体化信息网络、装置和介质
CN114301555A (zh) * 2022-01-04 2022-04-08 烽火通信科技股份有限公司 信道切换方法、装置、设备及可读存储介质
CN114301555B (zh) * 2022-01-04 2023-06-16 烽火通信科技股份有限公司 信道切换方法、装置、设备及可读存储介质
CN114584196B (zh) * 2022-01-07 2023-08-01 大连大学 一种基于二阶Markov预测的星地链路切换方法
CN114584196A (zh) * 2022-01-07 2022-06-03 大连大学 一种基于二阶Markov预测的星地链路切换方法
CN114449604B (zh) * 2022-02-14 2023-09-12 哈尔滨工业大学(深圳) 基于图论和多属性决策联合的低轨卫星切换方法和装置
CN114449604A (zh) * 2022-02-14 2022-05-06 哈尔滨工业大学(深圳) 基于图论和多属性决策联合的低轨卫星切换方法和装置
CN114698045A (zh) * 2022-03-30 2022-07-01 西安交通大学 大规模leo卫星网络下的串行q学习分布式切换方法及系统
CN114698045B (zh) * 2022-03-30 2023-08-29 西安交通大学 大规模leo卫星网络下的串行q学习分布式切换方法及系统
CN114928401A (zh) * 2022-05-17 2022-08-19 重庆邮电大学 一种基于多智能体强化学习的leo星间链路的动态规划方法
CN115441932A (zh) * 2022-08-30 2022-12-06 中国电信股份有限公司 针对接入卫星的切换控制方法、装置、介质及电子设备
CN115441932B (zh) * 2022-08-30 2024-06-28 中国电信股份有限公司 针对接入卫星的切换控制方法、装置、介质及电子设备

Also Published As

Publication number Publication date
CN113038387B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
CN113038387B (zh) 低轨卫星网络中基于q学习的切换判决方法
CN112333796B (zh) 软件定义卫星网络系统中基于演化博弈的多用户切换方法
CN111182594B (zh) 一种基于星历信息的低轨卫星星座系统小区切换方法及装置
CN112702772B (zh) 一种面向星地融合网络的终端切换方法
Wang et al. Seamless handover in LEO based non-terrestrial networks: Service continuity and optimization
CN115021799B (zh) 一种基于多智能体协同的低轨卫星切换方法
Qi et al. Federated learning based proactive handover in millimeter-wave vehicular networks
CN113839704B (zh) 一种密集低轨卫星与陆地融合的移动边缘计算方法
CN114650567B (zh) 一种无人机辅助v2i网络任务卸载方法
CN112887012B (zh) 一种面向星地融合网络的星载基站切换管理方法
CN114614881A (zh) 一种低轨卫星通信系统中基于星历的多属性联合切换方法
CN112911664A (zh) 一种基于概率排序的低轨卫星切换方法
CN112994776A (zh) 一种适于高通量卫星通信的信关站抗雨衰切换方法及装置
Dai et al. Multi-objective intelligent handover in satellite-terrestrial integrated networks
Park et al. Trends in LEO satellite handover algorithms
CN112558474A (zh) 基于多目标遗传算法的低轨卫星通信线路切换控制方法
Madelkhanova et al. Optimization of cell individual offset for handover of flying base stations and users
Liu et al. A successive deep Q-learning based distributed handover scheme for large-scale LEO satellite networks
Li et al. Beam handover based on multi-attribute decision in user-centric leo satellite networks
CN116980028A (zh) 一种基于星地融合网络的用户终端网络切换接入方法
Zou et al. Dynamic channel allocation strategy of satellite communication systems based on grey prediction
CN117614507A (zh) 一种高动态拓扑天地一体化网络的自适应流量卸载方法
Liu et al. Channel reservation based load aware handover for LEO satellite communications
CN117042073A (zh) 一种基于预测反馈的卫星切换方法
CN116916409A (zh) 一种dqn辅助低轨卫星切换的决策生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240119

Address after: 518000 1104, Building A, Zhiyun Industrial Park, No. 13, Huaxing Road, Henglang Community, Longhua District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Hongyue Information Technology Co.,Ltd.

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Applicant before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

GR01 Patent grant
GR01 Patent grant