CN115483964A - 一种空天地一体化物联网通信资源联合分配方法 - Google Patents
一种空天地一体化物联网通信资源联合分配方法 Download PDFInfo
- Publication number
- CN115483964A CN115483964A CN202211205614.4A CN202211205614A CN115483964A CN 115483964 A CN115483964 A CN 115483964A CN 202211205614 A CN202211205614 A CN 202211205614A CN 115483964 A CN115483964 A CN 115483964A
- Authority
- CN
- China
- Prior art keywords
- relay node
- channel
- satellite
- channel quality
- relay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000004891 communication Methods 0.000 title claims abstract description 43
- 230000005540 biological transmission Effects 0.000 claims abstract description 54
- 239000011159 matrix material Substances 0.000 claims abstract description 53
- 238000013468 resource allocation Methods 0.000 claims abstract description 38
- 230000009471 action Effects 0.000 claims abstract description 30
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 238000012790 confirmation Methods 0.000 claims abstract description 10
- 239000003795 chemical substances by application Substances 0.000 claims description 43
- 239000000872 buffer Substances 0.000 claims description 20
- 230000007958 sleep Effects 0.000 claims description 18
- 230000008901 benefit Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 10
- 238000005562 fading Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 230000002787 reinforcement Effects 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000000354 decomposition reaction Methods 0.000 claims description 2
- 230000007774 longterm Effects 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 230000005059 dormancy Effects 0.000 claims 1
- 108091006146 Channels Proteins 0.000 description 104
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/14—Relay systems
- H04B7/15—Active relay systems
- H04B7/185—Space-based or airborne stations; Stations for satellite systems
- H04B7/1851—Systems using a satellite or space-based relay
- H04B7/18513—Transmission in a satellite or space-based system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y10/00—Economic sectors
- G16Y10/75—Information technology; Communication
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y30/00—IoT infrastructure
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y40/00—IoT characterised by the purpose of the information processing
- G16Y40/30—Control
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Astronomy & Astrophysics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Radio Relay Systems (AREA)
Abstract
一种空天地一体化物联网上行链路资源联合分配方法,建立中继节点与卫星间链路的通信资源联合分配模型;通过交替最小二乘算法进行信道质量矩阵补全;将中继节点的动态信道选择与功率控制决策建模为Dec‑POMDP;各中继节点观察环境,并基于队列长度、信道质量、剩余能量、之前时刻动作与收益等信息进行决策;各中继节点将资源分配决策发送到卫星,卫星确认资源分配方案后向中继节点发送确认信息;接收到确认信息后,各中继节点按照所选方案对应的信道和发送功率进行数据传输,并通过DRL进行通信资源联合分配策略优化。本发明通过中继节点之间的协同,利用空分复用降低同频干扰,从而在满足流量需求的情况下提升系统资源利用率。
Description
技术领域
本发明属于卫星通信领域,涉及一种基于矩阵补全与多智能体强化学习的空天地一体化物联网中继节点通信资源联合分配方法。
背景技术
由于终端节点通常分布在偏远地区,地面基站部署困难,而且物联网的终端设备功耗有限,因此借助无人机部署方便灵活的优势,使无人机作为地面中继的补充,构成无人机与地面中继辅助的空天地一体化物联网,是一种十分可行的远程物联网架构。在已有技术充分优化终端与中继之间链路的接入选择与资源分配的基础上,本专利重点考虑无人机和地面中继的空天地一体化物联网场景下,中继节点与卫星间上行链路通信资源联合分配问题。
现有卫星网络动态资源分配方法对信道质量信息的处理主要有以下两种机制:一是依据固定的信道模型,二是定期收集信道质量信息,因此假设信道质量信息全局已知以辅助资源分配算法决策。但在实际的空天地一体化物联网系统中,一方面卫星频段对天气、干扰等因素较为敏感,信道质量波动幅度大,预先定义的信道模型往往存在误差;另一方面卫星链路不稳定,当发生链路中断时,信道质量缺失导致无法为资源分配决策提供依据。
现有的分配方法往往忽略了中继节点与卫星之间链路的资源优化配置问题,默认采用固定的资源分配方案,无法根据动态变化的中继节点流量需求和信道质量调整发射功率,无法充分利用空分复用提高频谱利用率。
现有空天地一体化物联网场景下的资源分配方法存在以下不足:
(1)现有分配方法大多集中于物联网终端的接入选择和资源分配以及无人机的轨迹规划等问题,而较少关注中继节点与卫星之间链路的资源分配,若各中继节点采用固定的发射功率和信道分配方案,则无法充分利用空分复用提高频谱资源利用率;且无法随动态变化的数据流量需求调整资源分配方案。上述问题制约了通信资源利用率的进一步提高。
(2)现有研究大多默认已知准确完整的信道状态,但在空天地一体化卫星网络中,由于LEO卫星与无人机节点的持续运动,以及受天气影响信道质量波动显著的卫星频段,CSI信息容易由于链路中断而缺失,导致资源分配算法缺失信道信息。
发明内容
本发明提供一种空天地一体化物联网通信资源联合分配方法,关注中继节点与卫星之间数据传输过程的通信资源动态分配问题,对于多波束卫星,优化各中继节点的资源动态协同分配策略,可以通过中继节点之间的协同,利用空分复用降低同频干扰,从而在满足流量需求的情况下提升系统资源利用率。
一种空天地一体化物联网通信资源联合分配方法,包括如下步骤:
步骤一:基于历史数据,构建空天地一体化物联网场景,建立中继节点与卫星间链路的通信资源联合分配模型;
步骤二:通过交替最小二乘算法进行信道质量矩阵补全;
步骤三:将中继节点的动态信道选择与功率控制决策建模为Dec-POMDP;
步骤四:各中继节点观察环境,并基于队列长度、信道质量、剩余能量、之前时刻动作与收益等信息进行决策;
步骤五:各中继节点将资源分配决策发送到卫星,卫星确认资源分配方案后向中继节点发送确认信息;
步骤六:接收到确认信息后,各中继节点按照所选方案对应的信道和发送功率进行数据传输,并通过深度强化学习进行通信资源联合分配策略优化。
本发明采用上述技术方案,与现有技术相比具有如下优点:
1、考虑到空天地一体化物联网中无人机节点和地面中继节点都需要太阳能电池供电,能量资源宝贵,将终端的能量收益率作为优化目标,有利于满足传输需求的同时,延长中继节点使用寿命,降低成本。
2、填补了已有方法关注空天地一体化物联网中终端与中继节点之间链路的资源优化,而忽略中继节点与卫星间链路资源分配问题导致的技术空白,通过基于多智能体强化学习的信道与功率资源联合动态分配,提高了此段链路的资源利用效率。
3、本发明考虑到空天地一体化物联网中由于链路不稳定导致的信道质量缺失问题,通过矩阵补全方法不以额外通信开销为代价对缺失数据进行估计,有助于解决资源联合分配问题中的信息不完备问题。其次针对星地链路时延较长导致的信道质量信息过时问题,通过挖掘时序信道质量信息规律从而对其进行预测。
4、本发明所提出的通信资源动态分配算法采用集中式训练分布式执行框架,各中继节点只需根据本地缓冲区队列长度和信道质量进行资源联合分配决策,不需要额外通信开销。
附图说明
图1是本发明的应用场景即空天地一体化物联网场景的示意图;
图2是信道质量矩阵构造方式的示意图图;
图3是本发明各中继节点资源分配动作的示意图;
图4是本发明中通过交替最小二乘算法补全信道质量矩阵中补全误差随信息缺失率变化图。
具体实施方式
一种空天地一体化物联网上行链路资源联合分配方法,包括如下步骤:
步骤一:基于历史数据为信道质量、终端数据传输等所需环境信息构建空天地一体化物联网场景,建立中继节点与卫星间链路的通信资源联合分配模型;具体过程为:
LEO卫星具有多个天线,接收各波束范围内中继节点传输的上行数据。B个波束集合表示为第l个中继节点与波束之间的归属关系由地理位置确定,表示为xl=[xl,1,xl,2,…xl,B]xl,b∈{0,1},xl,b=1表示第l个中继节点Rl位于第b个波束的覆盖范围中。在t时刻,中继节点Rl的缓冲区内数据包数量为
对于功率控制,令Pl表示中继Rl的最大发送功率,将其对卫星的发送功率量化为Np个档位,其分配方案可表示为表示中继Rl的上行链路发送功率为:因此所有中继节点的功率控制结果可表示为P=[p1,p2,…,pL],
对于中继节点与卫星间链路,整体增益可以表示为其中,Gl表示中继节点发送天线增益。表示卫星接收天线增益,其中为中继节点Rl与所属卫星波束bl之间在t时刻的夹角。gl,S(t)为信道增益,可以表示为gl,S(t)=PLl,S|hl,S(t)|2,其中PLl,S代表Rl与卫星之间的大尺度衰落,hl,S(t)表示时变的小尺度衰落,包括多径衰落和云、雨等天气因素造成的大气衰减损失。根据上述定义,考虑到同信道干扰,中继节点Rl数据传输信噪比可表示为:
其中σ2表示噪声功率的方差,bl为中继节点Rl所属波束,cl为Rl选择的上行信道。为确保中继Rl的传输质量,其信噪比应超过最低阈值δth,即否则卫星不会为此次传输分配资源,此次中继的传输请求将被拒绝。
t时刻中继节点Rl的传输速率可表示为t到t+1时刻数据传输量为其中表示数据传输成功的收益,定义为缓冲区容量有限,若发送速率低于数据到达速率,会导致缓冲区溢出。若t时刻丢弃数据量为其数据丢弃损失分量定义为
综上所述,优化系统的长期能量收益的模型如下:
其中优化变量Wt和Pt代表t时刻各中继的信道与功率选择结果。其中表示中继节点信道选择结果,表示中继节点Rl在t时刻选择的信道为 表示中继节点功率选择结果,示中继节点Rl在t时刻选择的发射功率档位为如前文所述,表示中继节点Rl的休眠决策结果,则代表决定休眠,而不再进行资源分配决策。
前两项约束指每个时刻,若中继节点工作,则只能选择一个信道和一个功率水平,若中继节点不工作,则不选择任何一个信道和功率水平;第三项约束指所有中继的数据传输速率之和不高于卫星系统回程传输容量,为每个中继节点在t时刻的数据传输速率,为卫星系统回程传输容量。
步骤二:通过交替最小二乘算法进行信道质量矩阵补全,具体过程为:
步骤21、对各中继的链路,基于导频信号进行信道估计;
系统正常运行状态下,各中继节点将物联网终端的数据发送到卫星,卫星接收数据后可利用导频信号估计各中继上行链路信道质量。上行链路信道模型可表示为:Y=XH+Z,其中X为已知的导频信号,Y为卫星处接收到的导频信号,H为信道响应,Z为高斯白噪声。最小二乘法核心在于求解H的估计值,使XH与Y之间的差值最小,即:
J(H)=||Y-XH||2=(Y-XH)H(Y-XH)
通过求解偏导数可以得到最小二乘信道估计的结果为
步骤22、构造信道质量矩阵;
信道质量具有时间-空间-频谱的连续性。由于卫星系统通常采用频点紧密排列的一系列信道,且带宽有限,考虑到信道质量在频谱上的连续性,可近似认为相同地理位置不同信道频点处的信道质量相同。信道质量矩阵CSI的第i行和第j列的元素CSIi,j可定义为第i行第j列的方格地理范围内,中继节点的平均信道质量。通过对第i行、第j列的方格地理范围内所有中继节点信道质量求平均即可得到CSIi,j的值。
步骤23.利用交替最小二乘算法补全信道质量矩阵;
矩阵补全方法核心在于利用矩阵低秩特性,根据矩阵中已知元素,通过最小化矩阵秩推断空缺的元素。本发明利用空间信道质量矩阵CSI的低秩特性,通过最小化信道质量矩阵的秩,对链路中断造成的信道质量进行估计,从而解决空天地一体化物联网资源分配方法面临的信道质量缺失问题,因此有:
min rank(Ct)
sub.Ct.*Mt=CSIt
由于完整的CSI矩阵Ct具有低秩特性,引入矩阵Lt和Rt对矩阵Ct进行SVD分解,表示为Ct=UΣVH=LtRtH,其中Lt=UΣ12,Rt=VΣ12。因此有:
min rank(LtRtH)
sub.LtRtH.*Mt=CSIt
秩极小化是一个NP难问题,可以通过求解核范数极小化问题来近似。在低秩、均匀随机抽样和抽样数受限的假设下,核范数极小化问题的解是秩极小化的近似最优结果,并能以接近1的概率恢复CSIt矩阵,则有:
min||LtRtH||*
sub.LtRtH.*Mt-CSIt=0
令CSIt*=CSIt+LtRtH.*(I-Mt),其中I为单位矩阵,可进一步转化为:
此优化问题中,矩阵Lt和Rt可以使用ALS算法以迭代方式求解,如算法1所示。随机选择Lt和Rt,随后固定其中一个矩阵例如Lt,将其偏导数被设置为0,将Rt视为优化变量,用线性最小二乘法求解。然后,将Lt与Rt交换,并继续相同的过程求解出Lt。持续迭代,直至Lt和Rt收敛。
步骤三:将中继节点的动态信道选择与功率控制问题建模为Dec-POMDP,重点包括动作空间、观测空间和即时收益,具体过程为:
首先将各具有决策能力的中继节点建模为智能体。由于各中继节点仅了解自身所需传输的数据量与自身链路的信道质量,获知全局状态的代价过大不符合实际系统应用,因此其通信资源动态分配的决策过程应当建模为分布式局部可观测马尔可夫决策过程(Dec-POMDP)。所有智能中继节点为合作模式,此Dec-POMDP模型可以被定义为L,S,A,P,R,O,Z,γ>,其中L为智能中继节点数量,S为状态空间,A=[A1,A2,…,AL]为各智能体联合动作a的空间,Al为中继节点Rl所对应智能体的动作空间。P(s′∣s,a):S×A×S→[0,1]代表状态转移函数,用来描述在状态s下所有智能体联合动作为a时,状态转移为s′的概率。表示各智能体的即时收益,此中继节点资源分配问题中,所有智能体协作,因而需要考虑将系统整体收益作为即时收益的一部分。O=[O1,O2,…,OL]代表各智能体对环境的局部观测。Z:S×A→O代表智能体的观测函数。γ∈[0,1]代表强化学习中的折扣因子。
对于一个整体环境状态,中继节点Rl只能观察到局部环境,得到观察Ol,基于此观察,智能体选择动作al,所有智能体联合动作a使环境转移到新状态s′,且获得收益rl。
观测空间
中继节点进行资源分配所需考虑的局部观测信息可归纳为以下几类:
(1)信道质量:通过的信道估计和矩阵补全,可以获知上一时刻中继Rl与卫星间信道质量与之前本地存储的ΔT-1个时间片的信道质量合并作为观测的一部分由于信道质量具有时间连续特性,因此采用之前时间片的信道质量信息有利于通过学习时序规律应对卫星链路长时延导致的信道质量过期问题;
综上所述,中继节点的观测信息可以表示为其中都包含历史数据。现有的基于DRL的资源分配方法通常对环境或观测空间的定义只包括上一时刻信息,本专利充分利用时序信息将有助于学习智能体的行为动作规律和信道质量的时序变化规律。
动作空间
中继节点分布式地进行信道选择与功率控制联合决策,且由于中继节点Rl可以根据缓冲区内数据量决定是否休眠,因此表示为One-hot形式的动作空间为其中Al包含三个决策分量,即其中,代表其处于运行或睡眠状态的决策,和分别代表其信道选择和资源控制结果。每个智能体,在每个资源动态调整时间片内,根据对环境的观测进行决策。若则其策略为此时间片休眠,仅接收终端上传的数据,而不与卫星发生通信,也不占用信道资源。若则ai的值代表此终端在这一时刻的动态资源分配决策,上报卫星,卫星确认后即开始与卫星之间进行通信。
即时收益
各智能体的局部收益可以定义为
由于各智能体为合作模式,因此其动作的即时收益需考虑自身数据传输效果与对整体传输效果的影响,即当所需传输量不多时,让出通信资源给其他中继节点,从而优化整体收益,因此智能体的即时收益设定为整体收益与局部收益的加权和,其中α为加权参数,表征智能体在整体利益和自身利益之间的权衡。
步骤四:各中继节点观察环境,并基于队列长度、信道质量、剩余能量、之前时刻动作与收益等信息进行决策;
步骤五:各中继节点将资源分配决策发送到卫星,卫星确认资源分配方案后向中继节点发送确认信息;
步骤六:接收到确认信息后,各中继节点按照所选方案对应的信道和发送功率进行数据传输,并通过深度强化学习进行通信资源联合分配策略优化,具体过程为:
按照集中式训练分布式执行的MADDPG框架对通信资源联合分配算法进行训练,重点包括CriticNet模块和ActorNet模块。ActorNet模块负责根据中继节点的局部观测进行动作决策,而CriticNet模块负责评价各中继节点智能体状态-动作对的Q值。采用如下公式进行训练:
其中,Q(O,a∣θC)代表CriticNet模块对应的神经网络,输出为状态-动作对的值函数估计,利用前两个公式通过梯度下降训练此模块参数θC。ActorNet模块表示为用于进行联合资源分配动作决策,其参数通过第三个公式训练。
训练阶段结束后,各中继节点的智能体都充分收敛,每个ActorNet就可以自己根据状态采取合适的动作,此时不再需要CriticNet模块。因此虽然训练过程是集中式的,但决策过程是分布式的,不需要额外通信开销。此算法流程如下。
如图1所示,本发明所针对的空天地一体化物联网。本发明中的空天地一体化物联网由LEO卫星所支持的空间层、无人机中继支持的空中层和地面中继与物联网终端组成的地面层构成,如图1所示。卫星通信能力可为偏远区域物联网设备提供无缝覆盖,无人机和地面中继节点为低功耗的物联网终端提供传输中继服务。以虚拟节点策略屏蔽LEO卫星的拓扑动态性。系统运行过程可离散为包含相等时间片的时间序列
假设无人机中继节点的航迹已预先确定,不考虑对航迹的动态规划,而关注于中继节点的资源分配问题。并且中继节点只通过与卫星的信道传输数据,不考虑利用中继节点间的通信进行流量卸载,中继节点间通信仅用于彼此协作。无人机和地面中继节点都为存储转发机制,将各物联网终端发送的数据存储在中继的发送缓冲区队列中,依次发送给卫星进行数据回传。
LEO卫星具有多个天线,接收各波束范围内中继节点传输的上行数据。B个波束集合表示为第l个中继节点与波束之间的归属关系由地理位置确定,表示为xl=[xl,1,xl,2,…xl,B]xl,b∈{0,1},xl,b=1表示第l个中继节点Rl位于第b个波束的覆盖范围中。
中继节点具有休眠功能。其原因在于以下两个方面:(1)无人机节点电池容量有限,而偏远地区的地面中继节点往往也面临供电问题,因此对于远程物联网的中继节点,能量资源十分宝贵;(2)物联网终端流量时空分布不均匀。因此允许各中继节点根据缓冲区队列长度决定是否休眠一定时间,一方面有助于优化中继节点的能量利用效率,符合节能环保要求;另一方面有助于让出信道资源给缓冲区队列更长的中继,通过协同提升整体传输效果。
在每一时间片,空天地一体化物联网中的数据传输分为两个阶段,一是资源分配与连接建立阶段,二是数据传输阶段。在第一阶段,终端按照自身策略对中继节点进行选择,并与中继节点建立上行链路连接,而中继节点需与卫星建立上行链路连接。具体包括:根据自身缓冲区队列长度、信道质量和自身能量状态,决定是否休眠,如不休眠,则选择发送信道和功率,并将决策结果通过控制信道上报卫星。得到卫星的确认回复后,连接建立成功。在第二阶段,数据传输分为两个时隙,第1个时隙中地面物联网终端向所接入的转发节点Rl发送数据,数据放入缓冲区中;在第2个时隙中,中继节点Rl将缓冲区中数据包依次按照所选信道cl和发送功率pl,S发送给卫星。
对于中继节点与卫星间链路,整体的链路增益可以表示为:
其中,Gl表示中继节点发送天线增益。表示卫星接收天线增益,其中为中继节点Rl与所属卫星波束bl之间在t时刻的夹角。gl,S(t)为信道增益,可以表示为gl,S(t)=PLl,S|hl,S(t)|2,其中PLl,S代表Rl与卫星之间的大尺度衰落,hl,S(t)表示时变的小尺度衰落,包括多径衰落和云、雨等天气因素造成的大气衰减损失。
根据上述定义,考虑到同信道干扰,中继节点Rl数据传输信噪比可表示为
其中σ2表示噪声功率的方差,bl为中继节点Rl所属波束,cl为Rl选择的上行信道。为确保中继Rl的传输质量,其信噪比应超过最低阈值δth,即否则卫星不会为此次传输分配资源,此次中继的传输请求将被拒绝。
如图2所示,本发明信道质量矩阵的构造方式,信道质量具有时间-空间-频谱的连续性。由于卫星系统通常采用频点紧密排列的一系列信道,且带宽有限,考虑到信道质量在频谱上的连续性,可近似认为相同地理位置不同信道频点处的信道质量相同。
由于信道质量具有空间连续性,因此将卫星覆盖范围内分布的中继节点按照地理位置进行排列,如图2所示,可直观地依据地理位置将各中继节点的信道质量组织为矩阵形式得到CSI。由于空间位置相近点的信道质量相似,CSI的第i行和第j列的元素CSIi,j可定义为第i行第j列的方格地理范围内,中继节点的平均信道质量。在卫星处可以通过接收到的上行链路导频信号通过最小二乘估计得到各个中继节点对应链路的信道质量估计。通过对第i行、第j列的方格地理范围内所有中继节点信道质量求平均即可得到CSIi,j的值。若卫星在方格地理范围没有收到任何中继节点的导频信号,则代表此位置信道质量缺失。
其中,代表其处于运行或睡眠状态的决策,和分别代表其信道选择和资源控制结果。每个智能体,在每个资源动态调整时间片内,根据对环境的观察进行决策。各智能体的动作空间如图3所示。若则其策略为此时间片休眠,仅接收终端上传的数据,而不与卫星发生通信,也不占用信道资源。若则ai的值代表此终端在这一时刻的动态资源分配决策,上报卫星,卫星确认后即开始与卫星之间进行通信。
如图4所示,本发明补全误差随CSI信息缺失率增加的变化过程,在CSI信息缺失率低于20%时,矩阵补全准确率最高,而缺失率小于40%时,估计误差依旧较为平稳,MRSE误差低于0.5,可为后续资源联合分配提供较为准确的CSI估计。但当CSI缺失率超过80%后,矩阵补全误差急剧增加。综上所述,本发明提出的基于ALS的CSI矩阵补全算法能解决卫星覆盖范围内40%以下区域的CSI缺失问题。
Claims (5)
1.一种空天地一体化物联网通信资源联合分配方法,其特征在于包括如下步骤:
步骤一:基于历史数据,构建空天地一体化物联网场景,建立中继节点与卫星间链路的通信资源联合分配模型;
步骤二:通过交替最小二乘算法进行信道质量矩阵补全;
步骤三:将中继节点的动态信道选择与功率控制决策建模为Dec-POMDP;
步骤四:各中继节点观察环境,并基于队列长度、信道质量、剩余能量、之前时刻动作与收益等信息进行决策;
步骤五:各中继节点将资源分配决策发送到卫星,卫星确认资源分配方案后向中继节点发送确认信息;
步骤六:接收到确认信息后,各中继节点按照所选方案对应的信道和发送功率进行数据传输,并通过深度强化学习进行通信资源联合分配策略优化。
2.根据权利要求1所述的空天地一体化物联网通信资源联合分配方法,其特征在于上述步骤一中基于历史数据,构建空天地一体化物联网场景,建立中继节点与卫星间链路的通信资源联合分配模型;具体过程为:
LEO卫星具有多个天线,用于接收各波束范围内中继节点传输的上行数据;B个波束集合表示为第l个中继节点与波束之间的归属关系由地理位置确定,表示为xl=[xl,1,xl,2,…xl,B]xl,b∈{0,1},xl,b=1表示第l个中继节点Rl位于第b个波束的覆盖范围中;在t时刻,中继节点Rl的缓冲区内数据包数量为
对于中继节点与卫星间链路,整体增益表示为其中,Gl表示中继节点发送天线增益,表示卫星接收天线增益;其中为中继节点Rl与所属卫星波束bl之间在t时刻的夹角;gl,S(t)为信道增益,表示为gl,S(t)=PLl,S|hl,S(t)|2,其中PLl,S代表中继节点Rl与卫星之间的大尺度衰落,hl,S(t)表示时变的小尺度衰落,包括多径衰落和天气因素造成的大气衰减损失;中继节点Rl数据传输信噪比表示为:
其中σ2表示噪声功率的方差,bl为中继节点Rl所属波束,cl为中继节点Rl选择的上行信道;为确保中继节点Rl的传输质量,中继节点Rl的信噪比应超过最低阈值δth,即否则卫星不会为此次传输分配资源,此次中继的传输请求将被拒绝;
综上所述,优化系统的长期能量收益的模型如下:
其中优化变量Wt和Pt代表t时刻各中继节点的信道与功率选择结果,表示中继节点信道选择结果,表示中继节点Rl在t时刻选择的信道为 表示中继节点功率选择结果,示中继节点Rl在t时刻选择的发射功率档位为如前文所述,表示中继节点Rl的休眠决策结果,则代表决定休眠,而不再进行资源分配决策;
3.根据权利要求2所述的空天地一体化物联网通信资源联合分配方法,其特征在于上述步骤二中通过交替最小二乘算法进行信道质量矩阵补全,具体过程为:
步骤21、对各中继的链路,基于导频信号进行信道估计;
正常运行状态下,各中继节点将物联网终端的数据发送到卫星,卫星接收数据后利用导频信号估计各中继上行链路信道质量;上行链路信道模型表示为:Y=XH+Z,其中X为已知的导频信号,Y为卫星处接收到的导频信号,H为信道响应,Z为高斯白噪声;最小二乘法核心在于求解H的估计值,使XH与Y之间的差值最小,即:
J(H)=||Y-XH||2
=(Y-XH)H(Y-XH)
通过求解偏导数得到最小二乘信道估计的结果为
步骤22、构造信道质量矩阵;
信道质量具有时间-空间-频谱的连续性,由于卫星系统通常采用频点紧密排列的一系列信道,且带宽有限,考虑到信道质量在频谱上的连续性,认为相同地理位置不同信道频点处的信道质量相同,信道质量矩阵CSI的第i行和第j列的元素CSIi,j定义为第i行第j列的方格地理范围内中继节点的平均信道质量,通过对第i行、第j列的方格地理范围内所有中继节点信道质量求平均得到CSIi,j的值;
步骤23.利用交替最小二乘算法补全信道质量矩阵;
矩阵补全方法为利用矩阵低秩特性,根据矩阵中已知元素,通过最小化矩阵秩推断空缺的元素;利用空间信道质量矩阵CSI的低秩特性,通过最小化信道质量矩阵的秩,对链路中断造成的信道质量进行估计,从而解决空天地一体化物联网资源分配方法面临的信道质量缺失问题,因此有:
min rank(Ct)
sub.Ct.*Mt=CSIt
由于完整的CSI矩阵Ct具有低秩特性,引入矩阵Lt和Rt对矩阵Ct进行SVD分解,表示为Ct=UΣVH=LtRtH,其中Lt=UΣ1/2,Rt=VΣ1/2;因此有:
min rank(LtRtH)
sub.LtRtH.*Mt=CSIt
在低秩、均匀随机抽样和抽样数受限的假设下,核范数极小化问题的解是秩极小化的近似最优结果,并能以接近1的概率恢复CSIt矩阵,则有:
min||LtRtH||*
sub.LtRtH.*Mt-CSIt=0
令CSIt*=CSIt+LtRtH.*(I-Mt),其中I为单位矩阵,进一步转化为:
此优化问题中,矩阵Lt和Rt使用ALS算法以迭代方式求解。
4.根据权利要求3所述的空天地一体化物联网通信资源联合分配方法,其特征在于上述步骤三将中继节点的动态信道选择与功率控制问题建模为Dec-POMDP,具体过程为:
首先将各具有决策能力的中继节点建模为智能体;由于各中继节点仅了解自身所需传输的数据量与自身链路的信道质量,获知全局状态的代价过大不符合实际应用,因此将通信资源动态分配的决策过程建模为分布式局部可观测马尔可夫决策过程(Dec-POMDP),所有智能中继节点为合作模式,此Dec-POMDP模型被定义为<L,S,A,P,R,O,Z,γ>,其中L为智能中继节点数量,S为状态空间,A=[A1,A2,…,AL]为各智能体联合动作a的空间,Al为中继节点Rl所对应智能体的动作空间;P(s′∣s,a):S×A×S→[0,1]代表状态转移函数,用来描述在状态s下所有智能体联合动作为a时,状态转移为s′的概率;表示各智能体的即时收益,此中继节点资源分配问题中,所有智能体协作,考虑将整体收益作为即时收益的一部分;O=[O1,O2,…,OL]代表各智能体对环境的局部观测;Z:S×A→O代表智能体的观测函数;γ∈[0,1]代表强化学习中的折扣因子;
对于一个整体环境状态,中继节点Rl只能观察到局部环境,得到观察Ol,基于此观察,智能体选择动作al,所有智能体联合动作a使环境转移到新状态s′,且获得收益rl;
观测空间
中继节点进行资源分配所需考虑的局部观测信息归纳为:
动作空间
中继节点分布式地进行信道选择与功率控制联合决策,且由于中继节点Rl根据缓冲区内数据量决定是否休眠,因此表示为独热形式的动作空间为其中Al包含三个决策分量,即其中,代表处于运行或睡眠状态的决策,和分别代表其信道选择和资源控制结果;每个智能体,在每个资源动态调整时间片内,根据对环境的观测进行决策;若则决策为此时间片休眠,仅接收终端上传的数据,而不与卫星发生通信,也不占用信道资源;若则ai的值代表此终端在这一时刻的动态资源分配决策,上报卫星,卫星确认后即开始与卫星之间进行通信;
即时收益
各智能体的局部收益定义为
5.根据权利要求4所述的空天地一体化物联网通信资源联合分配方法,其特征在于上述步骤六中通过深度强化学习进行通信资源联合分配策略优化,具体过程为:
按照集中式训练分布式执行的MADDPG框架对通信资源联合分配算法进行训练,包括CriticNet模块和ActorNet模块,ActorNet模块负责根据中继节点的局部观测进行动作决策,CriticNet模块负责评价各中继节点智能体状态-动作对的Q值;采用如下公式进行训练:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211205614.4A CN115483964B (zh) | 2022-09-30 | 2022-09-30 | 一种空天地一体化物联网通信资源联合分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211205614.4A CN115483964B (zh) | 2022-09-30 | 2022-09-30 | 一种空天地一体化物联网通信资源联合分配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115483964A true CN115483964A (zh) | 2022-12-16 |
CN115483964B CN115483964B (zh) | 2024-03-08 |
Family
ID=84393104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211205614.4A Active CN115483964B (zh) | 2022-09-30 | 2022-09-30 | 一种空天地一体化物联网通信资源联合分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115483964B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116502071A (zh) * | 2023-06-26 | 2023-07-28 | 武汉能钠智能装备技术股份有限公司 | 一种重点信号检测系统及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010077291A1 (en) * | 2009-01-05 | 2010-07-08 | Thomson Licensing | Resource allocation for orthogonal decode-and-forward multiple-input multiple-output relay channels with finite rate feedback |
EP3048745A1 (en) * | 2015-01-20 | 2016-07-27 | Airbus Defence and Space Limited | Space network node receiving data from terrestrial and space nodes. |
CN108832993A (zh) * | 2018-06-22 | 2018-11-16 | 西安电子科技大学 | 面向混合任务的在线中继卫星系统通信资源分配方法 |
US20190097717A1 (en) * | 2017-09-26 | 2019-03-28 | Thales | Method of allocating frequency resources for a satellite telecommunication system |
CN110972313A (zh) * | 2019-12-05 | 2020-04-07 | 北京邮电大学 | 空天地一体化网络的资源分配方法和系统 |
CN111787624A (zh) * | 2020-06-28 | 2020-10-16 | 重庆邮电大学 | D2d辅助的蜂窝网络中的一种基于深度学习的可变维度资源分配算法 |
US20220052756A1 (en) * | 2018-09-10 | 2022-02-17 | Telesat Technology Corporation | Resource deployment optimizer for non-geostationary and/or geostationary communications satellites |
CN114599099A (zh) * | 2022-03-08 | 2022-06-07 | 南京航空航天大学 | 一种基于强化学习的5g星地链路多波束动态功率分配方法 |
CN114665952A (zh) * | 2022-03-24 | 2022-06-24 | 重庆邮电大学 | 一种基于星地融合架构下低轨卫星网络跳波束优化方法 |
-
2022
- 2022-09-30 CN CN202211205614.4A patent/CN115483964B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010077291A1 (en) * | 2009-01-05 | 2010-07-08 | Thomson Licensing | Resource allocation for orthogonal decode-and-forward multiple-input multiple-output relay channels with finite rate feedback |
EP3048745A1 (en) * | 2015-01-20 | 2016-07-27 | Airbus Defence and Space Limited | Space network node receiving data from terrestrial and space nodes. |
US20190097717A1 (en) * | 2017-09-26 | 2019-03-28 | Thales | Method of allocating frequency resources for a satellite telecommunication system |
CN108832993A (zh) * | 2018-06-22 | 2018-11-16 | 西安电子科技大学 | 面向混合任务的在线中继卫星系统通信资源分配方法 |
US20220052756A1 (en) * | 2018-09-10 | 2022-02-17 | Telesat Technology Corporation | Resource deployment optimizer for non-geostationary and/or geostationary communications satellites |
CN110972313A (zh) * | 2019-12-05 | 2020-04-07 | 北京邮电大学 | 空天地一体化网络的资源分配方法和系统 |
CN111787624A (zh) * | 2020-06-28 | 2020-10-16 | 重庆邮电大学 | D2d辅助的蜂窝网络中的一种基于深度学习的可变维度资源分配算法 |
CN114599099A (zh) * | 2022-03-08 | 2022-06-07 | 南京航空航天大学 | 一种基于强化学习的5g星地链路多波束动态功率分配方法 |
CN114665952A (zh) * | 2022-03-24 | 2022-06-24 | 重庆邮电大学 | 一种基于星地融合架构下低轨卫星网络跳波束优化方法 |
Non-Patent Citations (4)
Title |
---|
DINGYUAN SHI等: "Resource Allocation in Beam Hopping Communication Satellite System", 2020 INTERNATIONAL WIRELESS COMMUNICATIONS AND MOBILE COMPUTING (IWCMC) * |
YU PAN: "Learning Deep Embedding for Community Detection", 2020 INTERNATIONAL CONFERENCE ON BIG DATA & ARTIFICIAL INTELLIGENCE & SOFTWARE ENGINEERING (ICBASE) * |
李化营;李轩;刘焱;: "基于卫星中继的多用户"分时复用"策略研究", 电子测量技术, no. 04 * |
穆文静;李勇朝;阮玉晗;张海林;: "基于遍历容量的低轨卫星协作通信中继选择算法", 信号处理, no. 10 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116502071A (zh) * | 2023-06-26 | 2023-07-28 | 武汉能钠智能装备技术股份有限公司 | 一种重点信号检测系统及方法 |
CN116502071B (zh) * | 2023-06-26 | 2023-11-17 | 武汉能钠智能装备技术股份有限公司 | 一种重点信号检测系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115483964B (zh) | 2024-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020204080B2 (en) | Airborne relays in cooperative-MIMO systems | |
Cao et al. | Deep reinforcement learning for multi-user access control in non-terrestrial networks | |
CN113839704B (zh) | 一种密集低轨卫星与陆地融合的移动边缘计算方法 | |
Li et al. | Deep Q-learning based resource management in UAV-assisted wireless powered IoT networks | |
CN109495906A (zh) | 基于无人机-地面站链路预测的无人机网关选择算法 | |
CN113055078B (zh) | 有效信息年龄确定方法、以及无人机飞行轨迹优化方法 | |
Cui et al. | Latency Optimization for Hybrid GEO–LEO Satellite-Assisted IoT Networks | |
Tang et al. | Federated learning for intelligent transmission with space-air-ground integrated network (SAGIN) toward 6G | |
Zheng et al. | Leo satellite channel allocation scheme based on reinforcement learning | |
CN113556163A (zh) | 面向多类业务需求的中继卫星系统波束调度系统及方法 | |
Chen et al. | Learning-based computation offloading for IoRT through Ka/Q-band satellite–terrestrial integrated networks | |
Li et al. | When UAVs meet cognitive radio: Offloading traffic under uncertain spectrum environment via deep reinforcement learning | |
Gangula et al. | A landing spot approach for enhancing the performance of UAV-aided wireless networks | |
CN115483964B (zh) | 一种空天地一体化物联网通信资源联合分配方法 | |
CN115412134A (zh) | 基于离线强化学习的以用户为中心的无蜂窝大规模mimo功率分配方法 | |
Taimoor et al. | Holistic resource management in UAV-assisted wireless networks: An optimization perspective | |
Cai et al. | Age-oriented access control in GEO/LEO heterogeneous network for marine IoRT: A deep reinforcement learning approach | |
CN114205769A (zh) | 基于无人机数据采集系统的联合轨迹优化与带宽分配方法 | |
CN116009590B (zh) | 无人机网络分布式轨迹规划方法、系统、设备及介质 | |
Zhang et al. | Mobility-Aware Resource Allocation for mmWave IAB Networks via Multi-Agent RL | |
Rajendra et al. | Optimal rate and distance based bandwidth slicing in uav assisted 5g networks | |
Zhu et al. | SyRoC: Symbiotic robotics for QoS-aware heterogeneous applications in IoT-edge-cloud computing paradigm | |
CN115589250A (zh) | 一种星地中继物联网大规模中继选择与功率控制方法 | |
CN115484550A (zh) | 面向无人机平台的多对用户场景下双向中继系统吞吐量最大化方法 | |
Chen et al. | Deep Reinforcement Learning Based Data Offloading in Multi-Layer Ka/Q Band LEO Satellite-Terrestrial Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |