一种适用于低轨卫星网络的能量受限终端随机接入方法
技术领域
本发明属于无线通信技术领域,具体涉及一种适用于低轨卫星网络的能量受限终端随机接入方法。
背景技术
近年来随着低轨卫星网络的迅速发展,低轨卫星物联网需求得到迅猛增长。据2017年美国北方天空研究公司预测,低轨卫星物联网服务的市场规模将从2020年的不到2000万美元增长至2027年的1.3亿美元,平均年增长率接近70%。届时,通过低轨卫星物联网获取应用的终端数量将突破370万,在全部卫星物联网终端数量中的占比将达到三成以上。这些低轨卫星物联网终端普遍配备能量捕获设备,使其可以通过从周围环境中收集太阳能、风能等各种能量来为自身提供持续的能量,实现长时间自主的数据采集和传输。由于能量捕获具有随机性和间断性,这对终端的数据发送提出了新的挑战。此外,在低轨卫星物联网系统中,由于卫星数目庞大密集,同一区域内的物联网终端可以被多颗卫星共同覆盖;而配备相控阵天线的物联网终端可以通过波束赋形等技术形成多个波束同时接入多颗卫星。
对于这种物联网终端系统来说,高效的基于能量的终端接入方法是实现卫星系统高吞吐量通信的关键,然而目前的研究者们针对低轨卫星物联网应用提出的终端接入方法并没有考虑终端能量消耗问题,仅考虑了系统丢包率和吞吐量方面的性能;考虑了终端能量动态变化的终端接入方法仅仅针对于传统的地面物联网场景,不能直接应用于低轨卫星物联网场景中,因为它们面向的是传统的单基站、网络固定的场景。所以需要根据低轨卫星物联网场景中多颗卫星共同覆盖一个区域、卫星覆盖区域终端数目动态变化、配备了相控阵天线的物联网终端可以生成多个波束同时与多颗卫星进行通信等新的特点,设计更适合的终端接入方法。
发明内容
本发明的目的在于针对现有技术的不足,提供一种适用于低轨卫星网络的能量受限终端随机接入方法。
本发明的目的是通过以下技术方案来实现的:
一种适用于低轨卫星网络的能量受限终端随机接入方法,每个终端配备多波束相控阵天线,可同时向所有低轨卫星发送数据包,且终端具有能量捕获能力;每个时隙各终端采集到的数据包的数目和低轨卫星数目相同,各数据包具有效用值且各数据包的效用值独立同分布;各终端仅知道自己此刻的能量和数据包的效用值的带有干扰的观测值,不知道其它终端的能量和数据包效用值;所有终端、所有数据包的接入方法均相同;各卫星与各终端之间的信道为带有衰落的冲突信道,即只有当某数据包的信噪比大于信噪比阈值且同时没有其它数据包到达同一卫星时该数据包才会被正确接收;
该方法包括如下步骤:
S1:初始化低轨卫星网络的场景参数,包括低轨卫星数目N、低轨卫星覆盖范围内的终端数目U、终端的平均能量捕获效率B、终端的电池容量e
max、平均信噪比增益K′、信噪比阈值γ;初始化二分算法精度∈
BM、策略迭代算法精度∈
PIA以及拉格朗日系数λ的上限
下限λ
L=0;
S2:随机给定初始策略η
0和初始能量价值函数v
0,其中η
0需满足下式条件:
且
其中
表示对其进行向下取整。其中η
0(e,t)表示在终端能量为e的条件下,数据包以能量t发送的概率;t=0即为不发送。
S3:根据二分算法求取拉格朗日系数λ,更新能量价值函数v,直到满足策略迭代算法精度∈PIA;
S4:更新终端在不同能量下以不同能量发送的能量-动作价值函数q,计算能量-动作概率η1,直到策略收敛;
S5:计算评估系数h,并更新拉格朗日系数λ的上下限;判断是否满足二分算法的精度∈
BM,满足则返回最优阈值
否则返回S3;
S6:在每个时隙k各终端u判断各个数据包的效用观测值y
u,k,n与最优阈值
的关系,当满足
时,则该数据包以能量t进行发送。其中e
u,k代表终端u在第k个时隙的能量状态。
进一步地,所述S3通过以下子步骤来实现:
S3.2:通过下式来求取终端的能量转移概率矩阵P,其元素Pef表示终端的能量从e转移到f的概率
其中,β(B,n)表示终端从环境中捕获n个能量单元的概率;B表示一个时隙内终端从环境中捕获能量单元的期望数目,与环境有关;α(e,t)表示终端能量为e时发射N个数据包消耗t个能量单元的概率;
S3.3:通过下式来求取终端能量稳态概率分布π
其中I为单位矩阵,1为全一向量;
其中
表示η
0(e,t)策略对应的效用值阈值,
终端无法获知其数据包的准确效用值,仅能获得带有干扰的效用观测值,效用观测值服从概率分布f
y(y);
S3.5:通过下式来求取Z
其中,
K′为平均信噪比增益,与信道条件有关;
表示效用观测值为y条件下数据包效用值的期望;G
0表示在初始策略下终端能量进入稳态后其它终端不发送数据包时所有卫星正确接收数据包的长期平均效用值,P
0表示在初始策略下所有终端能量进入稳态后任意终端不发送数据包的概率;
S3.6:通过下式更新每个能量e下的能量价值函数v1
其中p(f|e,t)表示终端在能量为e,通过以能量t发送数据包后变为f的概率;
S3.7:检测是否满足精度要求|v1-v0|<∈PIA,满足则v=v1,否则v0=v1并回到S3.6。
进一步地,所述S4通过以下子步骤来实现:
S4.1通过下式更新每个能量不同动作下的能量-动作价值函数q
S4.2通过下式来更新每个能量不同动作下的能量-动作概率η
S4.3检测是否满足条件η=η0,满足则将其转换为效用观测值阈值yth,转换的方法同S3.4,否则η0=η并返回S3。
进一步地,所述S5通过以下子步骤来实现:
S5.1通过下式计算评估系数h
其中G表示在该策略下终端能量进入稳态后其它终端不发送数据包时所有卫星正确接收数据包的长期平均效用值,P表示在该策略下所有终端能量进入稳态后任意终端不发送数据包的概率;
S5.2通过下式更新二分算法的上下限
S5.3检测是否满足精度要求λ′
H-λ′
L<∈
BM,满足则得到最优阈值策略
否则λ
H=λ′
H,λ
L=λ′
L并返回S2。
本发明的有益效果如下:
低轨卫星能量受限物联网终端可根据本发明的阈值求解方法求得的数据包效用观测值阈值策略方便地决定是否发送及以何种能量发送该数据包,进而实现了低轨卫星网络的终端高效能、高长期平均效用值、低丢包率的数据通信,其实现方法简单、手段灵活,求解方法计算复杂度低、运算效率高。
附图说明
图1是一种适用于低轨卫星网络的能量受限终端随机接入方法的阈值求解流程图。
图2为根据本发明的能量受限终端随机接入方法得到的网络长期平均效用值,及其与终端数目的关系图。
图3为根据本发明的能量受限终端随机接入方法得到的网络长期平均能效比,及其与终端数目的关系图。
图4为根据本发明的能量受限终端随机接入方法得到的网络长期平均丢包率,及其与终端数目的关系图。
具体实施方式
下面根据附图和优选实例详细说明本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的适用于低轨卫星网络的能量受限终端随机接入方法,每个终端配备多波束相控阵天线,可同时向所有低轨卫星发送数据包,且终端具有能量捕获能力;每个时隙各终端采集到的数据包的数目和低轨卫星数目相同,各数据包具有效用值且各数据包的效用值独立同分布;各终端仅知道自己此刻的能量和数据包的效用值的带有干扰的观测值,不知道其它终端的能量和数据包效用值;所有终端、所有数据包的接入方法均相同;各卫星与各终端之间的信道为带有衰落的冲突信道,即只有当某数据包的信噪比大于信噪比阈值且同时没有其它数据包到达同一卫星时该数据包才会被正确接收;
该方法包括如下步骤:
S1:初始化低轨卫星网络的场景参数,包括低轨卫星数目N、低轨卫星覆盖范围内的终端数目U、终端的平均能量捕获效率B、终端的电池容量e
max、平均信噪比增益K′、信噪比阈值γ;初始化二分算法精度∈
BM、策略迭代算法精度∈
PIA以及拉格朗日系数λ的上限
下限λ
L=0;
S2:随机给定初始策略η
0和初始能量价值函数v
0,其中η
0需满足下式条件
且
其中
表示对其进行向下取整。其中η
0(e,t)表示在终端能量为e的条件下,数据包以能量t发送的概率;t=0即为不发送。
S3:根据二分算法求取拉格朗日系数λ,更新能量价值函数v,直到满足策略迭代算法精度∈PIA;具体包括如下子步骤:
S3.2通过下式来求取终端的能量转移概率矩阵P,其元素Pef表示终端的能量从e转移到f的概率
其中,β(B,n)表示终端从环境中捕获n个能量单元的概率;B表示一个时隙内终端从环境中捕获能量单元的期望数目,与环境有关;α(e,t)表示终端能量为e时发射N个数据包消耗t个能量单元的概率;终端能量的单步变化情况取决于原有能量、发送数据包消耗的能量以及从环境中捕获的能量,故通过上式来求取能量转移概率;
S3.3通过下式来求取终端能量稳态概率分布π
其中I为单位矩阵,1为全一向量;因为该阈值策略的目的旨在高效用值通信,即长期平均效用值最大化所以需要计算终端能量进入稳态后的概率分布,由于终端能量变化是一个非周期不可约的马尔科夫决策过程,所以其能量稳态概率分布可通过上式求取。
其中
表示η
0(e,t)策略对应的效用值阈值,
终端无法获知其数据包的准确效用值,仅能获得带有干扰的效用观测值,效用观测值服从概率分布f
y(y);
S3.5通过下式来求取Z
其中,
K′为平均信噪比增益,与信道条件有关;
表示效用观测值为y条件下数据包效用值的期望;G
0表示在初始策略下终端能量进入稳态后其它终端不发送数据包时所有卫星正确接收数据包的长期平均效用值,P
0表示在初始策略下所有终端能量进入稳态后任意终端不发送数据包的概率;
S3.6通过下式更新每个能量e下的能量价值函数v1
其中p(f|e,t)表示终端在能量为e,通过以能量t发送数据包后变为f的概率;
S3.7检测是否满足精度要求|v1-v0|<∈PIA,满足则v=v1,否则v0=v1并回到S3.6。
S4:更新终端在不同能量下以不同能量发送的能量-动作价值函数q,计算能量-动作概率η1,直到策略收敛;具体包括如下子步骤:
S4.1通过下式更新每个能量不同动作下的能量-动作价值函数q
S4.2通过下式来更新每个能量不同动作下的能量-动作概率η
即通过softmax函数将能量-动作价值函数转换为能量-动作概率;
S4.3检测是否满足条件η=η0,满足则将其转换为效用观测值阈值yth,转换的方法同S3.4,否则η0=η并返回S3。
S5:计算评估系数h,并更新拉格朗日系数λ的上下限;判断是否满足二分算法的精度∈
BM,满足则返回最优阈值
否则返回S3;
S5.1通过下式计算评估系数h
其中G表示在该策略下终端能量进入稳态后其它终端不发送数据包时所有卫星正确接收数据包的长期平均效用值,P表示在该策略下所有终端能量进入稳态后任意终端不发送数据包的概率;
S5.2通过下式更新二分算法的上下限
S5.3检测是否满足精度要求λ′
H-λ′
L<∈
BM,满足则得到最优阈值策略
否则λ
H=λ′
H,λ
L=λ′
L并返回S2。
S6:在每个时隙k各终端u判断各个数据包的效用观测值y
u,k,n与最优阈值
的关系,当满足
时,则该数据包以能量t进行发送。其中e
u,k代表终端u在第k个时隙的能量状态。
图2、图3和图4分别为根据本发明的方法得到的网络长期平均效用值、能效比、丢包率及它们与终端数目的关系图,并将其与平均策略和贪婪策略进行了对比。在此处,网络长期平均效用值定义为一段时间内整个网络正确接收的数据包所具有的效用值的平均,能效比定义为网络长期效用值与该时间段内每个终端平均消耗的能量之比,丢包率定义为各终端每时隙由于未发送或未被卫星成功接收导致丢失的数据包占总数据包数目的比值,贪婪策略定义为各终端每个时隙始终以其所能采取的最大能量发送每个数据包,平均策略定义为各终端每个时隙发送每个数据包采用不同能量的概率相同。其中相关参数设定为:低轨卫星数目N为2,终端电池容量emax为4,终端的平均能量捕获效率B为0.1,平均信噪比增益K′为10,信噪比阈值γ为0.5,二分算法精度∈BM为0.01,策略迭代算法精度∈PIA为0.1。从图中可以看出本发明能明显提高通信系统发送数据所带来的网络长期平均效用值、能效比和明显降低整个网络的丢包率。从图2的x=48,y=2.44点可知,当终端数目为48时,在图中场景下可得到效用值为2.44,而平均策略和贪婪策略则分别只有0.66和0.39。从图3的x=48,y=3.25点可知,当终端数目为48时,在图中场景下可得到能效比为3.25,而平均策略和贪婪策略则分别只有0.14和0.08。从图4的x=48,y=0.26点可知,当终端数目为48时,在图中场景下平均策略和贪婪策略的丢包率都高达0.91,而本发明的策略仅为0.26。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。