CN111313995B - 多优先级用户频谱预测切换方法 - Google Patents

多优先级用户频谱预测切换方法 Download PDF

Info

Publication number
CN111313995B
CN111313995B CN202010098433.0A CN202010098433A CN111313995B CN 111313995 B CN111313995 B CN 111313995B CN 202010098433 A CN202010098433 A CN 202010098433A CN 111313995 B CN111313995 B CN 111313995B
Authority
CN
China
Prior art keywords
switching
time
priority
channel
prp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010098433.0A
Other languages
English (en)
Other versions
CN111313995A (zh
Inventor
曹开田
罗欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Technology
Original Assignee
Shanghai Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Technology filed Critical Shanghai Institute of Technology
Priority to CN202010098433.0A priority Critical patent/CN111313995B/zh
Publication of CN111313995A publication Critical patent/CN111313995A/zh
Application granted granted Critical
Publication of CN111313995B publication Critical patent/CN111313995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/382Monitoring; Testing of propagation channels for resource allocation, admission control or handover
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种多优先级用户频谱预测切换方法,本发明提出了一种M/G/m排队论模型表征SUs的切换过程,考虑不同信道之间的流量差异,避免因流量分布不均造成频谱资源浪费;推导出目标信道切换的优先序列,进而提出一种基于DQN预测判决的频谱切换方法。具有切换成功率更高、迭代次数更少等优点;该方法通过构建出SU频谱切换累计时延模型,采用深度Q网络及迁移学习策略对SUs的传输时延进行分析,实现系统整体传输时长最小。

Description

多优先级用户频谱预测切换方法
技术领域
本发明涉及一种多优先级用户频谱预测切换方法。
背景技术
认知无线电(Cognitive Radio,CR)技术通过允许次级用户(Secondary User,SU)机会接入授权频谱成为了频谱效率低下问题的一个有效的解决方法。由于认知无线网络具有独特的频谱占用形式,导致系统存在更大的不确定性,频谱切换的触发场景和执行过程与传统切换频谱切换相比较显得更为复杂。由于CR中频谱资源具有实时的变化性,频谱切换技术在满足用户网络性能需求方面具有极其重要的作用,是决定CR技术最终实现大规模商业使用的关键技术之一。由于其高效性与准确性,频谱预测切换方法对于提升频谱利用率具有重要作用,最近也获得了研究者的广泛关注,前景可期。
频谱预测切换主要是SU应对主用户(Primary User,PU)出现在其当前使用频段而采取的技术手段。PU的出现迫使SU放弃现有通信频段,重新进行频谱检测,造成了切换时延,增加了SU通信时延,直接影响着SU的通信性能。预测切换中,SU将感知到的实时信息与历史信息进行融合分析,基于对授权用户活动的先验知识,建立频谱切换模型,在PU到来之前进行合理预判,以此方式实现在PU到达授权频段前,执行频谱切换。预测判决式频谱切换有效克服了被动判决式频谱切换方法时延较长的缺点,大大节省了SU频谱切换的服务时间,极大地提高了频谱切换的敏捷性和系统性能。
因此,近年来,预测判决式频谱切换技术已成为CRNs技术的一个研究热点。有学者提出了一种优先级抢占式(Preemptive Resume Priority,PRP)M/G/1排队模型,用于描述多个SUs的频谱切换行为。其主要缺点在于:第一,PRP策略增加了切换频率,使传输时延增加;第二,M/G/1排队模型侧重于单一信道内的建模,缺乏信道之间的信息交流。同时,部分研究没有区分SU之间的时延需求差异。据此,有学者根据延迟敏感性将SUs划分为不同的优先级,高优先级SUs可以抢占低优先级SUs的传输频段,而低优先级SUs无法中断高优先级SUs的传输过程,以此满足延迟敏感型SUs的性能要求。同样,PRP策略的引入会导致频繁的切换,对于系统总体性能产生负面影响。因此,非抢占式(Non-Preemptive ResumePriority,N-PRP)排队也是一个研究的方向。有学者对比了PRP与N-PRP排队论模型的差异,N-PRP策略在保障系统整体性能的同时增大了高优先级SUs的传输时延。有学者根据PU频谱空洞的残余时间分布函数,建立频谱切换概率的分析模型,进而推导出SU平均切换次数的解析表达式,并分析了切换次数对SU切换概率的影响。但未考虑SU传输速率、认知无线电网络(Cognitive Radio Networks,CRNs)吞吐量等系统整体性能最优的问题。
上述频谱切换方法只对单一信道进行分析建模,没有考虑信道之间的联系,导致信道间负载的不平衡。同时,在复杂时变的电磁环境中不能获取最优决策,难以同时满足不同延迟需求的SUs的切换性能要求。
发明内容
本发明的目的在于提供一种多优先级用户频谱预测切换方法。
为解决上述问题,本发明提供一种多优先级用户频谱预测切换方法,包括:
步骤1,将SU在进行频谱切换的范围内划分为M个互不重叠的PU信道,按照其中心频率从小到大顺序,依次排列为
Figure BDA0002385562920000021
φi为第i个PU信道,i为正整数;
步骤2,将CR系统的每一个时隙划分为三部分:频谱感知TS、切换确认TACK和传输阶段TD
步骤3,根据步骤2的时隙划分,SU在切换确认TACK的时间间隔内,检测频谱切换完成的确认信号是否到来,以判断频谱切换过程是否结束,如果检测到,则整个频谱切换过程结束;反之,转至下一步骤;
步骤4,根据次用户的时延敏感程度对次用户进行优先级划分,依次排列为
Figure BDA0002385562920000031
SUj为优先级为j的次用户,j为正整数,其中,SU1是具有最高优先级的SU,SUL具有最低优先级,计算信道繁忙概率ρk
步骤5,设定抢占门限值τ,根据SU经历过的传输时间长短判断该SU能否被高优先级SUs中断传输过程,其中,中断权限判决依据为:
Figure BDA0002385562920000032
其中,Telap为SU经历过的传输时间,τ为SU的抢占门限值;
步骤6,根据步骤4的优先级划分的结果和步骤5的抢占门限值τ,构建一个混合PRP/N-PRP M/G/m排队论模型表征SUs的切换过程,将切换过程分为停留等待和切换至其他信道两种情况,分别计算等待时长,根据等待时长进行选择:
Figure BDA0002385562920000033
其中,E(W′)为停留等待条件下用户等待时长,E(W)为切换至其他信道条件下用户等待时长,ts为切换动作执行所需时间;
步骤7,在PU信号出现过程为泊松过程条件下,用SUs的扩展数据传输时间来表征切换策略的性能,根据步骤4的优先级划分的结果,步骤5的抢占门限值τ和步骤6的混合PRP/N-PRP M/G/m排队论模型计算切换时延E(Tj):
Figure BDA0002385562920000034
其中,n为中断次数,nmax为SUs的最大中断次数,当SU的中断次数达到nmax后,再次被中断后,SU放弃该次传输,E[·]表示数学期望,pk i,j为中断次数为i的SUj在信道k上再次被中断的概率,E(Xj)为优先级为j的SU期望服务时长;
步骤8,根据步骤7的切换时延E(Tj)的表达式将SU1的最优抢占门限值
Figure BDA0002385562920000035
的选取归结为以下最优化问题:
Figure BDA0002385562920000041
步骤9,根据步骤8提出的最优化问题,利用DQN算法求取最优门限值,对新加入CRNs系统的SU,利用周边距离其最近的SU的Q函数及其参数对其进行初始化,然后,要求SUj通过DQN方法寻找一个最优学习策略π,使得自己在下一时刻获得的回报最大,从而实现CRNs系统各优先级SU整体传输时延最小,即:
Figure BDA0002385562920000042
其中,γt是每一时间步长的折扣因子。
Figure BDA0002385562920000043
为最优Q值函数,表示SU1在最优学习策略π下,在(0,∞)时间范围内获得的最大折扣回报ri(s,a)之和;
步骤10,根据步骤9,按照SUs的扩展数据传输时间由低到高的原则,对
Figure BDA0002385562920000044
进行预测判决并排序,得到频谱切换接入时的目标信道序列
Figure BDA0002385562920000045
进一步的,在上述方法中,所述步骤4中信道繁忙概率ρk为:
Figure BDA0002385562920000046
其中,ρk p表示PU占用导致信道K繁忙的概率,ρk j表示信道K被SUj占据的概率。
进一步的,在上述方法中,所述步骤6中混合PRP/N-PRP M/G/m排队论模型的SU期望服务时长为:
Figure BDA0002385562920000047
E(φk i,j)为PRP M/G/1模型下中断次数为i的SUj在信道k上的平均服务时长。
进一步的,在上述方法中,所述步骤7中PU信号出现的频率为1/λ,其概率密度函数PDF为:
Figure BDA0002385562920000051
由泊松分布性质得到λ=E(X),其中,E(·)表示数学期望。
进一步的,在上述方法中,所述步骤7中E(Dk i,j)为中断次数为i的SUj切换等待时长:
Figure BDA0002385562920000052
进一步的,在上述方法中,所述步骤8中SU1的动作空间Al门限值的集合,表示为
Figure BDA0002385562920000053
t时刻,构建出系统的状态空间为S(t)=(I(t),D(t)),其中,
Figure BDA0002385562920000054
Figure BDA0002385562920000055
t时刻,SUj(j=1,2,...,L)获得的回报rj(st,at)为:
Figure BDA0002385562920000056
其中,ωk i,j和φk i,j分别是优先级为j,中断次数为i的次用户在信道k上的到达率和有效服务时间,λk p为信道k上主用户到达率,E(Xj)为SUj的期望服务时长,Λ为一个常数,其值小于采取任意学习策略时所得到的回报值。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
(1)本发明提出了一种M/G/m排队论模型表征SUs的切换过程,考虑不同信道之间的流量差异,避免因流量分布不均造成频谱资源浪费。
(2)推导出目标信道切换的优先序列,进而提出一种基于DQN预测判决的频谱切换方法。具有切换成功率更高、迭代次数更少等优点。
该方法通过构建出SU频谱切换累计时延模型,采用深度Q网络(Deep Q-Network,DQN)及迁移学习(Transfer Learning,TL)策略对SUs的传输时延进行分析,实现系统整体传输时长最小。
附图说明
图1是本发明一实施例的多优先级用户频谱预测切换方法的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供一种多优先级用户频谱预测切换方法,包括:
步骤1,将SU在进行频谱切换的范围内划分为M个互不重叠的PU信道,按照其中心频率从小到大顺序,依次排列为
Figure BDA0002385562920000061
φi为第i个PU信道,i为正整数;
步骤2,将CR系统的每一个时隙划分为三部分:频谱感知TS、切换确认TACK和传输阶段TD
步骤3,根据步骤2的时隙划分,SU在切换确认TACK的时间间隔内,检测频谱切换完成的确认信号是否到来,以判断频谱切换过程是否结束,如果检测到,则整个频谱切换过程结束;反之,转至下一步骤;
步骤4,根据次用户的时延敏感程度对次用户进行优先级划分,依次排列为
Figure BDA0002385562920000062
SUj为优先级为j的次用户,j为正整数,其中,SU1是具有最高优先级的SU,SUL具有最低优先级,计算信道繁忙概率ρk
步骤5,设定抢占门限值τ,根据SU经历过的传输时间长短判断该SU能否被高优先级SUs中断传输过程,其中,中断权限判决依据为:
Figure BDA0002385562920000063
其中,Telap为SU经历过的传输时间,τ为SU的抢占门限值;
步骤6,根据步骤4的优先级划分的结果和步骤5的抢占门限值τ,构建一个混合PRP/N-PRP M/G/m排队论模型表征SUs的切换过程,将切换过程分为停留等待和切换至其他信道两种情况,分别计算等待时长,根据等待时长进行选择:
Figure BDA0002385562920000071
其中,E(W′)为停留等待条件下用户等待时长,E(W)为切换至其他信道条件下用户等待时长,ts为切换动作执行所需时间;
在此,nmax为SUs的最大中断次数。当SU的中断次数达到nmax后,再次被中断后,SU放弃该次传输。
停留等待:在这种情况下,SU停留在当前信道等待,直到通道k上所有高优先级用户离开信道。因此,等待时间由三部分组成:中断当前传输的用户的服务时间、新到达的PUs的服务时间和新到达的高优先级SUs的服务时间。
Figure BDA0002385562920000072
其中,ωk i,v和φk i,v分别是优先级为v,中断次数为i的次用户在信道k上的到达率和有效服务时间。E(Xint)是抢占信道的用户的服务时间,λk pE(W′k i,j)E(Xk p)为新到达的主用户的服务时间,
Figure BDA0002385562920000073
为新到达的高优先级SUs的服务时间。
Figure BDA0002385562920000074
ρv表示信道K被SUv占据的概率。将(16)代入(15)得到:
Figure BDA0002385562920000075
切换至其他信道:此情况下,被中断的SU选择从当前信道切换到另一个信道。我们假设目标信道为信道k。当SUj离开当前信道,信道k可能处于四种状态:PU占用,高优先级或同优先级SU占用,低优先级SU占用和空闲。当目标信道被同优先级或高优先级用户占用时,SUj需要在相应优先级的队列中等待。当目标通道处于第三种状态时,SUj需要进行判断。如果信道用户进入中断保护状态,SUj就不能中断它的传输,需要返回到它的队列等待。否则,SUj中断其传输过程并抢占该信道。当信道处于空闲状态时,SUj直接进入信道进行传输,没有初始时延。
Figure BDA0002385562920000081
E(Rk s,j)为当前服务用户在通道k上的平均剩余服务时间,E(Qk p)E(Xk p)和
Figure BDA0002385562920000082
分别为信道k上当前PU和高优先级SU的服务时长,第4项为等待时间内新到达的PU的期望服务时间,最后一项为在等待时间内新到达的高优先级SU的期望服务时间。根据剩余时间的定义:
Figure BDA0002385562920000083
我们可以求出:
Figure BDA0002385562920000084
根据利特尔法则我们可以求出:
E(Qk p)=λk pE(Wk p) (21)
E(Qk p)为信道k上主用户数量,λk p为主用户在信道k上的到达率,E(Wk p)为PU在信道k上的期望等待时长,且有:
E(Wk p)=E(Rk p)+E(Qk p)E(Xk p) (22)
E(Rk p)为当前信道服务用户平均剩余服务时间,E(Qk p)E(Xk p)为当前队列中PU的总服务时间。因此我们求出:
Figure BDA0002385562920000091
类似地,我们求出
Figure BDA0002385562920000092
步骤7,在PU信号出现过程为泊松过程条件下,用SUs的扩展数据传输时间(ExtendData Delivery Time)来表征切换策略的性能,根据步骤4的优先级划分的结果,步骤5的抢占门限值τ和步骤6的混合PRP/N-PRP M/G/m排队论模型计算切换时延E(Tj):
Figure BDA0002385562920000093
其中,n为中断次数,nmax为SUs的最大中断次数。当SU的中断次数达到nmax后,再次被中断后,SU放弃该次传输,E[·]表示数学期望,pk i,j为中断次数为i的SUj在信道k上再次被中断的概率,E(Xj)为优先级为j的SU期望服务时长;
在此,
Figure BDA0002385562920000094
步骤8,根据步骤7的切换时延E(Tj)的表达式将SU1的最优抢占门限值
Figure BDA0002385562920000095
的选取归结为以下最优化问题:
Figure BDA0002385562920000096
在此,根据步骤7的切换时延表达式将SU1的最优抢占门限值
Figure BDA0002385562920000097
的选取归结为以下最优化问题:
Figure BDA0002385562920000101
步骤9,根据步骤8提出的最优化问题,利用DQN算法求取最优门限值,对新加入CRNs系统的SU,利用周边距离其最近的SU的Q函数及其参数对其进行初始化,然后,要求SUj通过DQN方法寻找一个最优学习策略π,使得自己在下一时刻获得的回报最大,从而实现CRNs系统各优先级SU整体传输时延最小,即:
Figure BDA0002385562920000102
其中,γt是每一时间步长的折扣因子。
Figure BDA0002385562920000103
为最优Q值函数,表示SU1在最优学习策略π下,在(0,∞)时间范围内获得的最大折扣回报ri(s,a)之和;
在此,根据步骤8提出的优化问题,利用DQN算法求取最优门限值,进行建模,构建出动作空间、状态空间和回报函数,然后采用DQN算法求得Q值近似估计器,从而得到最优学习策略。门限值的集合就构成了SUj的动作空间Ai,表示为
Figure BDA0002385562920000104
式(26)中的两个限制条件定义为状态,则在t时刻,构建出系统的状态空间为S(t)=(I(t),D(t)),其中
Figure BDA0002385562920000105
Figure BDA0002385562920000106
将回报函数定义为状态空间和当前动作空间上的函数,在t时刻,SUj(j=1,2,…,L)获得的回报ri(st,at)为
Figure BDA0002385562920000107
对新加入CRNs系统的SU,利用周边距离其最近的SU的Q函数及其参数对其进行初始化。然后,要求SU通过DQN方法寻找一个最优学习策略π,使得自己在下一时刻获得的回报最大,即
Figure BDA0002385562920000111
其中,γt是每一时间步长的折扣因子,E[·]表示数学期望。
Figure BDA0002385562920000112
为最优Q值函数,表示SUi在最优学习策略π下,在(0,∞)时间范围内获得的最大折扣回报ri(s,a)之和。由Bellman最优恒等式可知,在下一时刻,如果在状态序列s′下的最优Q值
Figure BDA0002385562920000113
对所有动作a′来说都是已知的,则式(5)可表示为
Figure BDA0002385562920000114
在DQN经验回放的任一时间步骤t时刻,SUj在与周边无线环境交互的过程中,将获取的经验值
Figure BDA0002385562920000115
存入回放存储器
Figure BDA0002385562920000116
中。SUj在上一步骤和当前步骤下Q值的估计参数分别为
Figure BDA0002385562920000117
θi,通过使得当前迭代步骤下的损失函数L(θi)最小,实现对DQN网络中θi参数的不断更新,即L(θi)=E[(yi-Q(s,a;θi))2] (28)
其中,
Figure BDA0002385562920000118
用∈-greedy策略来选择每个SU的动作(抢占门限τj),对参数θi进行更新,使得SUj的回报最大,实现SU扩展数据传输时间最小;
步骤10,根据步骤9,按照SUs的扩展数据传输时间由低到高的原则,对
Figure BDA0002385562920000119
进行预测判决并排序,得到频谱切换接入时的目标信道序列
Figure BDA00023855629200001110
本发明所述的一种多优先级用户频谱预测切换方法一实施例中,所述步骤4中信道繁忙概率ρk为:
Figure BDA00023855629200001111
其中,ρk p表示PU占用导致信道K繁忙的概率,ρk j表示信道K被SUj占据的概率。
本发明所述的一种多优先级用户频谱预测切换方法一实施例中,所述步骤6中混合PRP/N-PRP M/G/m排队论模型的SU期望服务时长为:
Figure BDA0002385562920000121
E(φk i,j)为PRP M/G/1模型下中断次数为i的SUj在信道k上的平均服务时长。
本发明所述的一种多优先级用户频谱预测切换方法一实施例中,所述步骤7中PU信号出现的频率为1/λ,其概率密度函数PDF(Probability Density Function)为
Figure BDA0002385562920000122
由泊松分布性质可知λ=E(X),其中,E(·)表示数学期望。
本发明所述的一种多优先级用户频谱预测切换方法一实施例中,所述步骤7中E(Dk i,j)为中断次数为i的SUj切换等待时长。
Figure BDA0002385562920000123
本发明所述的一种多优先级用户频谱预测切换方法一实施例中,所述步骤8中SU1的动作空间Al门限值的集合,表示为
Figure BDA0002385562920000124
t时刻,构建出系统的状态空间为S(t)=(I(t),D(t)),其中,
Figure BDA0002385562920000125
Figure BDA0002385562920000126
t时刻,SUj(j=1,2,...,L)获得的回报rj(st,at)为:
Figure BDA0002385562920000127
其中,ωk i,j和φk i,j分别是优先级为j,中断次数为i的次用户在信道k上的到达率和有效服务时间,λk p为信道k上主用户到达率,E(Xj)为SUj的期望服务时长。Λ为一个常数,其值小于采取任意学习策略时所得到的回报值。
在此,本发明所要解决的技术问题是克服现有技术的不足而提供一种基于M/G/m排队论模型的多优先级用户频谱预测切换方法,与传统频谱切换方法相比,本发明方法具有更低的传输时延和更优的切换性能。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
(3)本发明提出了一种M/G/m排队论模型表征SUs的切换过程,考虑不同信道之间的流量差异,避免因流量分布不均造成频谱资源浪费。
(4)推导出目标信道切换的优先序列,进而提出一种基于DQN预测判决的频谱切换方法。具有切换成功率更高、迭代次数更少等优点。
(5)该方法通过构建出SU频谱切换累计时延模型,采用深度Q网络(Deep Q-Network,DQN)及迁移学习(Transfer Learning,TL)策略对SUs的传输时延进行分析,实现系统整体传输时长最小。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (6)

1.一种多优先级用户频谱预测切换方法,其特征在于,包括:
步骤1,将SU在进行频谱切换的范围内划分为M个互不重叠的PU信道,按照其中心频率从小到大顺序,依次排列为
Figure FDA0003481354470000011
φi为第i个PU信道,i为正整数;
步骤2,将CR系统的每一个时隙划分为三部分:频谱感知TS、切换确认TACK和传输阶段TD
步骤3,根据步骤2的时隙划分,SU在切换确认TACK的时间间隔内,检测频谱切换完成的确认信号是否到来,以判断频谱切换过程是否结束,如果检测到,则整个频谱切换过程结束;反之,转至下一步骤;
步骤4,根据次用户的时延敏感程度对次用户进行优先级划分,依次排列为
Figure FDA0003481354470000012
SUj为优先级为j的次用户,j为正整数,其中,SU1是具有最高优先级的SU,SUL具有最低优先级,计算信道繁忙概率ρk,其中,L为优先级的级数;
步骤5,设定抢占门限值τ,根据SU经历过的传输时间长短判断该SU能否被高优先级SU中断传输过程,其中,中断权限判决依据为:
Figure FDA0003481354470000013
其中,Telap为SU经历过的传输时间,τ为SU的抢占门限值;
步骤6,根据步骤4的优先级划分的结果和步骤5的抢占门限值τ,构建一个混合PRP/N-PRP M/G/m排队论模型表征SU的切换过程,将切换过程分为停留等待和切换至其他信道两种情况,分别计算等待时长,根据等待时长进行选择:
Figure FDA0003481354470000014
其中,E(·)表示数学期望,ts为切换动作执行所需时间,W'表示停留等待条件下用户等待时长,W表示切换至其他信道条件下用户等待时长;
步骤7,在PU信号出现过程为泊松过程条件下,用SU的扩展数据传输时间来表征切换策略的性能,根据步骤4的优先级划分的结果,步骤5的抢占门限值τ和步骤6的混合PRP/N-PRPM/G/m排队论模型计算切换时延E(Tj):
Figure FDA0003481354470000021
其中,n为中断次数,nmax为SU的最大中断次数,当SU的中断次数达到nmax后,再次被中断后,SU放弃该次传输,E(·)表示数学期望,pk i,j为中断次数为i的SUj在信道k上再次被中断的概率,E(Dk i,j)表示中断次数为i的SUj切换等待时长,E(Xj)表示优先级为j的SU期望服务时长;
步骤8,根据步骤7的切换时延E(Tj)的表达式将SUl的最优抢占门限值
Figure FDA0003481354470000025
的选取归结为以下最优化问题:
Figure FDA0003481354470000022
E(Tj)表示切换时延;
步骤9,根据步骤8提出的最优化问题,利用DQN算法求取最优门限值,对新加入CRNs系统的SU,利用周边距离其最近的SU的Q函数及其参数对其进行初始化,然后,要求SUj通过DQN方法寻找一个最优学习策略π,使得自己在下一时刻获得的回报最大,从而实现CRNs系统各优先级SU整体传输时延最小,即:
Figure FDA0003481354470000023
其中,γt是每一时间步长的折扣因子,
Figure FDA0003481354470000024
为最优Q值函数,表示SUl在最优学习策略π下,在(0,∞)时间范围内获得的最大折扣回报ri(s,a)之和,s表示当前时刻状态,a表示当前时刻动作,s'代表下一时刻的状态,a'代表下一时刻的动作,st表示t时刻的状态,at表示t时刻的动作;
步骤10,根据步骤9,按照SUs的扩展数据传输时间由低到高的原则,对
Figure FDA0003481354470000031
进行预测判决并排序,得到频谱切换接入时的目标信道序列
Figure FDA0003481354470000032
2.如权利要求1所述的多优先级用户频谱预测切换方法,其特征在于,所述步骤4中信道繁忙概率ρk为:
Figure FDA0003481354470000033
其中,ρk p表示PU占用导致信道K繁忙的概率,ρk j表示信道K被SUj占据的概率。
3.如权利要求1所述的多优先级用户频谱预测切换方法,其特征在于,所述步骤6中混合PRP/N-PRP M/G/m排队论模型的SU期望服务时长为:
Figure FDA0003481354470000034
E(φk i,j)为PRP M/G/1模型下中断次数为i的SUj在信道k上的平均服务时长,E(θk i,j)表示M/G/m模型下中断次数为i的SUj在信道k上的平均服务时长。
4.如权利要求1所述的多优先级用户频谱预测切换方法,其特征在于,所述步骤7中PU信号出现的频率为1/λ,其概率密度函数PDF为:
Figure FDA0003481354470000035
由泊松分布性质得到λ=E(X),其中,E(·)表示数学期望。
5.如权利要求1所述的多优先级用户频谱预测切换方法,其特征在于,所述步骤7中E(Dk i,j)为中断次数为i的SUj切换等待时长:
Figure FDA0003481354470000036
其中,E(W'k i,j)表示中断次数为i的SUj在信道k上停留等待需要的时长的期望值,E(Wk i,j)表示中断次数为i的SUj在当前信道k上采取切换至其他信道所需的切换时长的期望值。
6.如权利要求1所述的多优先级用户频谱预测切换方法,其特征在于,所述步骤8中SUl的动作空间Al门限值的集合,表示为
Figure FDA0003481354470000041
t时刻,构建出系统的状态空间为S(t)=(I(t),D(t)),其中,
Figure FDA0003481354470000042
Figure FDA0003481354470000043
t时刻,j=1,2,…,L,SUj获得的回报rj(st,at)为:
Figure FDA0003481354470000044
其中,ωk i,j和φk i,j分别是优先级为j,中断次数为i的次用户在信道k上的到达率和有效服务时间,λk p为信道k上主用户到达率,E(Xj)为SUj的期望服务时长,Λ为一个常数,其值小于采取任意学习策略时所得到的回报值。
CN202010098433.0A 2020-02-17 2020-02-17 多优先级用户频谱预测切换方法 Active CN111313995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010098433.0A CN111313995B (zh) 2020-02-17 2020-02-17 多优先级用户频谱预测切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010098433.0A CN111313995B (zh) 2020-02-17 2020-02-17 多优先级用户频谱预测切换方法

Publications (2)

Publication Number Publication Date
CN111313995A CN111313995A (zh) 2020-06-19
CN111313995B true CN111313995B (zh) 2022-03-01

Family

ID=71161721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010098433.0A Active CN111313995B (zh) 2020-02-17 2020-02-17 多优先级用户频谱预测切换方法

Country Status (1)

Country Link
CN (1) CN111313995B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112953666B (zh) * 2021-02-23 2022-11-01 上海应用技术大学 认知无线网络中基于信道质量的频谱预测切换方法
CN114222335B (zh) * 2021-12-13 2024-04-19 北京理工大学 一种基于泊松簇过程的地面小区间切换概率预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104540178A (zh) * 2015-01-04 2015-04-22 重庆邮电大学 一种认知异构网络联合频谱切换与功率分配方法
CN110190918A (zh) * 2019-04-25 2019-08-30 广西大学 基于深度q学习的认知无线传感器网络频谱接入方法
CN110492955A (zh) * 2019-08-19 2019-11-22 上海应用技术大学 基于迁移学习策略的频谱预测切换方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8838520B2 (en) * 2010-04-06 2014-09-16 University Of Notre Dame Du Lac Sequence detection methods, devices, and systems for spectrum sensing in dynamic spectrum access networks
EP2770789B1 (en) * 2013-02-21 2016-09-07 Deutsche Telekom AG Contextual and predictive prioritization of spectrum access
CN104066132B (zh) * 2014-07-01 2017-05-03 重庆邮电大学 一种基于最小传输时延的异构认知网络频谱选择方法
US11775850B2 (en) * 2016-01-27 2023-10-03 Microsoft Technology Licensing, Llc Artificial intelligence engine having various algorithms to build different concepts contained within a same AI model

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104540178A (zh) * 2015-01-04 2015-04-22 重庆邮电大学 一种认知异构网络联合频谱切换与功率分配方法
CN110190918A (zh) * 2019-04-25 2019-08-30 广西大学 基于深度q学习的认知无线传感器网络频谱接入方法
CN110492955A (zh) * 2019-08-19 2019-11-22 上海应用技术大学 基于迁移学习策略的频谱预测切换方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Optimal Spectrum Handoff Control for CRN Based on Hybrid Priority Queuing and Multi-Teacher Apprentice Learning;Yeqing Wu等;《IEEE》;20170331;第66卷(第3期);全文 *
在认知无线网络中基于排队论的频谱切换研究;张倩倩;《CNKI》;20200131;全文 *
认知无线电网络中基于抢占式排队论的频谱切换模型;杨小龙;《物理学报》;20151231;第64卷(第10期);全文 *

Also Published As

Publication number Publication date
CN111313995A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
Prathiba et al. Federated learning empowered computation offloading and resource management in 6G-V2X
CN106413017B (zh) 异构网络中面向终端个性化服务的模糊垂直切换方法
CN111313995B (zh) 多优先级用户频谱预测切换方法
CN110493360A (zh) 多服务器下降低系统能耗的移动边缘计算卸载方法
CN108768876B (zh) 一种面向机器学习框架的流量调度方法
WO2019134197A1 (zh) 基于朴素贝叶斯分类器的最小负载路由选择方法及系统
CN111711666A (zh) 一种基于强化学习的车联网云计算资源优化方法
Loganathan et al. A novel multi-criteria channel decision in co-operative cognitive radio network using E-TOPSIS
CN106507370A (zh) 主动式频谱感知切换的方法
Sumathi et al. Machine learning-based algorithm for channel selection utilizing preemptive resume priority in cognitive radio networks validated by ns-2
Mir et al. An adaptive handoff strategy for cognitive radio networks
Yang et al. A novel distributed task scheduling framework for supporting vehicular edge intelligence
Chouhan et al. Priority based MAC scheme for cognitive radio network: A queuing theory modelling
Baloch et al. A mathematical model for wireless channel allocation and handoff schemes
CN113190342A (zh) 用于云-边协同网络的多应用细粒度卸载的方法与系统架构
Wang et al. A dynamic channel-borrowing approach with fuzzy logic control in distributed cellular networks
Alfa et al. A discrete time queueing model of cognitive radio networks with multi-modal overlay/underlay switching service levels
CN116634442A (zh) 一种基于交通与通信特征互补预测的基站资源调度方法
CN103249050A (zh) 基于业务需求的多尺度频谱接入方法
Chousainov et al. An analytical framework of a C-RAN supporting random, quasi-random and bursty traffic
CN115208892A (zh) 基于动态资源需求的车路协同在线任务调度方法及系统
CN109729561B (zh) 认知异构无线电网络中频谱切换方法
Shen et al. Resource management schemes for multiple traffic in integrated heterogeneous wireless and mobile networks
Kargahi et al. Utility accrual dynamic routing in real-time parallel systems
Saboji et al. Congestion-aware proactive vertical handoff decision using coalition game

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant