CN109039505B - 一种认知无线电网络中信道状态转移概率预测方法 - Google Patents

一种认知无线电网络中信道状态转移概率预测方法 Download PDF

Info

Publication number
CN109039505B
CN109039505B CN201810696652.1A CN201810696652A CN109039505B CN 109039505 B CN109039505 B CN 109039505B CN 201810696652 A CN201810696652 A CN 201810696652A CN 109039505 B CN109039505 B CN 109039505B
Authority
CN
China
Prior art keywords
state
channel
channel state
probability
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810696652.1A
Other languages
English (en)
Other versions
CN109039505A (zh
Inventor
韩光洁
李傲寒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Campus of Hohai University
Original Assignee
Changzhou Campus of Hohai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Campus of Hohai University filed Critical Changzhou Campus of Hohai University
Priority to CN201810696652.1A priority Critical patent/CN109039505B/zh
Publication of CN109039505A publication Critical patent/CN109039505A/zh
Application granted granted Critical
Publication of CN109039505B publication Critical patent/CN109039505B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/391Modelling the propagation channel
    • H04B17/3913Predictive models, e.g. based on neural network models

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明设计出一种基于两阶段Q学习方法的认知无线电网络中信道状态转移概率预测方法包括两个学习过程,分别为信道状态转移概率学习过程和信道状态学习过程;所述信道状态转移概率学习过程和信道状态学习过程均是基于Q学习方法,信道状态学习过程能够根据信道状态转移概率学习过程学习到的信道状态转移概率对信道的状态进行学习并且输出学习到的信道状态。该方法能够实时的对不断变化的授权信道状态进行预测。此外,该方法不需要提前假设授权用户或是干扰者满足任何概率分布。而且,该方法充分考虑了所使用的信道状态转移概率预测样本状态的正确与否问题。

Description

一种认知无线电网络中信道状态转移概率预测方法
技术领域
本发明涉及一种认知无线电网络中信道状态转移概率预测方法,属于无线电网络技术领域。
背景技术
在过去数十年的时间里,为了满足消费者对快速,安全而且智能的无线网络的需求,无线网络对不断增长地更高速率的数据速率的要求进行支持。然而,当前无线网络系统面临着频谱资源所带来的瓶颈。这一瓶颈使得在有限的可利用频段中对性能进行增强变得困难。因此,为了进一步加强无线网络的性能,需要新的通信案例。工业已经预测无线网络需要更多的频谱资源来来服务更多高速通信的用户。并且,当前的频谱资源需要更加有效地被利用。为了更加有效的利用有限的频谱资源,认知无线电技术应运而生。在认知无线电网络中,认知无线电用户可以在不干扰授权用户正常通信的情况下动态地利用授权频谱。然而,认知无线电用户的设计面临着很多安全方面的挑战。在认知无线电网络中,认知无线电用户可能受到干扰着的攻击。装有认知功能的干扰者能够感知到未被授权用户占用的信道并且攻击这些信道。干扰者对认知无线电用户的攻击将会破坏认知无线电用户之间的正常通信。因此,为了保证认知无线电用户在认知无线电网络中的正常通信并且避免对授权用户的干扰,对信道状态信息的预测是非常重要的。
在认知无线电网络中,认知无线电用户通常可以通过频谱感知技术来感知授权信道的状态。然而,由于认知无线电硬件及能量的限制,认知无线电用户可能没有能力在同一时间感知所有的授权频谱。此外,即使认知无线电用户有能力感知全部授权频谱,感知全部授权频谱将会消耗大量的时间,这将给认知无线电用户的通信带来很大程度的时延。因此,为了在有限的时间内获取更加正确的频谱状态,我们需要获得更有关于信道的信息。其中,最重要的一个信息便是信道状态转移概率。很多已有文章假设信道状态是由授权用户的状态决定的,并且认知无线电用户知道授权用户的状态转移信息。然而,在真实的认知无线电网络中,认知无线电用户是很难知道授权用户的状态转移信息的。因此,认知无线电用户需要对授权信道的状态信息进行预测。到目前为止,只有少部分的相关研究对认知无线电网络中授权信道的状态转移信息进行了预测。
目前针对认认知无线电网络中信道状态转移概率预测方法的相关研究文献如下:
1.C.Liu等人在2012年的《IEEE Globecom》上发表的文章“Prediction ofExponentially Distributed Primary User Traffic for Dynamic Spectrum Access”中提出了一种基于最大似然方法的授权用户活动预测方法。此方法假设授权用户的活动服从指数分布,并且感知是完美感知。在此预测方法中,首先根据采样样本计算授权用户占用信道的概率。然后,根据此评估概率对授权用户占用授权信道的时间进行评估。之后,根据评估的占用信道概率及占用信道时间对非授权用户对信道占用情况的转移概率进行评估。最后,根据完美感知感知到的信道状态及评估好的转移概率进行下一时刻信道状态的评估。然而,此最大似然预测方法假设信道感知结果是完美的。在真实的认知无线电网络中,由于感知时间及感知方法的限制,信道状态感知结果可能是不完美的。此外,授权用户对信道的占用间隔需要服从指数分布。而且,在预测下一状态时,需要长时间的采样过程。因此,此方法将会给认知无线电用户的通信带来长时间的时延。
2.C.Song等人在2010年的《IEEE ICC》上发表的文章“Understand thePredictability of Wireless Spectrum:A Large-scale Empirical Study”中提出了一种基于马尔可夫的信道预测方法。此方法使用所要预测的时隙的前K个信道状态来预测此时隙的信道状态。通过统计所使用的K个信道状态中占用信道的时隙数及未占用信道的时隙数来预测此时隙的信道状态。然而,通过此方法预测,在不同的情况下,会面临不同程度上的错误率。有些情况下,此方法面临着较大的预测错误率。此外,用于预测的信道状态序列中的信道状态同时面对着感知信道状态错误问题。
3.F.H.Panahi等人在2014年的《IEICE Transaction on Communication》上发表的文章“Optimal Channel-Sensing Scheme for Cognitive Radio Systems Based onFuzzy Q-Learning”中提出一种基于Baum-Welch算法的信道转移概率预测算法,此方法能够充分地预测信道转移概率。然而,此方法需要在使用信道转移概率对信道进行预测之前,通过一定数量的样本空间对信道转移概率进行预测。此外,若信道转移概率变化,此预测方法需要花费大量时间来重新进行采样来重新预测信道转移概率。这一信道转移预测算法不能够实时的预测信道的状态。因此,将会增加认知无线电用户的通信延迟。而且无法预知重新采样的时间。
4.S.Filippi等人在2008年的《IEEE CrownCom》上发表的文章“An EstimationAlgorithm of Channel State Transition Probabilities for Cognitive RadioSystems”中提出一种基于最大似然估计方法的信道转移概率预测方法,此方法能够相对准确的对信道转移概率进行评估。此方法的状态转移概率是基于认知无线电用户可以获得正确的信道状态基础的。然而,在实际的认知无线电网络中,由于认知无线电用户感知时间,感知方法及周围通信环境的限制,认知无线电用户可能无法获得真实的信道状态信息。此外,在此方法中,认知无线电用户需要同时收集长时间的信道状态信息来对信道转移概率进行评估。因此,这一信道转移概率预测方法将会增加认知无线电用户的通信延迟。
5.A.Akbulut等人在2012年的《Radioengineering》上发表的文章“Estimation ofTime-Varying Channel State Transition Probabilities for Cognitive RadioSystems by Means of Particle Swarm Optimization”中提出了一种基于粒子群方法的信道转移概率预测方法。此方法能够对变化的信道转移概率进行预测。然而,此方法同样面临着所使用的信道状态信息可能与实际的信道状态不同的情况。
在总结这些研究的基础上,可以看出当前认知无线电网络体系结构的设计中存在以下主要问题:
1.很多文章都默认用于预测的观察信道状态序列的状态与实际信道状态相同。然而,由于非授权用户频谱感知时间,频谱感知方法以及通信环境的限制,所观察到的信道状态可能与实际的信道状态存在一定程度上的偏差。
2.大部分文章都需要提前对信道状态转移概率进行预测,这将给认知无线电用户的通信带来一定程度的延迟。此外,由于大部分文章无法对信道状态转移概率进行实时地预测。因此,大部分文章中的信道状态转移概率只适用于信道状态转移概率一直不变的认知无线电网络中。然而,在真实的认知无线电网络中,信道状态转移概率可能是随时间变化的。
3.部分文章中的信道状态转移概率预测方法需要满足一定的概率分布,不能通用于认知无线电网络中。
发明内容
技术问题:本发明设计出一种基于两阶段Q学习方法的认知无线电网络中信道状态转移概率预测方法。此预测方法包含的两阶段基于Q学习方法的预测过程,分别为信道状态转移概率学习过程及信道状态学习过程。信道状态转移概率学习过程的输入和输出分别为:信道状态学习过程学习到的信道状态,以及所预测的信道状态转移概率。信道状态学习过程的输入和输出分别为:信道状态转移概率学习过程的输出,以及学习到的信道的状态。认知无线电用户通过对信道的不断学习,最终可以推断出信道的状态转移概率,从而正确的推断出信道下一时刻的状态信息,避免其收到干扰者的攻击以及对授权用户造成干扰。该方法能够实时的对不断变化的授权信道状态进行预测。此外,该方法不需要提前假设授权用户或是干扰者满足任何概率分布。而且,该方法充分考虑了所使用的信道状态转移概率预测样本状态的正确与否问题。
本发明的技术方案如下:
本发明涉及一种认知无线电网络中信道状态转移概率预测方法,包括两个学习过程,分别为信道状态转移概率学习过程和信道状态学习过程;
所述信道状态转移概率学习过程和信道状态学习过程均是基于Q学习方法,信道状态学习过程能够根据信道状态转移概率学习过程学习到的信道状态转移概率对信道的状态进行学习并且输出学习到的信道状态。
信道状态转移概率学习过程是基于Q学习方法的基本要素分别为:
状态:授权信道的状态即0和1,授权信道状态为0时,表示授权信道处于空闲状态,授权信道状态为1时,表示授权信道被授权用户占用或被干扰者攻击或同时被授权用户占用并被干扰者攻击;
动作:预测的下一时刻的授权信道状态即0或1;
奖赏:根据所预测的下一时刻的授权信道状态及信道学习过程所学习到的信道状态的差异决定;
信道状态转移概率学习过程的Q学习过程如下:
(2a)初始化Q学习方法中的参数
初始化Q学习方法中的参数为Q学习中当前信道状态对应的所要预测的下一时刻的信道状态所对应的Q值;初始化时,将Q学习方法中当前信道状态对应的所要预测的下一时刻的信道状态所对应的Q值设置为0;
(2b)动作决策过程
根据当前状态所对应的下一状态的Q值来选择动作,即预测下一时刻信道的状态;
动作决策过程采用ξ贪婪方法来选择动作,即认知无线电用户以ξ的概率选择最大的Q值所对应的下一时刻的状态,以1-ξ的概率选择非最大的Q值所对应的下一时刻的状态;
其选择方法为:
Figure BDA0001713592840000061
其中St为t时刻信道所对应的状态;St+1为t+1时刻信道所对应的状态;Q(·)为信道状态St与不同的下一时刻信道状态对应的Q值;
(2c)更新Q值
根据信道状态学习过程所学习的信道状态进行更新,Q值的更新方法为:
Figure BDA0001713592840000062
其中,
Figure BDA0001713592840000063
为在当前状态下所选择的下一状态所对应的Q值;
Figure BDA0001713592840000064
值为当前信道状态所对应的最大Q值;α为学习速率;γ为折扣因子;R为执行所选动作所获得的奖励;
当信道状态转移概率学习过程所选的动作与信道状态学习方法所学习到的信道状态相同时,信道状态转移概率学习过程可以获得奖励记为1;若信道状态转移概率学习过程所选的动作与信道状态学习方法所学习到的信道状态不同时,则可获得的奖励记为-1;
(2d)计算信道状态转移概率
根据当前状态所对应的下一状态的Q值计算信道状态转移概率;
其计算方法为:
Figure BDA0001713592840000065
其中,P0,j为信道从状态0转移到状态j的概率;P1,j为信道从状态1转移到j的概率;q0,j为当前状态0对应的下一状态为j的Q值;q0,0为当前状态0对应的下一状态为0的Q值;q0,1为当前状态0对应的下一状态为1的Q值;q1,j为当前状态1对应的下一状态为j的Q值;q1,0为当前状态1对应的下一状态为0的Q值;q1,1为当前状态1对应的下一状态为1的Q值。
信道状态学习过程,包括如下步骤:
信道状态学习过程基于Q学习方法的基本要素分别为:
状态:授权信道的状态概率,即授权信道的状态为0的概率及状态为1的概率;
动作:传输数据或者不传输数据;
奖赏:根据传输数据或不传输数据,以及是否产生冲突决定;
信道状态学习过程的Q学习过程如下:
(3a)预测授权信道状态概率
认知无线电通过频谱感知结果及信道状态转移概率学习过程输出的信道状态转移概率计算授权信道各个状态的概率,
其计算方法为:
Figure BDA0001713592840000071
Figure BDA0001713592840000072
其中,
Figure BDA0001713592840000075
为授权信道在t时刻状态为i的概率,i=0or1;
Figure BDA0001713592840000073
为授权信道在t+1时刻状态为i的概率,i=0or1;Yi为通过感知结果观察到的授权信道状态为i的概率,i=0or1;Pi,j为授权信道由状态i转移到状态j的概率,j=0or1;
(3b)选择相应动作
根据预测的授权信道状态概率选择相应的动作,
具体的选择过程为:若授权信道为空闲的概率大于授权信道被占用的概率,即
Figure BDA0001713592840000074
时,则认为授权信道处于空闲状态,以η的概率选择进行数据传输,1-η的概率选择不进行数据传输;否则,认为授权信道处于被占用状态,以η的概率选择不进行数据传输,1-η的概率选择进行数据传输;
(3c)计算奖励
若所选动作为数据传输且不与授权用户及干扰者冲突,奖励为1;若所选动作为数据传输且与授权用户或干扰者冲突,奖励为-1;若所选动作为不进行数据传输,奖励为0;
(3d)更新Q值
Q值更新方法为:
Figure BDA0001713592840000081
其中,
Figure BDA0001713592840000082
为在当前状态下所选择的动作所对应的Q值;
Figure BDA0001713592840000083
值为当前状态所对应的动作最大Q值;β为学习速率;χ为折扣因子;Rα为执行所选动作所获得的奖励;
(3e)输出授权信道状态
若所选动作为进行数据传输且不于授权用户及干扰者冲突,则输出授权信道状态为空闲;否则,输出信道状态为被占用。
本发明所达到的有益效果:
(1)本发明考虑了感知到的信道状态正确与否的问题。认知无线电用户通过信道状态学习过程对所感知的信道状态不断学习,从而获得正确的信道状态,避免其对授权用户的干扰以及干扰者对其的恶意攻击。
(2)本发明能够实时地评估信道状态转移概率,并且能够对变化的信道状态转移概率进行评估。从而,避免了一定程度的评估时延以及信道状态转移概率预测错误率。
(3)本发明所设计的认知无线电网络中信道状态转移概率预测方法不需要提前假设授权用户或者干扰用户的活动满足任何概率分布,此预测方法更加通用于认知无线电网络。
附图说明
图1为本发明的信道状态转移概率预测方法的整体框图;
图2为本发明的信道状态转移概率预测方法的流程图;
图3为本发明的信道状态预测方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,本发明涉及一种认知无线电网络中信道状态转移概率预测方法,包括两个学习过程,分别为信道状态转移概率学习过程和信道状态学习过程;
所述信道状态转移概率学习过程和信道状态学习过程均是基于Q学习方法,信道状态学习过程能够根据信道状态转移概率学习过程学习到的信道状态转移概率对信道的状态进行学习并且输出学习到的信道状态。
信道状态转移概率学习过程是基于Q学习方法的基本要素分别为:
状态:授权信道的状态即0和1,授权信道状态为0时,表示授权信道处于空闲状态,授权信道状态为1时,表示授权信道被授权用户占用或被干扰者攻击或同时被授权用户占用并被干扰者攻击;
动作:预测的下一时刻的授权信道状态即0或1;
奖赏:根据所预测的下一时刻的授权信道状态及信道学习过程所学习到的信道状态的差异决定;
如图2所示,信道状态转移概率学习过程的Q学习过程如下:
(2a)初始化Q学习方法中的参数
初始化Q学习方法中的参数为Q学习中当前信道状态对应的所要预测的下一时刻的信道状态所对应的Q值;初始化时,将Q学习方法中当前信道状态对应的所要预测的下一时刻的信道状态所对应的Q值设置为0;
(2b)动作决策过程
根据当前状态所对应的下一状态的Q值来选择动作,即预测下一时刻信道的状态;
动作决策过程采用ξ贪婪方法来选择动作,即认知无线电用户以ξ的概率选择最大的Q值所对应的下一时刻的状态,以1-ξ的概率选择非最大的Q值所对应的下一时刻的状态;
其选择方法为:
Figure BDA0001713592840000101
其中St为t时刻信道所对应的状态;St+1为t+1时刻信道所对应的状态;Q(·)为信道状态St与不同的下一时刻信道状态对应的Q值;
(2c)更新Q值
根据信道状态学习过程所学习的信道状态进行更新,Q值的更新方法为:
Figure BDA0001713592840000102
其中,
Figure BDA0001713592840000103
为在当前状态下所选择的下一状态所对应的Q值;
Figure BDA0001713592840000104
值为当前信道状态所对应的最大Q值;α为学习速率;γ为折扣因子;R为执行所选动作所获得的奖励;
当信道状态转移概率学习过程所选的动作与信道状态学习方法所学习到的信道状态相同时,信道状态转移概率学习过程可以获得奖励记为1;若信道状态转移概率学习过程所选的动作与信道状态学习方法所学习到的信道状态不同时,则可获得的奖励记为-1;
(2d)计算信道状态转移概率
根据当前状态所对应的下一状态的Q值计算信道状态转移概率;
其计算方法为:
Figure BDA0001713592840000105
其中,P0,j为信道从状态0转移到状态j的概率;P1,j为信道从状态1转移到j的概率;q0,j为当前状态0对应的下一状态为j的Q值;q0,0为当前状态0对应的下一状态为0的Q值;q0,1为当前状态0对应的下一状态为1的Q值;q1,j为当前状态1对应的下一状态为j的Q值;q1,0为当前状态1对应的下一状态为0的Q值;q1,1为当前状态1对应的下一状态为1的Q值。
信道状态学习过程,包括如下步骤:
信道状态学习过程基于Q学习方法的基本要素分别为:
状态:授权信道的状态概率,即授权信道的状态为0的概率及状态为1的概率;
动作:传输数据或者不传输数据;
奖赏:根据传输数据或不传输数据,以及是否产生冲突决定;
如图3所示,信道状态学习过程的Q学习过程如下:
(3a)预测授权信道状态概率
认知无线电通过频谱感知结果及信道状态转移概率学习过程输出的信道状态转移概率计算授权信道各个状态的概率,
其计算方法为:
Figure BDA0001713592840000111
Figure BDA0001713592840000112
其中,
Figure BDA0001713592840000113
为授权信道在t时刻状态为i的概率,i=0or1;
Figure BDA0001713592840000114
为授权信道
在t+1时刻状态为i的概率,i=0or1;Yi为通过感知结果观察到的授权信道状态为i的概率,i=0or1;Pi,j为授权信道由状态i转移到状态j的概率,j=0or1;
(3b)选择相应动作
根据预测的授权信道状态概率选择相应的动作,
具体的选择过程为:若授权信道为空闲的概率大于授权信道被占用的概率,即
Figure BDA0001713592840000115
时,则认为授权信道处于空闲状态,以η的概率选择进行数据传输,1-η的概率选择不进行数据传输;否则,认为授权信道处于被占用状态,以η的概率选择不进行数据传输,1-η的概率选择进行数据传输;
(3c)计算奖励
若所选动作为数据传输且不与授权用户及干扰者冲突,奖励为1;若所选动作为数据传输且与授权用户或干扰者冲突,奖励为-1;若所选动作为不进行数据传输,奖励为0;
(3d)更新Q值
Q值更新方法为:
Figure BDA0001713592840000121
其中,
Figure BDA0001713592840000123
为在当前状态下所选择的动作所对应的Q值;
Figure BDA0001713592840000122
值为当前状态所对应的动作最大Q值;β为学习速率;χ为折扣因子;Rα为执行所选动作所获得的奖励;
(3e)输出授权信道状态
若所选动作为进行数据传输且不于授权用户及干扰者冲突,则输出授权信道状态为空闲;否则,输出信道状态为被占用。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (2)

1.一种认知无线电网络中信道状态转移概率预测方法,其特征在于包括两个学习过程,分别为信道状态转移概率学习过程和信道状态学习过程;
所述信道状态转移概率学习过程和信道状态学习过程均是基于Q学习方法,信道状态学习过程能够根据信道状态转移概率学习过程学习到的信道状态转移概率对信道的状态进行学习并且输出学习到的信道状态;
信道状态转移概率学习过程是基于Q学习方法的基本要素分别为:
状态:授权信道的状态即0和1,授权信道状态为0时,表示授权信道处于空闲状态,授权信道状态为1时,表示授权信道被授权用户占用或被干扰者攻击或同时被授权用户占用并被干扰者攻击;
动作:预测的下一时刻的授权信道状态即0或1;
奖赏:根据所预测的下一时刻的授权信道状态及信道学习过程所学习到的信道状态的差异决定;
信道状态转移概率学习过程的Q学习过程如下:
(2a)初始化Q学习方法中的参数
初始化Q学习方法中的参数为Q学习中当前信道状态对应的所要预测的下一时刻的信道状态所对应的Q值;初始化时,将Q学习方法中当前信道状态对应的所要预测的下一时刻的信道状态所对应的Q值设置为0;
(2b)动作决策过程
根据当前状态所对应的下一状态的Q值来选择动作,即预测下一时刻信道的状态;
动作决策过程采用ξ贪婪方法来选择动作,即认知无线电用户以ξ的概率选择最大的Q值所对应的下一时刻的状态,以1-ξ的概率选择非最大的Q值所对应的下一时刻的状态;
其选择方法为:
Figure FDA0002764939580000021
其中St为t时刻信道所对应的状态;St+1为t+1时刻信道所对应的状态;Q(·)为信道状态St与不同的下一时刻信道状态对应的Q值;
(2c)更新Q值
根据信道状态学习过程所学习的信道状态进行更新,Q值的更新方法为:
Figure FDA0002764939580000022
其中,
Figure FDA0002764939580000023
为在当前状态下所选择的下一状态所对应的Q值;
Figure FDA0002764939580000024
值为当前信道状态所对应的最大Q值;α为学习速率;γ为折扣因子;R为执行所选动作所获得的奖励;
当信道状态转移概率学习过程所选的动作与信道状态学习方法所学习到的信道状态相同时,信道状态转移概率学习过程可以获得奖励记为1;若信道状态转移概率学习过程所选的动作与信道状态学习方法所学习到的信道状态不同时,则可获得的奖励记为-1;
(2d)计算信道状态转移概率
根据当前状态所对应的下一状态的Q值计算信道状态转移概率;
其计算方法为:
Figure FDA0002764939580000025
其中,P0,j为信道从状态0转移到状态j的概率;P1,j为信道从状态1转移到j的概率;q0,j为当前状态0对应的下一状态为j的Q值;q0,0为当前状态0对应的下一状态为0的Q值;q0,1为当前状态0对应的下一状态为1的Q值;q1,j为当前状态1对应的下一状态为j的Q值;q1,0为当前状态1对应的下一状态为0的Q值;q1,1为当前状态1对应的下一状态为1的Q值。
2.根据权利要求1所述的一种认知无线电网络中信道状态转移概率预测方法,其特征在于:信道状态学习过程,包括如下步骤:
信道状态学习过程基于Q学习方法的基本要素分别为:
状态:授权信道的状态概率,即授权信道的状态为0的概率及状态为1的概率;
动作:传输数据或者不传输数据;
奖赏:根据传输数据或不传输数据,以及是否产生冲突决定;
信道状态学习过程的Q学习过程如下:
(3a)预测授权信道状态概率
认知无线电通过频谱感知结果及信道状态转移概率学习过程输出的信道状态转移概率计算授权信道各个状态的概率,
其计算方法为:
Figure FDA0002764939580000031
Figure FDA0002764939580000032
其中,
Figure FDA0002764939580000033
为授权信道在t时刻状态为i的概率,i=0or1;
Figure FDA0002764939580000034
为授权信道在t+1时刻状态为i的概率,i=0or1;Yi为通过感知结果观察到的授权信道状态为i的概率,i=0or1;Pi,j为授权信道由状态i转移到状态j的概率,j=0or1;
(3b)选择相应动作
根据预测的授权信道状态概率选择相应的动作,
具体的选择过程为:若授权信道为空闲的概率大于授权信道被占用的概率,即
Figure FDA0002764939580000035
时,则认为授权信道处于空闲状态,以η的概率选择进行数据传输,1-η的概率选择不进行数据传输;否则,认为授权信道处于被占用状态,以η的概率选择不进行数据传输,1-η的概率选择进行数据传输;
(3c)计算奖励
若所选动作为数据传输且不与授权用户及干扰者冲突,奖励为1;若所选动作为数据传输且与授权用户或干扰者冲突,奖励为-1;若所选动作为不进行数据传输,奖励为0;
(3d)更新Q值
Q值更新方法为:
Figure FDA0002764939580000041
其中,
Figure FDA0002764939580000042
为在当前状态下所选择的动作所对应的Q值;
Figure FDA0002764939580000043
值为当前状态所对应的动作最大Q值;β为学习速率;χ为折扣因子;Rα为执行所选动作所获得的奖励;
(3e)输出授权信道状态
若所选动作为进行数据传输且不于授权用户及干扰者冲突,则输出授权信道状态为空闲;否则,输出信道状态为被占用。
CN201810696652.1A 2018-06-29 2018-06-29 一种认知无线电网络中信道状态转移概率预测方法 Expired - Fee Related CN109039505B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810696652.1A CN109039505B (zh) 2018-06-29 2018-06-29 一种认知无线电网络中信道状态转移概率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810696652.1A CN109039505B (zh) 2018-06-29 2018-06-29 一种认知无线电网络中信道状态转移概率预测方法

Publications (2)

Publication Number Publication Date
CN109039505A CN109039505A (zh) 2018-12-18
CN109039505B true CN109039505B (zh) 2021-02-09

Family

ID=65521930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810696652.1A Expired - Fee Related CN109039505B (zh) 2018-06-29 2018-06-29 一种认知无线电网络中信道状态转移概率预测方法

Country Status (1)

Country Link
CN (1) CN109039505B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110380802A (zh) * 2019-06-14 2019-10-25 中国人民解放军陆军工程大学 基于软件无线电平台的单用户动态频谱抗干扰系统及方法
CN110601826B (zh) * 2019-09-06 2021-10-08 北京邮电大学 一种基于机器学习的动态dwdm-qkd网络中的自适应信道分配方法
CN111181669B (zh) * 2020-01-03 2022-02-11 中国科学院上海高等研究院 基于预评估处理的自适应频谱感知方法、系统、介质及终端
CN111211831A (zh) * 2020-01-13 2020-05-29 东方红卫星移动通信有限公司 一种多波束低轨卫星智能动态信道资源分配方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102665219A (zh) * 2012-04-20 2012-09-12 南京邮电大学 一种基于ofdma的家庭基站系统的动态频谱分配方法
CN105120468A (zh) * 2015-07-13 2015-12-02 华中科技大学 一种基于演化博弈论的动态无线网络选择方法
CN105357158A (zh) * 2015-10-26 2016-02-24 天津大学 水下认知网络中节点准确高效接入多信道的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10091785B2 (en) * 2014-06-11 2018-10-02 The Board Of Trustees Of The University Of Alabama System and method for managing wireless frequency usage

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102665219A (zh) * 2012-04-20 2012-09-12 南京邮电大学 一种基于ofdma的家庭基站系统的动态频谱分配方法
CN105120468A (zh) * 2015-07-13 2015-12-02 华中科技大学 一种基于演化博弈论的动态无线网络选择方法
CN105357158A (zh) * 2015-10-26 2016-02-24 天津大学 水下认知网络中节点准确高效接入多信道的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Intelligent Spectrum Management Based on Transfer Actor-Critic Learning for Rateless Transmissions in Cognitive Radio Networks;Koushik A.M.等;《IEEE Transactions on Mobile Computing》;20180501;第17卷(第5期);1204-1215页 *
无线网络中基于深度Q学习的传输调度方案;朱江等;《通信学报》;20180430;第39卷(第4期);36-43页 *

Also Published As

Publication number Publication date
CN109039505A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN109039505B (zh) 一种认知无线电网络中信道状态转移概率预测方法
Tumuluru et al. Channel status prediction for cognitive radio networks
Mastronarde et al. Joint physical-layer and system-level power management for delay-sensitive wireless communications
Fu et al. Structure-aware stochastic control for transmission scheduling
JP2014123939A (ja) 無線通信ネットワークにおいて動作するトランシーバ、無線通信ネットワークにおける送信システムおよび方法
Wang et al. Analysis of opportunistic spectrum access in cognitive radio networks using hidden Markov model with state prediction
Hosahalli et al. Enhanced reinforcement learning assisted dynamic power management model for internet‐of‐things centric wireless sensor network
Jiao et al. Markov model‐based energy efficiency spectrum sensing in cognitive radio sensor networks
Tehrani et al. Asymptotically efficient multichannel estimation for opportunistic spectrum access
CN103916969A (zh) 联合授权用户感知与链路状态估计方法与装置
Mafuta et al. Decentralized resource allocation-based multiagent deep learning in vehicular network
Yan et al. Gaussian process reinforcement learning for fast opportunistic spectrum access
Yang et al. Adaptive modulation based on nondata-aided error vector magnitude for smart systems in smart cities
Thien et al. A transfer games actor–critic learning framework for anti-jamming in multi-channel cognitive radio networks
Nakıp et al. Dynamic automatic forecaster selection via artificial neural network based emulation to enable massive access for the Internet of Things
CN108449151B (zh) 一种基于机器学习的认知无线电网络中频谱接入方法
Nandakumar et al. LSTM Based Spectrum Prediction for Real-Time Spectrum Access for IoT Applications.
Osman Empowering internet-of-everything (IoE) networks through synergizing Lagrange optimization and deep learning for enhanced performance
Ganewattha et al. Confidence aware deep learning driven wireless resource allocation in shared spectrum bands
Yang et al. Detection performances and effective capacity of cognitive radio with primary user emulators
Ahmadi et al. Predictive opportunistic spectrum access using learning based hidden markov models
CN109769258B (zh) 基于安全urllc通信协议的资源优化方法
Håkansson et al. Cost-aware dual prediction scheme for reducing transmissions at IoT sensor nodes
Fang et al. Dynamic opportunistic spectrum access of multi-channel multi-radio based on game theory in wireless cognitive network
Akter et al. Modeling and forecasting secondary user activity in cognitive radio networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210209