CN104581738A - 基于q学习的认知无线电抗敌意干扰方法 - Google Patents

基于q学习的认知无线电抗敌意干扰方法 Download PDF

Info

Publication number
CN104581738A
CN104581738A CN201510047094.2A CN201510047094A CN104581738A CN 104581738 A CN104581738 A CN 104581738A CN 201510047094 A CN201510047094 A CN 201510047094A CN 104581738 A CN104581738 A CN 104581738A
Authority
CN
China
Prior art keywords
cognitive
value table
source node
state
cognitive radio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510047094.2A
Other languages
English (en)
Inventor
肖亮
陈桂权
周长华
李燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CN201510047094.2A priority Critical patent/CN104581738A/zh
Publication of CN104581738A publication Critical patent/CN104581738A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/02Resource partitioning among network components, e.g. reuse partitioning
    • H04W16/10Dynamic resource partitioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC
    • H04W52/30TPC using constraints in the total amount of available transmission power
    • H04W52/34TPC management, i.e. sharing limited amount of power among users or channels or data types, e.g. cell loading

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

基于Q学习的认知无线电抗敌意干扰方法,涉及认知无线电。1)认知源节点初始化学习因子γ和折扣因子β,设置Q值表、V值表值为0;2)认知源节点感知k时刻的状态s,并根据Q值表,选择最优行为a;3)认知源节点观察k+1时刻的状态s',并计算本次信息传输的即时回报us;4)更新Q学习算法的Q值表、V值表;5)认知源节点重复步骤2)~4),直到找到最优策略。于Q学习实现功率控制,认知源节点和智能干扰机通过不断学习环境,实时调整自身的发射功率,随着迭代学习的延续,最终使得自身的收益最大化。

Description

基于Q学习的认知无线电抗敌意干扰方法
技术领域
本发明涉及认知无线电,尤其是涉及一种基于Q学习的认知无线电抗敌意干扰方法。
背景技术
认知无线电技术的提出是用于解决当前静态频谱分配方案中频率资源利用率不高的问题。由于无线信道的广播特性,使得认知无线电无线网络容易受到敌意干扰攻击。干扰机通过连续或是间断地向无线信道发射干扰信号,以此阻碍认知用户接入到信道或者破坏节点间的信息传输。
扩频通信是传统的抗敌意干扰技术,主要的扩频方式有跳频(Frequency Hopping,FH)、直接序列扩频(Direct Sequence Spread Spectrum,DSSS)和线性调频扩频(Chirp SpreadSpectrum,CSS)[R.A.Poisel.Modern Communications Jamming Principles and Techniques.Artech House Publishers,2006.]。[Liu Y,Ning P,Dai H,et al.Randomized differential DSSS:Jamming-resistant wireless broadcast communication[C].Proceedings of IEEE INFOCOM,SanDiego,CA,United states,2010.]提出随机微分直接扩频机制,而这类扩频不适合预于智能的干扰机。[Wang B,Wu Y,Liu K J R,et al.An anti-jamming stochastic game for cognitive radionetworks[J].Selected Areas in Communications,IEEE Journal on,2011,29(4):877-889.]在无线认知网络提出了随机博弈的抗干扰框架。
通过学习干扰机的发射功率,进而调整源节点的发射功率,以此抵抗敌意干扰攻击是一种新的抗干扰技术,常用算法有分布式的功率控制算法、最优功率控制、机会主义功率控制策略、启发式算法及一些基于博弈的功率控制算法。[Tang N,Mao S,Kompella S.Power Controlin Full Duplex Underlay Cognitive Radio Networks:A Control Theoretic Approach[C]//MilitaryCommunications Conference(MILCOM),2014IEEE.IEEE,2014:949-954.]提出了一种整合比例微分差分proportional-integral-derivative,PID)控制器和功率约束机制的分布式功率控制算法,[S.M.Sanchez,R.D.Souza,E.M.G.Fernandez,and V.A.Reguera,“Impact of PowerAllocation and Antenna Directivity in the Capacity of a Multiuser Cognitive Ad Hoc Network,”Radioengineering,vol.21,pp.1110-1116,Dec.2012]提出利用位置感知认知节点的最优功率控制,[Chen Y,Yu G,Zhang Z,et al.On cognitive radio networks with opportunistic power controlstrategies in fading channels[J].Wireless Communications,IEEE Transactions on,2008,7(7):2752-2761.]提出了一种机会主义(opportunistic)功率控制策略,次级用户调整策略使数据速率最大化。[Y.Zhang and C.Leung,“Resource allocation in an OFDM-based cognitive radiosystem,”IEEE Trans.Commun.,vol.57,no.7,pp.1928-1931,July 2009.]阐述了一种启发式算法实现次优的解决方案,以此达到最优的功率分配。[D.Yang,G.Xue,J.Zhang,A.Richa,and X.Fang,“Coping with a smart jammer in wireless networks:A stackelberg game approach,”IEEETrans.Wireless Commun.,vol.12,no.8,pp.4038–4047,2013]提出了在智能干扰机存在下利用斯塔科尔伯格博弈模型研究功率控制问题,这类智能干扰机能够学习发射机的传输策略然后作出相应的干扰决定,而这种方法在合作的无线网络是无效的。
发明内容
本发明的目的是为了解决针对认知无线电网络中的敌意干扰攻击,使得认知用户无法接入到空闲信道或者认知用户间的信息传输被破坏等问题,提供一种基于Q学习的认知无线电抗敌意干扰方法。
本发明包括以下步骤:
1)认知源节点初始化学习因子γ和折扣因子β,设置Q值表、V值表值为0;
2)认知源节点感知k时刻的状态s,并根据Q值表,选择最优行为a;
3)认知源节点观察k+1时刻的状态s',并计算本次信息传输的即时回报us
4)更新Q学习算法的Q值表、V值表;
5)认知源节点重复步骤2)~4),直到找到最优策略。
在步骤1)中,所述Q值表是一个二维矩阵Q(S,A),其中S是一个非空集合,表示系统的所有可能状态,A表示所有可能行为的集合;所述V值表是一个一维向量,表示在每个状态s∈S下的最大Q值,即
在步骤2)中,所述状态s包括授权用户接入状态δ和干扰机发射功率aj,即源节点的状态s=(δ,aj),当授权用户接入到目标信道时,δ=0,否则δ=1;干扰机发射功率aj∈Aj,其中Aj表示干扰机的行为集;所述最优行为表示的是在当前状态s下,使得值函数Q(s,a)最大的行为a,即
在步骤4)中,所述Q学习算法的Q值表、V值表的更新算法表示如下:
Q(Ss k,As k)=(1-γ)Q(Ss k,As k)+γ(us+βV(Ss k+1))
V ( S s k ) = max A s ∈ A Q ( S s k , A s )
在步骤5)中,所述最优策略指的是每个状态下,使得累计回报函数最大化。
与现有技术相比,本发明提供了一种基于Q学习的认知无线电抗敌意干扰方法:认知源节点通过观察信道获取授权用户接入情况、干扰机发射功率等状态信息,并根据Q值表选择在当前状态下使得源节点累计回报最大的行为。接收节点将对应的信号干扰噪声比在信息传输结束后反馈给认知源节点,使其更新当前的Q值表,并对下一次发送策略做出不同的调整。该方法充分利用了强化学习机制,使认知源节点的发射功率随干扰机发射功率的变化而主动自适应地变化,从而有效地抵抗敌意干扰攻击。
与现有的抗干扰方法不同,本发明基于Q学习实现功率控制,从而达到抗干扰的目的。本发明中认知源节点和智能干扰机通过不断学习环境,实时调整自身的发射功率,随着迭代学习的延续,最终使得自身的收益最大化。
具体实施方式
以下实施例将对本发明作进一步的说明。
本发明实施例包括以下步骤:
1)认知源节点初始化学习因子γ、折扣因子β、最大时隙m,初始化Q值表和V值表的值为0;
2)判断当前时隙k是否为1;
3)当k=1时,认知源节点首先检测授权用户的接入状态δk,当授权用户在当前时刻接入到目标信道时,认知源节点选择发射功率0;否则,随机选择发射功率a;
4)当k>1时,认知源节点观察当前状态并根据Q值表,选择在状态下使得Q值最大的行为ak
5)认知源节点观察下一个时刻状态ss k+1
6)认知源节点计算本次传输收益
7)认知源节点更新Q值表和V值表:
Q ( S s k , A s k ) = ( 1 - γ ) Q ( S s k , A s k ) + γ ( u s + βV ( S s k + 1 ) ) , V ( S s k ) = max A s Q ( S s k , A s ) ;
9)当前时隙k=k+1;
10)判断当前时隙k是否已是Q学习的最大时隙m,若是,则结束学习;否则重复2)~10)。

Claims (7)

1.基于Q学习的认知无线电抗敌意干扰方法,其特征在于包括以下步骤:
1)认知源节点初始化学习因子γ和折扣因子β,设置Q值表、V值表值为0;
2)认知源节点感知k时刻的状态s,并根据Q值表,选择最优行为a;
3)认知源节点观察k+1时刻的状态s',并计算本次信息传输的即时回报us
4)更新Q学习算法的Q值表、V值表;
5)认知源节点重复步骤2)~4),直到找到最优策略。
2.如权利要求1所述基于Q学习的认知无线电抗敌意干扰方法,其特征在于在步骤1)中,所述Q值表是一个二维矩阵Q(S,A),其中S是一个非空集合,表示系统的所有可能状态,A表示所有可能行为的集合。
3.如权利要求1所述基于Q学习的认知无线电抗敌意干扰方法,其特征在于在步骤1)中,所述V值表是一个一维向量,表示在每个状态s∈S下的最大Q值,即
4.如权利要求1所述基于Q学习的认知无线电抗敌意干扰方法,其特征在于在步骤2)中,所述状态s包括授权用户接入状态δ和干扰机发射功率aj,即源节点的状态s=(δ,aj),当授权用户接入到目标信道时,δ=0,否则δ=1;干扰机发射功率aj∈Aj,其中Aj表示干扰机的行为集。
5.如权利要求1所述基于Q学习的认知无线电抗敌意干扰方法,其特征在于在步骤2)中,所述最优行为表示的是在当前状态s下,使得值函数Q(s,a)最大的行为a,即 a = arg max a ′ ∈ A Q ( s , a ′ ) .
6.如权利要求1所述基于Q学习的认知无线电抗敌意干扰方法,其特征在于在步骤4)中,所述Q学习算法的Q值表、V值表的更新算法表示如下:
Q ( S s k , A s k ) = ( 1 - γ ) Q ( S s k , A s k ) + γ ( u s + βV ( S s k + 1 ) )
V ( S s k ) = max A s ∈ A Q ( S s k , A s ) .
7.如权利要求1所述基于Q学习的认知无线电抗敌意干扰方法,其特征在于在步骤5)中,所述最优策略指的是每个状态下,使得累计回报函数最大化。
CN201510047094.2A 2015-01-30 2015-01-30 基于q学习的认知无线电抗敌意干扰方法 Pending CN104581738A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510047094.2A CN104581738A (zh) 2015-01-30 2015-01-30 基于q学习的认知无线电抗敌意干扰方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510047094.2A CN104581738A (zh) 2015-01-30 2015-01-30 基于q学习的认知无线电抗敌意干扰方法

Publications (1)

Publication Number Publication Date
CN104581738A true CN104581738A (zh) 2015-04-29

Family

ID=53096722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510047094.2A Pending CN104581738A (zh) 2015-01-30 2015-01-30 基于q学习的认知无线电抗敌意干扰方法

Country Status (1)

Country Link
CN (1) CN104581738A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104994569A (zh) * 2015-06-25 2015-10-21 厦门大学 基于多用户强化学习的认知无线网络抗敌意干扰方法
CN106205217A (zh) * 2016-06-24 2016-12-07 华中科技大学 基于机器视觉的无人机自动检测方法及无人机管制方法
CN106789906A (zh) * 2016-11-22 2017-05-31 全球能源互联网研究院 博弈数据分析方法及装置
CN106961684A (zh) * 2017-03-24 2017-07-18 厦门大学 基于深度强化学习的认知无线电空频二维抗敌意干扰方法
CN108012248A (zh) * 2017-12-07 2018-05-08 宁德师范学院 基于功率控制的车联网抗干扰的方法及电子设备
CN109274456A (zh) * 2018-09-10 2019-01-25 电子科技大学 一种基于强化学习的不完全信息智能抗干扰方法
CN109302262A (zh) * 2018-09-27 2019-02-01 电子科技大学 一种基于深度确定梯度强化学习的通信抗干扰方法
CN109714786A (zh) * 2019-03-06 2019-05-03 重庆邮电大学 基于Q-learning的毫微微小区功率控制方法
CN110061982A (zh) * 2019-04-02 2019-07-26 广州大学 一种基于强化学习的对抗智能攻击安全传输方法
CN111182549A (zh) * 2020-01-03 2020-05-19 广州大学 一种基于深度强化学习的抗干扰无线通信方法
CN111600676A (zh) * 2020-06-05 2020-08-28 上海特金无线技术有限公司 Q值表确定方法、抗干扰方法、装置及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103209419A (zh) * 2013-04-25 2013-07-17 西安电子科技大学 一种面向用户需求和提升网络性能的动态频谱接入的方法
CN103987018A (zh) * 2014-06-10 2014-08-13 厦门大学 基于非协调跳频的认知无线网络抗敌意干扰协作广播方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103209419A (zh) * 2013-04-25 2013-07-17 西安电子科技大学 一种面向用户需求和提升网络性能的动态频谱接入的方法
CN103987018A (zh) * 2014-06-10 2014-08-13 厦门大学 基于非协调跳频的认知无线网络抗敌意干扰协作广播方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BEIBEI WANG,YONGLE WU,K. J. RAY LIU,T. CHARLES CLANCY: "An Anti-Jamming Stochastic Game for Cognitive Radio Networks", 《IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS》 *
YONGLE WU ETC.: "Anti-Jamming Games in Multi-Channel Cognitive Radio Networks", 《IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104994569A (zh) * 2015-06-25 2015-10-21 厦门大学 基于多用户强化学习的认知无线网络抗敌意干扰方法
CN106205217A (zh) * 2016-06-24 2016-12-07 华中科技大学 基于机器视觉的无人机自动检测方法及无人机管制方法
CN106205217B (zh) * 2016-06-24 2018-07-13 华中科技大学 基于机器视觉的无人机自动检测方法及无人机管制方法
CN106789906A (zh) * 2016-11-22 2017-05-31 全球能源互联网研究院 博弈数据分析方法及装置
CN106961684A (zh) * 2017-03-24 2017-07-18 厦门大学 基于深度强化学习的认知无线电空频二维抗敌意干扰方法
CN108012248A (zh) * 2017-12-07 2018-05-08 宁德师范学院 基于功率控制的车联网抗干扰的方法及电子设备
CN109274456A (zh) * 2018-09-10 2019-01-25 电子科技大学 一种基于强化学习的不完全信息智能抗干扰方法
CN109302262A (zh) * 2018-09-27 2019-02-01 电子科技大学 一种基于深度确定梯度强化学习的通信抗干扰方法
CN109302262B (zh) * 2018-09-27 2020-07-10 电子科技大学 一种基于深度确定梯度强化学习的通信抗干扰方法
CN109714786A (zh) * 2019-03-06 2019-05-03 重庆邮电大学 基于Q-learning的毫微微小区功率控制方法
CN109714786B (zh) * 2019-03-06 2021-07-16 重庆邮电大学 基于Q-learning的毫微微小区功率控制方法
CN110061982A (zh) * 2019-04-02 2019-07-26 广州大学 一种基于强化学习的对抗智能攻击安全传输方法
CN111182549A (zh) * 2020-01-03 2020-05-19 广州大学 一种基于深度强化学习的抗干扰无线通信方法
CN111600676A (zh) * 2020-06-05 2020-08-28 上海特金无线技术有限公司 Q值表确定方法、抗干扰方法、装置及设备

Similar Documents

Publication Publication Date Title
CN104581738A (zh) 基于q学习的认知无线电抗敌意干扰方法
Slimeni et al. Cooperative Q-learning based channel selection for cognitive radio networks
CN104994569B (zh) 基于多用户强化学习的认知无线网络抗敌意干扰方法
CN101978757B (zh) 多载波系统中的快速载波分配
Luo et al. Online power control for 5G wireless communications: A deep Q-network approach
Mériaux et al. Mean field energy games in wireless networks
US8200270B2 (en) Method for adusting power at a node
CN112188504A (zh) 多用户协同抗干扰系统及动态频谱协同抗干扰方法
CN101729164B (zh) 无线资源分配方法和认知无线电用户设备
CN110830136A (zh) 一种基于无线电地图的无人机轨迹设计和功率分配方法
Ibrahim et al. Anti-jamming game to combat intelligent jamming for cognitive radio networks
Wang et al. Secure wireless powered cooperative communication networks with finite energy storage
Liu et al. Q-learning based UAV secure communication in presence of multiple UAV active eavesdroppers
CN101778465A (zh) Cdma蜂窝系统中基于误差估计的比例功率控制方法
CN105530203B (zh) D2d通信链路的接入控制方法及系统
Singh APC: Adaptive power control technique for multi-radio multi-channel cognitive radio networks
CN104780541A (zh) 一种抗伪装ssdf恶意攻击的合作频谱感知的方法
Roh et al. Cross-layer optimization for wireless sensor networks with RF energy transfer
Li Efficient power allocation for multiuser cognitive radio networks
Arafa et al. Mobile energy harvesting nodes: Offline and online optimal policies
Darabkh et al. Efficient routing protocol for optimal route selection in cognitive radio networks over IoT environment
Lu et al. Channel-adaptive sensing strategy for cognitive radio ad hoc networks
Manimegalai et al. Enhanced Power Control Algorithm in Cognitive Radio for Multimedia Communication
Lei et al. Trajectory and power design for aerial CRNs with colluding eavesdroppers
Saoucha et al. On applying firefly algorithm for cognitive radio networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150429