CN115102648A - 一种基于Stackelberg博弈的多频段群智频谱感知方法 - Google Patents

一种基于Stackelberg博弈的多频段群智频谱感知方法 Download PDF

Info

Publication number
CN115102648A
CN115102648A CN202210598013.8A CN202210598013A CN115102648A CN 115102648 A CN115102648 A CN 115102648A CN 202210598013 A CN202210598013 A CN 202210598013A CN 115102648 A CN115102648 A CN 115102648A
Authority
CN
China
Prior art keywords
perception
sensing
secondary user
cooperative
reward
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210598013.8A
Other languages
English (en)
Other versions
CN115102648B (zh
Inventor
朱琦
郭晓敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202210598013.8A priority Critical patent/CN115102648B/zh
Priority to PCT/CN2022/107291 priority patent/WO2023231165A1/zh
Publication of CN115102648A publication Critical patent/CN115102648A/zh
Application granted granted Critical
Publication of CN115102648B publication Critical patent/CN115102648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/382Monitoring; Testing of propagation channels for resource allocation, admission control or handover
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Stackelberg博弈的多频段群智频谱感知方法,将感知需求次用户向协作感知次用户支付报酬问题建模为博弈模型,其中前者是领导层,后者是从属层。感知需求次用户发布频段感知任务与初始报酬,各协作感知次用户通过优化感知时间使自身效用最优并将感知数据发送给感知需求次用户,感知需求次用户不断更新报酬使效用最优并得到最终判决结果。本发明在领导层博弈中综合考虑检测概率和报酬定义了感知需求次用户效用,通过博弈优化报酬获得最佳效用,从属层博弈中综合考虑检测概率和感知时间定义了协作感知次用户效用,根据感知需求次用户发布报酬优化感知时间以获得最佳效用,推导证明了感知时间的优化存在纳什均衡。

Description

一种基于Stackelberg博弈的多频段群智频谱感知方法
技术领域
本发明属于通信技术领域,具体涉及一种基于Stackelberg博弈的多频段群智频谱感知方法。
背景技术
随着智能终端设备的急剧增加,频谱资源日益紧缺,认知无线电技术(CognitiveRadio,CR)可以通过频谱共享大大提高频谱利用率,频谱感知是认知无线电技术的重要环节。频谱空洞是指授权用户(AuthorizedUser,AU)合法使用但未被占用的空闲频段,认知无线电可以将次用户(Second User,SU)机会接入到频谱空洞,但要想实现空闲频谱资源的接入,通过频谱感知技术检测确认授权用户是否存在这一过程尤为重要。
次用户频谱感知通常采用能量检测法,不需要知道授权用户的先验知识,通过计算频段积累的能量是否超过门限值来判断授权用户是否存在。然而面对无线环境中阴影效应、多径衰落、噪声不确定等不利因素的影响,单个次用户对授权频段的感知结果往往是不可靠的,而多个次用户协作频谱感知性能优于单个次用户的感知性能,因此通常采用多个次用户协作频谱感知。关于多用户协作频谱感知的许多研究都是默认次用户无偿感知授权用户是否存在,这在生活中是不现实的,因为次用户在感知过程中会消耗时间、能量、内存等计算资源,所以多用户感知结果虽然更准确,但次用户可能不愿意无偿参与频谱感知过程。因此将激励机制引入频谱感知可以有效解决这一问题,激励机制通过支付报酬的方式补偿次用户的成本,鼓励他们积极参与协作频谱感知。
文献[10]提出了一种基于SU分类的协作频谱感知算法,引入激励机制来鼓励更多的SU积极参与检测,该算法根据信道条件将次用户分为普通次用户(OSU)和中继次用户(RSU),首先每个SU通过计算效用函数决定是否参与,然后OSU将检测到的数据发送给附近的RSU,接着RSU将收到的数据与本地检测数据一同传送给融合中心。
上述研究只针对单个频段进行频谱感知,在实际系统中,往往需要占用多个频段,并且该研究没有考虑次用户感知成本优化问题,造成感知代价较大。本发明将群智感知技术引入到频谱感知中,考虑多频段的场景,提出了一种基于Stackelberg博弈的多频段群智频谱感知方法,通过优化感知时间减少协作感知次用户的感知成本。
[10]LI Peijun,HAN Bo,LI Heng,et al.The research of spectrum sensingbased on SU classification in cognitive LTE-A network[C]//2019IEEE 3rdInformation Technology,Networking,Electronic andAutomation ControlConference,Chengdu,China.IEEE,2019:1917-1921.
发明内容
本发明的目的在于克服现有技术感知单个频段的缺陷,提供一种基于Stackelberg博弈的多频段群智频谱感知方法,通过领导层感知需求次用户和从属层协作感知次用户各自博弈,为感知需求次用户招募到合适的协作感知次用户完成感知任务,提高协作感知积极性,在博弈过程中优化协作感知次用户感知时间节约感知成本,提高感知性能。
为解决上述技术问题,本发明采用以下技术方案。
一种基于Stackelberg博弈的多频段群智频谱感知方法,将感知需求次用户向协作感知次用户支付报酬的问题建模为Stackelberg博弈系统模型,其中感知需求次用户是博弈模型中的领导层,协作感知次用户是博弈模型中的从属层;所述系统的场景是一个圆形区域,随机分布有N个协作感知次用户和M个感知需求次用户,取M=2,即存在两个感知需求次用户;所述的感知需求次用户的集合,表示为
Figure BDA0003668579100000021
所述的协作感知次用户的集合表示为
Figure BDA0003668579100000022
所述方法包括以下步骤:
Step1、构建从属层优化问题,并推导协作感知次用户博弈存在纳什均衡解:综合考虑检测概率、感知时间定义协作感知次用户的效用函数,使协作感知次用户的效用最大化;
Step2、构建领导层优化问题:综合考虑经表决融合后的检测概率和任务报酬定义了感知需求次用户的效用函数,使感知需求次用户的效用最大化;
Step3、将感知需求次用户向协作感知次用户支付报酬的问题构建成基于Stackelberg博弈的多频段群智频谱感知系统模型,在博弈模型中感知需求次用户是领导层,协作感知次用户是从属层,每个协作感知次用户可以感知所有频段,但同时只能感知一个频段;
Step4、感知需求次用户对于要感知的频段向协作感知次用户发布任务及初始报酬,初始化感知需求次用户的最大效用
Figure BDA0003668579100000023
为0;
Step5、所有协作感知次用户根据报酬及感知时间计算其在当前报酬下的效用,通过优化感知时间选择效用最大时对应的感知时间,协作感知次用户根据该感知时间计算对应的检测概率与成本,并将数据对(感知时间,检测概率,基于成本产生的报价)传送给感知需求次用户;
Step6、感知需求次用户根据其报酬向检测概率高的协作感知次用户发送招募意愿及支付报酬的价格;
Step7、若协作感知次用户被多个感知需求次用户同时招募时,通过比较多个感知需求次用户提供的价格选择能够获得报酬多的感知任务加入;
Step8、感知需求次用户计算在当前报酬下的效用,如果该效用值高于
Figure BDA0003668579100000024
则将该报酬记录下来,在最大报酬Bmax的限制下以步长μ增加报酬值,发布新的报酬并重复Step5-Step8,直到相邻两次感知需求次用户的效用值误差小于δ;
Step9、将Step8中得到的感知需求次用户效用最优时对应的报酬作为最终的报酬,协作感知次用户根据该报酬确定最终的感知时间并将感知数据上传给感知需求次用户,得到最终的判决结果。
具体的,协作感知次用户
Figure BDA0003668579100000031
的报酬pij为:
Figure BDA0003668579100000032
其中
Figure BDA0003668579100000033
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬,Tj表示参与频段感知任务j的协作次用户集合。
具体的,协作感知次用户的成本cij为:
cij=β×tij+γ×dij (2)
其中β和γ表示加权系数,tij表示协作感知次用户i感知频段任务j的感知时间,dij表示协作感知次用户i和感知需求次用户j之间的距离。
具体的,协作感知次用户
Figure BDA0003668579100000034
的效用为:
Figure BDA0003668579100000035
其中pij表示协作感知次用户i获得的报酬,cij表示协作感知次用户i完成频段感知任务j消耗的成本,
Figure BDA0003668579100000036
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬,β和γ表示加权系数,tij表示协作感知次用户i感知频段任务j的感知时间,dij表示协作感知次用户i和感知需求次用户j之间的距离。
具体的,协作感知次用户i感知频段j的检测概率公式为:
Figure BDA0003668579100000037
其中,pf表示次用户i的虚警概率,γij表示次用户i感知频段j的信噪比,tij表示次用户i感知频段j的感知时间,fs表示采样频率,通常是一个定值,Q函数是一个互补的累积分布函数,表达式为:
Figure BDA0003668579100000041
具体的,感知需求次用户
Figure BDA0003668579100000042
通过招募协作感知次用户
Figure BDA0003668579100000043
完成相应频段感知任务得到的效用表示为:
Figure BDA0003668579100000044
其中α表示加权系数,
Figure BDA0003668579100000045
表示感知需求次用户经过表决融合之后得到频段j的检测概率,
Figure BDA0003668579100000046
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬。
具体的,所述感知需求次用户经过表决融合后感知任务j的检测概率表示为:
Figure BDA0003668579100000047
其中
Figure BDA0003668579100000048
表示次用户i感知频段j的虚警概率,
Figure BDA0003668579100000049
表示次用户i感知频段j的检测概率。
优选的,所述的协作感知次用户的采样频率取10kHz,虚警概率取0.1,加权系数α=8,β=1,γ=0.3,无线信号传输考虑大尺度衰落,其衰落系数取4,表决融合准则的判决门限值取N/2。
与现有技术相比,本发明具有以下优点和有益效果:
1、本发明方法将感知需求次用户与协作感知次用户分别建模为Stackelberg博弈的领导层和从属层,通过博弈得到感知需求次用户和协作感知次用户各自的最优策略,在领导层博弈中优化报酬使感知需求次用户效用最优,在从属层博弈中优化感知时间使协作感知次用户效用最优。
2、本发明将频谱感知与群智感知结合,考虑工作在不同频段的多个感知需求次用户招募协作感知次用户完成任务来获得不同的频段的使用情况,在该场景中一个协作感知次用户同时只能感知一个频段,协作感知次用户将感知结果发送给感知需求次用户,感知需求次用户融合多个协作感知次用户的结果,得到更准确的感知结果。
3、本发明考虑工作在不同频段的多个感知需求次用户需要对不同的频段进行感知,有感知需求次用户发布频段感知任务,分别招募协作感知次用户获得频段的使用情况。每个感知需求次用户招募到的协作感知次用户不是事先确定好的,而是根据协作感知次用户的检测概率、感知时间以及报价,随着博弈的过程而变化。
4、本发明感知需求次用户的效用定义为综合考虑检测概率以及报酬,协作感知次用户的效用定义为报酬减去成本,报酬与检测概率有关,成本与感知时间以及协作感知次用户与感知需求次用户之间的距离有关。
5、本发明在协作感知次用户选择时考虑反向选择,当一个协作感知次用户仅被一个感知需求次用户发送招募意愿时,该协作感知次用户就完成该感知任务。当一个协作感知次用户被多个感知需求次用户同时发送招募意愿时,该次用户通过比较多个感知需求次用户给出的报酬价格选择可以使自己获得报酬最多的任务加入。
附图说明
图1为本发明的一个实施例的方法流程图。
图2为本发明的一个实施例的Stackelberg博弈系统模型示意图。
具体实施方式
本发明的一种基于Stackelberg博弈的多频段群智频谱感知方法,该方法将感知需求次用户向协作感知次用户支付报酬的问题建模为Stackelberg博弈系统模型,其中感知需求次用户是博弈模型中的领导层,协作感知次用户是博弈模型中的从属层。感知需求次用户发布频段感知任务与初始报酬,每个协作感知次用户通过优化感知时间使得自身的效用最优并将感知数据发送给感知需求次用户,感知需求次用户通过不断的更新报酬使其效用达到最优,并得到最终的判决结果。在领导层博弈中,该方法综合考虑检测概率和报酬定义了感知需求次用户的效用,通过博弈优化报酬以获得最佳效用,在从属层博弈中,该方法综合考虑检测概率和感知时间定义了协作感知次用户的效用,根据感知需求次用户发布的报酬优化感知时间以获得最佳效用,并且推导证明了感知时间的优化存在纳什均衡。
下面结合附图和实施例对本发明做进一步详细说明。
图2为本发明一个实施例的Stackelberg博弈系统模型示意图。如图2所示,系统的场景是一个圆形区域,随机分布着N个协作感知次用户和M个感知需求次用户,本发明取M=2,即存在两个感知需求次用户。在本实施例中,协作感知次用户的采样频率取10kHz,虚警概率取0.1,加权系数α=8,β=1,γ=0.3,无线信号传输考虑大尺度衰落,并且衰落系数取4,表决融合准则的判决门限值取N/2。为了激励协作感知次用户完成感知任务,感知需求次用户会向提供感知结果的次用户支付报酬。
本发明在系统模型中存在的次用户分为两部分,第一部分次用户分别工作在不同的频段上,想要在不影响授权用户情况下使用授权频段的次用户,首先需要发布感知任务,然后招募其他空闲次用户进行协作频谱感知获得频段的使用情况,这些有需求的次用户组成的集合称为感知需求次用户集合,表示为
Figure BDA0003668579100000051
另外一部分是空闲次用户,在接收到感知需求次用户发布的任务以后,他们通过自身携带的智能设备进行感知并上传感知结果,这些空闲次用户组成的集合称为协作感知次用户集合
Figure BDA0003668579100000061
如图1所示,本发明的一种基于Stackelberg博弈的多频段群智频谱感知方法,包括以下步骤:
Step1:构建从属层优化问题,并推导协作感知次用户博弈存在纳什均衡解:综合考虑检测概率、感知时间定义了协作感知次用户的效用函数,即从属层的优化问题就是使协作感知次用户的效用最大化。
协作感知次用户
Figure BDA0003668579100000062
完成频段感知任务可以从感知需求次用户
Figure BDA0003668579100000063
那里得到报酬,并且得到的报酬与其自身的检测概率有关,所以协作感知次用户
Figure BDA0003668579100000064
的报酬pij定义为:
Figure BDA0003668579100000065
其中
Figure BDA0003668579100000066
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬,Tj表示参与频段感知任务j的协作次用户集合。
协作感知次用户
Figure BDA0003668579100000067
完成感知任务需要消耗成本,包括感知频段消耗的成本和上传感知数据消耗的成本,感知频段消耗的成本与感知时间tij有关,上传感知数据消耗的成本与协作感知次用户
Figure BDA0003668579100000068
和感知需求次用户
Figure BDA0003668579100000069
之间距离有关,因此协作感知次用户的成本cij的定义如下:
cij=β×tij+γ×dij (2)
其中β和γ表示加权系数,tij表示协作感知次用户i感知频段任务j的感知时间,dij表示协作感知次用户i与感知需求次用户j之间的距离。
所以协作感知次用户
Figure BDA00036685791000000610
的效用定义为:
Figure BDA00036685791000000611
其中pij表示协作感知次用户
Figure BDA00036685791000000612
获得的报酬,cij表示协作感知次用户
Figure BDA00036685791000000613
完成频段感知任务消耗的成本,
Figure BDA00036685791000000614
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬,β和γ表示加权系数,tij表示协作感知次用户i感知频段任务j的感知时间,dij表示协作感知次用户i与感知需求次用户j之间的距离。
对于协作感知次用户
Figure BDA00036685791000000615
而言,为了获得更多的报酬,需要向感知需求次用户
Figure BDA00036685791000000616
提交最佳的检测概率,假设检测概率中只有感知时间是可以由协作感知次用户
Figure BDA0003668579100000071
自身决定的,为了使得协作感知次用户
Figure BDA0003668579100000072
效用最优,协作感知次用户
Figure BDA0003668579100000073
通过博弈可以确定自己最优的感知时间,从而获得最优的检测概率,因此,从属层协作感知次用户
Figure BDA0003668579100000074
的优化问题表示为:
Figure BDA0003668579100000075
在认知无线电频谱感知中,次用户通过能量检测法来感知授权用户的频谱是否在使用,协作感知次用户i感知频段j的检测概率公式表示为:
Figure BDA0003668579100000076
其中,pf表示次用户i的虚警概率,γij表示次用户i感知频段j的信噪比,tij表示次用户i感知频段j的感知时间,fs表示采样频率,通常是一个定值,Q函数是一个互补的累积分布函数,表达式为:
Figure BDA0003668579100000077
为了使次用户的检测概率具有参考意义,要求
Figure BDA0003668579100000078
Figure BDA0003668579100000079
Figure BDA00036685791000000710
Figure BDA00036685791000000711
关于tij的一阶偏导数表示为:
Figure BDA00036685791000000712
进而,Uij关于tij的一阶偏导数表示为:
Figure BDA00036685791000000713
进而,Uij关于tij的二阶偏导数表示为:
Figure BDA00036685791000000714
其中,
Figure BDA0003668579100000081
因为任务预算Bj、感知时间tij、采样频率fs、检测概率
Figure BDA0003668579100000082
信噪比γij都是正值,所以K'中第二部分
Figure BDA0003668579100000083
小于0,第三部分
Figure BDA0003668579100000084
小于0,又因为K<0,所以K'中第一部分
Figure BDA0003668579100000085
小于0,所以K'小于0,又因为Uij关于tij二阶偏导的前一部分
Figure BDA0003668579100000086
大于0,从而可知Uij关于tij的二阶偏导数
Figure BDA0003668579100000087
Figure BDA0003668579100000088
的效用函数Uij是关于tij的严格凸函数,存在唯一的最优解。
由于Uij关于tij的二阶偏导数恒为负值,意味着Uij关于tij的一阶偏导数单调递减,又因为K<0,即
Figure BDA0003668579100000089
所以有
Figure BDA00036685791000000810
假设当K=0时,可得
Figure BDA00036685791000000811
从而有
Figure BDA00036685791000000812
即Uij关于tij的一阶偏导数存在正值。
假设当K→-∞时,可得tij→∞,从而有
Figure BDA0003668579100000091
由于β>0,所以当tij→∞时,
Figure BDA0003668579100000092
即Uij关于tij的一阶偏导数存在负值。
因此若
Figure BDA0003668579100000093
的最大值大于0,则最优的感知时间
Figure BDA0003668579100000094
可以通过下列方程组得到:
Figure BDA0003668579100000095
Figure BDA0003668579100000096
的最大值小于0,则
Figure BDA00036685791000000918
效用最大时对应的感知时间为
Figure BDA0003668579100000097
因此,
Figure BDA0003668579100000098
的感知时间博弈存在唯一纳什均衡解,即
Figure BDA00036685791000000919
检测概率博弈存在唯一纳什均衡解。
Step2:构建领导层优化问题:综合考虑经表决融合后的检测概率和任务报酬定义了感知需求次用户的效用函数,即领导层的优化问题就是使感知需求次用户的效用最大化。
考虑
Figure BDA0003668579100000099
的效用与发布的报酬以及
Figure BDA00036685791000000910
感知相应频段的检测概率有关,通过向
Figure BDA00036685791000000911
发放报酬可以激励更多的协作感知次用户参与感知。感知需求次用户
Figure BDA00036685791000000912
通过招募
Figure BDA00036685791000000913
完成相应频段感知任务得到的效用定义为:
Figure BDA00036685791000000914
其中α表示加权系数,
Figure BDA00036685791000000915
表示感知需求次用户经过表决融合之后得到频段j的检测概率,
Figure BDA00036685791000000916
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬。每个感知需求次用户采用表决融合准则对多个协作感知次用户提交的感知结果进行处理,经过表决融合后感知任务j的检测概率表示为:
Figure BDA00036685791000000917
其中
Figure BDA0003668579100000101
表示次用户i感知频段j的虚警概率,
Figure BDA0003668579100000102
表示次用户i感知频段j的检测概率。因此,领导层感知需求次用户
Figure BDA0003668579100000103
的优化问题表示为:
Figure BDA0003668579100000104
假设每个感知需求次用户支付给协作感知次用户的总报酬不超过Bmax,那么在0<Bj≤Bmax的范围内一定存在一个最优的报酬
Figure BDA0003668579100000105
使得感知需求次用户的效用函数值最大。
Step3:将感知需求次用户向协作感知次用户支付报酬的问题构建成基于Stackelberg博弈的多频段群智频谱感知系统模型,在博弈模型中感知需求次用户是领导层,协作感知次用户是从属层,每个协作感知次用户可以感知所有频段,但同时只能感知一个频段;
Step4:感知需求次用户对于要感知的频段向协作感知次用户发布任务及初始报酬,初始化感知需求次用户的最大效用
Figure BDA0003668579100000106
为0;
Step5:所有协作感知次用户根据报酬及感知时间计算其在当前报酬下的效用,通过优化感知时间选择效用最大时对应的感知时间,协作感知次用户根据该感知时间计算对应的检测概率与成本,并将数据对感知时间,检测概率,基于成本产生的报价)传送给感知需求次用户;
Step6:感知需求次用户根据其报酬向检测概率高的协作感知次用户发送招募意愿及支付报酬的价格;
Step7:若协作感知次用户被多个感知需求次用户同时招募时,通过比较多个感知需求次用户提供的价格选择能够获得报酬多的感知任务加入;
Step8:感知需求次用户计算在当前报酬下的效用,如果该效用值高于
Figure BDA0003668579100000107
则将该报酬记录下来,在最大报酬Bmax的限制下以步长μ增加报酬值,发布新的报酬并重复Step5-Step8,直到相邻两次感知需求次用户的效用值误差小于δ;
Step9:将Step8中得到的感知需求次用户效用最优时对应的报酬作为最终的报酬,协作感知次用户根据该报酬确定最终的感知时间并将感知数据上传给感知需求次用户,得到最终的判决结果。
综上所述,本发明针对频谱感知场景,结合群智感知技术,提出了一种基于Stackelberg博弈的多频段群智频谱感知方法。该方法将感知需求次用户向协作感知次用户支付报酬的问题建模为Stackelberg博弈模型,其中感知需求次用户是博弈模型中的领导层,协作感知次用户是博弈模型中的从属层。在领导层博弈中,综合考虑检测概率和报酬定义了感知需求次用户的效用,通过博弈优化报酬以获得最佳效用;在从属层博弈中,综合考虑检测概率和感知时间定义了协作感知次用户的效用,根据感知需求次用户发布的报酬通过优化感知时间以获得最佳效用,并且推导证明了感知时间的优化存在纳什均衡。

Claims (8)

1.一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,将感知需求次用户向协作感知次用户支付报酬的问题建模为Stackelberg博弈系统模型,其中感知需求次用户是博弈模型中的领导层,协作感知次用户是博弈模型中的从属层;所述系统的场景是一个圆形区域,随机分布有N个协作感知次用户和M个感知需求次用户,取M=2,即存在两个感知需求次用户;所述的感知需求次用户的集合,表示为
Figure FDA0003668579090000011
所述的协作感知次用户的集合表示为
Figure FDA0003668579090000012
所述方法包括以下步骤:
Step1、构建从属层优化问题,并推导协作感知次用户博弈存在纳什均衡解:综合考虑检测概率、感知时间定义协作感知次用户的效用函数,使协作感知次用户的效用最大化;
Step2、构建领导层优化问题:综合考虑经表决融合后的检测概率和任务报酬定义了感知需求次用户的效用函数,使感知需求次用户的效用最大化;
Step3、将感知需求次用户向协作感知次用户支付报酬的问题构建成基于Stackelberg博弈的多频段群智频谱感知系统模型,在博弈模型中感知需求次用户是领导层,协作感知次用户是从属层,每个协作感知次用户可以感知所有频段,但同时只能感知一个频段;
Step4、感知需求次用户对于要感知的频段向协作感知次用户发布任务及初始报酬,初始化感知需求次用户的最大效用
Figure FDA0003668579090000013
为0;
Step5、所有协作感知次用户根据报酬及感知时间计算其在当前报酬下的效用,通过优化感知时间选择效用最大时对应的感知时间,协作感知次用户根据该感知时间计算对应的检测概率与成本,并将数据对(感知时间,检测概率,基于成本产生的报价)传送给感知需求次用户;
Step6、感知需求次用户根据其报酬向检测概率高的协作感知次用户发送招募意愿及支付报酬的价格;
Step7、若协作感知次用户被多个感知需求次用户同时招募时,通过比较多个感知需求次用户提供的价格选择能够获得报酬多的感知任务加入;
Step8、感知需求次用户计算在当前报酬下的效用,如果该效用值高于
Figure FDA0003668579090000014
则将该报酬记录下来,在最大报酬Bmax的限制下以步长μ增加报酬值,发布新的报酬并重复Step5-Step8,直到相邻两次感知需求次用户的效用值误差小于δ;
Step9、将Step8中得到的感知需求次用户效用最优时对应的报酬作为最终的报酬,协作感知次用户根据该报酬确定最终的感知时间并将感知数据上传给感知需求次用户,得到最终的判决结果。
2.根据权利要求1所述的一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,协作感知次用户
Figure FDA0003668579090000021
的报酬pij为:
Figure FDA0003668579090000022
其中
Figure FDA0003668579090000023
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬,Tj表示参与频段感知任务j的协作次用户集合。
3.根据权利要求1所述的一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,协作感知次用户的成本cij为:
cij=β×tij+γ×dij (2)
其中β和γ表示加权系数,tij表示协作感知次用户i感知频段任务j的感知时间,dij表示协作感知次用户i和感知需求次用户j之间的距离。
4.根据权利要求1所述的一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,协作感知次用户
Figure FDA0003668579090000024
的效用为:
Figure FDA0003668579090000025
其中pij表示协作感知次用户i获得的报酬,cij表示协作感知次用户i完成频段感知任务j消耗的成本,
Figure FDA0003668579090000026
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬,β和γ表示加权系数,tij表示协作感知次用户i感知频段任务j的感知时间,dij表示协作感知次用户i和感知需求次用户j之间的距离。
5.根据权利要求1所述的一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,协作感知次用户i感知频段j的检测概率公式为:
Figure FDA0003668579090000027
其中,pf表示次用户i的虚警概率,γij表示次用户i感知频段j的信噪比,tij表示次用户i感知频段j的感知时间,fs表示采样频率,通常是一个定值,Q函数是一个互补的累积分布函数,表达式为:
Figure FDA0003668579090000031
6.根据权利要求1所述的一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,感知需求次用户
Figure FDA0003668579090000032
通过招募协作感知次用户
Figure FDA0003668579090000033
完成相应频段感知任务得到的效用表示为:
Figure FDA0003668579090000034
其中α表示加权系数,
Figure FDA0003668579090000035
表示感知需求次用户经过表决融合之后得到频段j的检测概率,
Figure FDA0003668579090000036
表示协作感知次用户i感知频段任务j的检测概率,Bj表示感知需求次用户j发布的报酬。
7.根据权利要求1所述的一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,所述感知需求次用户经过表决融合后感知任务j的检测概率表示为:
Figure FDA0003668579090000037
其中
Figure FDA0003668579090000038
表示次用户i感知频段j的虚警概率,
Figure FDA0003668579090000039
表示次用户i感知频段j的检测概率。
8.根据权利要求1至7任一项所述的一种基于Stackelberg博弈的多频段群智频谱感知方法,其特征在于,所述的协作感知次用户的采样频率取10kHz,虚警概率取0.1,加权系数α=8,β=1,γ=0.3,无线信号传输考虑大尺度衰落,其衰落系数取4,表决融合准则的判决门限值取N/2。
CN202210598013.8A 2022-05-30 2022-05-30 一种基于Stackelberg博弈的多频段群智频谱感知方法 Active CN115102648B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210598013.8A CN115102648B (zh) 2022-05-30 2022-05-30 一种基于Stackelberg博弈的多频段群智频谱感知方法
PCT/CN2022/107291 WO2023231165A1 (zh) 2022-05-30 2022-07-22 一种基于Stackelberg博弈的多频段群智频谱感知方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210598013.8A CN115102648B (zh) 2022-05-30 2022-05-30 一种基于Stackelberg博弈的多频段群智频谱感知方法

Publications (2)

Publication Number Publication Date
CN115102648A true CN115102648A (zh) 2022-09-23
CN115102648B CN115102648B (zh) 2023-07-25

Family

ID=83288924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210598013.8A Active CN115102648B (zh) 2022-05-30 2022-05-30 一种基于Stackelberg博弈的多频段群智频谱感知方法

Country Status (2)

Country Link
CN (1) CN115102648B (zh)
WO (1) WO2023231165A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117118547A (zh) * 2022-10-24 2023-11-24 湖南科技学院 认知无线电网络中优化能效与感知性能的动态分组算法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120108276A1 (en) * 2010-10-27 2012-05-03 The Hong Kong University Of Science And Technology Cooperative spectrum sensing in cognitive radio networks
CN104780007A (zh) * 2015-04-03 2015-07-15 南京邮电大学 基于联盟博弈的多用户协作频谱感知方法
CN106535198A (zh) * 2015-09-15 2017-03-22 索尼公司 频谱管理装置及方法、基站侧和用户设备侧的装置及方法
CN110149161A (zh) * 2019-05-10 2019-08-20 南京邮电大学 一种基于Stackelberg博弈的多任务协作频谱感知方法
CN110798273A (zh) * 2019-10-21 2020-02-14 南京邮电大学 一种基于次用户效用最优的协作频谱感知方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8014809B2 (en) * 2006-12-11 2011-09-06 New Jersey Institute Of Technology Method and system for decentralized power control of a multi-antenna access point using game theory
CN105528248B (zh) * 2015-12-04 2019-04-30 北京邮电大学 多任务合作应用下的群智感知激励机制
CN109492887B (zh) * 2018-10-25 2021-10-26 浙江工商大学 基于势博弈理论的移动群智感知激励方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120108276A1 (en) * 2010-10-27 2012-05-03 The Hong Kong University Of Science And Technology Cooperative spectrum sensing in cognitive radio networks
CN104780007A (zh) * 2015-04-03 2015-07-15 南京邮电大学 基于联盟博弈的多用户协作频谱感知方法
CN106535198A (zh) * 2015-09-15 2017-03-22 索尼公司 频谱管理装置及方法、基站侧和用户设备侧的装置及方法
CN110149161A (zh) * 2019-05-10 2019-08-20 南京邮电大学 一种基于Stackelberg博弈的多任务协作频谱感知方法
CN110798273A (zh) * 2019-10-21 2020-02-14 南京邮电大学 一种基于次用户效用最优的协作频谱感知方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117118547A (zh) * 2022-10-24 2023-11-24 湖南科技学院 认知无线电网络中优化能效与感知性能的动态分组算法

Also Published As

Publication number Publication date
CN115102648B (zh) 2023-07-25
WO2023231165A1 (zh) 2023-12-07

Similar Documents

Publication Publication Date Title
CN104579523B (zh) 认知无线网络频谱感知和接入决策联合的优化方法
Boussaïd et al. Hybridizing biogeography-based optimization with differential evolution for optimal power allocation in wireless sensor networks
Huang et al. Efficient workload allocation and user-centric utility maximization for task scheduling in collaborative vehicular edge computing
CN110798273B (zh) 一种基于次用户效用最优的协作频谱感知方法
CN110149161B (zh) 一种基于Stackelberg博弈的多任务协作频谱感知方法
CN115102648B (zh) 一种基于Stackelberg博弈的多频段群智频谱感知方法
Wang et al. Interplay between social selection and social influence on physical proximity in friendship formation
Fantacci et al. A d2d-aided federated learning scheme with incentive mechanism in 6G networks
Tang et al. A reinforcement learning approach for D2D-assisted cache-enabled HetNets
Zeng et al. How mobile contributors will interact with each other in mobile crowdsourcing with word of mouth mode
CN108631895B (zh) 一种基于贝叶斯博弈的频谱感知次用户激励方法
CN116939866A (zh) 一种基于协同计算和资源分配联合优化的无线联邦学习效率提升方法
CN110417572B (zh) 一种基于目标节点相遇概率预测消息传递节点的方法
Su et al. Dynamic resource allocation in queue-constrained and delay-sensitive vehicular networks
CN112261704B (zh) 一种基于可充电无线传感器网络的重复博弈路由方法
Lai et al. Optimal wireless information and energy transmissions for UAV-enabled cognitive communication systems
Jiang et al. Age of information-based computation offloading and transmission scheduling in mobile edge computing-enabled iot networks
CN107465471B (zh) 协作感知中基于公平和节能的认知用户选择方法
Banitalebi et al. Self-optimized collaborative data communication in wireless sensor networks
Li et al. Satisfied matching-embedded social Internet of Things for content preference-aware resource allocation in D2D underlaying cellular networks
CN111866952A (zh) 一种基于用户组偏好集中度差异的d2d概率式缓存放置方法
Zhang et al. System revenue maximization for offloading decisions in mobile edge computing
Yang et al. Reputation Mechanism Designed for Blockchain Empowered Dynamic Spectrum Sharing System
Yan et al. A Contract-based incentive mechanism in RF-powered backscatter cognitive radio networks
Biswas et al. Sensing throughput optimization in cognitive fading multiple access channels with energy harvesting secondary transmitters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant