CN107979846A - 一种情景知觉下的重叠联盟博弈模型及空间自适应算法 - Google Patents

一种情景知觉下的重叠联盟博弈模型及空间自适应算法 Download PDF

Info

Publication number
CN107979846A
CN107979846A CN201711481730.8A CN201711481730A CN107979846A CN 107979846 A CN107979846 A CN 107979846A CN 201711481730 A CN201711481730 A CN 201711481730A CN 107979846 A CN107979846 A CN 107979846A
Authority
CN
China
Prior art keywords
msub
mrow
user
alliance
msubsup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711481730.8A
Other languages
English (en)
Inventor
陈瑾
阮朗
徐煜华
陈学强
杨旸
张玉立
孔利君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Army Engineering University of PLA
Original Assignee
Army Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Army Engineering University of PLA filed Critical Army Engineering University of PLA
Priority to CN201711481730.8A priority Critical patent/CN107979846A/zh
Publication of CN107979846A publication Critical patent/CN107979846A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/18Network planning tools
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/0453Resources in frequency domain, e.g. a carrier in FDMA
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/50Allocation or scheduling criteria for wireless resources
    • H04W72/53Allocation or scheduling criteria for wireless resources based on regulatory allocation policies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于情景知觉的重叠联盟博弈模型及空间自适应学习算法。该模型为:考虑D2D网络中具有内容需求的次级用户,将内容需求存在重叠的相邻用户组成一个联盟,通过一个用户向上层获取频谱资源后转发给联盟中其他用户。算法为:构建重叠联盟博弈模型,参与者是D2D网络内所有次级用户;各用户将其他用户划分为邻居用户和非邻居用户;各用户随机选择一个联盟进行接入,计算所有能够选择的联盟带来的效用函数,用户选择能带来最优效用的联盟进行接入;循环迭代,直至所有用户的联盟选择实现收敛或者达到设定的迭代次数;循环结束后计算其他内容下的联盟选择直至覆盖全网。本发明能够更加精确地刻画用户之间频谱资源的内容重叠关系并加以利用。

Description

一种情景知觉下的重叠联盟博弈模型及空间自适应算法
技术领域
本发明属于无线通信技术领域,提出了一种情景知觉下的重叠联盟博弈模型及空间自适应学习(Spatial Adaptive Play,SAP)算法。
背景技术
频谱资源的短缺和获取频谱资源的高开销已经成为通信领域中的一个重要问题,这使得D2D网络中的频谱拍卖和团购的研究变得越来越重要。针对这个问题,有人提出了一个频谱团购的三层拍卖框架(参考文献Peng Lin,Xiaojun Feng,Qian Zhang and MounirHamdi,“Groupon inthe Air:A Three-stage Auction Framework for SpectrumGroup-buying,”2013Proceedings IEEE INFOCOM)来对团购进行分层优化;有人提出了两种诚信的团购拍卖方式(参考文献Dejun Yang,Guoliang Xue and Xiang Zhang,“GroupBuyingSpectrum Auctions in Cognitive Radio Networks,”DOI10.1109/TVT.2016.2546948,IEEE),利用次级用户使得主设备以某种机制选择信道从而最大化次级接入用户的效益。然而,大部分研究都只是专注于用户在不同层的关系以及在上层的选择和底层的接入点,没有考虑用户自己的资源需求。
联盟形成博弈(参考文献Walid Saad,Zhu Han,M′erouane Debbah,Areand TamerBas,ar,“Coalitional Game Theory for CommunicationNetworks”,inIEEE Signal Processing Mag.,Special Issue on Game Theory,vol.26,no.5,Sept.2009,pp.77C97.)主要考虑的是合作下的网络结构;重叠联盟形成博弈(参考文献Tianyu Wang,Lingyang Song,Zhu Han,and Walid Saad,“OverlappingCoalitionFormation Games for Emerging Communication Networks,”in IEEE Network,vol.30,Sept.2016,pp.46-53,以及参考文献Yuli Zhang,Yuhua Xu and Qihui Wu,“Group BuyingBased on SocialAware in D2D Networks:A Game Theoretic Approach,”6th IEEE/CICInternational Conference on Communications in China(ICCC 2017),Qingdao,China Oct.2017,accepted.)中,提到了一个在D2D网络中基于用户社会关系的联盟形成博弈模型,该模型考虑了不同用户中存在的重叠内容,在联盟形成后通过一次获取这些重叠内容转发到所有需要的用户,从而减少转发开销,但它并没有考虑到在不同内容需求下,相应的联盟形成也是不同的。
发明内容
本发明的目的在于提供一种能够降低频谱资源获取开销、提高频谱利用率的情景知觉下的重叠联盟博弈模型及空间自适应学习(Spatial Adaptive Play,SAP)算法。
实现本发明目的的技术解决方案为:一种情景知觉下的重叠联盟博弈模型,对于D2D网络中的任意一个具有内容需求的次级用户,将其他用户按照通信范围分为邻居用户和非邻居用户;在进行需求内容获取时,存在重叠内容的相邻用户组成一个联盟,其中一个用户向上层进行相应内容的频谱资源团购,获取资源后将内容转发给联盟中其他拥有相同内容需求的用户。
一种基于所述情景知觉下的重叠联盟博弈模型的空间自适应学习算法,包括以下步骤:
步骤1,将用户团购问题建模为联盟形成博弈模型,博弈的参与者是网络内所有具有频谱资源需求的次级用户;
步骤2,引入局部互利博弈模型,针对选中用户,将其他用户按照通信范围是否在一跳范围内,分为邻居用户和非邻居用户,并定义效用函数;
步骤3,随机选择一个用户,根据此时邻居用户和选中用户自身的联盟选择情况,利用效用函数计算选中用户接入各个联盟的效用值;选中用户选择所有可接入联盟中效用值最大即获取频谱资源开销最小的联盟进行接入,接入的规则是依概率进行探索学习;
步骤4,循环步骤3,用户通过探索学习进行联盟选择,直至所有用户的联盟选择实现收敛,或者达到设定的迭代次数。
进一步地,步骤1将用户团购问题建模为博弈模型,该博弈模型定义为:
该博弈模型中包含四个组成部分,其中,N={1,2,...n0}为参与博弈的次级用户集合,An为用户n的可选择联盟策略空间,Jn为用户n一跳范围内的邻居用户,un为用户n的效用函数。
进一步地,步骤3所述随机选择一个用户,根据此时邻居用户和选中用户自身的联盟选择情况,利用效用函数计算选中用户接入各个联盟的效用值,具体如下:
定义任意时刻已经形成的联盟中,每个次级用户n拥有不同的频谱资源需求其中ln为次级用户n的内容长度;设定次级用户n的联盟选择为αn,假设获取每块内容的频谱资源开销为α0,计算出存在重叠频谱资源内容的次级用户的重叠度:
其中,表示与同属于一个联盟的其他用户的集合,并且:
其中,表示为次级用户k的第o个内容块的内容;公式(2)表示不同用户频谱资源中的内容块是否相同;
基于以上条件,能够得到次级用户n的效用函数un为:
从而得到网络全局的效用函数:
博弈的优化目标:以式(4)的效用函数进行联盟选择,通过考虑不同的内容块,使得网络全局的效用最大即获取频谱资源的开销最小:
(P1):max U (5)
利用局部互利博弈(local altruistic game)模型,优化式(4)、(5),将局部效用函数和目标函数表示如下:
进一步地,步骤3所述选中用户选择所有可接入联盟中效用值最大即获取频谱资源开销最小的联盟进行接入,接入的规则是依概率进行探索学习,具体如下:
(1)初始化,每个次级用户n∈N随机选择一个联盟,选择一个内容块i,作为下一个循环中用户进行联盟选择的依据;
(2)探测:所有的次级用户进行信息交互,并通过空间自适应学习的方式,每次迭代都随机选择一个次级用户n进行操作,其他所有的用户重复之前的联盟选择;对于选中的次级用户n,利用公式(3)计算它选择不同联盟的效用值;
(3)联盟选择:用户n根据效用值对联盟进行依概率选择并接入。
进一步地,步骤4所述循环步骤3,用户通过探索学习进行联盟选择,直至所有用户的联盟选择实现收敛,或者达到设定的迭代次数,具体如下:
(1)所有的次级用户进行信息交互;
(2)每次迭代都随机选择一个次级用户n进行操作;
(3)其他所有的用户重复之前的联盟选择,即ak(j+1)=ak(j),k∈Jn
对于选中的次级用户n,首先利用公式(3)计算它选择不同联盟的效用值,用户n考虑内容块i的频谱获取开销然后次级用户更新它的选择策略:
其中,β>0是学习系数,表示用户n选择其他联盟,表示用户n第j次选择时,选择联盟an的概率。
本发明与现有技术相比,其显著优点在于:(1)在情景知觉的前提下,充分考虑了次级用户存在重叠内容需求的情况,提出了频谱资源利用率更高的基于情景知觉的重叠联盟博弈模型,避免了联盟选择和内容选择存在矛盾的时候基于不同内容形成不同联盟的情况,更好地刻画了D2D网络中用户存在重叠内容的频谱资源团购特性;(2)通过引入局部互利博弈模型,利用联盟形成博弈证明了该重叠联盟博弈模型存在纳什稳定解,并且是可以求解的,为算法的设计提供了理论支持;(3)提出的基于用户内容的空间自适应学习(SAP)算法,通过局部信息交互,探测并达到全局最优,避免了在计算全局最优中存在的不收敛问题,并设置了学习参数对探测学习的过程调整,所提算法适用于大规模次级用户网络。
附图说明
图1是经典的基于情景知觉的重叠联盟博弈模型的示意图。
图2是不同内容需求下网络内形成的不同联盟的示意图。
图3是本发明基于情景知觉的重叠联盟博弈模型的算法中联盟形成的示意图。
图4是在不同用户通信距离条件下,本发明实施例中模型方法与现有方法的网络全局开销的对比示意图。
图5是本发明实施例中模型方法与现有方法的网络全局开销,在不同用户数量关系下对比的示意图。
图6是本发明实施例中模型方法与现有方法的网络全局开销,不同用户内容量关系下对比的示意图。
图7是本发明实施例中模型方法与现有方法的网络全局开销,在不同用户内容重叠度关系下对比的示意图。
具体实施方式
对于D2D网络中的任意N个拥有频谱资源需求的任一次级用户,其他用户被分为邻居用户和非邻居用户。图1所示为经典的基于情景知觉的重叠联盟博弈模型。在图1中,用户A、B、C分别拥有不同的内容,其中存在重复的内容,此时针对不同内容,用户会形成不同的联盟,如考虑内容1时,用户A和用户B可以形成联盟,联盟形成后可以由其中一个用户来向上层获取相应频谱资源,即内容1,并转发给联盟中的其他用户,从而实现频谱获取开销的优化;相对于从上层获取频谱的开销,转发开销和联盟形成的开销可以忽略不计。图2为在不同内容需求条件下网络内形成的不同联盟的示意图。考虑内容2、内容3或者内容8时,用户间会在一跳范围内形成不同的联盟,这些联盟的形成对于相应的内容来说是最优的分配方案。
本发明情景知觉下的重叠联盟博弈模型,对D2D网络中的任意一个具有内容需求的次级用户,将其他用户按照通信范围分为邻居用户和非邻居用户;在进行需求内容获取时,将存在重叠内容的相邻用户组成一个联盟,其中一个用户对上层进行相应内容的频谱资源团购,获取资源后将内容转发给联盟中其他拥有相同内容需求的用户。
本发明基于联盟选择策略和网络全局效用的关系,通过求解局部最优来达到全局最优,从而达到最大化全局效用,即最小化频谱资源获取开销的目的。
本发明基于所述情景知觉下的重叠联盟博弈模型的空间自适应学习算法,包括以下步骤:
步骤1,将权利要求1所述用户团购问题建模为博弈模型,博弈的参与者是网络内所有具有频谱资源需求的次级用户;
步骤2,引入局部互利博弈(local altruistic game)模型,针对选中用户,将其他用户按照通信范围是否在一跳范围内,分为邻居用户和非邻居用户,定义效用函数;
步骤3,随机选择一个用户,根据此时邻居用户的联盟选择情况和自身的联盟选择情况,利用效用函数计算用户接入各个联盟的效用值。用户选择所有可接入联盟中效用值最大即获取频谱资源开销最小的联盟进行接入,接入的规则是依概率进行探索学习;
步骤4,循环步骤3,用户通过探索学习进行联盟选择,直至所有用户的联盟选择实现收敛,或者达到设定的迭代次数。
本发明的具体实施如下:
一、步骤1所述将所述用户团购问题建模为博弈模型,该博弈模型定义为:
该博弈模型中包含四个组成部分,其中,N={1,2,...n0}为参与博弈的次级用户集合,An为用户n的可选择联盟策略空间,Jn为用户n一跳范围内的邻居用户,un为用户n的效用函数。
二、步骤2所述引入局部互利模型,根据此时邻居用户的联盟选择情况和自身的联盟选择情况,利用效用函数计算用户接入各个联盟的效用值,具体如下:
定义任意时刻已经形成的联盟中,每个次级用户n拥有不同的频谱资源需求其中ln为次级用户n的内容块数量;设定次级用户n的联盟选择为an,获取每个频谱资源内容块的开销为α0,计算出存在重叠内容需求的次级用户的重叠度:
其中,表示与同属于一个联盟的其他用户的集合,并且:
其中:表示为次级用户k的第o个内容块的内容;公式(2)表示不同用户中的内容是否相同;
基于以上条件,得到次级用户n的效用函数un为:
该效用函数表示的是用户的频谱资源获取的开销。根据之前的设定,仅考虑用户向上层获取频谱资源的开销,忽略用户之间的转发开销,从而可以得到网络全局的效用函数为:
三、博弈的优化目标:以式(4)的效用函数进行合适的联盟选择,通过考虑不同的内容块,使得网络全局的效用最大,即获取频谱资源的开销最小,如式(5)所示:
(P1):max U (5)
通过将基于情景知觉的重叠联盟博弈模型与局部合作博弈结合,证明了该模型是具有纳什稳定的联盟形成博弈,从而优化公式(4)(5),将局部效用函数和目标函数表示如下:
四、步骤3所述用户选择所有可接入联盟中效用数值最大即获取频谱资源开销最小的联盟进行接入,接入的规则是依概率进行探索学习,其中,
进行联盟选择,完成以下工作:
(1)初始化,每个次级用户n∈N随机选择一个不同的联盟,选择一个内容块i,作为下一个循环联盟选择所要考虑的内容。
(2)探测:所有的次级用户进行信息交互,并通过空间自适应学习的方式,每次迭代都随机选择一个次级用户n进行操作,其他所有的用户重复之前的联盟选择。对于选中的次级用户n,利用公式(3)计算它选择不同联盟的效用值;
(3)联盟选择:用户n根据效用值对联盟进行依概率选择并接入。
实施例1
本发明的一个具体实施例如下描述:系统仿真采用Matlab软件,参数设定不影响一般性;N个次级用户随机布设在一个200m×200m的网络场景中,单个频谱资源获取开销α0统一设置为1,所有次级用户的通信范围都一样并设为Radii,所有用户的内容重叠度设置为Od,学习系数β设置为3,并随着迭代次数增加而增大至25,使得结果逐渐从学习探测过程偏向收敛。
本发明基于情景知觉的重叠联盟博弈模型的算法,具体过程如下:
步骤1:初始化,设置迭代次数j=0,每个次级用户n∈N选择一个不同的联盟,选择一个内容块i,作为下一个循环联盟选择的内容。
步骤2:联盟选择策略更新(循环):
①所有的次级用户进行信息交互。
②每次迭代都随机选择一个次级用户n进行操作。
③其他所有的用户重复之前的联盟选择,即ak(j+1)=ak(j),k∈Jn。对于选中的次级用户n,利用公式(3)计算它选择不同联盟的效用值,用户n考虑计算内容块i的频谱获取开销然后次级用户依据下式更新它的选择策略:
其中,β>0是为学习系数,表示用户n选择其他联盟,表示用户n第j次选择时,选择联盟an的概率。
步骤3:当所有用户的联盟选择实现收敛,或者达到一定的迭代次数时,回到初始化状态,此时,在特定内容块i下的用户联盟选择循环结束。
步骤4:全局效用:计算网络中考虑所有内容块的联盟选择,并计算整体的频谱资源获取开销U。
图3为20个次级用户基于内容1而形成的联盟选择。可以看出在经过算法的迭代之后,联盟选择更新策略最终收敛到一个稳定的状态。下面考虑不同的因素对总效用影响的示意图,并通过与一种基于用户自身的重叠联盟SAP算法(参考文献:Yuli Zhang,Yuhua Xuand Qihui Wu,“Group Buying Based on SocialAware in D2D Networks:A GameTheoretic Approach,”IEEE ICCC,,Qingdao,2017.)进行对比,该算法只体现所有用户对所有内容的优化情况下的一次联盟形成。对比发现,本发明所提出的算法具有更强的性能。此外,所提方法只需要知道局部信息便可以达到全局最优。
例1通信距离Radii
考虑8个次级用户,由图4可知,在不同通信距离条件下,所提出的基于用户内容的空间自适应学习(SAP)算法与基于用户自身的重叠联盟的SAP对比算法相比较,平均频谱获取开销要减小13.8%。
例2次级用户的数量(N)
考虑不同数量的次级用户,假设每个用户n随机生成ln个内容(0<ln<50),,Radii为40m,其他参数都不变。比较两个算法,由图5可知,所提出的基于情景知觉的重叠联盟博弈模型的算法与基于用户自身的重叠联盟的SAP对比算法相比较,平均频谱获取开销要减小17.7%。
例3内容长度
考虑内容的长度ln,假设存在8个次级用户,Radii为40m,假设每个次级用户n随机生成ln个内容,范围为1到100(N=8,),其他参数不变。比较两个算法,由图6可知,所提出的基于情景知觉的重叠联盟博弈模型的算法平均频谱获取开销要比基于用户自身的重叠联盟的SAP对比算法减小9.8%。
例4重叠度
重叠度表示用户之间内容的重叠情况,假设每个用户n随机生成ln个内容(0<ln<50),生成的内容满足设重叠度公式:表示用户n中与其他用户存在重叠的内容数量,其他变量与例3中一样。比较两个算法,由图7可知,所提出的基于情景知觉的重叠联盟博弈模型的算法平均频谱获取开销要比基于用户自身的重叠联盟的SAP对比算法减小12.6%。
综上,本发明提出的基于情景知觉的重叠联盟博弈模型及算法,充分地考虑到了重叠内容,利用局部信息的交互进行求解从而得到全局最优,并通过多次循环,进行不同的联盟选择,从而极大地降低了频谱资源获取的开销,有效提高了全网效用。通过与基于用户自身的重叠联盟的SAP对比算法的比较,在考虑重叠内容需求的情况下,针对用户不同的重叠内容进行相应的联盟选择,避免了在不同内容下存在的联盟选择矛盾,从而更加适用于内容需求重叠度高的网络。通过算法分析证明了所提算法的频谱资源获取开销更小,性能更强,也验证了理论的正确性。
实施例2
无人机(UAV)在节点部署中起着很重要的作用,能有效地执行一些任务预分配的任务。无人机需要协同合作,所以许多无人机场景中使用联盟形成博弈来完成如目标侦测、环境监控和信息传输等任务。在通信的角度下,无人机可被视为一个节点,无人机按照编组进行划分,则机群中的组长即为簇头,在进行通信频谱资源管理时起到中继和转发的作用。这些特征都表示,本发明提出的基于情景知觉的重叠联盟博弈模型可以适用于这些无人机场景。由于节点具有动态移动性,使得模型的分析更为复杂,需要更精确地对动态变化的场景进行刻画;在不同的场景和任务分配下,节点不再是单一的,而是具有不同的形式,如无人机和基站、组长和僚机等,这使节点变量设置更为复杂;优化目标不再是简单的转发开销,而可能是无人机执行任务的完成度,如信息传输量、目标侦测情况等。

Claims (6)

1.一种情景知觉下的重叠联盟博弈模型,其特征在于,对于D2D网络中的任意一个具有内容需求的次级用户,将其他用户按照通信范围分为邻居用户和非邻居用户;在进行需求内容获取时,存在重叠内容的相邻用户组成一个联盟,其中一个用户向上层进行相应内容的频谱资源团购,获取资源后将内容转发给联盟中其他拥有相同内容需求的用户。
2.一种基于权利要求1所述情景知觉下的重叠联盟博弈模型的空间自适应学习算法,其特征在于,包括以下步骤:
步骤1,将用户团购问题建模为联盟形成博弈模型,博弈的参与者是网络内所有具有频谱资源需求的次级用户;
步骤2,引入局部互利博弈模型,针对选中用户,将其他用户按照通信范围是否在一跳范围内,分为邻居用户和非邻居用户,并定义效用函数;
步骤3,随机选择一个用户,根据此时邻居用户和选中用户自身的联盟选择情况,利用效用函数计算选中用户接入各个联盟的效用值;选中用户选择所有可接入联盟中效用值最大即获取频谱资源开销最小的联盟进行接入,接入的规则是依概率进行探索学习;
步骤4,循环步骤3,用户通过探索学习进行联盟选择,直至所有用户的联盟选择实现收敛,或者达到设定的迭代次数。
3.根据权利要求2所述的基于情景知觉的重叠联盟博弈模型的空间自适应学习算法,其特征在于,步骤1将用户团购问题建模为博弈模型,该博弈模型定义为:
该博弈模型中包含四个组成部分,其中,N={1,2,...n0}为参与博弈的次级用户集合,An为用户n的可选择联盟策略空间,Jn为用户n一跳范围内的邻居用户,un为用户n的效用函数。
4.根据权利要求3所述的基于情景知觉的重叠联盟博弈模型的空间自适应学习算法,其特征在于,步骤3所述随机选择一个用户,根据此时邻居用户和选中用户自身的联盟选择情况,利用效用函数计算选中用户接入各个联盟的效用值,具体如下:
定义任意时刻已经形成的联盟中,每个次级用户n拥有不同的频谱资源需求其中ln为次级用户n的内容长度;设定次级用户n的联盟选择为an,假设获取每块内容的频谱资源开销为α0,计算出存在重叠频谱资源内容的次级用户的重叠度:
<mrow> <msub> <mi>S</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <msubsup> <mi>J</mi> <mi>n</mi> <mi>i</mi> </msubsup> </mrow> </msub> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>o</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>l</mi> <mi>k</mi> </msub> </msubsup> <mi>f</mi> <mrow> <mo>(</mo> <msubsup> <mi>a</mi> <mi>n</mi> <mi>i</mi> </msubsup> <mo>,</mo> <msubsup> <mi>a</mi> <mi>k</mi> <mi>o</mi> </msubsup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中,表示与同属于一个联盟的其他用户的集合,并且:
<mrow> <mi>f</mi> <mrow> <mo>(</mo> <msubsup> <mi>a</mi> <mi>n</mi> <mi>i</mi> </msubsup> <mo>,</mo> <msubsup> <mi>a</mi> <mi>k</mi> <mi>o</mi> </msubsup> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msubsup> <mi>a</mi> <mi>n</mi> <mi>i</mi> </msubsup> <mo>=</mo> <msubsup> <mi>a</mi> <mi>k</mi> <mi>o</mi> </msubsup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <msubsup> <mi>a</mi> <mi>n</mi> <mi>i</mi> </msubsup> <mo>&amp;NotEqual;</mo> <msubsup> <mi>a</mi> <mi>k</mi> <mi>o</mi> </msubsup> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
其中,表示为次级用户k的第o个内容块的内容;公式(2)表示不同用户频谱资源中的内容块是否相同;
基于以上条件,能够得到次级用户n的效用函数un为:
<mrow> <msub> <mi>u</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>l</mi> <mi>n</mi> </msub> </msubsup> <mfrac> <mrow> <mo>-</mo> <msub> <mi>&amp;alpha;</mi> <mn>0</mn> </msub> </mrow> <mrow> <msub> <mi>S</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
从而得到网络全局的效用函数:
<mrow> <mi>U</mi> <mo>=</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>n</mi> <mo>&amp;Element;</mo> <mi>N</mi> </mrow> </msub> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>l</mi> <mi>n</mi> </msub> </msubsup> <mfrac> <mrow> <mo>-</mo> <msub> <mi>&amp;alpha;</mi> <mn>0</mn> </msub> </mrow> <mrow> <msub> <mi>S</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
博弈的优化目标:以式(4)的效用函数进行联盟选择,通过考虑不同的内容块,使得网络全局的效用最大即获取频谱资源的开销最小:
(P1):max U (5)
利用局部互利博弈模型,优化式(4)、(5),将局部效用函数和目标函数表示如下:
<mrow> <mi>U</mi> <msub> <mn>1</mn> <mi>n</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>u</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <msub> <mi>J</mi> <mi>n</mi> </msub> </mrow> </msub> <msub> <mi>u</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <msub> <mi>J</mi> <mi>k</mi> </msub> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>
5.根据权利要求4所述的基于情景知觉的重叠联盟博弈模型的空间自适应学习算法,其特征在于,步骤3所述选中用户选择所有可接入联盟中效用值最大即获取频谱资源开销最小的联盟进行接入,接入的规则是依概率进行探索学习,具体如下:
(1)初始化,每个次级用户n∈N随机选择一个联盟,选择一个内容块i,作为下一个循环中用户进行联盟选择的依据;
(2)探测:所有的次级用户进行信息交互,并通过空间自适应学习的方式,每次迭代都随机选择一个次级用户n进行操作,其他所有的用户重复之前的联盟选择;对于选中的次级用户n,利用公式(3)计算它选择不同联盟的效用值;
(3)联盟选择:用户n根据效用值对联盟进行依概率选择并接入。
6.根据权利要求5所述的基于情景知觉下的重叠联盟博弈模型的空间自适应学习算法,其特征在于,步骤4所述循环步骤3,用户通过探索学习进行联盟选择,直至所有用户的联盟选择实现收敛,或者达到设定的迭代次数,具体如下:
(1)所有的次级用户进行信息交互;
(2)每次迭代都随机选择一个次级用户n进行操作;
(3)其他所有的用户重复之前的联盟选择,即ak(j+1)=ak(j),k∈Jn
对于选中的次级用户n,首先利用公式(3)计算它选择不同联盟的效用值,用户n考虑内容块i的频谱获取开销然后次级用户更新它的选择策略:
<mrow> <msubsup> <mi>q</mi> <mi>n</mi> <msub> <mi>a</mi> <mi>n</mi> </msub> </msubsup> <mrow> <mo>(</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>exp</mi> <mo>{</mo> <msub> <mi>&amp;beta;u</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>a</mi> <msub> <mi>J</mi> <mi>n</mi> </msub> </msub> <mo>(</mo> <mi>j</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>}</mo> </mrow> <mrow> <mi>exp</mi> <mo>{</mo> <msub> <mi>&amp;beta;u</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <msub> <mi>a</mi> <msub> <mi>J</mi> <mi>n</mi> </msub> </msub> <mo>(</mo> <mi>j</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>}</mo> <mo>+</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mover> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>~</mo> </mover> <mo>&amp;Element;</mo> <msub> <mi>A</mi> <mi>n</mi> </msub> </mrow> </msub> <mi>exp</mi> <mo>{</mo> <msub> <mi>&amp;beta;u</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mover> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>~</mo> </mover> <mo>,</mo> <msub> <mi>a</mi> <msub> <mi>J</mi> <mi>n</mi> </msub> </msub> <mo>(</mo> <mi>j</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>}</mo> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>
其中,β>0是学习系数,表示用户n选择其他联盟,表示用户n第j次选择时,选择联盟an的概率。
CN201711481730.8A 2017-12-29 2017-12-29 一种情景知觉下的重叠联盟博弈模型及空间自适应算法 Pending CN107979846A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711481730.8A CN107979846A (zh) 2017-12-29 2017-12-29 一种情景知觉下的重叠联盟博弈模型及空间自适应算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711481730.8A CN107979846A (zh) 2017-12-29 2017-12-29 一种情景知觉下的重叠联盟博弈模型及空间自适应算法

Publications (1)

Publication Number Publication Date
CN107979846A true CN107979846A (zh) 2018-05-01

Family

ID=62005311

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711481730.8A Pending CN107979846A (zh) 2017-12-29 2017-12-29 一种情景知觉下的重叠联盟博弈模型及空间自适应算法

Country Status (1)

Country Link
CN (1) CN107979846A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108710348A (zh) * 2018-05-14 2018-10-26 西安工业大学 一种无人机群控制系统及其无人机设备
CN109327514A (zh) * 2018-09-26 2019-02-12 中国人民解放军陆军工程大学 一种基于内容复用的数据下载开销博弈优化模型及方法
CN109451542A (zh) * 2018-11-22 2019-03-08 中国人民解放军陆军工程大学 一种基于频谱开销的预售系统模型及分层学习算法
CN109600774A (zh) * 2019-01-17 2019-04-09 南京邮电大学 一种LTE网络中基于联盟博弈的WiFi卸载方法
CN111083668A (zh) * 2020-01-02 2020-04-28 山东大学 一种在车联网中基于联盟博弈算法的d2d资源分配方法
CN111800185A (zh) * 2020-07-06 2020-10-20 中国人民解放军陆军工程大学 一种无人机辅助通信中的分布式空地联合部署方法
CN113037876A (zh) * 2021-05-25 2021-06-25 中国人民解放军国防科技大学 基于合作博弈的云下行任务边缘节点资源分配方法
CN113395676A (zh) * 2021-08-17 2021-09-14 南京航空航天大学 一种基于重叠联盟形成博弈的无人机任务协作方法
CN114217638A (zh) * 2021-12-15 2022-03-22 中国人民解放军66389部队88分队 一种任务驱动下的移动台站信息采集动态部署方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103684641A (zh) * 2013-12-31 2014-03-26 遵义天义利威机电有限责任公司 基于重叠联盟博弈的认知无线电合作频谱感知机制
CN104506261A (zh) * 2014-12-15 2015-04-08 河海大学常州校区 基于次级用户频谱需求的认知无线电网络的频谱感知方法
WO2015080547A1 (en) * 2013-11-26 2015-06-04 Mimos Berhad Method of coalition formation for cooperative spectrum sharing in cognitive wireless networks
CN106230973A (zh) * 2016-08-30 2016-12-14 南京邮电大学 一种基于社交网络的文件共享方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015080547A1 (en) * 2013-11-26 2015-06-04 Mimos Berhad Method of coalition formation for cooperative spectrum sharing in cognitive wireless networks
CN103684641A (zh) * 2013-12-31 2014-03-26 遵义天义利威机电有限责任公司 基于重叠联盟博弈的认知无线电合作频谱感知机制
CN104506261A (zh) * 2014-12-15 2015-04-08 河海大学常州校区 基于次级用户频谱需求的认知无线电网络的频谱感知方法
CN106230973A (zh) * 2016-08-30 2016-12-14 南京邮电大学 一种基于社交网络的文件共享方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RUAN LANG ET AL.: "Context-Aware Group Buying in D2D Networks: An Overlapping Coalition Formation Game Approach", 《2017 17TH IEEE INTERNATIONAL CONFERENCE ON COMMUNICATION TECHNOLOGY》 *
张国富等: "基于讨价还价的重叠联盟效用划分策略", 《模式识别与人工智能》 *
李昊鹏等: "基于重叠式联盟博弈的Femtocell干扰管理研究", 《信息技术》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108710348A (zh) * 2018-05-14 2018-10-26 西安工业大学 一种无人机群控制系统及其无人机设备
CN108710348B (zh) * 2018-05-14 2024-03-26 西安工业大学 一种无人机群控制系统及其无人机设备
CN109327514A (zh) * 2018-09-26 2019-02-12 中国人民解放军陆军工程大学 一种基于内容复用的数据下载开销博弈优化模型及方法
CN109327514B (zh) * 2018-09-26 2019-12-27 中国人民解放军陆军工程大学 一种基于内容复用的数据下载开销博弈优化模型及方法
CN109451542A (zh) * 2018-11-22 2019-03-08 中国人民解放军陆军工程大学 一种基于频谱开销的预售系统模型及分层学习算法
CN109600774B (zh) * 2019-01-17 2021-09-28 南京邮电大学 一种LTE网络中基于联盟博弈的WiFi卸载方法
CN109600774A (zh) * 2019-01-17 2019-04-09 南京邮电大学 一种LTE网络中基于联盟博弈的WiFi卸载方法
CN111083668A (zh) * 2020-01-02 2020-04-28 山东大学 一种在车联网中基于联盟博弈算法的d2d资源分配方法
CN111083668B (zh) * 2020-01-02 2021-06-11 山东大学 一种在车联网中基于联盟博弈算法的d2d资源分配方法
CN111800185A (zh) * 2020-07-06 2020-10-20 中国人民解放军陆军工程大学 一种无人机辅助通信中的分布式空地联合部署方法
CN113037876A (zh) * 2021-05-25 2021-06-25 中国人民解放军国防科技大学 基于合作博弈的云下行任务边缘节点资源分配方法
CN113395676A (zh) * 2021-08-17 2021-09-14 南京航空航天大学 一种基于重叠联盟形成博弈的无人机任务协作方法
US11567512B1 (en) 2021-08-17 2023-01-31 Nanjing University Of Aeronautics And Astronautics Unmanned aerial vehicle (UAV) task cooperation method based on overlapping coalition formation (OCF) game
CN114217638A (zh) * 2021-12-15 2022-03-22 中国人民解放军66389部队88分队 一种任务驱动下的移动台站信息采集动态部署方法

Similar Documents

Publication Publication Date Title
CN107979846A (zh) 一种情景知觉下的重叠联盟博弈模型及空间自适应算法
Guo et al. Energy-aware computation offloading and transmit power allocation in ultradense IoT networks
Gu et al. Matching theory for future wireless networks: Fundamentals and applications
Zhang et al. Energy–latency tradeoff for computation offloading in UAV-assisted multiaccess edge computing system
Chen et al. iRAF: A deep reinforcement learning approach for collaborative mobile edge computing IoT networks
Guo et al. Mobile-edge computation offloading for ultradense IoT networks
Tan et al. UAV-aided edge/fog computing in smart IoT community for social augmented reality
CN107819840A (zh) 超密集网络架构中分布式移动边缘计算卸载方法
Xu et al. A game-theoretic perspective on self-organizing optimization for cognitive small cells
Liu et al. Max-min energy balance in wireless-powered hierarchical fog-cloud computing networks
Liu et al. Wireless distributed learning: A new hybrid split and federated learning approach
CN103687023B (zh) 基于时延区分业务和比例性速率约束的优化无线资源方法
CN105120468A (zh) 一种基于演化博弈论的动态无线网络选择方法
CN104796993B (zh) 异构网络中基于Stackelberg博弈的跨层资源分配方法
Lyu et al. A stackelberg game model for overlay D2D transmission with heterogeneous rate requirements
Zhang et al. Many-to-many matching-theory-based dynamic bandwidth allocation for UAVs
Wu et al. Matching-coalition based cluster formation for D2D multicast content sharing
Chen et al. Joint optimization of trajectory and user association via reinforcement learning for UAV-aided data collection in wireless networks
Xi et al. Real-time resource slicing for 5G RAN via deep reinforcement learning
Wang et al. Joint heterogeneous tasks offloading and resource allocation in mobile edge computing systems
Xie et al. Dynamic d2d multihop offloading in multi-access edge computing from the perspective of learning theory in games
Dai et al. Contextual multi-armed bandit for cache-aware decoupled multiple association in UDNs: A deep learning approach
Huang et al. Hypergraph-Based Interference Avoidance Resource Management in Customer-Centric Communication for Intelligent Cyber-physical Transportation Systems
Xu et al. Distributed channel selection in CRAHNs with heterogeneous spectrum opportunities: A local congestion game approach
Chen et al. Distributed task offloading game in multiserver mobile edge computing networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB03 Change of inventor or designer information

Inventor after: Wang Jinlong

Inventor after: Chen Jin

Inventor after: Ruan Lang

Inventor after: Xu Yuhua

Inventor after: Chen Xueqiang

Inventor after: Yang Yang

Inventor after: Zhang Yuli

Inventor after: Kong Lijun

Inventor before: Chen Jin

Inventor before: Ruan Lang

Inventor before: Xu Yuhua

Inventor before: Chen Xueqiang

Inventor before: Yang Yang

Inventor before: Zhang Yuli

Inventor before: Kong Lijun

CB03 Change of inventor or designer information
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180501

RJ01 Rejection of invention patent application after publication